160 likes | 245 Views
Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία. WordNet. Σημασιολογικά Δίκτυα. δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις μια μορφή αναπαράστασης γνώσης (knowledge representation). WordNet.
E N D
Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία WordNet
Σημασιολογικά Δίκτυα • δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών • οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις • μια μορφή αναπαράστασης γνώσης (knowledge representation)
WordNet • δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985 • εποπτεία του Καθ. Ψυχολογίας George A. Miller • τρέχουσα έκδοση 3.0 • διανέμεται υπό παραλλαγή της BSD άδειας χρήσης
Εισαγωγή • πρόκειται για: • μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών • περιέχει: • ουσιαστικά, ρήματα, επίθετα, επιρήματα • διπλή φύση: • λεξικού και θησαυρού • ομαδοποίηση λέξεων σε: • σύνολα συνωνύμων όρων (synsets) • διασύνδεση synsets: • εννοιολογική-σημασιολογική ή λεξικολογική σχέση
Ορολογία • synset (έννοια): • ένα σύνολο από συνώνυμες λέξεις ή collocations (συνδυασμοί λέξεων με ξεχωριστό νόημα) • gloss (ορισμός): • σύντομος ορισμός μιας έννοιας
Σημασιολογικές Σχέσεις • ουσιαστικά: • υπερωνυμίας: το Y είναι υπερώνυμο του X όταν κάθε X είναι μέρος του Y • υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y είναι μέρος του Y • ολωνυμίας: το Y είναι ολώνυμο του X όταν το X είναι μέρος του Y • μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y είναι μέρος του X • αντίστοιχες σχέσεις υπάρχουν και για τα ρήματα, επίθετα και επιρήματα
Ιεραρχίες • Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας
Σχετικά Projects • σημασιολογικάδίκτυα: • σεάλλεςγλώσσες (εκτόςτωναγγλικών) • web interfaces: • πρόσβασημέσωάλλωνδικτύων • APIs: • σεόλεςσχεδόντιςγνωστέςγλώσσες (πχ: C#, Java, MySQL, Perl, PHP, PostgreSQL, Python, Ruby) • extentions: • επέκτασητωνχαρακτηριστικώντου ή ενσωμάτωσησεμεγαλύτερασυστήματα • mappings: • μεταξύδιαφορετικώνεκδόσεων
Μετρικές Σημασιολογικής Ομοιότητας • δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες • γνωστές μετρικές ομοιότητας: • Leacock-Chodorow Similarity • Wu-Palmer Similarity • Resnik Similarity • Jiang-Conrath Similarity • Lin Similarity
Wu-Palmer Similarity • Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους
Δικτυακοί Τόποι • WordNet official page: • http://wordnet.princeton.edu/ • WordNet Wikipedia page: • http://en.wikipedia.org/wiki/WordNet • WordNet visualization: • http://www.visuwords.com/ • WordNet vocabulary helper: • http://poets.notredame.ac.jp/cgi-bin/wn