420 likes | 550 Views
Χ. Παπαθεοδώρου (papatheodor@ionio.gr) Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο. Συστήματα Θεματικής Πρόσβασης. Περιεχόμενα. ορολογία, χαρακτηριστικά και κατηγορίες όρων θεµατική ανάλυση, θεματικές γλώσσες
E N D
Χ. Παπαθεοδώρου (papatheodor@ionio.gr) Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο Συστήματα Θεματικής Πρόσβασης
Περιεχόμενα • ορολογία, χαρακτηριστικά και κατηγορίες όρων • θεµατική ανάλυση, θεματικές γλώσσες • UNIMARC AUTHORITIES • ταξινόµηση ταξινοµικά συστήµατα, Dewey, UDC, LCC, άλλα • ευρετηρίαση, ευρετήρια τίτλων KWIC, KWOC, ευρετήρια παραποµπών • προσυνδυασµένη και υστεροσυνδυασµένη ευρετηρίαση • θεµατικές επικεφαλίδες, θεµατικοί όροι • θεµατικές επικεφαλίδες Βιβλιοθήκης του Κογκρέσσου (LCSH), Sears, άλλες • Θησαυροί • πρότυπα τεκµηρίωσης για τη θεµατική ανάλυση και την ορολογία
Πρότυπα • ΕΛΟΤ 402. Αρχές και µέθοδοι ορολογίας • ΕΛΟΤ 414. Περιλήψεις για τις δηµοσιεύσεις και την τεκµηρίωση • ΕΛΟΤ 561-1. Λεξιλόγιο Ορολογίας • ΕΛΟΤ 720 :1993. Φύλλα περιλήψεων σε περιοδικές εκδόσεις. (ISO 5122-1979) • ΕΛΟΤ 743. Μετατροπή του ελληνικού αλφαβήτου µε λατινικούς χαρακτήρες • ΕΛΟΤ 1213:1994. Ευρετήριο ενός δηµοσιεύµατος. ( ISO 999-1996) • ΕΛΟΤ 1312:1993 (ΣΕΠ). Θεµατική ανάλυση τεκµηρίων : Μέθοδοι εξέτασης τεκµηρίων, προσδιορισµού των θεµάτων τους και επιλογής των όρων ευρετηρίασης (ISO 5963-1985) • ΕΛΟΤ 1321:1993 (ΣΕΠ) Κατευθυντήριες οδηγίες για τη συγκρότηση και ανάπτυξη µονόγλωσσων θησαυρών. (ISO 2788-1986) • ΕΛΟΤ 1381-1 (ΣΕΠ). Λεξιλόγιο - Μέρος 1 : Βασικές έννοιες. (ISO 5127/1-1983) • ΕΛΟΤ 1381-2-1997(ΣΕΠ) Λεξιλόγιο - Μέρος 2 : Παραδοσιακά τεκµήρια. (ISO 5127/2-1983)
Διαχείριση τεκμηρίων • Περιγραφή τεκμηρίων • Τίτλος, πνευματική υπευθυνότητα, επιμέλεια (edition), έκδοση (publication), φυσική περιγραφή (αρ. σελίδων, μέγεθος), σχετικός εξοπλισμός κλπ • Σημεία πρόσβασης καταλόγου • Ευρετήρια με βάση τα οποία γίνεται η αναζήτηση στον κατάλογο • Δημιουργία/χρήση αρχείου καθιερωμένων όρων (authority file) • τίτλοι – εναλλακτικοί τίτλοι – τίτλοι σειρών, ονόματα, συλλογικά όργανα • Θεματική ανάλυση - ταξινόμηση • Προσδιορισμός θεμάτων-εννοιών που καλύπτει ένα τεκμήριο • Ανάθεση θεματικών επικεφαλίδων • Ταξινόμηση τεκμηρίου σε θεματικές κατηγορίες με τη χρήση ταξινομικού συστήματος
Ταξινομημένη – αλφαβητική πληροφόρηση • Κατά τη διαδικασία της ταξινόμησης κάθε τεκμήριο εντάσσεται σε μία κατηγορία • Κατά τη θεματική ανάλυση σε ένα τεκμήριο αποδίδονται περισσότερα του ενός θέματα • Απαιτείται θεματικός κατάλογος • Τα τεκμήρια τακτοποιούνται συνήθως ταξινομικά (ιεραρχική ή κάθετη τακτοποίηση) ή αλφαβητικά (οριζόντια τακτοποίηση) • Στην ταξινομημένη τακτοποίηση υπάρχει ανάλυση σε βάθος και ακριβής εντοπισμός τεκμηρίων (όλα τα τεκμήρια είναι συναφή μεταξύ τους) • Στην αλφαβητική τακτοποίηση ο εντοπισμός είναι άμεσος, χωρίς δυσκολίες
Τρόποι θεματικής ανάλυσης • Εύρεση σκοπού του συγγραφέα • Πολλαπλοί σκοποί, ιεράρχηση σκοπών (κάποιοι από το διάβασμα αναδεικνύονται πρωτεύοντες) • Βασικό αντικείμενο (κυρίαρχο αντικείμενο – item - ή ομάδα αντικειμένων) • Αντικειμενική μέθοδος, μέτρηση αναφορών σε αντικείμενα και πρόσωπα, ακόμα και αυτών που δεν αναφέρονται ξεκάθαρα • Προσδιορισμός συνόλου ή κανόνων κριτηρίων επιλογής ή απόρριψης θεμάτων • Συμπέρασμα: ο προσδιορισμός των θεμάτων που αφορούν σε ένα τεκμήριο είναι υποκειμενική διαδικασία, εξαρτάται από τον αναγνώστη
Αρχεία Καθιερωμένων όρων • Καθιερωμένες εγγραφές (authorities) • Ονόματα, τίτλοι, θέματα που χρησιμοποιούνται στον κατάλογο • Άλλοι όροι και πηγές που χρησιμοποιούνται για τον προσδιορισμό των θεμάτων των τεκμηρίων • Τα αρχεία καθιερωμένων όρων συσχετίζουν τις βιβλιογραφικές εγγραφές του καταλόγου • Συγκεντρώνουν τις διαφορετικές εκφάνσεις (manifestations, μεταφράσεις, εκδόσεις κα) των τεκμηρίων • Ομαδοποιούν εγγραφές με ίδια θέματα • Ανάγκη ενιαίας αναπαράστασης των θεμάτων των βιβλιογραφικών εγγραφών – ενιαία γλώσσα
Γλώσσες • Φυσικές γλώσσες • πχ ελληνικά, αγγλικά • Πιο δύσκολη η ανάκτηση πληροφοριών στο πλήρες κείμενο. Σύγκριση ερώτησης χρήστη με το πλήρες κείμενο • Τεχνητές γλώσσες –Esperanto, γλώσσες προγραμματισμού • Γλώσσες θεμάτων (indexing, subject) • Πιο απλές γλώσσες, λίγοι τύποι και σχεδόν καθόλου γραμματική • Αποδίδουν σημασιολογικά το περιεχόμενο και τις σχέσεις • Παρέχουν στο χρήστη ισοδύναμες εκφράσεις για τις ίδιες έννοιες – ο χρήστης πρέπει να γνωρίζει αυτές τις γλώσσες για να εντοπίσει τεκμήρια που αναζητά • Την περιγραφή μιας γλώσσας την κάνει ο θεματικός καταλογογράφος / ταξινόμος • σχήματα ταξινόμησης, θησαυροί, λίστες θεματικών κεφαλίδων • Σκοπός • Χρησιμοποιούνται από καταλογογράφους και χρήστες για τη θεματική απόδοση των τεκμηρίων • Για την επιτυχή ανάκτηση πληροφορίας οι καταλογογράφοι και οι χρήστες πρέπει να μιλούν κοινή γλώσσα. Έτσι τα τεκμήρια και οι πληροφοριακές ανάγκες των χρηστών εκφράζονται με κοινό τρόπο και προσδιορίζονται με ακρίβεια
Γλώσσες (συνέχεια) • Μια γλώσσα έχει τα ακόλουθα συστατικά: • Λεξιλόγιο (vocabulary) • Σημασιολογία (semantics) • Συντακτικό (syntax)
Θεματικές γλώσσες • Δηλώσεις θεμάτων: σύνολο ζευγών facet/concept • π.χ. <τύπος γεύματος, δείπνο> • Κάθε έννοια (concept) είναι μια τάξη (class), στην οποία ένα σύνολο από τεκμήρια είναι μέλη • Κάθε έννοια αναπαρίσταται από ένα όρο (term)ή ετικέτα (label) • π.χ. ο όρος «δείπνο» όταν χρησιμοποιείται σε μια δήλωση θέματος είναι μια ετικέτα για την τάξη των τεκμηρίων που το περιεχόμενό τους περιστρέφεται γύρω από δείπνα • Ένας όρος μπορεί να αποτελείται από μία ή περισσότερες λέξεις • Κάθε φασέτα (οπτική γωνία) είναι μια κατηγορία (category)εννοιών (concepts) • π.χ. ο «τύπος γεύματος» είναι μια ετικέτα (label) κατηγορίας και το «δείπνο» μια έννοια της κατηγορίας «τύπος γεύματος»
Είδη γλωσσών • Υπάρχουν φασέτες; Συνθετική γλώσσα (synthetic ή facetic) • Δεν υπάρχουν; Γλώσσα απαρίθμησης (enumerative) • Οι συσχετίσεις μεταξύ των κατηγοριών ονομάζονται «συνταγματικές»
Ορισμοί • Εννοια(concept) είναι η νοητική αντιπροσώπευση ενός ιδιαίτερου αντικειµένου ή ενός συνόλου ιδιαίτερων αντικειµένων που έχουν ορισµένες κοινές ιδιότητες • Ορος(term) είναι µια λέξη ή φράση που αντιπροσωπεύει και προσδιορίζει µια έννοια. • Πλάτος (έκταση)µίας έννοιας: το σύνολο όλων των αντικειµένων στα οποία αντιστοιχεί µία έννοια • π.χ. {ακαδηµαϊκές, σχολικές, ειδικές, …} βιβλιοθήκες • Βάθος (ένταση)µίας έννοιας: το σύνολο των ουσιωδών χαρακτηριστικών που συνιστούν την έννοια • π.χ. στην έννοια {ξύλινο τραπέζι} το χαρακτηριστικό της σύνθεσης (ξύλινο) αποτελεί ουσιώδες χαρακτηριστικό και διακρίνει την έννοια τραπέζι • Ατοµική έννοια:αντιστοιχεί σε ένα µόνο αντικείµενο {νήσος Κέρκυρα} • Γενική έννοια:αντιστοιχεί σε δύο ή περισσότερα αντικείµενα που αποτελούν οµάδα µε κοινές ιδιότητες {νήσος}
Ορισμοί (συνέχεια) • Χαρακτηριστικό(attribute, characteristic) µιας έννοιας είναι οποιαδήποτε από τις ιδιότητες ή σχέσεις που συνιστούν µία έννοια • (π.χ. ένα χαρακτηριστικό της έννοιας δέντρο είναι ο ξυλώδης κορµός) • Ενδογενή χαρακτηριστικά(σχήµα, µέγεθος, υλικό, χρώµα) • π.χ. οδοντωτός (τροχός), κόκκινο (φως), ξύλινο (τραπέζι) • Εξωγενή χαρακτηριστικά(προέλευση, προορισµός, λειτουργία, θέση, εφευρέτης, τοποθέτηση) • π.χ. πεντελικό (µάρµαρο), ευκλείδεια (γεωµετρία), δοκιµαστικός (σωλήνας)
Ορισμοί εννοιών • Ορισµός µιας έννοιας είναι η λεκτική περιγραφή της έννοιας για διαφοροποίηση από συναφείς έννοιες • Εντατικός: περιγράφει το βάθος µιας έννοιας • π.χ ισόπλευρο τρίγωνο είναι το τρίγωνο που έχει και τις 3 πλευρές ίσες • Εκτατικός: απαρίθµηση των υποτασσόµενων εννοιών, πλάτος • π.χ. τρίγωνο: ισόπλευρο, ισοσκελές, σκαληνό • Εµµεσος: ορισµός µέσω παραδείγµατος
Λεξιλόγιο • Σύνολο όρων • Στις γλώσσες θεμάτων το λεξιλόγιο είναι ελεγχόμενο (controlled vocabulary) δηλ. μόνο συγκεκριμένοι όροι ή είδη όρων επιτρέπεται να συμμετέχουν στις δηλώσεις θεμάτων • Ονομάζονται περιγραφείς (descriptors) ή προτιμώμενοι όροι (preferred terms) • Αναφορές (references, “see” or “use”) από μη προτιμώμενους όρους σε προτιμώμενους • Κριτήρια επιλογής προτιμώμενων όρων • Από κάτω προς τα πάνω (bottom-up) • Συχνότητα χρήσης από τους συγγραφείς • Συχνότητα χρήσης στις αναζητήσεις των χρηστών • Από πάνω προς τα κάτω • με τη χρήση εργαλείων (Dewey, Ranganathan)
Αναπαράσταση λεξιλογίου • Λεκτική, οι θεματικές δηλώσεις εκφράζονται από διατάξεις όρων • Π.χ. Θεματικές επικεφαλίδες της Βιβλιοθήκης του Κογκρέσου (LCSH) • Κωδικοποιημένη, θεματικές δηλώσεις εκφράζονται από αριθμούς • Π.χ. κωδικοί του Dewey Classification System (DCC) • Οι όροι διατάσσονται στην περιγραφή της γλώσσας • Αλφαβητικά (π.χ. LCSH) • Συστηματικά (π.χ. DCC) • Συνήθως οι τα συστηματικά ταξινομικά συστήματα έχουν αλφαβητικά ευρετήρια και οι αλφαβητικοί θησαυροί έχουν ιεραρχικές απεικονίσεις
Είδη όρων • απλός όρος: όρος που περιλαµβάνει µόνο µία ρίζα • ήχος, φως • σύµπλοκος όρος: όρος που περιλαµβάνει δύο ή περισσότερες ρίζες • ηχοαπορρόφηση, ταχύτητα του ήχου, φωτοβολία, υπέρυθρο φως • δάνειος όρος: όρος που έχει ληφθεί από άλλη γλώσσα ή από άλλο θεµατικό πεδίο • νεολογισµός: µονολεκτικός όρος – απλός ή σύµπλοκος – που σχηµατίζεται και χρησιµοποιείται για πρώτη φορά στη γλώσσα για την απόδοση δεδοµένης έννοιας
Μορφές όρων • Μορφή του όρου είναι η εικόνα µε την οποία απεικονίζεται • Εσωτερική µορφή (νοητική, λογική υπόσταση, µνηµονική εικόνα) • Εξωτερική µορφή (φυσική, υλική υπόσταση) • Φωνητική µορφή • Γραπτή µορφή • κλίµα και κλήµα
Γραµµατική ανάλυση όρων • Κατάληξη (ending): Το τελικό µόρφηµα που εκφράζει τη γραµµατική κλίση • Ρίζα (root): Το ορολογικό µόρφηµα που µπορεί να χρησιµοποιηθεί ως λέξη, µόνο του ή µε κατάληξη • Πρόσφυµα (affix): Προσθήκη σε ρίζα • Πρόθεµα (prefix): προηγείται της ρίζας • Επίθεµα (suffix): ακολουθεί τη ρίζα
Συντόμευση εξωτερικής μορφής • Μη προφερόµενες συντοµοµορφές (µόνο στη γραπτή µορφή, δεν αποτελείόρο), π.χ. κ. (=κύριος) • Συντοµοµορφές (στη γραπτή και φωνητική µορφή) • Συνοπτικοί όροι, π.χ. η ευθεία (=η ευθεία γραµµή) • Aρκτικόλεξο, σχηµατίζεται από τα αρχικά γράµµατα και προφέρεται γράµµα – γράµµα, π.χ. ΙΧ (=Ιδιωτικής χρήσης) • Ακρώνυµα, σχηµατίζεται από τα αρχικά γράµµατα και προφέρεται συλλαβικά π.χ. ΔΕΗ(Δηµόσια Επιχείρηση Ηλεκτρισµού)
Ξενόγλωσσοι όροι • Εισαγωγή ξενόγλωσσων όρων • Απόδοση στην ελληνική, π.χ. online γίνεται επιγραµµικός • Δανεισµός, π.χ. πιγµέντο (από pigment=χρωστική) • Μεταγραφή, π.χ. µάρκετινγκ, µάνατζµεντ • Μετατροπή ξενόγλωσσων όρων • Μεταγραφή (µετατροπή – απόδοση – των χαρακτήρων του αλφαβήτου µιας γλώσσας σε χαρακτήρες του αλφαβήτου άλλης γλώσσας) • Μεταγραµµατισµός (ΕΛΟΤ 743) (µετατροπή γράµµα προς γράµµα ανεξάρτητα από προφορά)
Αντιστοιχία όρου και έννοιας • Οµωνυµία (homonyms), ίδια εξωτερική µορφή • Οµόφωνα (homophones), π.χ. λιµός – λοιµός, τοίχος - τείχος • Οµόγραφα (homographs) • Ταυτώνυµα (polysemy), π.χ. λόγος (=αιτία, οµιλία) • Πολυσηµία, (polysemy), • π.χ. κλάδος (δέντρου) – κλάδος (επιστηµονικός) • Συνωνυµία (synonyms) • Ταυτόσηµα (full synonyms), π.χ ικεσία - παράκληση • Ηµισυνώνυµα (quasi-synonyms), π.χ. καφενείο - κυλικείο.
Σημασιολογία • Σημασιολογία κατηγοριών • Η κατηγοριοποίηση των εννοιών σε κατηγορίες • Σημασιολογία αναφοράς • Η αντιστοίχηση των όρων σε έννοιες έτσι ώστε: • Να προσδιορίζονται τα συνώνυμα και να ομαδοποιούνται μαζί και • Να αποσαφηνίζονται τα ομώνυμα (homonyms, λέξεις με ίδια προφορά αλλά διαφορετική ορθογραφία και σημασία, scene, seen) • Αναφορές από προτιμώμενους σε μη προτιμώμενους όρους και αντίστροφα με τις σχέσεις USE (βλέπε) και UF (use for,βλέπε επίσης) ) • Σημασιολογία συσχέτισης • Ο προσδιορισμός των συσχετίσεων μεταξύ των εννοιών (paradigmatic relationships) • Ευρύτεροι, στενότεροι όροι, ισοδύναμοι κλπ
Σχέσεις µεταξύ εννοιών • Ιεραρχική σχέση: Σχέση µεταξύ δύο εννοιών όταν η µία ευρίσκεται σε υψηλότερη στάθµη από την άλλη • γένους – είδους (ειδογονική): υπερτασσόµενη και υποτασσόµενες έννοιες • π.χ. άνθρωπος και άνδρας, γυναίκα, όχηµα και αυτοκίνητο, ποδήλατο • όλου – µέρους (µεριστική): Η υπερτασσόµενη έννοια αποτελεί το όλον και η υποτασσόµενη µέρος του όλου • π.χ. αίθουσα θεάτρου και πλατεία, εξώστης, θεωρεία, αυλαία, βίδα και µπουλόνι, ροδέλα, παξιµάδι
Σχέσεις μεταξύ ενοιών • Μη ιεραρχική σχέση - πραγµατολογική σχέση: συνάφεια στο χρόνο, στο χώρο, αιτιακή, εννοιολογική σύνδεση • π.χ. εκδότης και βιβλίο, εκπαίδευση και διδασκαλία • αυτοκίνητο, τροχός αυτοκινήτου, λάστιχο τροχού αυτοκινήτου • βιοχηµεία και βιολογία, χηµεία • παιδί και αγόρι, κορίτσι • ακολουθιακή σχέση(π.χ. «παραγωγή» και «κατανάλωση») • χρονική σχέση(π.χ. «άνοιξη», «καλοκαίρι», «φθινόπωρο», «χειµώνας») • αιτιακή σχέση(π.χ. «πυρηνική έκρηξη» και «ραδιενεργός µόλυνση του περιβάλλοντος»
Ειδογονική σχέση – συστηµατική διάταξη (Πηγή: Βαλεοντής Κ. Οι σύγχρονες διαγλωσσικές αρχές της Ορολογίας) 1 Όργανο γραφής 1.1 µολύβι (γραφίτη) 1.1.1 (Υποδιαίρεση µε βάση το κριτήριο 1) 1.1.1.1 (κοινό) µολύβι 1.1.1.2 µηχανικό µολύβι 1.1.2 (Υποδιαίρεση µε βάση το κριτήριο 2) 1.1.2.1 µολύβι γραφείου 1.1.2.2 µολύβι µαραγκού 1.2 στυλό 1.3 µαρκαδόρος 1.4 …
Μεριστική σχέση – συστηµατική διάταξη 1 µηχανικό µολύβι 1.1 περίβληµα 1.1.1 σώµα 1.1.2 συνδετήρας εξάρτησης 1.1.3 λαβή δακτύλων 1.2 µηχανισµός προώθησης της µύτης 1.3 µύτη από γραφίτη 1.4 γοµολάστιχα
Είδος συσχέτισης μολύβι Χωρική-χρονική Όργανο-ενέργεια-εργαλείο γραφή Αίτιο-αποτέλεσμα Αιτιατική γράμμα Περιεχόμενο-περιέκτης Χωρική Διεύθυνση αποστολέα φάκελος Διεύθυνση παραλήπτη Χωρική Φέρον-φερόμενο Χωρική γραμματόσημο Ενέργεια-αντικείμενο ενέργειας χρονική ταχυδρόμηση Σχέση συνάφειας
Συσχετίσεις - ανακεφαλαίωση • Ιεραρχία • Όροι που περιγράφουν ένα φαινόμενο από τα μέρη του (πλοίο, αυτοκίνητο, τραίνο – μέσα μαζικής μεταφοράς) • Πολύ-ιεραρχία: μεταλλική καρέκλα έπιπλο και μεταλλική κατασκευή • Ισοδυναμία (συνώνυμα) • Πλοίο, καράβι • Σχετική ισοδυναμία (quasi-synonyms) κληρονομικότητα – γενετική, journalist-reporter • Πολυσημεία π.χ. συγκέντρωση: κοινωνικό γεγονός, χημικό φαινόμενο, ψυχολογικό φαινόμενο • Συνάφεια • Αθλήματα, εκπαίδευση
Σύνταξη • Κανόνες συνδυασμού των όρων (και από διαφορετικές κατηγορίες) κατά τις δηλώσεις θεμάτων • Προ-συνδυασμένες δηλώσεις θεμάτων (pre-coordination)= συνδυασμός όρων που έγινε πριν την αναζήτηση τεκμηρίων (δηλ. από τον θεματικό καταλογογράφο ή τον ταξινόμο) • ακρίβεια • Yστερο-συνδυασμένες δηλώσεις θεμάτων (post-coordination) = συνδυασμός όρων που έγινε μετά την ευρετηρίαση (δηλ. στη διαδικασία αναζήτησης ο χρήστης μπορεί να συσχετίζει όρους σχηματίζοντας θεματικές δηλώσεις με λογικούς τελεστές) • ευελιξία • Τα ταξινομικά συστήματα είναι προ-συνδυασμένες γλώσσες (έγιναν από τον ταξινόμο), απαρίθμησης (χωρίς φασέτες, DDC) ή συνθετικές (με φασέτες UDC)
Σύνοψη • Περιγραφείς (descriptors): ονόματα ή σύνολα ονομάτων ουσιαστικών σε απλή γραμματική μορφή (ονομαστική ενικού) • Προσδιοριστές (specifiers): δεν απαντώνται μόνοι τους ορίζουν τη σημασία των περιγραφέων • Λέξεις σχετικές με τους περιγραφείς (π.χ. περιγραφέας σχέδιο – όρος σκίτσο) • Σχέσεις μεταξύ των περιγραφέων (ιεραρχικές, ισοδυναμίας κλπ) • Σύμβολα αριθμητικά ή αλφαριθμητικά (π.χ. 110, Β15, Αa) • Συντακτικό: ρυθμίζει τη σειρά των περιγραφέων • Σημειώσεις: που, πώς, πότε χρησιμοποιούνται οι περιγραφείς • Τακτική συντήρηση θεματικών γλωσσών, τα λεξιλόγια εξελίσσονται όπως στις φυσικές γλώσσες
Παράδειγμα DRAWING UF Sketch BT GRAPHIC ARTS NT TECHNICAL DRAWING Sketch USE DRAWING
Κατηγορίες γλωσσών • Ταξινομίες • Προ-συνδυασμένες γλώσσες • Περιγράφουν τις έννοιες σε ένα γνωστικό πεδίο • Οι περιγραφείς τους είναι συστηματικά διατεταγμένοι σε ιεραρχίες με συγκεκριμένα κριτήρια που βασίζονται είτε στις λογικές συσχετίσεις τους, είτε στις συσχετίσεις του υλικού • Αντιστοίχιση του περιγραφέα με ένα αριθμό • Ταξινομικά συστήματα (DDC, UDC, LC) • Καλύπτουν όλο το φάσμα της γνώσης με ιεραρχικό τρόπο • Σε ορισμένα πεδία γνώσης η θεματική απόδοση γίνεται από πολύ μακριά αριθμοδότηση
Κατηγορίες γλωσσών (συνέχεια) • Φασετική ταξινομηση (Colon classification, 1933) • Πολυδιάστατη τακτοποίηση εννοιών και αντικειμένων • Κάθε κατηγορία αντιστοιχεί σε διαφορετική οπτική γωνία από την οποία επισκοπείται το γνωστικό αντικείμενο. Π.χ. τα κτίρια κατατάσσονται στην κατηγορία «Τεχνικές» • Τεχνικές • Υλικό: ξύλα, τούβλα, πέτρα • Χρήση: βιομηχανικά, εμπορικά, κατοικίες • Ύψος: ισόγεια, …, πολυ-όροφα • Τοποθεσία: (αγροικίες, αστικές κατοικίες) • Οι φασέτες μπορεί να προσαρμόζονται σε κάθε θεματική κατηγορία ή να είναι προκαθορισμένες για όλες τις κατηγορίες (personality-matter, energy, place, time)
Κατηγορίες γλωσσών (συνέχεια) • Συστηματικές λίστες • Τα αντικείμενα (items) διατάσσονται ιεραρχικά με βάση κάποια χαρακτηριστικά τους που προκύπτουν από την παρατήρηση • Π.χ. συστηματική βοτανική-κλείδες φυτών, συστηματική ζωολογία, ορυκτολογία • Αυτή η ταξινόμηση και χρησιμοποιείται στη θεματική απόδοση των τεκμηρίων
Κατηγορίες γλωσσών (συνέχεια) • Θεματικές (επι)κεφαλίδες • Περιγραφείς που σχηματίζονται από μοναδικές λέξεις ή ομάδες λέξεων, συνήθως εμπειρικά επιλεγμένες από το κείμενο ενός τεκμηρίου, με σκοπό την θεματική περιγραφή του τεκμηρίου με τη μεγαλύτερη δυνατή ακρίβεια • Στη γενική τους μορφή συνδέονται μεταξύ τους με οριζόντιες σχέσεις διασταύρωσης (cross-reference, see also) • Δευτερεύουσες επικεφ/δες: συνδυασμός επικεφ/δων • Balance of payment (payments, balance of), developing countries => balance of payment-developing countries , developing countries-balance of payment • Αλφαβητική διάταξη επικεφαλίδων μαζί με τις σχέσεις διασταύρωσης και τις εγγραφές των τεκμηρίων που χαρακτηρίζονται θεματικά από αυτές • Πολύ ευέλικτος τρόπος θεματικής περιγραφής, πολλές όμως κεφαλίδες σε ένα τεκμήριο μεγαλώνουν το χρόνο αναζήτησης και δυσκολεύουν τη διαχείριση και τον έλεγχο • Κανόνας: λίγες και όσο πιο γενικές επικεφαλίδες γίνεται ανά τεκμήριο
Κατηγορίες γλωσσών (συνέχεια) • Λίστες με λέξεις-κλειδιά • Λέξη κλειδί: μια λέξη από τη φυσική γλώσσα των τεκμηρίων • Πρόβλημα συνέπειας στη θεματική περιγραφή, απαιτείται επιλογή περιγραφέων • Αλφαβητική παράθεση • Λίστες περιγραφέων • Περιγραφέας: λέξη που έχει επιλεγεί από τη φυσική γλώσσα των τεκμηρίων, αφού έχουν εξαχθεί όλοι οι όροι από ένα τεκμήριο • Συνοδεύονται με τα συνώνυμά τους • Μπορεί να έχουν συσχετίσεις μεταξύ τους • Δημιουργούν ένα ελεγχόμενο λεξιλόγιο (controlled vocabulary)
Κατηγορίες γλωσσών (συνέχεια) • Θησαυροί • Ελεγχόμενο λεξιλόγιο, οι όροι (περιγραφείς) του οποίου επικεντρώνονται σε μια συγκεκριμένη γνωστική περιοχή και είναι συνδεμένοι με συσχετίσεις ιεραρχικές, συνάφειας και σχέσεις ισοδυναμίας με άλλους όρους φυσικής γλώσσας • Κάθε περιγραφέας έχει μια μοναδική και αναμφισβήτητη ερμηνεία ελαχιστοποιώντας την πολυσημία και ελέγχοντας τα συνώνυμα • Αποτελείται από ένα συστηματικό μέρος, όπου οι περιγραφείς οργανώνονται σε υποσύνολα και ένα αλφαβητικό κατάλογο
Α Β Γ Δ Buildings Buildings Construction Public health Public buildings Hospital Medical facilities Health services Medical buildings Hospital Hospital Hospital Συμβατότητα γλωσσών • Ένα τεκμήριο που περιγράφεται σε μια γλώσσα Α, μπορεί να εισαχθεί σε μια βάση δεδομένων που χρησιμοποιεί μια διαφορετική γλώσσα; • Τυπική συμβατότητα: ίδιοι ή ταυτόσημοι όροι σε διαφορετικές γλώσσες • Στις γλώσσες Α και Β ο όρος hospital ανήκει στην ίδια κατηγορία (buildings) αν και σε διαφορετικά επίπεδα • Στη γλώσσα Γ ο όρος ανήκει σε πιο γενική κατηγορία αν και περιστρέφεται γύρω από κατασκευές • Στη γλώσσα Δ ο όρος σχετίζεται με δραστηριότητα
Συμβατότητα γλωσσών (συνέχεια) • Μεταγλώσσες • δεν περιγράφουν πληροφορία και τεκμήρια αλλά διασυνδέουν διαφορετικές γλώσσες • Ολοκληρώνουν τη δομή των θεματικών γλωσσών σε μια μοναδική δομή και αναδιατάσσουν τους περιγραφείς τους προσδιορίζοντας ισοδυναμίες ή ενσωματώνοντάς τους σε ομάδες • Μακρο-θησαυροί • Καλύπτουν πολλά γνωστικά πεδία, αλλά περιέχουν μόνο τις βασικές έννοιες των πιο εξειδικευμένων γλωσσών • Δημιουργούνται πριν ή και μετά από τις γλώσσες που καλούνται να ολοκληρώσουν • Αποτελούν το βασικό κορμό και τα μεγάλα κλαριά που στηρίζουν τα επιμέρους κλαδιά που παράγουν τα επιμέρους γνωστικά πεδία • Αποτελούνται από γενικούς όρους, έτσι ώστε να γίνουν απαρχή για μια γλώσσα • Παρέχουν και σχέσεις συνάφειας μεταξύ των βασικών όρων υψηλού επιπέδου του μακρο-θησαυρού
Επιλέγοντας γλώσσα • Κριτήριο οι χρήστες • Πλήθος, ποιες οι ανάγκες τους, ποιες οι επερωτήσεις τους, με ποιο τρόπο • Μέσο ο οργανισμός πληροφόρησης • Τι υπηρεσίες προσφέρει, τι μέσα έχει, τι προσωπικό, τι υποδομή, πόση πληροφορία παράγει και επεξεργάζεται, τι δυνατότητες ανάκτησης και αποθήκευσης πληροφορίας προσφέρει, ποιες οι σχέσεις τους με άλλους φορείς πληροφόρησης • Ερώτημα: υπάρχει γλώσσα που καλύπτει τις ανάγκες ή πρέπει να δημιουργηθεί καινούργια γλώσσα;
Επεξεργασία θεματικής γλώσσας • Η προσαρμογή/δημιουργία μια θεματικής γλώσσας στις ανάγκες ενός οργανισμού απαιτεί χρόνο και προσπάθεια από ειδικών στη θεματική περιοχή και επιστήμονες πληροφόρησης • Προσεγγίσεις προσδιορισμού ορολογίας • A priori: Επεξεργασία ορολογίας από υπάρχοντα ευρετήρια, λεξικά, ταξινομίες και καταρτίζοντας λίστες όρων από ειδικούς στο γνωστικό αντικείμενο • Post priori (analytic): Εξαγωγή όρων από αντιπροσωπευτικές συλλογές τεκμηρίων • Συνήθως χρησιμοποιούμε και τις δύο προσεγγίσεις • Επιλογή περιγραφέων και της μορφής τους: Με βάση λεξικογραφικά δεδομένα προσδιορίζουμε δυνητικούς περιγραφείς και τις σχέσεις τους, ομαδοποίηση περιγραφέων με βάση τη σπουδαιότητά τους • Προσδιορισμός σχέσεων περιγραφέων • Έλεγχος από ειδικούς πριν τη δημοσίευση της γλώσσας • Μέγεθος γλώσσας: εξαρτάται από το γνωστικό πεδίο