100 likes | 293 Views
IL VOCABOLARIO DI INDICIZZAZIONE. nell’indicizzazione verbale L’insieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla lingua naturale per rappresentare in un indice, uniformemente e univocamente, il contenuto dei documenti dimensioni : sottoinsieme del
E N D
IL VOCABOLARIO DI INDICIZZAZIONE nell’indicizzazione verbale L’insieme controllato e strutturato dei termini (termini di indicizzazione) selezionati dalla lingua naturale per rappresentare in un indice, uniformemente e univocamente, il contenuto dei documenti dimensioni: sottoinsieme del vocabolario della lingua naturale significati: scelta tra sinonimi, CONTROLLO disambiguazione degli omografi, relazioni semantiche forme: solo sostantivi o sintagmi nominali, ognuno con un’unica grafia e in un unico caso e/o numero
CONTROLLO DEL VOCABOLARIO: ANALISI CATEGORIALE • Categorie semantiche: serie di categorie generali, tale che ognuno dei termini da sottoporre a controllo morfologico e semantico possa appartenere, per l’essenza del suo significato, ad una e non più di una delle categorie individuate • Norme: regole generali per il controllo del vocabolario, riferite non ai singoli termini, ma alle singole categorie • Analisi: riconoscimento della categoria di appartenenza del termine da sottoporre a controllo, e suo trattamento morfologico e semantico secondo quanto stabilito per la categoria di appartenenza Il metodo dell’analisi categoriale permette un controllo del vocabolario coerente (predittività del sistema) ed efficiente (efficacia ed economicità del sistema)
CONTROLLO DEL VOCABOLARIO: SCOMPOSIZIONE • Possono essere accolti come termini di indicizzazione: • sostantivi singoli (termini semplici) • sintagmi nominali (termini composti) • Sintagma nominale: locuzione composta da un sostantivo (focus o testa) seguito da aggettivi o altri sostantivi (differenza o modificatore) che restringono il significato del sostantivo di testa • Non dovrebbero essere accolti come singoli termini di indicizzazione, ma andrebbero scomposti e riespressi con più termini, i sintagmi nei quali: • il focus indichi un materiale, una proprietà o una parte dell’entità rappresentata dalla differenza • il focus indichi un’azione transitiva (o l’agente di un’azione transitiva) il cui oggetto è espresso dalla differenza • il focus indichi un’azione il cui agente è espresso dalla differenza
CONTROLLO DEL VOCABOLARIO: SINGOLARE E PLURALE Principio della numerabilità al plurale: termini che rappresentano entità numerabili al singolare: termini che rappresentano entità non numerabili categorie “plurali”categorie “singolari” aree geografiche attività, processi, discipline avvenimenti credenze e sistemi ideologici istituzioni materiali e sostanze oggetti proprietà, condizioni, caratteristiche organismi viventi parti uniche di organismi parti plurime di organismi L’appartenenza ad una categoria “plurale” o “singolare” è un criterio di riferimento e di verifica, ma non prevale sul principio della numerabilità; ne consegue che alcuni termini, pur appartenendo ad una categoria “plurale”, dovranno essere accolti nel vocabolario in forma singolare, e viceversa
CONTROLLO DEL VOCABOLARIO: NOMI PROPRI La forma preferita dei nomi propri deve corrispondere alla forma corretta e prevalente nell’espressione in lingua naturale, sia per quanto attiene al numero, sia per quanto attiene alla grafia e all’eventuale abbreviazione per sigla; l’inversione degli elementi componenti un nome proprio è di norma ammessa solo per i nomi propri di persona, in presenza di un cognome che è presumibile costituisca l’elemento di accesso più certo. L’unicità del catalogo, ed in particolare del catalogo informatizzato, impone un’applicazione assoluta e generale del principio di uniformità; ne consegue che in tutti i tipi di indicizzazione (per soggetto, per autori, per opere, ecc.) va impiegata, per ogni nome proprio, la medesima forma.
CONTROLLO DEL VOCABOLARIO: POLISEMI E OMOGRAFI Per il principio di univocità non possono essere ammesse come termini di indicizzazione le forme verbali che abbiano più significati (polisemi). Qualora concetti diversi siano espressi in lingua naturale con sostantivi o sintagmi di identica forma grafica (omografi), questi sostantivi o sintagmi, per essere ammessi nel vocabolario di indicizzazione, debbono essere tra loro formalmente distinti (disambiguati), in modo che a ciascuna forma grafica corrisponda un solo significato. Metodo tipico di disambiguazione è l’inserimento nel termine di indicizzazione, dopo il sostantivo o sintagma polisemo, di un ulteriore sostantivo o sintagma, posto tra parentesi, che ne distingua e individui il significato. Come elemento disambiguante va di norma utilizzato il termine che nel medesimo vocabolario indica la classe di appartenenza del concetto da designare.
CONTROLLO DEL VOCABOLARIO: RELAZIONI SEMANTICHE relazione di equivalenza: tra termini di uguale significato Relazioni semantiche: relazione gerarchica: le relazioni di significato tra termini di significato affine, che sussistono tra i ma di diversa estensione termini accolti nel vocabolario relazione associativa: tra termini il cui significato si “interseca” Perché sia stabilita ed espressa nel vocabolario una relazione semantica tra due termini è necessario e sufficiente che uno dei due termini sia indispensabile a definire l’altro, o ne condivida la definizione (criterio definitorio). Poiché non dipendendo dalla compresenza dei termini in un enunciato, le relazioni semantiche sono dette a priori.
CONTROLLO DEL VOCABOLARIO: RELAZIONE DI EQUIVALENZA La relazione tra il termine da impiegare costantemente nell’indicizzazione dei documenti (termine preferito) e gli eventuali altri sostantivi e sintagmi di significato equivalente (sinonimi e quasi sinonimi), che, per il principio di uniformità, non possono essere impiegati nelle voci d’indice (termini non preferiti), ma dai quali deve essere comunque possibile iniziare la consultazione dell’indice (termini di accesso) simboli standard: USE UF
CONTROLLO DEL VOCABOLARIO: RELAZIONE GERARCHICA La relazione tra un termine che designa un insieme (termine sovrordinato) e i termini che indicano i sottoinsiemi o i singoli individui che compongono quell’insieme (termini subordinati). La relazione gerarchica sussiste solo tra termini appartenenti alla stessa categoria. simboli standard: BT NT Genere / specie (relazione generica): le caratteristiche logiche che definiscono l’insieme (genere) sono tutte presenti nella definizione di ognuno dei sottoinsiemi (specie), unite ad almeno una ulteriore caratteristica, diversa e distintiva per ciascuna specie Classe / individuo (relazione esemplificativa): le caratteristiche che definiscono la classe sono tutte possedute dal singolo individuo (nome proprio) Intero / parte (relazione partitiva): la parte è componente costante dell’intero, l’intero è ambito di appartenenza esclusivo della parte (parti di organismi, aree geografiche, discipline, strutture sociali)
CONTROLLO DEL VOCABOLARIO: RELAZIONE ASSOCIATIVA La relazione tra termini che, pur non legati da una relazione di equivalenza o gerarchica, hanno tuttavia significato o fortemente correlato, essendo l’uno di norma necessario alla definizione dell’altro, o parzialmente coincidente simboli standard: RT Termini appartenenti alla medesima categoria: - contrari - quasi sinonimi non ritenuti equivalenti Termini appartenenti a categorie distinte: - attività / oggetto - attività / agente o strumento, o agente contrario - azione / prodotto - strumento / oggetto - proprietà / possessore