390 likes | 544 Views
La biblioteca ibrida: verso un servizio informativo integrato. Metadati: parola chiave per l'accesso alla biblioteca ibrida. Milano, Palazzo delle Stelline, 14 -15 marzo 2002. Antonella De Robbio. SBA Università di Padova. 16 FAQ. 1. Come si esprimono i metadati?
E N D
La biblioteca ibrida: verso un servizio informativo integrato Metadati: parola chiave per l'accesso alla biblioteca ibrida Milano, Palazzo delle Stelline, 14 -15 marzo 2002 Antonella De Robbio SBA Università di Padova
16 FAQ 1. Come si esprimono i metadati? 2. Perché usare sistemi di metadati? 3. Cosa si dice sui metadati? 4. Quando sono nati i metadati? 5. Che cosa significa metadato? 6. Dove sono collocati i metadati? 7. Quanti sono i formati di metadati? 8. Come sono strutturati i metadati? 9. Qual è la funzione dei metadati? 10. Quali sono i domini di appartenenza dei metadati? 11. Chi produce i metadati? 12. I metadati sono sempre ad accesso libero? 13. Qual è la relazione tra metadati e interoperabilità? 14. Quali prospettive per i metadati? 15. Quando un modello per la rappresentazione dei metadati? 16. Metadati perché?
I contenuti 1. La biblioteca ibrida presenta le sue risorse 2. Biblioteca ibrida: servizio di accesso all'informazione 3. Metadati e confusione semantica 4. Origini e nascita dei metadati 5. Definizione di metadato 6. Metadati interni e metadati esterni 7. Popolazioni di metadati e infodiversità 8. Suddivisione dei metadati per tipologia strutturale 9. Suddivisione dei metadati per tipologia funzionale 10. Suddivisione dei metadati per domini di appartenenza 11. Metadati nelle comunità di utenti 12. Formati proprietari e formati standard 13. Interoperabilità tra formati di metadati 14. XML il linguaggio flessibile 15. RDF la terra di mezzo 16. Metadati chiave di accesso alla biblioteca ibrida
1. Come si esprimono i metadati? 1. La biblioteca ibrida presenta le sue risorse • Documenti e collezioni di documenti, nella biblioteca tradizionale e in quella digitale, hanno in associazione ai loro contenuti qualcosa che è noto come metadato • La rappresentazione di forme e contenuti avviene attraverso i metadati • Un'efficace gestione dell'informazione digitale deve necessariamente includere la presentazione delle risorse
2. Perché usare sistemi di metadati? 2. Biblioteca ibrida: servizio di accesso all'informazione • Il sistema di metadati è la componente logica di qualsiasi biblioteca, digitale o tradizionale • l’organizzazione informativa è fondamentale • I metadati possono essere usati per molti scopi non solo catalografici: • diritti di proprietà intellettuale, • firma digitale, • tariffazione servizi, • livelli di riservatezza di un documento, • metadescrizioni di oggetti non testuali e-commerce PICS MMIR
Documentare Contestualizzare Conservare Gestire date, persone, strutture … Gestire profili e accessi A cosa servono i metadati? In relazione al contesto In relazione alle risorse • Presentazione • Localizzazione • Selezione • adeguata all’uso • Acquisizione • termini • Manipolazione • Utilizzazione
Numerosi sono i progetti o le biblioteche ibride che utilizzano metadati
3. Cosa si dice sui metadati? You call it corn as we call it maize • "Poi c'è il problema della catalogazione e dei metadati. • Su questi il mio punto di vista è che siano • un tentativo sconsiderato di trovare una sorta di terza via tra • il deserto dei motori di ricerca e della ricerca a testo libero • e la grande architettura del controllo bibliografico • che i bibliotecari hanno sviluppato negli ultimi centocinquant'anni. • Penso che i metadati siano il prodotto di quelli che, • senza alcuna conoscenza della catalogazione, • né riguardo per essa, come alchimisti bibliografi • cercano la pietra filosofale che ci offrirà una catalogazione • efficace senza spese e accesso efficace senza vocabolari controllati. • Non esiste nessuna cosa del genere e prima si abbandona meglio è". • [Michael Gorman, Roma novembre 2001] "I metadati sono nulla di più che dati sui dati: i record dei cataloghi sono metadati: così come un header TEI, o qualsiasi altra forma di descrizione. Potremmo chiamarla catalogazione, ma per alcuni tale termine porta in sé un bagaglio eccessivo, come le Anglo-American Cataloging Rules e USMARC. Così alcuni lo estendono ad una situazione del tipo "Voi chiamatelo granturco, noi lo chiamiamo mais", ma i metadati sono un buon termine neutrale per coprire tutte le basi” [Priscilla Caplan, 1995]
La nuova terminologia ci aiuta Martin Dillon differenzia i metadati per: • Presentazione delle risorse (resource discovery) • Descrizione delle risorse (resource description). • Nella lingua inglese il termine "discovery" ha un significato duplice, di scoperta, ma anche di "presentazione".
Immagine tratta dal poster di P. Doherty e R. Zinkernagel. Premio Nobel 1996 Nobel in Fisiologia. Poster pubblicato dall’Australian Academy of Science Presentazione della risorsa La "presentazione" dei metadati di una risorsa avviene, più o meno, nello stesso modo in cui, in medicina, avviene la presentazione di uno o più antigeni da parte di una cellula. In entrambi i casi si presentano informazioni Descrizione della risorsa
identificatori • Tradizionali: ISBN; ISSN, SICI, BICI • ampliamento e revisione delle strutture per ospitare le RER • Emergenti: International Standard Work CodesISWC • si riferiscono alle "opere" intese come FRBR • riuniscono, sotto un unico identificatore, le differenti manifestazioni in cui un'opera può manifestarsi. 1. International Standard Textual Work Code (ISTC) 2. International Standard Audiovisual Number (ISAN) 3. International Standard Musical Work Code (ISWC) La gestione di questi identificatori è demandata ai "resolvers" o "risolutori"
4. Quando sono nati i metadati? 4. Origini e nascita dei metadati • origine e primi usi del termine trovano radici nell'ambiente basi di dati. • Metadata Workshop 1995 Stu Weibel OCLC: nascita del Dublin Core nella comunità dei bibliotecari • mancanza del termine nei testi sulle biblioteche digitali fino a dopo il 1997 • il termine "metadata" è un marchio registrato dal 1986 di proprietà di The Metadata Company
La legge del metadato • i cataloghi di biblioteca, i servizi di indicizzazione, gli archivi e la documentazione dei musei possono essere tutti interpretati come contenitori di metadati • Non esiste solo il Dublin Core • Anche il MARC è un metadato Ad ogni formato di metadato il suo utente A ciascuna comunità di utenti i propri metadati ;-)
5. Che cosa significa metadato? 5. Definizione di metadato • letteralmente definito come "dato sul dato” • inteso nel significato di "dato strutturato sulle risorse • Tim Berners-Lee lo definisce "informazione comprensibile alla macchina su risorse Web o altri oggetti". • l'assioma è questo: il metadato è un dato • un metadato può descrivere un metadato
Dentro al documento Fuori dal documento 6. Dove sono collocati i metadati? 6. Dove sono collocati i metadati? Interni alla risorsa: utili ai motori di ricerca risorsa • Esterni alla risorsa: • entro collezioni di metadati • esposizione di metadati • in basidati integrate con altri contenitori • collezioni a modello distribuito (OA) • servizi di accesso ai contenuti risorsa metadato metadato
7. Quanti sono i formati di metadati? 7. Popolazioni di metadati e infodiversità. • L’indagine DESIRE del 1996 identificava e descriveva oltre 20 "popolazioni" diverse • I metadati sono numerosi e diversi per • natura tipologica, • implementazione, • ambiti di provenienza • descrivono oggetti di natura/specie diverse • scopo • tipologia • funzione
Popolazioni di metadati e infodiversità come in biologia ... Il termine "metadiversità”coniato da Clifford Lynch con significato di "metadato in un contesto di biodiversità che può relazionarsi con un'ampia gamma di tipi di informazione che includono dati bibliografici, dati su modellizzazioni di oggetti di musei, tassonomie sviluppate da biologi, prodotti della ricerca e indagini geospaziali [Michael Day] • la diversità intraspecifica genetica, • la diversità a livello di specie • la diversità a livello di comunità.
8. Come sono strutturati i metadati? In analogia al concetto di biodiversità anche per i metadati si riscontrano tre livelli di distinzione: 1. tipologico strutturale, o intraspecifico al record 2. funzionale, correlato alla funzione stessa del metadato in relazione all'ambiente 3. di comunità, in una suddivisione in domini sulla base delle specifiche attività di comunità di utenti.
9. Qual è la funzione dei metadati? 2. Suddivisione dei metadati per tipologia funzionale • Amministrativi • utilizzati nella gestione e amministrazione delle risorse informative • Descrittivi • utilizzati per descrivere o identificare risorse informative • Di conservazione • riferiti alla gestione della conservazione delle risorse informative • Tecnici • riferiti al funzionamento di un sistema e al comportamento dei metadati • Di utilizzo • riferiti al livello e al tipo di utilizzo delle risorse informative
Amministrativi: metadati utilizzati nella gestione e nell'amministrazione delle risorse informative • Informazioni sull'acquisizione • Tracciato storico dei diritti di proprietà intellettuale, cessione e passaggi ai fini della riproduzione • Documentazione dei requisiti di accesso legale • Informazioni sulla reperibilità • Criteri di selezione per la digitalizzazione [= formato, set di caratteri] • Controllo della versione e distinguibilità fra oggetti informativi simili • Tracce di controllo create da sistemi di gestione di metadati [recordkeeping]
Descrittivi:metadati utilizzati per descrivere o identificare risorse informative • Registrazioni catalografiche • Indicazioni di aiuto per il reperimento • Indicizzazione su database specialistici • Connessioni fra risorse tramite link Web • Annotazioni di utenti • Metadati per sistemi di gestione [recordkeeping] generati dai programmi di creazione delle registrazioni
Conservazione: metadati riferiti alla gestione della conservazione delle risorse informative • Documentazione della condizione fisica delle risorse • Documentazione delle azioni intraprese per conservare le versioni fisiche e digitali delle risorse, per esempio ripristino [refreshing] e migrazione dei dati
Tecnici: metadati riferiti al funzionamento di un sistema e al comportamento dei metadati • Documentazione sull'hardware e il software • Informazioni sulla digitalizzazione, per esempio formati, rapporti di compressione, procedure di graduazione [scaling routines] • Tracciato storico dei tempi di risposta di sistema • Dati di autenticazione e sicurezza, per esempio chiavi crittografiche, password
Di utilizzo: metadati riferiti al livello e al tipo di utilizzo delle risorse informative • Registrazioni di visualizzazione [exhibit records] • Tracciato storico dell'uso e gestione dei profili utenti • Informazioni sulla riutilizzazione del contenuto e sull'esistenza di una pluralità di versioni [multi-versioning information
10. Quali sono i domini di appartenenza dei metadati? 3.Suddivisione dei metadati per domini di appartenenza
Possono essere creati • manualmente • automaticamente 11. Chi produce i metadati? • Publisher side • autori • webmaster • istituzioni Agenzie catalografiche nazionali Repository/site manager Archivi Autori, creatori risorse. Biblioteche domini Musei. metadati domini Editori. Terze parti:servizi di risoluzione URN agenzie identificatori: ISBN, ISSN, BICI, SICI, ... • Service side • servizi di ricerca • creatori: terze parti
Comunità di metadati ... • I metadati riflettono le esigenze delle comunità dai quali provengono • Differenti comunità producono documenti intellettuali peculiari all’utenza specifica che vi afferisce (matematici, fisici, chimici, …) • Comunità diverse parlano e necessitano di linguaggi specifici con i quali formulano la propria produzione intellettuale • I metadati prodotti da queste comunità riflettono necessariamente la struttura e la forma dei documenti da esse prodotti conseguenza dell’ampia gamma di comunità con interesse nei metadati è lo sconcertante numero di standard e formati esistenti o sotto sviluppo
12. I metadati sono sempre ad accesso libero? 7. Formati proprietari e formati standard • molte comunità di soggetti, in numerosi settori di mercato, sono fortemente attaccati ai loro formati • sui formati proprietari vi sono stati investimenti: in termini di documentazione, conoscenza e apprendimento, • sono stati sviluppati entro i sistemi creati per manipolare i dati e offrire servizi ad utenze specifiche. • Esiste tensione tra questo continuo progredire di formati specialisti e qualsiasi requisito per un livello di interoperabilità
13. Qual è la relazione tra metadati e interoperabilità? Il problema della diversità • L'interoperabilità è l'abilità dei sistemi di fornire/accettare servizi in termini di comunicazione comprensione reciproca attuata attraverso un colloquio reso possibile nonostante le differenze. • ai fini dell’interoperabilità è necessario • individuare uno schema di riferimento semplice • utilizzare terminologia controllata per una corretta corrispondenza semantica tra elementi • implementare servizi cross-domain per l’accesso a risorse provenienti da domini differenti
La mappatura: icrosswalk • da un confronto tra popolazioni diverse emergono basse aree di sovrapposizione • una risposta al problema della diversità è la produzione di crosswalk o mapping di metadati tra uno o più formati • ai fini della comparazione tra formati • al fine di stabilire il loro potenziale di interoperabilità • come base per la produzione di uno specifico programma di conversione di formati • per la produzione di sistemi di ricerca, i quali dovrebbero permettere l'interrogazione di formati di metadati eterogenei. • centralità del Dublin Core • formato strutturato semplice • facilità di creazione direttamente dai creatori di risorse
14. Quali prospettive per i metadati? 14. XML ...il linguaggio flessibile • XML = eXtensible Markup Language • XML può essere definito in molti modi diversi • XML è una sintassi per marcare i documenti • XML è una famiglia di tecnologie correlate • XML consente di • aggiungere metadati (semantica) ai propri dati • separare il contenuto dalla presentazione • definire in maniera rigorosa il linguaggio di markup utilizzato • utilizzare un formato neutrale e testuale
<?xlm version=1.0”?> <libro> <autore>Antonella De Robbio</autore> <titolo>Diritto d’autore</titolo> </libro> XLM <XML permetterà non solo di scambiare informazioni tra differenti sistemi operativi, ma anche si superare confini nazionali e culturali./> <?xlm version=1.0”?> <libro> <titolo>Antonella De Robbio</titolo> <autore>Diritto d’autore</autore> </libro> <XML e XSL permetteranno agli editori di scrivere una sola volta e pubblicare ovunque, su carta o in forma elettronica./> <?xlm version=1.0”?> <libro autore=“Antonella De Robbio”> <titolo>Diritto d’autore</titolo> </libro>
… ma da solo XML non è sufficiente ... • XML è troppo flessibile mentre è necessario un modello estremamente semplice per esprimere delle conoscenze elaborabili automaticamente • HTML è estremamente semplice ma non flessibile e perciò può solo rappresentare informazioni senza tener conto della semantica
Lo stack XML/RDF/DC • Il modello attuale prevede l’utilizzo di tre standard come strati diversi (layers comunicativi) • XML stabilisce la sintassi di base (struttura fisica) • RDF definisce la struttura delle relazioni (struttura logica) • DC definisce i contenuti (struttura per i contenuti)
15. Quando un modello per la rappresentazione dei metadati? Resource Description Framework (RDF) 15. RDF la terra di mezzo • RDF è un modello di metadati • RDF è una piattaforma per il trattamento dei metadati • RDF costituisce una ipotesi di soluzione individuata dal W3C al problema della rappresentazione dei metadati • RDF è complementare a XML “RDF, the middle layer, will only be visible to the wizards who invent new ways of cataloging, describing and organizing information - the librarian of the future.” Goldfarb, Prescod - The XML Handbook (p. 53)
16. Metadati perché? 16. Metadati chiave di accesso alla biblioteca ibrida • i metadati rappresentano la chiave d'accesso a differenti sistemi comunicativi, i quali utilizzano linguaggi diversi. • i metadati sono l'anello che congiunge i due mondi, quello della biblioteca tradizionale e le nuove forme nascenti di biblioteca digitale. • l'integrazione tra i due mondi, attuata dallo scambio comunicativo tra metadati, dà vita e origine ad un ambiente che prende il nome di "biblioteca ibrida". biblioteca ibrida Biblioteca fisica mondo degli oggetti reali Biblioteca digitale mondo degli oggetti trasposti dal reale o nati digitali metadati
"…Ma anche questo è solo un passo intermedio. Già da molto tempo i bibliotecari hanno capito che il modo migliore per accedere con facilità alle informazioni non consiste nel cercarle direttamente, ma nel restringere la ricerca a insiemi mirati e ristretti di dati: da qui nascono gli schedari delle biblioteche. Queste informazioni che riguardano altre informazioni sono chiamate metadati" [John Bosak e Tim Bray "XML e la Rete di seconda generazione". Le Scienze 373/sett.1999]