470 likes | 592 Views
METADATOS EN LA BIBLIOTECA DIGITAL. Julián Cellini Claudia González Yanina González Terán. Mónica Pené. Gustavo Archuby. Karina Presta. Adrián Mastronardi. Temas. Introducción Descripción de un recurso Implementación para la Interoperabilidad. Introducción.
E N D
METADATOS EN LA BIBLIOTECA DIGITAL Julián Cellini Claudia González Yanina González Terán Mónica Pené Gustavo Archuby Karina Presta Adrián Mastronardi JBD - GIDRID
Temas • Introducción • Descripción de un recurso • Implementación para la Interoperabilidad JBD - GIDRID
Introducción • Desde el modelo tradicional Nuevo contexto • Nuevas tecnologías de Información • Metadatos en 3 niveles de acción JBD - GIDRID
Modelo tradicional SISTEMA DE INFORMACION DOCUMENTAL DOCUMENTOS Libros Revistas Legislación Tesis Videos Música Estadísticas Mapas … etc. JBD - GIDRID
Modelo Tradicional SISTEMA DE INFORMACION DOCUMENTAL DOCUMENTOS Libros Revistas Legislación Tesis Conocidos Videos Música Estadísticas Mapas … etc. USUARIOS JBD - GIDRID
Modelo Tradicional SISTEMA DE INFORMACION DOCUMENTAL DOCUMENTOS Libros Revistas Legislación Tesis Conocidos Videos Música Estadísticas Mapas … etc. USUARIOS SRI Borges El Aleph Bs. As. Sud. 1965 Autor Titulo Lugar Editorial Fecha ISBD ACR Representación CDU MARC TES EM JBD - GIDRID
Nuevo Contexto WEB OID E-Libros Revistas E BD Bibl. Imágenes Audio/Video Software Sitios Web Obj.Apren. JBD - GIDRID
Nuevo Contexto WEB OID E-Libros Revistas E BD Bibl. Imágenes Audio/Video Software Sitios Web Obj.Apren. USUARIOS Multilingüismo JBD - GIDRID
Nuevo Contexto WEB OID E-Libros Revistas E OPACs BD Bibl. Imágenes Audio/Video Software Estadísticas Obj.Apren. USUARIOS SRI DR Bca. Dig. Orig. Multilingüismo DC W3C JBD - GIDRID
Evolución de las TI • HTMLMETAETIQUETAS • XMLESQUEMAS • RDFPERFILES DE APLICACIÓN JBD - GIDRID
HTML - Metaetiquetas • META <HTML> <HEAD> <META NAME = "DC.title" CONTENT="Hänsel und Gretel"> <META NAME = "DC.creator" CONTENT="Grimm Brothers"> <META NAME = "DC.language" CONTENT="de"> <META NAME = "DC.subject" CONTENT = "fairy tale, Grimm Brothers, child protagonist, brother and sister, woodcutter, stepmother, forest, poverty, child neglect, witch, cannibalism"> <META NAME = "DC.format" CONTENT="text/html; images/gif; audio/ra"> <META NAME = "DC.identifier" CONTENT="http://www.vcu.edu/hasweb/for/grimm/haensel.html"> <META NAME = "DC.source" CONTENT="1857 edition of Haus- und Kindermärchen der Brüder Grimm"> <META NAME = "DC.relation" CONTENT="Grimm fairy tale number 15"> <META NAME = "DC.rights" CONTENT="Free use for educational purposes"> ... • LINK <LINK rel="Index" href="../index.html"> <LINK rel="Next" href="Chapter3.html"> JBD - GIDRID
XML <?xml version="1.0" encoding="ISO-8859-1" ?> <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> .... JBD - GIDRID
XML - Esquemas <?xml version="1.0" encoding="UTF-8"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="http://purl.org/dc/elements/1.1/" targetNamespace="http://purl.org/dc/elements/1.1/" elementFormDefault="qualified" attributeFormDefault="unqualified"> ... <xs:element name="any" type="SimpleLiteral" abstract="true"/> <xs:element name="title" substitutionGroup="any"/> <xs:element name="creator" substitutionGroup="any"/> <xs:element name="subject" substitutionGroup="any"/> .... JBD - GIDRID
RDF <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about=“El Aleph”> <dc:creator>J. L. Borges</dc:creator> </rdf:Description> </rdf:RDF> JBD - GIDRID
Niveles de Acción • Instanciación • Estructuración • Interoperabilidad JBD - GIDRID
Descripción de un recurso JBD - GIDRID
Descripción de un recurso • El objeto de información • Su forma • Su identificación • Su descripción JBD - GIDRID
Descripción de un recurso • Diversidad de Estándares • El estándar único • El contexto del SID • La semántica JBD - GIDRID
Descripción de un recurso • La descripción • Estándares de metadatos • CDWA Standard • Dublin Core • Control de vocabulario y autoridades • AAT / ULAN / ICONCLASS / TGN JBD - GIDRID
Página Catedral JBD - GIDRID
Descripción de un recurso • Dublin Core • Creator: Alí Mustafa • Title: La Catedral de La Plata • Publisher: Organización de Estados Iberoamericanos. Oficina Regional en Bogotá. CO • Date: 1999 06 • Description: Artículo sobre el reconocimiento que hiciera el Vaticano a la Catedral de La Plata como una de las más importantes del mundo. • Subject: catedrales, construcciones religiosas, neogótico • Coverge: La Plata, Argentina • Identifier: http://www.oei.org.co/sii/entrega17/art02.htm • CDWA • Object/Work_Type: catedral • Creation_Creator_Identity: Pedro Benoit • Creation_Creator_Role: arquitecto • Titles or Names Text: Catedral de La Plata • Creation-Date: 1884 • Current Location - Geographic Location: La Plata, Argentina • Subject Matter: 11Q711 • Styles/Periods/Groups/Movements - Description: De las obras neogóticas en América, es una de las más importantes. JBD - GIDRID
RDF • Resource Description Farmework JBD - GIDRID
RDF • Resource Description Farmework (RDF) • Lenguaje para representar información acerca de recursos • Pensado para el procesamiento automático • Representa recursos que pueden identificarse en la web JBD - GIDRID
Conceptos • Metadatos para RDF • “El Aleph tiene como autor a J. L. Borges” JBD - GIDRID
Problemas • Lenguaje natural • Ambiguo • No entendible por una máquina JBD - GIDRID
Ambigüedad • Cómo compartir información • ¿Qué es "El Aleph"? • ¿Qué significa “autor”? • ¿"J. L. Borges" o "Borges"? • ¿Qué pasa si hay dos "J. L. Borges"? JBD - GIDRID
Procesamiento • No entendible por una máquina • No tiene una sintaxis y semántica bien definida • Se debe usar un lenguaje común (intercambio) JBD - GIDRID
Soluciones • RDF resuelve estos problemas • AmbigüedadReferencias URI • Procesamiento automático XML JBD - GIDRID
URL • URL (Uniform Resource Locator) • Identifica un recurso Web mediante la representación del mecanismo de acceso • Utiliza la ubicación en la red • Ejemplos • http://www.gidrid.com.ar/index.html • ftp://ftp.mozilla.org JBD - GIDRID
URI • URI (Uniform Resource Identifier) • No están limitados a recursos web • Pueden identificar personas, conceptos, etc. • Todas las URL son URI • Ejemplos: • todas las URL anteriores • mailto:info@gidrid.com.ar • urn:isbn: 950-04-0163-0 JBD - GIDRID
Referencias URI • RDF utiliza Referencias URI • URI + "#" + identificador de fragmento. • Permiten identificar una parte de un recurso • Ejemplo • http://www.gidrid.com.ar/index.html#staff JBD - GIDRID
Ejemplo “El Aleph tiene como autor a J. L. Borges” JBD - GIDRID
XML • El XML nos provee • Namespaces • Nos permite usar varios esquemas en un mismo XML • XSLT • Nos permite transformar un XML en otro • Bibliotecas de funciones • Lengua común JBD - GIDRID
Ejemplo <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about="urn:isbn:950-04-0163-0”> <dc:creator rdf:resource= "http://www.biblio.org.ar/personas/borgesjl.html”/> </rdf:Description> </rdf:RDF> JBD - GIDRID
Ejemplo <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about="urn:isbn:950-04-0163-0”> <dc:creator rdf:resource= "http://www.biblio.org.ar/personas/borgesjl.html”/> </rdf:Description> </rdf:RDF> JBD - GIDRID
Ejemplo <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about="urn:isbn:950-04-0163-0”> <dc:creator rdf:resource= "http://www.biblio.org.ar/personas/borgesjl.html”/> </rdf:Description> </rdf:RDF> JBD - GIDRID
Ejemplo <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about="urn:isbn:950-04-0163-0”> <dc:creator rdf:resource= "http://www.biblio.org.ar/personas/borgesjl.html”/> </rdf:Description> </rdf:RDF> JBD - GIDRID
Ejemplo <?xml version="1.0"?> <rdf:RDF xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=“http://purl.org/dc/elements/1.1/”> <rdf:Description rdf:about="urn:isbn:950-04-0163-0”> <dc:creator>J. L. Borges</dc:creator> </rdf:Description> </rdf:RDF> JBD - GIDRID
OAI-PMH • Open Archives Initiative • Protocol for Metadata Harvesting JBD - GIDRID
OAI-PMH • Open Archives Initiative • The Digital Library Federation (DLF) • Coalition for Networked Information (CNI) • National Science Foundation (NSF) • Protocol for Metadata Harvesting • HTTP • XML • Dublin Core JBD - GIDRID
Estrategias • Búsqueda distribuida • Recolección y centralización JBD - GIDRID
Búsqueda distribuida • Diferencias entre leguajes de búsqueda • Dificultad en procesar los resultados • No escala bien Server 1 Resultado 1 Exp Exp Server 2 Exp Interfaz de búsqueda Usuario Resultado 2 Resultados 1 + 2 + 3 (Ordenados) Exp Resultado 3 Server 3 JBD - GIDRID
Recolección y centralización • Un solo lenguaje de búsqueda • Una sola fuente de datos en la búsqueda • Actualización en lotes • Escala mejor Server 1 Actualización Proveedor de servicio Exp Server 2 Server Local Interfaz de búsqueda Usuario Actualización Resultados (Ordenados) Actualización Server 3 JBD - GIDRID
Definiciones • Recolector • Cliente del Repositorio • Concentrador • Repositorio • Servidor de datos • Proveedor GET/POST Recolector Repositorio HTTP XML JBD - GIDRID
Definiciones • Recurso • Ítem • Identificador • Registro • Conjunto Recurso Identificador MIRO723 Ítem Metadatos de la obra Ítem Metadatos de la obra Ítem Metadatos de la obra Ítem Metadatos de la obra Ítem Metadatos de la obra Conjunto Pinturas Ítem Metadatos de la obra Ítem Metadatos de la obra Registro DC Registro Formato Propio JBD - GIDRID
Protocolo • Basado en fecha de alta/baja/modificación • Pide las novedades desde la última “visita” • Requiere un identificador de registro • Fácil de implementar • Esquemas de metadatos • DC no calificado (requerido) • Otros pueden ser pedidos/provistos JBD - GIDRID
Preguntas? JBD - GIDRID