670 likes | 792 Views
Repositorios Tecnologías & Interoperabilidad. José Carvalho ( Universidade do Minho ) – jcarvalho@sdum.uminho.pt Curso de capacitación para formadores – Guadalajara (México), 22-24 de agosto 2011. Programa de formación.
E N D
RepositoriosTecnologías & Interoperabilidad José Carvalho (Universidade do Minho) – jcarvalho@sdum.uminho.pt Curso de capacitaciónpara formadores – Guadalajara (México), 22-24 de agosto 2011
Programa de formación Losprincipalesdesafios enfrentados pela humanidadsonglobales Investigación y comunicaciónen el mundo digital: Distribuida Global Red Colaborativa Orientada a la web Compartir recursos IlariaCapua, Berlin 5 Open Access http://hdl.handle.net/10760/10882
¿Cómo pueden los depósitos permitir a los investigadores a utilizar las publicaciones abiertas y los datos para hacer un trabajo interesante y útil? camino errado
Programa de formación "Por primera vez, la Internet nos da la oportunidad de construir una representación global e interactiva del conocimiento humano"Declaración de Berlín 2003
Un mundo que es más rápido, más fácil y más barato para encontrar medicinas y curar enfermedades. Modo de empleo: leer, procesar, mostrar, reutilización, intercambio, análisis, minería de datos, a través de disciplinas en entornos colaborativos, redes de acceso abierto Representación interactiva global del conocimiento (operatión por las máquinas) repositorios “abertos” Contenido de libre acceso, sin restricciones y de forma permanente a través de Internet
Programa de formación Elemento esencial en la creación de infraestructura: la interoperabilidad la capacidad de una máquina o sistema (repositorios) para el intercambio de información y servicios a otras máquinas
Programa de formación Repositorio abierto (interoperable) " Puede el intercambio de procesos, servicios y datos con otros sistemas para que puedan trabajar juntos de manera efectiva"" Repositorio de acceso abierto "Su contenido es accesible sin restricciones y de forma permanente a través de la Internet para ser usado"
Programa de formación Repositorio abierto (interoperable): • La arquitectura abierta (orientada a servicios) • Estándares y protocolos abiertos • Directrices detalladas sobre la forma de aplicar estas normas y protocolos
Programa de formación Arquitecturas Orientadas a Servicios (SOA) • Caracteristicas dos servicios: • Modulares, atómicos • Interfaces biendefinidas • Normasparainvocarlasoperaciones (SOAP/REST, XML) • Beneficios • Flexibilidad • Le permitecrear el mayor nivel de servicios • Le permitepersonalizarlasaplicaciones de usuario final • Reutilización de los servicios en diferentescontextos • Evolución: crearnuevosserviciosbasados en lasnecessidades • Orquestración de serviciosparacomplementarprocessos
Programa de formación Escenarios de interoperabilidad para los repositorios y sus normas y protocolos
un problema R1 R2 ? R3 R4 Búsqueda y descubrimiento in varias bases de datos
Programa de formación Open Archive Initiative (OAI) y el protocolo OAI-PMH Facilitar la búsqueda de eficiencia y visibilidad de las publicaciones científicas distribuidas en diferentes repositorios institucionales y temáticos.
otro problema R1 R2 ? R3 R4 Depósito múltiple
Programa de formación No se puede depositar en más de un repositorio con un solo clic: En la actualidad varios trabajos científicos son depositados individualmente en una fuente de financiación, o repositorios institucionales o temáticos ¿Cómo iniciar un proceso de depósito fuera del repositório: processador de texto, laboratorio, revista... Sword (Simple Web-services Offering Repository Deposit) http://www.swordapp.org
Programa de formación CRIS (gestión de los sistemas de investigación) • Gestión del contexto de la investigación RI (RepositorioInstitucional) • Gestión del contenido de la investigación
Programa de formación http://www.eurocris.org/Index.php?page=workshops&t=1
Programa de formación El nuevo objeto científico
Programa de formación DATOS Como la investigación médica se vuelve más compleja y que el público espera cada vez más de la medicina y la ciencia, el artículo ya no es el fin de la historia. Cada vez más, y con razón, consideró que el artículo científico es una instantánea de la investigación, recubiertas por la interpretación de sus análisis de los autores y los resultados de la investigación básica son datos muy crudos.
Programa de formación Es necesario que las máquinas hacen explícitas las relaciones (agregaciones) entre los objetos en la web, especialmente la relación entre el artículo y los datos Cornell/LANL Pathways Project
Programa de formación • Posibles enfoques alternativos: • OAI-ORE (ObjectReuse and Exchange) • TopicMaps • Linked Data (RDF)
Programa de formación OAI-ORE: Open Archive Initiative-Open Reuse and Exchange: http://www.openarchives.org/ore/
Programa de formación OAI-ORE Ejemplos de lo que podría lograrse (en formas interoperables): • Agrupación en el motor de búsqueda de resultados de acuerdo a los límites del objeto compuesto en lugar de o además de la lista de resultados agrupados. • Agrupación de todas las citas de un documento, en lugar de tener citas individuales, por ejemplo, decirle a la versión PDF, para contar la versión de PS, el número de citas de todos los componentes del objeto compuesto en un. • Proporcionar mapas de navegación de todos los componentes de un objeto compuesto. • Grupo de recursos y sus notas. • Enviar para un repositorio objetos compuestos (cf. Sword).
Programa de formación La web semántica, la verdadera oportunidad para la ciencia URI’s Ontologías RDF
Programa de formación Linking Open Drug Data (LODD) http://www.w3.org/wiki/HCLSIG/LODD
Pilares de la Interoperabilidad El caso de Proyeto RCAAP en Portugal http://projecto.rcaap.pt http://www.rcaap.pt
Pilares da Interoperabilidad Interoperabilidad
OAI-PMH enloProyeto RCAAP • Agrega el contenido de los 32 depósitos integrados en el Portal RCAAP • Simplifica los metadatos (Simplified DC) • Los conjuntos (sets) se pueden utilizar para exponer sólo una parte del repositorio (por ejemplo: set driver, ec_fundedresources, tesis, etc ...)
SWORD enloProyetoRCAAP • Protocolo para el depósito automático en los repositorios • Se utiliza para enviar los documentos (y metadatos) del Sistema de CurriculosDeGóispara DSpace. • Nueva versión breve (v2). • Permite el envío remoto de documentos en el repositorio institucional
Dublin Core • Esquema genérico de metadatos que puede ser simple o cualificada. • Se usa en conjunto en todos los repositorios del Portal RCAAP • Casi siempre se utilizan para la interoperabilidad entre los diferentes sistemas (ddi, ETD-MS, ...)
DirectricesDriver • Utilizados en la definición de los términos de agregación del Portal RCAAP • Permitir la interoperabilidad entre los metadatos del repositorio y los servicios • Todos los repositorios del portal RCAAP cumplen con los aspectos obligatorios de las directrices
Directrices DRIVER/DRIVER Guidelines • Desarrollado bajo el proyecto DRIVER - Digital RepositoryInfrastructureVisionforEuropeanResearch • Actual versión 2.0 (noviembre de 2008) • Traducido al español, japonés y portugués
¿Por qué se necesitan directrices? • Para guiar a los administradores de repositorios para garantizar la interoperabilidad y la compatibilidad con los servicios DRIVER • Para los desarrolladores de las plataformas de depósito de incorporar nuevas características en futuras versiones
Directrices DRIVER • Paso 1 - Directrices generales (Parte A) • Paso 2 - Directrices para los metadatos (Parte B) • Paso 3 - Directrices para el protocolo OAI-PMH
DirectricesGenerales (Parte A) Dos posibles niveles de compatibilidad con las directrices DRIVER: Nível Requerido Nível Recomendado
DirectricesGenerales (A) - Requerido • El repositorio contiene recursos textuales digitales • recurso textual = artículos científicos, tesis doctorales, documentos de trabajo, libros electrónicos y similares resultados de la investigación científica • Recursos textuales están en formatos generalizados y ampliamente utilizados (PDF, TXT, RTF, DOC, TeX ...). • Recursos textuales son de acceso libre, disponibles directamente desde el repositorio para cualquier usuario sin restricciones, como la autorización o el pago. • acceso libre = acceso sin ningún tipo de pago, otorgamiento de licencias, control de acceso con contraseña, control de acceso por IP, …
DirectricesGenerales (A) - Requerido • Recursos textuales están descritos mediante registros de metadatos. • Recursos textuales y de metadatos están unidos entre sí de modo que los usuarios finales pueden acceder a los recursos mediante el identificador de texto (normalmente una URL) en el registro de metadatos. • La dirección URL de un recurso introducido en los metadatos es accesible en todo momento y nunca cambia o se le asigna a otro recurso. • Un identificador único identifica el registro de metadatos y el recurso textual (no enlaces a sistemas externos, como un sistema nacional de bibliotecas o un editor).
DirectricesGenerales (A) - Recomendado • Verificación transparente de la integridad de un recurso textual. • Medidas de control de calidad (contenido científico) de los recursos textuales expuestos para limitarlos a, por ejemplo, los recursos textuales incluidos en el informe científico anual (o equivalente). • La dirección URL de un recurso registrado con los metadatos basado en un esquema de identificadores persistentes, tales como DOI, URN ...
Poner en práctica un Set Driver • Una forma de seleccionar y filtrar los registros que son relevantes para el conjunto. • Cuando se implementa un set DRIVER? • Cuando el repositorio contiene los documentos que no cumplen con la definición de "recurso textual": • contenido que no es literatura cientifica • contenidos de acceso restringido, controlado o embargados • contenido en formatos inusuales