300 likes | 424 Views
La Internet científica de libre acceso:. nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad Complutense de Madrid Becario FPI Comunidad de Madrid. Sumario. Evolución de la publicación científica en Internet
E N D
La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad Complutense de Madrid Becario FPI Comunidad de Madrid
Sumario • Evolución de la publicación científica en Internet • La necesidad de una Web Semántica • La publicación científica en Internet y la Web Semántica
La prensa científica • La validez del conocimiento científico es inversamente proporcional al tiempo que tarda en difundirse y directamente proporcional al número de científicos que reciben este conocimiento. • No se hace Ciencia si no se difunde ... rápidamente. • Necesidad de difundir y de hacerlo lo antes posible
Internet: Herramienta de difusión científica I • Desde finales de los 80 ya existe una infraestructura tecnológica usada para el intercambio de información científica entre universidades y centros de investigación
Internet: Herramienta de difusión científica II • El Protocolo de transferencia de hipertexto (HTTP) fue creado en 1990 en el CERN (Laboratorio Europeo de Física de las Partículas), como un medio para compartir los datos científicos a nivel internacional, instantáneamente y a bajo costo.
Los archivos de e-prints • En 1991 Paul Ginsparg, del Laboratorio Nacional de Los Alamos, Estados Unidos, funda el primer archivo de e-prints reconocido como tal, llamado arXiv.org y centrado en el campo de la Física.
El concepto de pre-publicación • Los repositorios de e-prints se establecen con el objetivo de comunicar a la comunidad científica los resultados de una investigación antes de su publicación en una revista. • Se busca un menor tiempo de publicación
Algunos ejemplos de e-prints • ArXiv.org: • http://www.arxiv.org/ • CogPrints: • http://cogprints.soton.ac.uk/ • NCSTRL: • http://www.ncstrl.org/ • NDLTD: • http://www.ndltd.org/ • RePEc: • http://netec.mcc.ac.uk/RePEc/ • Para ver más ejemplos: • http://www.osti.gov/eprints/ppnbrowse.html
El contexto en la Red • Problemas de recuperación de información científica: • Entre el silencio y el ruido documental • Del caos al orden • De la Web a la Web Semántica
XML y los lenguajes de marcado • Un sintaxis para la estructuración de documentos • La información es analizable por el hombre y por la máquina • Se trata de un esfuerzo global de la industria
Metadatos: Uso y necesidades • Intercambio • Distribución • Interoperabilidad entre aplicaciones
Archivos abiertos • De los archivos abiertos a los archivos distribuidos • De z39.50 a OAI-PMH: • complejidad frente a simplicidad • obsolescencia frente tecnologías punta • fuerte inversión frente a bajo coste
Algunos conceptos previos • Archivo como repositorio de artículos científicos • Harvesting como recolección de metadatos • Proveedor de Datos (Data Provider) • Proveedor de Servicios (Services Provider) • Interoperabilidad
Open Archives Initiative (OAI) • El principal objetivo de OAI es facilitar un entorno de interoperabilidad entre los archivos de e-prints.
OAI- Protocol Metadata Harvesting • El protocolo OAI (OAI-PMH) define un mecanismo para recolectar metadatos contenidos en los distintos archivos o repositorios
Funcionamiento básico de OAI-PMH imagen extraída de http://www.oaforum.org
Estructura de OAI-PMH imagen extraída de http://www.oaforum.org
Arquitectura básica de OAI-PMH Data Provider Service Provider Petición por HTTP SCRIPTS SCRIPTS OAI-PMH (XML) sobre HTTP SQL SQL SGBD 2 SGBD 1
Elementos a identificar imagen extraída de http://www.oaforum.org
Ejemplo I imagen extraída de http://www.oaforum.org
Ejemplo II imagen extraída de http://www.oaforum.org
¿Como creamos un sistema basado en OAI-PMH? • Existen múltiples implementaciones del protocolo • Data Providers y Services Providers (Harvesters) ya implementados y de libre acceso GNU/GPL • Multiples Tecnología: Java, PHP, Perl, ASP, etc
Software • CDSware del CERN • DSpace MIT • GNU E-prints • Greenstone Universidad de Waikato • OAICat, OAIHarvester OCLC • Para saber más: http://www.oaforum.org/oaf_db/list_db/list_software.php
¿Que más necesito? • Servidor Web (Apache) • Servidor BBDD (MySql, PosgresSQL) • Una implementación de OAI-PMH • Requerimientos específicos de cada implementación: Máquina Virtual Java, módulos Perl, PHP, etc
Mi experiencia • Plataforma: Linux (Debian) • SGBD MySQL • Servidores Apache 1.3.. TomCat (Para Java) • Implementaciones Services y Data Providers: • OAICat, OAIHarvester, OJS, implementación propia PHP = • COSTE 0
Otros campos de aplicación • Bibliotecas digitales • Cualquier tipo de colección de documentos electrónicos
Conclusiones y cuestiones para el debate • OAI surge de la necesidad de los científicos de optimizar el proceso de publicación de sus investigaciones, lo que garantiza su continuidad, ya que no es una necesidad creada a priori • OAI-PMH es aplicable más allá de los depósitos de e-prints • ¿Como encajan las editoriales en este entorno?