620 likes | 789 Views
Flujos de trabajo en la gestión de un repositorio institucional. Antonio Juan Prieto Jiménez Jordi Serrano-Muñoz Universitat Politècnica de Catalunya. ¿Quiénes somos?. Sumario. Razón de ser ¿Biblioteca? Agentes ¿Empezamos? Check-list Como organizarlo Interoperabilidad e integración
E N D
Flujos de trabajo en la gestión de un repositorio institucional Antonio Juan Prieto Jiménez Jordi Serrano-Muñoz UniversitatPolitècnica de Catalunya
Sumario • Razón de ser • ¿Biblioteca? • Agentes • ¿Empezamos? • Check-list • Como organizarlo • Interoperabilidad e integración • Sostenibilidad • Soporte • Infraestructura TIC • Mas tareas • La UPC en cifras • Repositorios en la UPC
Repositorios: Razón de ser (I) • Ofrecer a nuestra comunidad una herramienta o aplicación para publicar sus trabajos académicos, en acceso abierto y en texto completo en Internet • Garantizar el acceso perpetuo a los trabajos archivados mediante su almacenamiento en servidores seguros mantenidos y gestionados por la ¿Biblioteca? • Mejorar la visibilidad de la organización y sus autores en la red.
Repositorios: Razón de ser (II) • ¿De verdad necesitamos crear, gestionar y mantener un repositorio? • Analicemos las implicaciones: • ¿Está la organización madura? • Dimensiones • Capacidades • Recursos: personas, infraestructura, económicos, ….
Repositorios: Razón de ser (y III) • No lo necesitamos: • Esperamos la oportunidad • Creamos las condiciones • Preparamos el terreno • No hacemos nada • Si lo necesitamos • ¿Podemos hacerlo? • Lo tenemos claro • Alianzas / Colaboraciones
Repositorios: ¿Biblioteca? (I) • La implementación, gestión, organización no es solo una responsabilidad de la biblioteca • Es de toda la institución • Requiere un compromiso institucional • Si no hay compromiso…. ¿Para que queremos un repositorio?
Repositorios: ¿Biblioteca? (y II) La institución debe comprometerse con el control y la protección de su producción intelectual en soporte digital Alicia López Medina (UNED)
Repositorios: Agentes (I) • Implicación a diferentes niveles: • Órganos de gobierno • Gestores / administradores • Docentes / investigadores, … • Oficina de apoyo a la investigación y transferencia de tecnología • Sistemas de información • ….. Y también biblioteca
Repositorios: Agentes (y II) • Necesitamos la complicidad y el compromiso de nuestro entorno • No debemos “lanzarnos a la piscina” solos, en ese caso lo mas probable es que fracasemos • Cada uno de los agentes tiene su responsabilidad, su tarea y evidentemente diferentes niveles de implicación
Repositorios: ¿Empezamos? • Habrá que hacer pasillos y “cafés” • Crear complicidades • Explicar cuales son los beneficios para el investigador / docente y para la organización también para la sociedad • Implicará un cambio cultural • Pensemos en la lista de tareas e implicaciones • Y naturalmente en asignarle un presupuesto Atención: ¡esto no es un proyecto!
Repositorios: Check-list (I) / • Visión, misión, objetivo del repositorio • ¿Qué representa el repositorio para la organización? • ¿Qué contenidos? • ¿Hemos identificado a los agentes? • ¿La organización tiene una política sobre la propiedad intelectual? • ¿Se han analizado los riesgos?
Repositorios: Check-list (II) • ¿No habrá ya por ahí algún repositorio? • ¿Tenemos el soporte institucional? ¿Está la institución “madura”? • La organización y los agentes, ¿Están preparados? ¿Están capacitados? • ¿Tenemos algún “champion” como cómplice? • ¿Hemos definido roles, responsabilidades, etc.. para el desarrollo del repositorio?
Repositorios: Check-list (y III) • ¿Hay financiación? • ¿Qué estadísticas, datos e informes facilitaremos del repositorio? • ¿Y el ROI? Fuente: JISC: Planning Checklist - Before You Start Repositories Support Project
Repositorios: Como organizarlo (I) • Identificar comunidades, usuarios, contenidos,… • Quien deposita o almacena • Procedimientos: • Flujos y roles: aceptación, moderador/validador, revisor • Mandato • Licencias
Repositorios: Como organizarlo (II) • Metadatos, normalización, … • Políticas de preservación migración de formatos • Dominio, hosting, backup/copias de seguridad, actualizaciones, migraciones … No estamos solos en esto
Repositorios: Como organizarlo (III) • Diferentes implicaciones = diferentes niveles: • “Políticos” • Tecnológicos • Gestión • Se trata de una carrera de fondo: ¿Empezamos por un “piloto”? …. pero …. • ….. ¿De verdad que necesitamos el repositorio?
Repositorios: Como organizarlo (IV) • Modelo centralizado único repositorio para todos los contenidos • Modelo diversificado: • Ajustar los modelos de metadatos. • Adaptarse a la naturaleza de los contenidos. • Trabajar las particularidades de los documentos. • Facilitar su integración con otros sistemas de información. • Adaptarlos a la organización de la biblioteca • Desarrollo tecnológico mas flexible
Repositorios: Como organizarlo (y V) • Modelo centralizado: • Fácil de gestionar • Incidencias con las "excepciones" • Modelo diversificado: • Incremento en los costes de mantenimiento. • Dispersión de contenidos y posible confusión en la comunidad de usuarios Conocer la organización la decisión es de todas las partes
Interoperabilidad e integración (I) • Con otros sistemas de información: • De la organización • Externos • Podemos compartir / reusar información • Se pueden generar nuevas aplicaciones / utilidades • Mejoramos tareas / flujos de trabajo • Todos ponen / Todos ganan • Disponemos de estándares No inventemos la rueda
Interoperabilidad e integración (y II) • OAI-PMH • DublinCore • SWORD • SOA • IMS • SCORM • ….incluso el MARC
Sostenibilidad • Estamos preparados respecto a: • Crecimiento de repositorio • Infraestructura TIC • Presupuesto asignado • Personal y su gestión • Updates / Migraciones • Preservación Calculemos a medio / largo plazo
Soporte • Legal, TIC, Gestión ….. • Modelo(s) de metadatos • Plataforma(s) • Políticas de colecciones y de acceso • Gestiónusuarios → roles, flujos … • Interacción con los agentes • Capacidad de respuesta (compromiso)
Infraestructura TIC • In house / externalizado • Cloud • Compartido • Atención a los SLA (la letra pequeña) • Backup Evaluar costes…….
Más tareas • Mandato ¿Work in progress? • Autores ¿Están dispuestos a colaborar? • Algún tipo de incentivo • Difusión interna / externa • Alta directorios / Google Scholar • ...... ¿de verdad que necesitamos un repositorio?
La UPC en cifras 2010-2011 (I) Titulaciones • 69 titulaciones de grado • 19 dobles titulaciones • 85 convenios internacionales de doble titulación • 61 programas de máster • 46 programas de doctorado • 363 programas de formación continua (másteres UPC y cursos de posgrado) • Comunidad • 44.221 estudiantes • 2.780 personal docente e investigador • 1.694 personal de administración y servicios • Distribuida en • 11 campus y centros territoriales • 23 escuelas y facultades • 13 bibliotecas • +/-100 personas
La UPC en cifras 2010-2011 (II) • Departamentos, institutos y centros de investigación • 42 departamentos • 6 institutos de investigación • 183 grupos de investigación • 17 centros específicos de investigación • 19 Centros de investigación en la red TECNIO • 19 Centros de investigación vinculados Investigación • 64.164.414 € Ingresos por proyectos I+D+i y transferencia tecnológica • 101 Distinciones científico-técnicas recibidas • 843 nuevos convenios y proyectos de investigación • 2.070 artículos publicados en revistas científicas • 78 patentes Universidad y Empresa • 2.680 empresas y entidades con convenio de colaboración • 14 empresas creadas y participadas (Programa Innova y Innova 31) • 21 cátedras y aulas de empresa
La UPC en cifras 2010-2011 (y III) • 13 bibliotecas • +/-120 personas • Modelo diversificado • 2 TB. Contenidos • +/-64.000 documentos • Desde CRIS 9.700 documentos revisados / año • 47% personal implicado en estas tareas • En algunos casos representa el 25% de su tarea
Repositorios en la UPC • Modelo diversificado: • 2001: TDX • 2002: Archivo Gráfico de la ETSAB • 2003: Videoteca Digital de la UPC • 2004: Trabajos académicos • 2005: Revistas y congresos • 2006: E-prints • 2007: OCW Materiales docentes • 2010: Fondo histórico bibliotecas UPC • 2011: Nuevo OCW • 2012: Depósito de exámenes
Integración • Recuperar la información donde se genera o introduce por primera vez • Evitar duplicar tareas • Actualizaciones => Estándares (SWORD, OAI, RSS, etc.) • Importancia en el crecimiento repositorio
Estándares: extraer información • OAI-PMH • Nuevos formatos de metadatos añadidos • Módulo OAIExtended: sets específicos (driver, OpenAIRE, etc.) • RSS • Ampliado para casos específicos (ItunesU, Universia, etc.)
Estándares: Carga de datos Simple Web-services Offering Repository Deposit • Un protocolo para depositar en repositorios entre aplicaciones • Proyecto financiado por JISC iniciado en 2007 • Implementado para diversas plataformas (DSpace, Eprints, Fedora, IntraLibrary) • Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB) • Dos operaciones básicas • Servicedocument • Deposit
SWORD: formato METS (I) • Llamada HTTP en la que se envía un archivo ZIP comprimido en formato estándar METS que contiene: • Archivo xml con las datos del recurso (archivo mets.xml) • Documentos propios del recurso … Memoria.pdf Annex.pdf … • Mets.xml • (datos del recurso: • Autor • Tutor • Titulo • Fechas • Palabras clave… )
SWORD: formato METS (II) Cabecera Metadatos descriptivos en formato MODS/SWAP/etc. Licencia Creative Commons Lista archivos Mapa estructural -- --
SWORD – Llamada deposit HTTP POST Cliente Servidor SWORD UPCommons POST /deposit/123456789/18 HTTP/1.1 Host:eprints.upc.es/pfc-sword Content-Type: application/zip Authorization: Basic ZGFmZnk6c2VjZJldA== Content-length: nnn Content-MD5: md5-digest Content-Disposition: filename=mydeposit.zip X-Format-Namespace: METS RESP HTTP 201 CREATED <?xmlversion="1.0" encoding="UTF-8"?> <atom:entryxmlns:atom="http://www.w3.org/2005/Atom"xmlns:sword="http://purl.org/net/sword/"> <atom:id>info:something:1</atom:id> … </atom:entry>
Puesta en marcha • Pasos iníciales • Ver las necesidades de datos a enviar • Explicación del protocolo y formato • Preparar un entorno de desarrollo • Creación deun wiki con información sobre: • Datos necesarios para el envío del recurso • Como se mapean estas datos dentro del formato METS • Como se envían (SWORD) • Enlaces a librerías en diferentes formatos de programación
Otras • No siempre existen los estándares adecuados • Debemos hacer cambios específicos para casos concretos (solo “si no hay más remedio”) • Exportación de bases de datos, cargas manuales, etc. • Cambios bien documentados
Visión General DRAC Portal producción científica BD EXPORT Doctorat Catálogo Atenea OAI-PMH TDX UPC E-prints UPC GD Escuelas Trabajos académicos UPC OCW UPC GD Escuelas SWORD PRISMA BD EXPORT Videoteca UPC Exámenes UPC RSS ITunesU Fondo Antiguo UPC Revistas y congresos UPC SWORD GD Escuelas SWORD MediaTIC OAI-PMH SWORD OJS MDC
E-prints UPC • Integración con DRAC (CRIS de la UPC) • Portal producción científica UPC • Driver / OpenAIRE
Integración DRAC DRAC, el Descriptor de la Recerca i l’ActivitatAcadèmica de la UPC: http://drac.upc.edu/info • Sistema que registra la actividad académica de la UPC • Generación CVN • Intervención del SBD en la definición del proyecto y posterior participación en los workflows de revisión de datos • Integrado con UPCommons • “Política institucional de acceso abierto: acceso, visibilidad, impacto y preservación de la producción académica de la UPC en Internet”
Modelo de integración • Integración en dos fases: 1. Envío: • Introducción metadatos básicos en DRAC • Obligatoriedad de introducir enlace o archivo • Si se introduce archivo, se conecta a UPCommons 2. Revisión: • Revisión de metadatos básicos en DRAC • Revisión de metadatos propios de UPCommons, validación de las condiciones de acceso y publicación final • Autenticación simultánea en ambas aplicaciones mediante CAS
Integración DRAC: Pasos PASO 1: Carga archivo PASO 2: Aceptación licencia
Portal Producción científica Portal de la Producción científica de la UPC http://bibliotecnica.upc.edu/producciocientifica
Evolución E-prints UPC Antes de DRAC 2262 reg. (4 años) Con DRAC 4214 reg. en abierto (2 años) 2804 reg. acceso restringido (2 años)
Trabajos académicos UPC • Envío de los PFC/TFC desde las aplicaciones de gestión de las escuelas • Proceso de carga de registros al catálogo