380 likes | 536 Views
Repositorio y metabuscador de cubiertas del CBUC. Consorci de Bibliotecas Università ries de Catalunya y Universitat Pompeu Fabra. IX Asamblea del Grupo Español de Usuarios de Innovative Universidad Pablo de Olavide Sevilla, 23 y 24 de marzo de 2011.
E N D
Repositorio y metabuscador de cubiertas del CBUC Consorci de Bibliotecas Universitàries de Catalunya y Universitat Pompeu Fabra IX Asamblea del Grupo Español de Usuarios de Innovative Universidad Pablo de Olavide Sevilla, 23 y 24 de marzo de 2011
Repositorio y metabuscador de cubiertas del CBUC • CBUC: • La misión del Consorcio de Bibliotecas Universitarias de Catalunya (CBUC) es mejorar los servicios bibliotecarios a través de la cooperación. • Formado por 10 instituciones miembros, 9 instituciones asociadas y muchas mas instituciones participando en proyectos. • Trabajando con 10 grandes proyectos. • Millennium e Innovative: • Catalogo colectivo (CCUC) • Gestión servidores de las universidades • Cluster Millennium • ...
Repositorio y metabuscador de cubiertas del CBUC • UPF: • Universidad pública creada en el año 1990 con sede en Barcelona • 8.500 estudiantes de grado • 3.000 estudiantes de postgrado • 1.300 personal docente e investigador (800 equivalentes a tiempo completo) • 580 Personal de administración y servicios • 22 titulaciones, 90 másters, 9 programas de doctorado
Repositorio y metabuscador de cubiertas del CBUC • Sumario: • Objetivos • Script de búsqueda a múltiples repositorios • Repositorio de cubiertas del CBUC • Mejorar el rendimiento con una caché
Repositorio y metabuscador de cubiertas del CBUC • Objetivos • Millennium sólo permite recuperar cubiertas desde un único proveedor. Debido a ello hemos puesto un servidor intermedio que hará la búsqueda en múltiples repositorios de diferentes proveedores. • Por otro lado hemos creado un repositorio propio para depositar las cubiertas que difícilmente nos serán proporcionadas por los proveedores comerciales. El CBUC se convierte en un proveedor más.
Repositorio y metabuscador de cubiertas del CBUC • Sumario: • Objetivos • Script de búsqueda a múltiples repositorios • Repositorio de cubiertas del CBUC • Mejorar el rendimiento con una caché
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios: • ¿Porqué? Cubiertas según proveedor
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios: • Sólo hace falta editar la weboption BIBIMAGE. Debe quedar así: • https://cobertes.cbuc.cat/cobertes.php?isbn=%s&institucio=XXXX|I|https://cobertes.cbuc.cat/cobertes_link.php?institucio=XXXX&isbn=%s • Se ha programado en PHP. No necesita acceso a ninguna base de datos. • A cada institución XXXX se le asocia un fichero de configuración dónde hay los parámetros de búsqueda a los diferentes repositorios.
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios: • Tenemos definidos los siguientes repositorios: • Syndetic Solution • Amazon • Repositorio CBUC • OpenLibrary (en pruebas) • LibraryThing (en pruebas) • Google (en pruebas) • Cada institución configura a qué proveedores busca y en qué orden. • Syndetic tiene un apartado propio de configuración.
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios: • Fichero de configuración de recursos
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios: • Ejemplo de fichero de configuración:
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios:
Repositorio y metabuscador de cubiertas del CBUC • Script de búsqueda a múltiples repositorios:
Repositorio y metabuscador de cubiertas del CBUC • Sumario: • Objetivos • Script de búsqueda a múltiples repositorios • Repositorio de cubiertas del CBUC • Mejorar el rendimiento con una caché
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Alojado en un servidor del CBUC • Programación PHP, base de datos Mysql • Las imágenes se guardan en el sistema de ficheros del servidor, en una estructura en pairtree • https://confluence.ucop.edu/download/attachments/14254128/PairtreeSpec.pdf?version=2&modificationDate=1295552323000 • Tiene tres niveles de usuarios: administrador global, administrador de institución, usuario final.
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Permite subir cubiertas escaneadas en formato jpeg, gif o png. • Se pueden subir los ficheros de forma individual o agrupados en un fichero zip. • Posibilidad de controlar el dígito de control del ISBN • Si la cubierta ya existe avisa. Da la posibilidad de sobrescribirla o conservar la existente. • Las cubiertas borradas se pueden recuperar
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Todas las cubiertas deben tener un identificador • ISBN • 8477203946 • Número de sistema del Catalogo Colectivo (CCUC) ampliado a 13 dígitos. • .b42877131 -> 1111142877131 • ISSN (en estudio)
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Permite buscar imágenes utilizando el ISBN o código
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Dispone de un módulo de estadísticas • Estadísticas globales • Estadísticas por institución • Permite descargar ficheros de log para procesamiento externo por las instituciones
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • El módulo de administrador global permite crear y gestionar instituciones y usuarios. También es el encargado de configurar los recursos de los proveedores de cubiertas • Se ha desarrollado un script para detectar posibles inconsistencias entre la base de datos y el sistema de ficheros. Envía los resultados por correo electrónico
Repositorio y metabuscador de cubiertas del CBUC • Repositorio de cubiertas del CBUC: • Como pintar una cubierta en una página web cualquiera: • Buscando a múltiples repositorios: • Buscando directamente al repositorio del CBUC:
Repositorio y metabuscador de cubiertas del CBUC • Sumario: • Objetivos • Script de búsqueda a múltiples repositorios • Repositorio de cubiertas del CBUC • Mejorar el rendimiento con una caché
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Las pantallas de browse muestran simultáneamente hasta 50 cubiertas. • El tiempo de respuesta de los proveedores comerciales es demasiado grande. Para cargar al completo una pantalla de browse se tarda del orden de 30 o 40 segundos
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Con el uso de la caché el tiempo de respuesta mejora sustancialmente. La misma pantalla de browse se carga en tan sólo 6 segundos. • Hemos mejorado la velocidad más de 5 veces
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Proveedores de cubiertas: • Syndetic Solutions • Amazon • OpenLibrary • Los usuarios pueden colgar cualquier imagen. Hay que revisarlas • GoogleBooks • Cubiertas pequeñas y marcadas. Bloqueo script detección proceso automático • LibraryThing • Comercial (?)
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Prioridades de carga: • Syndetic Solution • Amazon • OpenLibrary
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Características • No se necesita ninguna base de datos • Las imágenes se guardan en el sistema de ficheros en una estructura en pairtree • Se integra en el metabuscador como si fuera un proveedor más. • De momento sólo está operativo en la UPF
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Recolección inicial en febrero del 2010 a partir de 292.372 ISBN • Syndetics: 65h40m -> 54.120/54.144 cubiertas • Amazon: 32h37m -> 22.031/64.054 cubiertas • OpenLibrary: 60h47m -> 7.388/84.559 cubiertas • Total: 84.074 cubiertas • Recolección diaria: • Para Syndetic y Amazon diariamente se recolectan y cargan cubiertas de los nuevos ISBN del sistema • Para OpenLibrary diariamente se recolectan. Mensualmente se revisan y finalmente se cargan • Total en marzo 2011: 90.408 cubiertas
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Proceso de recolección: • Obtener un fichero de ISBN con “crear listas” • Ejecutar para cada ISBN un php que recolecta la cubierta. • Cargar las cubiertas recolectadas en el sistema de ficheros (pairtree) • Se aprovecha la carga para redimensionar las cubiertas a un máximo de 70x100 px
Repositorio y metabuscador de cubiertas del CBUC • Mejorar el rendimiento con una caché: • Integración con el metabuscador: • Se crea un script de recuperación: • se le pasa el parámetro ISBN • accede al pairtree • devuelve la cubierta • Se configura cómo un recuso más:
Repositorio y metabuscador de cubiertas del CBUC • Conclusiones finales: • Acceso a mayor número de cubiertas(catálogos Millennium y no Millennium) • Aportación de las cubiertas y Imágenes de nuestras colecciones que nunca van a estar en otros repositorios • Acceso más rápido
Repositorio y metabuscador de cubiertas del CBUC • Gracias por su atención: Antoni Borràs – UPF antoni.borras@upf.edu Jordi Pallarès – CBUC jpallares@cbuc.cat
Contraportada IX Asamblea del Grupo Español de Usuarios de Innovative Universidad Pablo de Olavide Sevilla, 23 y 24 de marzo de 2011