200 likes | 407 Views
SERGEN : Servidor General para la Biblioteca Digital de la Universidad de las Américas - Puebla. Héctor Cocoletzi Moreno Asesor: Dr. Alfredo Sánchez. Índice. Introducción Esquema de la Biblioteca Digital Problema Objetivos Generales Servicios Búsqueda y Recuperación de Información
E N D
SERGEN: Servidor General para la Biblioteca Digital de la Universidad de las Américas - Puebla Héctor Cocoletzi Moreno Asesor: Dr. Alfredo Sánchez
Índice • Introducción • Esquema de la Biblioteca Digital • Problema • Objetivos Generales • Servicios • Búsqueda y Recuperación de Información • Navegación Taxonómica • Otros Servicios
Introducción • Construcción de un acervo digital por parte de la Biblioteca de la UDLA-P • Desarrollo de aplicaciones y/o ambientes que dependen del acervo digital • Sistemas de Recomendación • Reserva Digital • Ambientes Personalizados • Agentes Móviles
Problema • Existen diversas aplicaciones a desarrollar cuya operación depende del acervo digital • Cada aplicación requiere de protocolos de comunicación con el acervo • Las aplicaciones tienen en común algunas funcionalidades • Mecanismos de Búsqueda y Recuperación de información • Espacios Vectoriales • Búsqueda Booleana Extendida
Objetivos Generales • Establecer un protocolo de intercomunicación entre aplicaciones (KQML, JINI o CORBA) • Diseñar e implementar un servidor general que provea servicios comunes, robustos y confiables a aplicaciones y/o ambientes que hagan uso de la Biblioteca Digital de la UDLA-P
Objetivos Específicos • Diseñar e implementar el protocolo de comunicación interagentes en una Biblioteca Digital (MICK) [Barceinas, 1998] • Implementar técnicas de búsqueda y recuperación de información como Espacios Vectoriales y Búsqueda Booleana Extendida [Pérez, 1998].
Búsquedas y Recuperación de Información • Espacios Vectoriales • Documentos representados en una matriz bidimensional • Renglones -> documentos • columnas -> términos contenidos en documentos • Entrada: vector de términos de consulta • Salida: términos de la base de datos más pegados a los de consulta • Criterio: ángulo de diferencia entre términos de consulta y términos de las base de datos
Búsquedas y Recuperación de Información... • Búsqueda Boolena Extendida • Técnica aplicada a consultas con conectivos lógicos “and” y/o “or” • Les asigna peso a los operaciones lógicas realizadas • Hace uso de criterios matemáticos para determinar el grado de similitud entre términos
Navegación Taxonómica • Problema: • existen diversas taxonomías o clasificaciones en la Biblioteca Digital: Biblioteca del Congreso (UDLA), Dewey, personales, etc. • Las clasificaciones son jerárquicas y están representadas como tuplas en la Base de Datos. • Objetivo: • encontrar una forma de recorrer las diversas taxonomías sin problemas
Otros Servicios • Visualización aplicada a recuperación de documentos de texto • Indización Semántica aplicada a documentos • Otras técnicas de Búsqueda y Recuperación de información • Búsqueda Booleana • Método Probabilístico • Reconocimento de Caracteres en Paralelo • Mecanismos de Consulta a Imágenes • Traducción automática de descripciones de libros
Para más información • Página personal • http://ict.udlap.mx/people/hector
Bibliografía • Barceinas, A. 1998. MICK: Un Marco de Comunicación Interagentes en una Biblioteca Digital. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas – Puebla. Cholula, Pue. 72820, México • Cabrera, J. 1997. Integración de Servicios y Agentes de Usuario en la Recuperación de Información en una Biblioteca Digital. Tech. Rep. No. ICT-97-2. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico • Emmerich, W. 1997. An Introduction to OMG / CORBA Proceedings of the 1997 international conference on Software engineering. 641–642 • Pérez, C. V. 1998. Agentes móviles en bibliotecas digitales. Tech. Rep. No. ICT-98-8. Laboratorio de Tecnologías Interactivas y Cooperativas, Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico. (Disponible en http://ict.udlap.mx/pubs). • Waldo, J. 1999. The Jini architecture for network-centric computing. Communications of the ACM. Vol. 42 No. 7, 76-82, julio
Conceptos Básicos • Definición de Biblioteca Digital • Grandes depósitos de grandes colecciones hetereogéneas (multimedios, diferentes formatos y tamaños de datos) [Sánchez, 1999] • “Es un ensamblaje de cómputo digital, mecanismos de comunicación y software necesario para reproducir, emular y extender los servicios provistos por bibliotecas convencionales como son la colección, catalogación, búsqueda y diseminación de la información”. Gladney citado en [Pérez, 1998]
Conceptos Básicos... • KQML (Knowledge Query Manipulation Language) • lenguaje de comunicaciónbasado en la teoría de actos del habla, usada en sistemas multiagentes para construir una capa lingüística y formalizar las acciones lingüísticas de los agentes • sus mensajes además de comunicar oraciones, comunican una actitud acerca del contenido (por ejemplo, afirmación, solicitud, pregunta) • se divide en tres capas: contenido, mensaje y comunicación
Conceptos Básicos... • CORBA (Common Object Request Broker Architecture) • se crea con el objetivo de simplificar el desarrollo de aplicaciones distribuidas y de proveer bases flexibles para servicios de más alto nivel. • es una especificación para una arquitectura estándar orientada a objetos para aplicaciones • utliza a los objetos como una metáfora de unificación para lograr poner todas las aplicaciones existentes dentro de un mismo canal y así permitir una interoperatividad
Conceptos Básicos... • JINI • arquitectura que provee una infraestructura para definir, propagar y encontrar servicios en una red • diseñada para soportar actualizaciones incrementales de componentes de red (hardware y software) • reemplaza la noción de periféricos y aplicaciones con la de servicios en red y clientes que usan esos servicios • definida en términos del lenguaje Java
JINI facilitala integración de aplicaciones de tipo distribuido requiere que el cliente y el servidor estén implementados en Java conserva las características de Java CORBA facilita la integración de aplicaciones de tipo heterogéneo y distribuido permite la independencia de plataforma, sistema operativo y lenguaje de programación entre el cliente y el servidor JINI y CORBA: algunas características
JINI fomenta el “plug and play” para los servicios en red sus componentes pueden verse como una extensión de Java promueve una arquitectura basada en servicios CORBA facilita la reusabilidad y portabilidad de componentes de las aplicaciones soporta diversos lenguajes de programación orientada a objetos con sus características JINI y CORBA: algunas características...