130 likes | 260 Views
Universidad de la República - Facultad de Ingeniería Instituto de Computación Proyecto de Grado 2005 Evoluci ó n de sistemas de Web Warehousing guiado por Parámetros de calidad. Integrantes Daniela Vila Martín Balestra. Tutoras Regina Motz Verónika Peralta. Introducción.
E N D
Universidad de la República - Facultad de Ingeniería Instituto de Computación Proyecto de Grado 2005 Evolución de sistemas de Web Warehousing guiado por Parámetros de calidad Integrantes Daniela Vila Martín Balestra Tutoras Regina Motz Verónika Peralta
Introducción Se presenta la arquitectura a alto nivel con el propósito de identificar los principales módulos del sistema y la metadata que cada uno de ellos exporta. Se intentará mostrar una aproximación a la estructura y el formato en que la metadata es presentada, y se realizará un análisis de la misma.
Arquitectura del Sistema Extraido de referencia [1]
Diseño de Wrappers Extraido de referencia [2]
Metadata Exportada De los cinco módulos identificados solo dos exportan metadata del proceso: el Extractor y el Generador de Salida: • Metadata exportada por el módulo Extractor • Consiste en un archivo XML con la definición de las reglas para la extracción de información de las páginas Web. • Ejemplo de metadata exportada por el Extractor: Extraido de referencia [2]
Metadata exportada por el módulo Generador de Salida • Exporta dos tipos de metadata: • Un archivo XML con las reglas que fueron aplicadas del conjunto de reglas definidas. • Un archivo XML con la agrupación de infromación extraída por las reglas aplicadas, ya que para una página Web varias reglas pueden extraer información para una misma entidad. Esta información es ordenada y complementada. Su estructura es similar a la anterior.
Ejemplo de metadata exportada por el Generador de Salida : Extraido de referencia [2]
Diseño de Mediadores Intermedios Extraido de referencia [2]
Metadata exportada por el módulo Limpieza y Homogenización de Datos • Un archivo XML donde para cada atributo de un elemento se especifica la información original extraída de ese atributo. • Ejemplo de metadata exportada: Extraido de referencia [2]
Metadata exportada por el módulo Fusión de Datos • Un archivo XML donde se encuentra el mapeo de la información extraída hacia su fuente original. • Ejemplo de metadata exportada: Extraido de referencia [2]
Mediador Final y Mapeo al Web Warehouse • Dado que el alcance del proyecto anterior no abarca estos dos módulos, no se tiene aún información precisa de la metadata generada. • De todas formas se estima que debe existir algún tipo de información relacionada a la ejecución de esta parte del sistema.
Conclusiones • Se excluyeron archivos de definición de estructura, ontologías y definición de reglas de filtrado por no considerarse relevantes para el manejo de la evolución del Web Warehouse. • Se posee suficiente información en lo que respecta al alcance del proyecto anterior (referencia [1]), pero no se tiene información de la metadata exportada por los dos últimos módulos del sistema (mediador final y mapeo al Web Warehouse).
Referencias [1]A. Marotta, R. Motz, R. Ruggia. Managing Source Schema Evolution in Web Warehouses. International Workshop on Information Integration on the Web (WIIW ‘2001). [2] V. Giaudrone, M. Guerra, M. Vaccaro. Informe General. Proyecto de Grado 2004. Extracción e integración en una arquitectura de Web Warehouse.