1 / 23

Integración de Datos

Integración de Datos. Integración : read-only. Carácterísticas: necesidad de fusión de datos Abordajes : virtual (basado en modelo de descomposici ón de consultas, enviando las subconsultas a las BD fuentes y mezclando las respuestas.)

sheri
Download Presentation

Integración de Datos

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Integración de Datos

  2. Integración: read-only • Carácterísticas: necesidad de fusiónde datos • Abordajes: • virtual (basado en modelo de descomposición de consultas, enviando las subconsultas a las BD fuentes y mezclando las respuestas.) • Close Word Assumption (CWA)La vista integrada posee exactamente la union de los datos en las BD fuentes. Vista construida “bottom-up” • Open Word Assumption (OWA) La respuesta provista a través de una vista integrada tendrá un subconjunto de las respuestas completas que implican cada una de las bases de datos fuentes. Vista construida “top-down”

  3. Integración: read-only (II) • Abordajes: • materializado • Vista construida “bottom-up” en un abordaje CWA. ((DW)) • Aspecto crítico: mantenimiento actualizado de la vista. • “Refresh” periódico • Mantenimiento incremental [GL95], [LMSS95] • “Self- maintainability” [GJM96] [ZHK96] (deltas: representación, álgebra, aplicación inmediata o diferida) • Ventaja sobre el virtual: tiempo de respuesta. • híbridos

  4. Metodologías • Correspondencias al nivel de los esquemas. Parten de la resolución de heterogeneidades entre los esquemas. (Sistemas fuertemente acoplados) [SpaccapietraParent 94], [Kosky 95], [Fankhauser 97] • Correspondencias al nivel de las instancias . (Sistemas débilmente acoplados) [Fang et al. 93], [Scholl et al. 94] , [VermeeerApers 96]

  5. S1 S2 integer integer Id- Id- exc exc scales string tours Excursion string tours National Internat. BusExc BusExc National National National Internat. BusExc string tours scales integer string string Id-exc posses Excursion Itinerary performs posses Excursion Itinerary performs scales string ExcursionItineraryscales  Excursionscales ExcursionItinerarytours  Excursiontours ExcursionNational  ExcursionBusExcNational

  6. Instance Mapping Schema 1 Schema 2 Augmentation 1 Augmentation 2 Homogenized Schema 2 Homogenized Schema 1 a) Identifying objects from multiple sources b) Resolving instance- conflicts between corresponding objects c) Maintaining integrity constraints Merge Integrated Schema

  7. Generating an Integrated Schema • Identifying Instances: keys values approach • Data Representation Conflicts: conversion mappings or routines • Data Precision Conflicts: conversion function (when possible) • Data Scaling Conflicts: conversion functions • Default Value Conflicts: preference criterion • Attribute Integrity Constraint Conflicts: • generalization of constraint (when possible)

  8. string string string string c a b a  A B string string c b AB a string string string string string a c a c b b  A string A B string string string a c b A B string

  9. A A C B C A A B A A B B  B A C B B A

  10. A B  A C B A C B

  11. Mapping Specification Syntax interface <class name >: {<superclass name>}{ extent <extent name> keys [<attribute name>]*; attribute <attribute type> <attribute name> relationship <class name> <relationship name> inverse <class name>: <relationship name>} mapping <class name >{ origins <attribute name> [,<attribute name>]*; def_ext <oql expression> def_att <attribute name> as <oql expression> def_rel <traversal path name> as <oql expression>; }

  12. mapping h_Excursion1{ origins eorig; // eorig from Excursion1 def_ext select h_Excursion1(eorig: e_inst) from e_inst in e_excursions; def_att h_exc_id as this.eorig.exc_id; def_rel posses as select e from e in posses where (this.eorig = e.eorig.tours) and (this.eorig = e.eorig.scales); } mapping h_Itinerary2{ origins torig, eorig1, eorig2; // torig from Excursion2 , // eorig1 from Itinary.tours, // eorig2 from Itinary.scales def_ext select h_Itinerary2(torig: inst, eorig1: itinerary.tours, eorig2: itinerary.scales) from inst in e_excursions, inst.tours in itinerary.tours, inst.scales in itinerary.scales; def_rel posses as select p from p in excursion where (this.torig.excursion.tours = p.eorig1) and (this.torig.excursion.scales= p.eorig2) ;}

  13. Integración basada en relaciones semánticas al nivel de las instancias OBJETOS: Cadaobjetorepresenta cierto objeto del mundo real. Los objetos de la BD están agrupados en clases. Cada clase posee un conjunto de propiedades por las cuales los objetos de esa clase son descriptos. El conjunto de propiedades determina la estructura de un objeto. Cada propiedad tiene un dominio del cual toma valores. Para propiedades referenciales el dominio es una clase. Cada objeto de la BD tiene valores para sus propiedades. Este conjunto de valores determina el estado del objeto de la BD.

  14. Publ authors publisher Scientific forum descr org type Referred NonRef Springer Readings ICS “IC” “VC” O3 O4 {JonesSmith} {Jones} chapter Springer Proc Ejemplo [VermeerApers96] title Prof “VC” IRIS O1 t {Jones} “CB” t O2 {Star} IRIS title Journal “CC” MasterTh student O5 {Star} supervisor IEEE Press “CA” IEEE Lewis O6 Star

  15. Ejemplo [VermeerApers96] title Publications authors ref? pp Paper Book publisher TechReport nr superv “VC” Springer true O’2 O’1 false PhDTh proc {Quinn} Proc. t5 Proc O’8 {Jones} XYZPress Journal Conf Springer {Ram} journal true false “CD” O’3 O’4 {Scan} Readings “VC” Quinn Journal {Jones} XYZPress O’6 “AC” {JonesSmith} O’5 {Smith} 24-48 O’2 “NC” O’7 30-88 JournalAA 10-20 {QuinnShort} O’8

  16. title title Ej.: Eq(O4,O’6) Publications authors Publ authors publisher pp Paper Scientific forum org proc Conf Referred ICS “VC” “VC” O4 {JonesSmith} O’6 {JonesSmith} Springer Proc 24-48 O’2 Relacionamientos entre objetos [VermeerApers96] • Equal:corresponden al mismo objeto del mundo real Eq(A,B) vale siiel objeto A es el mismo que el objeto modelado por la abstracción B. a)B puede ser un objeto.

  17. Relacionamientos entre objetos [VermeerApers96] (II) b)B puede ser un conjunto de valores de propiedades. Ejemplo: Publicaciones cientificas de un forum son vistas como objetos en DB2 mientras que son vistas como valores describiendo publicaciones en libros en DB1. Eq(O4.forum, O’2) title title authors Publications Publ authors publisher ref? Scientific forum Book publisher org Referred Springer true O’2 {Quinn} Proc. ICS “VC” O4 {JonesSmith} Springer Proc

  18. Relacionamientos entre objetos [VermeerApers96] (III) • Similar Un objeto puede ser similar a un conjunto de objetos de una clase C • Strict Similarity Sim(A,B) es valido sii objeto A es similar a los objetos representados por la abstracción B. Ejemplo: Una PhDTh es con referato entonces: SIM(O’4,Referred) • Approximate Similarity Sim(A,B, NewC) Ocurre cuando O’ y los objetos de C son suficientemente similares como para a gruparlos en una nueva clase NewC. Ejemplo: Sim(O’4, MasterTh, GradTh)

  19. Relacionamientos entre objetos [VermeerApers96] (IV) • Aggregate Es usada para la composición de objetos dentro de un objeto mayor. Aggr(A, B [, Role]) Vale sii el objeto modelado por la abstraccion A es una agregación del objeto representado por la abstracción B. Opcionalmente se puede especificar un papel (role) especifico por B en A. Ejemplo: El chapter de Jones esta contenido en su libro: Aggr(O3, O’3)

  20. Reglas de Comparación de Objetos Ejemplo: Sim(O’:ConfPaper, refereed)  O’.proc.ref? = true - Resuelven heterogeneidades esquemáticas - El conj. de objetos relacionados que definen no necesariamente coinciden con las extensiones de ninguna clase.

  21. Proceso Entrada: Set of local objects LO1, LO2. Clasificación de los objetos locales SC1, SC2. Relacionamientos entre LO1 y LO2. Salida: • Un nuevo conjunto de objetos integrados IO Reconciliación de objetos Ejemplo: Eq(O,O’.prop) como objeto de DB1 o como valor de DB2?: Estrategia fija Diferentes dominios: Funciones de conversión Diferentes valores: Funciones de decisión • Una nueva clasificación para estos objetos.

  22. Características • Aplicable para sistemas débilmente acoplados. • Aplicable en ambientes estables • Carece de integración de métodos • Carece de formas de detectar inconsistencias • Usado para read-only

  23. Bibliografía [Fang et al. 93] Fang D., Ghandeharizadeh S., McLeod D. And Si A. The design, implementation and evaluation of an object-based sharing mechanism for federated database systems. In Proc. Ninth Internat. Conf. on Data Engineering, Vienna, Austria, April 19-23, 1993. Washington, DC,: IEEE Computer Society Press, pp 467-475,1993. [Scholl et al. 94] Scholl M. H., Scheck H-J. And Tresch M. Object algebra and views for multiobjectbases. In Distributed Object Management, M.T. Oszu, U.Dayal and P. Valduriez, Eds. San Mateo, CA: Morgan Kaufmann Publishers,pp353-374,1994. [VermeerApers96] Vermeer M.W.W. And Apers P.M.G. On the applicability of schema integration techniques to database interoperation. ER’96

More Related