380 likes | 500 Views
BTW 2001 – Sitzung: Datenbanken im Internet. Verteilte Metadatenverwaltung für die Anfragebearbeitung auf Internet-Datenquellen. Markus Keidl 1 Alexander Kreutz 1 Alfons Kemper 1 Donald Kossmann 2. 1 Universität Passau D-94030 Passau <nachname>@db.fmi.uni-passau.de. 2 TU München
E N D
BTW 2001 – Sitzung: Datenbanken im Internet Verteilte Metadatenverwaltung für die Anfragebearbeitung auf Internet-Datenquellen Markus Keidl1Alexander Kreutz1 Alfons Kemper1 Donald Kossmann2 1 Universität Passau D-94030 Passau <nachname>@db.fmi.uni-passau.de 2 TU München D-81667 München Kossmann@in.tum.de Verteilte Metadatenverwaltung
Gliederung • Motivation • Die Metadatenverwaltung MDV • Architektur • Publish/Subscribe-Mechanismus • Regelsystem • Vorfilter-Algorithmus • Zusammenfassung Verteilte Metadatenverwaltung
Motivation • Ressourcenverwaltung für Internet- Anfragebearbeitung in ObjectGlobe • Anforderungen: • große Zahl von Klienten 3-Schichten-Architektur • Informationen nahe bei den Klienten Caching, Replikation • Aktualität der Information Verteilte Metadatenverwaltung
Das ObjectGlobe-System Cycle-Provider thumbnail Lade Operator wrap_S Fct-Provider Data-Provider A thumbnail Data-Provider B wrap_S S Verteilte Metadatenverwaltung
Die Metadatenverwaltung • Metadaten im RDF-Format • Metadaten-Schema mit RDF Schema • 3-Schichten-Architektur: Ö-MDVs, L-MDVs und MDV-Klienten • Caching/Replikation auf lokaler Ebene • Aktualität durch Publish/Subscribe-Mechanismus Verteilte Metadatenverwaltung
RDF • RDF = Resource Description Framework • Dokumente enthalten Ressources, Properties und Values( Objekten, Instanzvariablen, Werten) • RDF Schema: Klassenhierarchie • Zukünftiger Standard für Metadaten(MDV ist aber nicht darauf festgelegt) Verteilte Metadatenverwaltung
RDF - Beispiel • Beispiel: <Partition rdf:ID=“part“> <cardinality>2000</cardinality> <theme> <Theme rdf:ID=“theme“> <themeName>Hotels</themeName> </Theme> </Partition> Verteilte Metadatenverwaltung
Architektur der MDV Ö-MDV Ö-MDV Ö-MDV Backbone Publish/Subscribe L-MDV L-MDV Optimierer Verteilte Metadatenverwaltung
Architektur - Ö-MDVs • Öffentlichen MDVs (Ö-MDVs): • Backbone aus Ö-MDVs • speichern globale Metadaten • repliziert innerhalb des Backbones Verteilte Metadatenverwaltung
Architektur der MDV Ö-MDV Ö-MDV Ö-MDV Backbone Publish/Subscribe L-MDV L-MDV Optimierer Verteilte Metadatenverwaltung
Architektur - L-MDVs • Lokale MDVs (L-MDVs): • liegen nahe bei den Klienten • abonnieren globale Metadaten Caching • speichern lokale Metadaten • Anfrageauswertung: abonnierte und lokale Metadaten • Hinzufügen von L-MDVs Skalierbarkeit Verteilte Metadatenverwaltung
Architektur der MDV Ö-MDV Ö-MDV Ö-MDV Backbone Publish/Subscribe L-MDV L-MDV Optimierer Verteilte Metadatenverwaltung
Architektur - MDV-Klienten • MDV-Klienten • stellen Anfragen an L-MDVs • browsen Metadaten an Ö-MDVs und L-MDVs • modifizieren die Abonnement-Regeln ihrer L-MDV Verteilte Metadatenverwaltung
Publish/Subscribe-Mechanismus • Lokale MDVs abonnieren Metadaten Regeln • Beispielregel:search Partition p register pwhere p.cardinality > '1000' and p.theme.themeName = 'Hotels' • Registrieren, Ändern oder Löschen von RDF-Dokumenten Auswertung • Problem: Große Menge von Regeln Verteilte Metadatenverwaltung
Vorfilter • Basierend auf Standard-RDBMS • Idee: Auswerten einer Regel-Teilmenge • Zerlegung in Atome: • RDF Dokumente • Regeln auslösende und abhängige Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung der Regeln • Ziel: Index auf gesamte Regelmenge Verteilte Metadatenverwaltung
Publish/Subscribe mit Vorfilter • Registrierung eines RDF Dokuments • Zerlegung des RDF Dokuments • Vorfilter-Lauf Regeln, die neue Metadaten abonnieren + neue Metadaten • Regeln L-MDVs • Benachrichtigung der L-MDVs Verteilte Metadatenverwaltung
Zerlegung: RDF-Dokument <Partition rdf:ID=“part“> <cardinality>2000</cardinality> <theme> <Theme rdf:ID=“theme“> <themeName>Hotels</themeName> </Theme> </Partition> Verteilte Metadatenverwaltung
Zerlegung: RDF-Dokument <Partition rdf:ID=“part“> <cardinality>2000</cardinality> <theme> <Theme rdf:ID=“theme“> <themeName>Hotels</themeName> </Theme> </Partition> Verteilte Metadatenverwaltung
Zerlegung: Regeln search Partition p register p where p.cardinality > '1000' and p.theme.themeName = 'Hotels' A: search Partition p register pB: search Partition p register p where p.cardinality > '1000'C: search Theme t register t where t.themeName = 'Hotels' D: search Regel(C) d register dE: search Regel(A) a, Regel(D) d register a where a.theme = gF: search Regel(E) e, Regel(B) b register e where e = b Verteilte Metadatenverwaltung
Regel F e = b Regel E Regel B a.theme = d Regel A Regel D cardinality > '1000' Regel C themeName = 'Hotels' Partition Theme Partition Zerlegung: Regel - Ergebnis Verteilte Metadatenverwaltung
Zerlegung: Auslösende Regeln search Partition p register p where p.cardinality > '1000' > search Theme t register t where t.themeName = 'Hotels' = search Partition p register p Verteilte Metadatenverwaltung
Vorfilter • Basierend auf Standard-RDBMS • Idee: Auswerten einer Regel-Teilmenge • Zerlegung in Atome: • RDF Dokumente • Regeln auslösende und abhängige Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung der Regeln • Ziel: Index auf gesamte Regelmenge Verteilte Metadatenverwaltung
Vorfilter • Basierend auf Standard-RDBMS • Idee: Auswerten einer Regel-Teilmenge • Zerlegung in Atome: • RDF Dokumente • Regeln auslösende und abhängige Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung der Regeln • Ziel: Index auf gesamte Regelmenge Verteilte Metadatenverwaltung
Bestimmung ausgelöster Regeln Join Verteilte Metadatenverwaltung
Bestimmung ausgelöster Regeln Join Verteilte Metadatenverwaltung
Bestimmung ausgelöster Regeln Join Verteilte Metadatenverwaltung
Bestimmung ausgelöster Regeln Join Verteilte Metadatenverwaltung
Bestimmung ausgelöster Regeln Join Verteilte Metadatenverwaltung
Vorfilter • Basierend auf Standard-RDBMS • Idee: Auswerten einer Regel-Teilmenge • Zerlegung in Atome: • RDF Dokumente • Regeln auslösende und abhängige Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung der Regeln • Ziel: Index auf gesamte Regelmenge Verteilte Metadatenverwaltung
Vorfilter • Basierend auf Standard-RDBMS • Idee: Auswerten einer Regel-Teilmenge • Zerlegung in Atome: • RDF Dokumente • Regeln auslösende und abhängige Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung der Regeln • Ziel: Index auf gesamte Regelmenge Verteilte Metadatenverwaltung
Inkrementelle Auswertung • ausgelöste Regeln Auswerten aller abhängigen Regeln • inkrementelle Auswertung soweit möglich Verteilte Metadatenverwaltung
Inkrementelle Auswertung Regel F e = b Regel E Regel B a.theme = d Regel A Regel D cardinality > '1000' Regel C themeName = 'Hotels' Partition Theme Partition Verteilte Metadatenverwaltung
Inkrementelle Auswertung Regel F e = b Regel E Regel B a.theme = d Regel A Regel D cardinality > '1000' Regel C themeName = 'Hotels' Partition Theme Partition Verteilte Metadatenverwaltung
Inkrementelle Auswertung Regel F e = b Regel E Regel B a.theme = d Regel A Regel D cardinality > '1000' Regel C themeName = 'Hotels' Partition Theme Partition Verteilte Metadatenverwaltung
Inkrementelle Auswertung Regel F e = b Regel E Regel B a.theme = d Regel A Regel D cardinality > '1000' Regel C themeName = 'Hotels' Partition Theme Partition Verteilte Metadatenverwaltung
Verwandte Arbeiten - 1 • Metadaten:Equal Time For Data on the Internet with WebSemantics[Mihaila, Raschid, Tomasic; EDBT '98]Automatic Deployment of Application-Specific Metadata and Code in MOCHA [Rodriguez-Martinez, Roussopoulos; EDBT '00] Universal Description, Discovery, and Integration (UDDI)[Ariba, Inc., IBM, Microsoft; http://www.uddi.org] • Publish/Subscribe:Efficient Matching for Web-Based Publish/Subscribe Systems[Pereira, Fabret, Llirbat, Shasha; CoopIS '00]Matching Events in a Content-Based Subscription System[Aguilera, Strom, Sturman, Astley, Chandra; PODC '99]The SIFT Information Dissemination System[Yan, Garcia-Molina; TODS '99]Efficient Filtering of XML Documents for Selective Dissemination of Information [Altinel, Franklin; VLDB '00] Verteilte Metadatenverwaltung
Verwandte Arbeiten - 2 • Continuous Queries:NiagaraCQ: A Scalable Continuous Query System for Internet Databases [Chen, DeWitt, Tian, Wang; SIGMOD '00]Continual Queries for Internet Scale Event-Driven Information Delivery [Liu, Pu, Tang; IEEE TKDE '99] • Materialized Views und Semantic Caching:Maintaining Views Incrementally [Gupta, Mumick, Subrahmanian; SIGMOD '93]Efficiently Updating Materialized Views[Blakeley, Larson, Tompa; SIGMOD '00]Semantic Data Caching and Replacement [Dar, Franklin, Jónsson, Srivastava, Tan; VLDB '96] Verteilte Metadatenverwaltung
Zusammenfassung • Metadatenverwaltung MDVArchitektur: Ö-MDVs, L-MDVs, Klienten • Publish/Subscribe-Mechanismus • Vorfilter-Algorithmus: • Zerlegung von RDF-Dokumenten • Zerlegung von Regeln • Bestimmung ausgelöster Regeln • Inkrementelle Auswertung Verteilte Metadatenverwaltung