220 likes | 329 Views
RDF-S3 und eRQL: RDF-Technologien für Informationsportale Karsten Tolle und Fabian Wleklinski. Inhalt. Speicherung: RDF Source related Storage System ( RDF-S3 ) Anfrage: easy RDF Query Language ( eRQL ) Darstellung und Ranking der Ergebnisse. Ausgangspunkt. Zentrale Speicherung
E N D
RDF-S3 und eRQL:RDF-Technologien für InformationsportaleKarsten Tolle undFabian Wleklinski
Inhalt • Speicherung:RDF Source related Storage System (RDF-S3) • Anfrage:easy RDF Query Language (eRQL) • Darstellung und Ranking der Ergebnisse
Ausgangspunkt Zentrale Speicherung Datenbanken, ad-hoc Anfragen Dezentrale Speicherung Agenten, Peer-Peer, Alert-Systeme
Fehlende Quellinformationen • Im RDF Modell ist die Speicherung der Herkunft der Daten nicht vorgesehen. Diese Quellinformationen sind jedoch nützlich zur: • Überprüfung der Daten (Aktualität) • Bezug weiterer Informationen (HTML) • Glaubwürdigkeit • Jeder kann beliebige Aussagen ins Internet stellen.
http://www.abc.com vom 23.09.2004 http://www.abc.com vom 23.09.2004 Glaubwürdigkeit • Stimmen die Angaben? ????
RDF-S3 Eigenschaften • Speicherung der Quellinformation zu jedem RDF Tripel • Möglichkeit zum Löschen und Aktualisieren einzelner Quellen • Optimierung durch Kombination der Generischen- und Schemaspezifischen-Repräsentation der RDF-Daten innerhalb der Datenbank
RDF-S3 Aufbau • hohe Datenqualität durch semantische Überprüfungsfunktionen, die der integrierte Validating RDF Parser (VRP) bietet
Problem – Verständnis • Real-World-Beispiel: • Zur Erzeugung dieser Präsentation wurde die Länge der Tower Bridge gesucht • Suche mit "Tower Bridge" length lieferte eine Menge Ergebnisseiten, aber: • Einheiten verschieden (z. B. “Fuß”) oder fehlend • “Länge” einer Brücke? • Spannweite? Gesamtlänge? Länge der beweglichen Teile? …? • Zwei „Kontexte“ nötig: Einheit und Längendefinition
Problem – Verständnis • RDF Aussagen können oft nur in ihrem Kontext verstanden werden • Beispiel: Width of Golden Gate Bridge? • 90! 90? 90 Meter, 90 Inch, 90 Feet?
eRQL • Ziele • So einfach wie möglich! • Nutzung der Möglichkeitendurch die Speicherung derQuellinformation! • Darstellung der Ergebnissein ihrem Kontext (sieheGolden Gate Bridge Beispiel)! Ein-Wort-Abfragen Dokumenten-Modus PointOfInterest-Modus
Ein-Wort-Anfrage SELECT ?s, ?p, ?o WHERE ?s =~ „bridge“ AND ?p =~ „bridge“ AND ?o =~ „bridge“ ?????? • Sehr einfach und ohne Vorwissen einsetzbar! • Idee: nicht komplizierter als Google • Beispiel: Tripel, die „bridge“ enthalten • eRQL: bridge • RQL: select * from {X}@P{Y} where @P like "*[bB][rR][iI][dD][gG][eE]*" or X like "*[bB][rR][iI][dD][gG][eE]*" or Y like "*[bB][rR][iI][dD][gG][eE]*" • RDQL: ähnlich wie RQL • Perl ähnliche Notation
Dokumenten-Modus 0: weglassen 1: einschränken • Ermöglicht die Einschränkung auf ausgewählte Quellen (oder das Weglassen nicht vertrauenswürdiger Quellen) • Syntax: <Anfrage;Quellen-Liste;0|1> • Beispiel: <bridge;3,4;1> • In RQL nicht vorgesehen! • In RDQL können in der from-Klausel Einschränkungen definiert werden • Aber kein gezieltes Weglassen
PointOfInterest-Modus • Gibt den internen Kontext (umgebener RDF Graph) der einzelnen Treffer mit an • Ergebnisse können besser verstanden werden (siehe Golden Gate Bridge) • Die Größe des zu zeigenden Kontextes wird in der Anfrage definiert • Beispiel: [bridge] ohne Kontext bridge Kontextgröße 1 (default) ~ bridge Kontextgröße 2 ~~ bridge Kontextgröße 3 ...
Golden Gate Bridge s:width 90 s:widthofsidewalk 10.5 rdf:comment All units of measurements are feet. eRQL PointOfInterest • eRQL erweitert Fundstellen zu “POIs” • benachbarte Aussagen werden hinzugefügt • z. B. “comment” zu “Golden Gate Bridge” s:name
268 Golden Gate Bridge 90 eRQL PointOfInterest • POIs werden auch für Sub-Queries gebildet • "Golden Gate Bridge" OR "Tower Bridge" s:name Tower Bridge s:length s:width s:name
eRQL PointOfInterest • POIs werden auch für Sub-Queries gebildet • "Golden Gate Bridge"ANDwidth • POIs für “Golden Gate Bridge” und “width” werden gebildet • Vereinigung der POIs, falls diese überlappen, sonst leer • übereinstimmend mit “Google-Query” s:name Golden Gate Bridge s:width 90
eRqlEngine • eRQL-Prototyp • kein Datenbank-Backend • arbeitet mit RDF-Dateien • einfache Installation • Details und Download: • www.dbis.informatik.uni-frankfurt.de/~tolle/RDF/eRQL/ • www.wleklinski.de/rdf/
Zusammenfassung RDF-S3 und eRQL bieten: • Überprüfbare Daten mehrGlaubwürdigkeit • Antworten mit Kontext mehrVerständnis der Ergebnisse • Anfragen können auf ausgewählte Quellen eingeschränkt werden bessere Ergebnisse • sehr einfach kann ohne Vorwissen genutzt werden (wichtig für Portale)
Zukünftige Ziele • Steigerung der Performance von RDF-S3 und eRQL • Weitere nützliche Anfragemöglichkeiten untersuchen • Verbesserung der Ergebnisdarstellung • Versionsunterstützung für Quellen unter RDF-S3 • ...
Danke für die Aufmerksamkeit Fragen? • Weitere Infos und Downloads: http://www.dbis.informatik.uni-frankfurt.de/~tolle/rdf/ • Kontakt: Karsten Tolle: tolle@dbis.informatik.uni-frankfurt.de Fabian Wleklinski: wleklinski@eworks.de