250 likes | 414 Views
Context-Aware Mobile Information Filtering System. Anna Jankowska. Doktorandenworkshop Technologien und Anwendungen von XML. Überblick. Ziel des Projektes Kontext und kontext-adaptive Anwendungen Kontext in Mobile Computing Modellierung der Kontext-Informationen Benutzerprofil
E N D
Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML
Überblick • Ziel des Projektes • Kontext und kontext-adaptive Anwendungen • Kontext in Mobile Computing • Modellierung der Kontext-Informationen • Benutzerprofil • Retrieval, Filtering und mobiles IF • Semantische Netze • Webdienste und Semantische Webdienste • Probleme & Chancen • Zusammenfassung & Ausblick 1/23
Ziel des Projektes • Entwicklung und prototypische Umsetzung eines kontext-sensitiven Systems zur Filterung von Dokumenten und Webdiensten für mobile Geräte. 2/23
Kontext • ”Context is any information that can be used to characterize the situation of an entity. An entity is a person, place or object that is considered relevant to the interaction between a user and an application, including the user and application themselves.” Anind K. Dey, Gregory D. Abowd • Kontext-Informationen: • Identität • räumliche Informationen: Standort • zeitliche Informationen: Uhrzeit • soziale Situation: wer ist in der Nähe • Umgebung: Temperatur • umgebende Resourcen: Computer • Verfügbarkeit der Resourcen: Art des Netzwerkes 3/23
Kontext-Adaptive Anwendungen • Ein System heißt ”context-aware”, wenn es den Kontext verwendet, um relevante Informationen und/oder Dienste dem Benutzer zur Verfügung zu stellen, wobei die Relevanz von der Rolle des Benutzers abhängt.” Dey, Abowd • Merkmale kontext-adaptiver Applikationen: • In Abhängigkeit von den aktuellen Kontext-Informationen werden dem Benutzer Daten und Dienstleistungen zur Verfügung gestellt. • Automatische Ausführung von Diensten, wenn ein bestimmter Zustand/Kontext auftritt. • Verknüpfung von Kontext und Informationen für eine spätere Wiederverwendung. 4/23
Kontext in Mobile Computing • Mobile versus stationäre Geräte: • nicht vorhersagbarer, variierender Kontext • Ubiquität - Dienste & Informationen überall und immer verfügbar • zusätzliche Funktionalitäten (Ortslokalisierung, Spracherkennung etc.) • Beschränkungen (geringe CPU, kleine Displays, etc.) • Kontext-adaptive mobile Anwendungen: • Mobile Resource Management System • Hydrogen Context-Framework • Cyberguide • Forget-Me-Not • Context-Phonebook • YellowMap Mobile Services 5/23
Modellierung von Kontext-Informationen • HTTP headers - Kontext des Gerätes: ”accept”, ”user-agent”, etc. • CC/PP -Composite Capabilities Preference Profiles • setzt auf RDF auf, um Metadaten über Geräteeigenschaften und Benutzerwünsche/Bedürfnisse zwischen Server und Browser auszutauschen • UAProf - User Agent Profile • berücksichtigt gerätespezifische Charakteristika, Software-spezifische Fähigkeiten, Browser-Einstellungen und Netzwerkeigenschaften • ConteXtML - Context Markup Language • Verarbeitung der Kontext-Informationen: • DELI -DElivery ContextLIbrary for CC/PP and UAProf • DICE -Device Independent Content Engine 6/23
Format für Kontext-Informationen • Muss folgende Anforderungen erfüllen: • gut strukturiert • standardisiert • einheitlich für alle Kontext-Informationen • austauschbar zwischen Systemkomponenten • erweiterbar • kompatibel mit dem Format für Modellierung der Benutzerinformationen • Soll auf den bereits unterstützten Formaten aufbauen (CC/PP) • Alle relevanten Kontext-Informationen in session profiles • serialisierter RDF + RDF Schema (Ontologie) 7/23
Person123 PhysOrt GeogrOrt LogOrt Stadt Kontinent Geogr. Länge Geogr. Breite Land Internet Netz Telefon Berlin Europa 27"28' S 153"02' E Dautschland +4933 8266131 www.berlin.org http:// 192.168.1.102 Format für Kontext-Informationen <? xml version="1.0" ?> <rdf:RDF xmlns:loc="http://www.x.org/ort-schemat#"> <rdf:Description about=“http://www.x.com/person#person123”> <ccpp:component> <rdf:Description about=”person123PhysOrt"> <rdf:type rdf:resource="http://www.x.com/ort- schemat#PhysOrt"/> <loc:kontinent>Europa</loc:kontinent> <loc:land>Deutschland</loc:land> <loc:stadt>Berlin</loc: stadt> </rdf:Description> </ccpp:component> </rdf:Description> </rdf:RDF> 8/23
Benutzerprofil • Bestimmt kurzfristige und langfristige Informationsbedürfnisse des Benutzers, ist zerlegbar • Erstellung des Profils (Top-Down Ansatz): • Organisationsprofil – relativ stabile Informationsbedürfnisse • Abteilungsprofil • Stellenbeschreibung (Rolle des Benutzers) • Vorlieben/Interessen des Benutzers • Wird jeweils um Kontext-Informationen aktualisiert (“Profile Resolution“): • Gerätekontext • zeitliche Informationen • räumliche Informationen • Informationen aus TMS: Termine, Aufgaben, Kontakte • Historischer Kontext • Format: serialisierter RDF, XTM 9/23
Relevant Dokumente in Antwortmenge DA Relevante Dokumente D Antwortmenge A Information Retrieval • Ein Retrievalmodell besteht aus: • einer Menge D von Repräsentationen für Dokumente • einer Menge Q von Repräsentationen für Benutzeranfragen • einer Rankingfunktion R, die jedem Anfrage/Dokumentpaar eine reelle Zahl (das Ranking) zuweist, nach der Dokumente sortiert werden • Suche bezieht sich auf Wörter • Beurteilung der Güte der Ergebnisse: • Recall: Anteil relevanter Dokumente, die gefunden wurden: R=Da/D • Precision: Anteil der gefundenen Dokumente, die relevant sind: P=Da/A • Ansätze: • informatischer Ansatz • computerlinguistischer Ansatz 10/23
Informationsfilterung • Information werdem dem Benutzer abhängig von seinen Informationsbedürfnissen/Interessen zur Verfügung gestellt • Inhaltsbasierte Filterung • für jeden Nutzer eigene Filter • Profil: Repräsentation des Nutzerinteresses • Soziale Filterung • Idee: Information ist relevant, wenn andere Benutzer, die bisher ähnliches Verhalten gezeigt haben, die Information ebenfalls als relevant betrachtet haben • Bewertung der Relevanz von Informationen durch Benutzer • Vergleich von Profilen mehrerer Nutzer • Gemischte Ansätze 11/23
Probleme bisheriger Ansätze • Fragen, die man bei traditionellen IF&IR Ansätzen nicht korrekt beantworten kann: • “Finde alle Dokumente über CAR” semantische Information • “Finde alle Dokumente, die im Projekt mIF verfaßt wurden!” Kontextinformation • “Finde alle E-Mails mit Absender Frank Mustermann!” Logische Struktur • “Finde das Dokument mit dem Logo der TU Berlin oben rechts!” Layout 12/23
Neue Ansätze in IF, IR • Bisherige Suchverfahren rein syntaktisch, ohne Kenntnis der Wortbedeutungen • Intelligentes IF, IR: • Berücksuchtigung der Besonderheiten natürlicher Sprachen (Polysemie, Synonymie) • Identifizieren und Unterscheiden verschiedener Kontexte des Wortgebrauchs • flexible Gestaltung der Anfrage • Die Suche kann oft verbessert werden, wenn Hilfsmittel zur Verfügung stehen, die etwas über die Semantik des Suchraums aussagen: • Thesaurus • Latent Semantic Indexing 13/23
mIF - Aufgaben • Metadaten und Ontologien generieren • Kontext-Informationen abfangen und dem System zur Verfügung stellen • Benutzerprofile erstellen (automatisch/manuell) • Filterungsmaschine bauen • Relevante Dokumente herausfiltern (Präzision wichtig) • Antworten statt Trefferlisten • Nützliche Informationen personalisiert und aufgabenspezifisch anbieten • Berücksichtigung von Kontext-Informationen bei IF und bei Präsentation der Ergebnisse (kurzfristige und langfristige Informationsbedürfnisse) • Webdienste: • relevante Webdienste herausfiltern • Transaktionen auslösen • Decision Support anbieten • Unterstützung: Intelligente Softweareagenten 15/23
Semantische Netze • Traditionelle Informationsverarbeitung beruht auf: • Zeichenketten und kontextfreier Struktur (Syntax) • Verarbeitung von Konzepten, Kontextabhängigkeiten oder Kontextbedingungen werden vernachlässigt • Zielgerichteter Zugriff auf Informationen ist problematisch, da Inhalte im Web vom Menschen interpretiert, kombiniert und aufbereitet werden müssen. • Das Semantic Web: Ein Meta-Web, aufbauend auf dem WWW, welches die Inhalte auch für Maschinenverarbeitbar und interpretierbar macht. • Verspricht bessere Endbenutzerdienste durch: • Standardisierte Architektur für Dokumentenverarbeitung • Standardisierte Vokabularien • Standardisierte Sprachen für Kontextbedingungen 16/23
Semantische Netze • Repräsentation durch netzartige Strukturen aus Objekten und Relationen • Semantische Netze bestehen aus : • Knoten: Repräsentation von Klassen oder Klasseninstanzen • Kanten: entsprechen 2-stelligen Relationen zwischen Objekten • Wissen über einen Knoten wird durch die Verbindungen repräsentiert, die von ihnen ausgehen • Mögliche Inferenzen: • Beantwortung von Anfragen durch Verfolgen von Kanten • Spreading Activation bzw. Intersection Search • Vererbung • Semantische Netze = Metadaten + Ontologien 17/23
Individuelles Konzept (Instanz) unfall GenerischesKonzept (Klasse) instance-of u57 verursacher geschädigter a43 volvo instance-of is-a instance-of auto hat-farbe hat-teil hat- farbe motor besitzer besitzer weiss rot instance-of farbe instance-of holtmann andreas instance-of instance-of person Beispiel für ein semantisches Netz „Holtmann fuhr mit seinem roten Auto auf meinen weissen Volvo“ a25 18/23 Quelle: Hinkelmann
Ontologien • Semantik: Interpretationsfunktion von einem syntaktischen in einen semantischen Bereich • Idee: Spezifiziere alle durch ein Programm oder eine Wissensbasis verwendbaren Begriffe • Ontologie = eine Vereinbarung über ein gemeinsam zu nutzendes Vokabular, mit dem Anfragen und Aussagen zwischen Maschinen ausgetauscht werden: • eine standardisierte Menge von Begriffen mit Kontextbedingungen • Kontextbedingungen werden durch Inferenzregeln angegeben • Alle potentiellen Welten müssen sich auf die vorgegebenen Ontologien abstützen und die Einschränkungen erfüllen • Ontologiesprachen: RDF Schema, DAML+OIL 19/23
UDDI Verzeichnisdienst WSDL Schnittstellen- beschreibung URL des Webdienstes Suchen nach Webdiensten WSDL-Dokument holen SOAP-Nachrichten Klient Webdienst Methodenaufrufe Anfragen und Antworten Webdienste • Ein Webdienst ist eine Anwendung, die es erlaubt, ihre Methoden über eine Web-Schnittstelle aufzurufen. 20/23
Semantische Webdienste • Entwicklung des Internet: von einem Informationsnetz zum Servicenetz • Semantische Webdienste sollen ermöglichen: • automatisches Auffinden von Webdiensten • automatische Ausführung von Webdiensten • Komposition von Web Services • Überwachung der Ausführung von Webdiensten • DAML-S (DARPA Agent Markup Language for Services): • eine DAML+OIL - Ontologie für Webdienste, dessen Ziel es ist, Webdienste in einer computer-interpretierbaren Art und Weise zu beschreiben • ermöglicht den intelligenten Agenten, diverse Aufgaben zu erfüllen • WSMF - Web Services Modeling Framework 21/23
Probleme und Chancen • Chancen: • Das Semantische Web reitet auf der "Welle" HTML/XML • Technologie entwickelt sich sehr schnell • Killer-Applikation • Probleme: • Technologien noch nicht ausgereift • Beschränkungen mobiler Geräte • Nutzen der Information abhängig von: • Informationsquellen • Qualität der Information • Kosten der Information • Aktualität der Information • Vertrauenswürdigkeit der Information • “Big Brother“ – Ansatz • Abschätzung der Qualität von Webdiensten • Technik muss sicher und unsichtbar sein 22/23
Zusammenfassung • Semantische Netze und Webdienste als (reale) Zukunftsvision: • verbesserter Zugriff auf Wissen • verbesserte Kommunikation zwischen Maschinen • intelligente Webdienste • Context-Aware Mobile Information Filtering System: • innovative Anwendung im Bereich IF • ein Filterungssystem, das im Filterungsprozess die Kontext-Informationen sowie Benutzerprofile berücksichtigt • Filterung: • Dokumente (Semantic Web) • Webdienste • Integration semantischer Technologien in bestehende Ansätze des Information Filtering • Bereitstellen der Informationen für verschiedene mobile Geräte • Umsetzung auch in Form eines Webdienstes 23/23
Context-Aware Mobile Information Filtering System Anna Jankowska Doktorandenworkshop Technologien und Anwendungen von XML