1 / 22

Besondere Aspekte in Multimedia-Datenbanken

Besondere Aspekte in Multimedia-Datenbanken. Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback). Gliederung. Motivation Methoden zur Anfrageverfeinerung Auswertungen der Verfeinerungs-mechanismen Zusammenfassung. Motivation.

keran
Download Presentation

Besondere Aspekte in Multimedia-Datenbanken

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback) Niko Zenker

  2. Gliederung • Motivation • Methoden zur Anfrageverfeinerung • Auswertungen der Verfeinerungs-mechanismen • Zusammenfassung Niko Zenker

  3. Motivation • keine genauen Kenntnisse über den Aufbau der DB und Retrieval-Umgebung • Anfragen beruhen auf dem Prinzip „Glück“ • Verfeinerungen können per Hand realisiert werden • durch Einführung von Relevanz-Feedback Methoden wird dieser Prozess teilautomatisiert Niko Zenker

  4. Grundidee • Auswählen von wichtigen Termen oder Ausdrücken, die an bestimmte vorherige Dokumente gebunden sind • Dokumente, die der Benutzer vorher schon nicht sehen wollte, scheinen auch nicht von Interesse zu sein • Ziel: gute Ergebnisse bei vagen Anfrangen Niko Zenker

  5. Information Retrieval Dokumente Anfrage Verarbeitung Verarbeitung Dokument-darstellung Anfrage-darstellung Verlgeich (Ähnlichkeitsberechnung) Ergebnisdokumente Relevanzbewertung und Feedback Niko Zenker

  6. Vektor-Modell • Anfragen werden mittels Vektor an die entspr. Daten gestellt mit und • Relevanz Feedback Methode(n) generiert neuen Anfragevektor Niko Zenker

  7. Anfrageverfeinerung Niko Zenker

  8. Anfrageverfeinerung (II) Niko Zenker

  9. Anfrageverfeinerung (III) Niko Zenker

  10. Wahrscheinlichkeitsfeedback • Ziel ist es, die Dokumente nach ihrer Wahrscheinlichkeit zu ordnen, die vom Benutzer als relevant in Bezug auf die Query eingestuft wurden Niko Zenker

  11. Anfrageverfeinerung (IV) Niko Zenker

  12. Anfrageverfeinerung (V) Niko Zenker

  13. Beispiel • 500 Dokumente in der DB (N) • 100 mit den gewünschten Informationen (ni) • 25 werden als relevant markiert (R) • nur 10 dieser als relevant markierten Dokumente enthalten die gewünschte Information (ri) Niko Zenker

  14. Beispiel (II) Niko Zenker

  15. Anfrageverfeinerung (VI) Niko Zenker

  16. Auswertung der Methoden • die Effizienz der Methoden, errechnet man durch einen Vergleich der ersten Iteration des Feedback-Verfahrens und der Initiationssuche • normalerweise benutzt man Recall und Precision Messungen um dieses Ergebnis zu errechnen Niko Zenker

  17. Precision & Recall relvante Dokumente • Precision gefundene relevante Dokumente alle gefundenen Dokumente • Recall gefundene relevante Dokumente__ gespeicherte relevante Dokumente Menge aller Dokumente gefundene relevante Dokumente Niko Zenker

  18. Auswertung der Methoden (II) • die Auswertung der Feedback-Dokumente wird erschwert • weil sich die Ergebnisse teils deutlich vom echten Feedback-Ergebnis unterscheiden • der User will nicht zweimal das selbe Dokument sehen • die Relevanz-Feedback Operation muss entscheiden, ob sie neue Dokumente anzeigt, die nicht ursprünglich vom User gesehen wurden Niko Zenker

  19. Partial Query Expansion vs. Full Query Expansion • FQE: • alle Anfragevektoren haben die selbe Länge wie der Ursprung • Gewichtungen werden verändert • PQE: • reduzieren auf durchschnittliche Länge der Anfragevektoren • Terme mit hoher Frequenz werden übernommen Niko Zenker

  20. Ergebnisse aus der Forschung • gewichtete Terme produzieren bessere Ergebnisse beim Feedback-Prozess • full expansion erweist sich als besser als partial expansion • die beste Feedback-Methode ist: „Ide dec hi“ • Wahrscheinlichkeits-Feedback ist im Allgemeinen schlechter als Vektor-Feedback Niko Zenker

  21. Optimierung des Feedbacks • die durchschnittliche Länge der Anfrage ist von besonderem Interesse • schlechte Initial-Ergebnisse iterieren meist mit guten Ergebnissen • präzise gestellte Anfragen werden vom Feedback-Prozess besser adaptiert Niko Zenker

  22. Zusammenfassung • Relevanz-Feedback ist eine „billige“ Methode für die Neuformulierung von Anfragen mit Bezug auf die vorherigen Ergebnisse • wegen der Einfachheit der Veränderungen der Anfragen, sollten Relevanz-Feedback-Systeme in jedes Text-Retrieval-System eingebunden werden Niko Zenker

More Related