1 / 43

Blick hinter die Kulissen einer Suchmaschine

Blick hinter die Kulissen einer Suchmaschine. Matthias Dreier, SCIL St. Gallen, matthias.dreier@unisg.ch. Werner Hartmann, ETH Zürich und infoSense, hartmann@infosense.ch. Warum eine didaktische Suchmaschine?. Typisches Suchverhalten.

Download Presentation

Blick hinter die Kulissen einer Suchmaschine

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Blick hinter die Kulissen einer Suchmaschine

  2. Matthias Dreier, SCIL St.Gallen,matthias.dreier@unisg.ch

  3. Werner Hartmann, ETH Zürich undinfoSense, hartmann@infosense.ch

  4. Warum eine didaktische Suchmaschine?

  5. Typisches Suchverhalten Bekannte Sites sind wichtige Ausgangspunkte für User und werden immer wieder besucht. User surfen auf dem Web und benutzen dabei eine lokale Backtracking-Strategie. User verwenden oft Suchmaschinen und wechseln den Suchdienst eher selten. User planen die Suche kaum, verwenden einfache Suchanfragen und nutzen die Interaktion mit dem Suchdienst (z.B. Relevanzfeedback) kaum. User schätzen die Glaubwürdigkeit der Informationen auf dem Web als hoch ein. Marilyn Domas White, Mirja Iivonen: Questions as a factor in Web search strategy. Information Processing and Management 37(2001), Heft 5, 721–740.

  6. Gefragt: Langlebiges Konzeptwissen Gängige Suchmaschinen sind heute technisch fast ausgereizt. Entscheidende Verbesserungen können nur durch systematischeres Vorgehen der Benutzer erreicht werden. Amanda Spink: A user-centered approach to evaluating human interaction with Web search engines: an exploratory study. In: Information Processing and Management 38 (2002), Heft 3, 401–426. Amanda Spink, Bernard J. Jansen, Dietmar Wolfram, Tefko Saracevic: From E-Sex to E-Commerce: Web Search Changes. In: IEEE Computer 35(2002), Heft 3, 107–109. Marilyn Domas White, Mirja Iivonen: Questions as a factor in Web search strategy. Information Processing and Management 37(2001), 5, 721–740.

  7. Mangelndes Problembewusstsein Eine aktuelle Untersuchung aus den USA zeigt: 96% der User sind überzeugt von ihren Suchfähigkeiten, 62% sogar sehr überzeugt 87% haben gute Erfahrungen mit Suchmaschinen, 17% sagen sogar, sie finden immer was sie suchen 68% glauben, Suchmaschinen liefern zuverlässige, unparteiische Informationen Fallows, D. (2005) Search Engine Users. Internet searchers are confident, satisfied and trusting – but they are also unaware and naïve. PEW Internet & American Life Project, Washington.

  8. Was müsste man über Suchmaschinen wissen?

  9. Das müsste man wissen:Typen von Fragestellungen

  10. Das müsste man wissen:Ausbeute versus Präzision relevante Dokumente gefundene Dokumente relevante Dokumente gefundene Dokumente Dokumentenkollektion Dokumentenkollektion geringe Ausbeute geringe Präzision hohe Ausbeute geringe Präzision relevante Dokumente gefundene Dokumente relevante Dokumente gefundene Dokumente Dokumentenkollektion Dokumentenkollektion geringe Ausbeute hohe Präzision hohe Ausbeute hohe Präzision

  11. Warum geht das so schnell? Eine halbe Million Dokumente ... ... aus der ganzen Welt ... ... im Bruchteil einer Sekunde ... UNMÖGLICH!

  12. Das müsste man wissen:Gute Vorbereitung ist alles Web-Roboter beschafft Dokumente aus Internet Suchsystem indexiert Dokumenteund erstellt Tabelle mit Begriffen

  13. Informationsanbieter müssten wissen: Das sieht eine Suchmaschine

  14. Das müsste man wissen:So sieht ein Index aus! Das „Stichwortverzeichnis“ einer Suchmaschine

  15. So arbeitet die Suchmaschine mit dem Index Gesucht: Übersicht über die Planeten unseres Sonnensystems Anfrage: mars Resultat: Alle Webseiten zum Begriff „mars“ aus dem Index, kaum etwas zu Planeten

  16. So arbeitet die Suchmaschine mit dem Index Anfrage:mars

  17. Zweiter Versuch Gesucht: Übersicht über die Planeten unseres Sonnensystems Anfrage: mars pluto saturn Resultat: Suchmaschine kombiniert Listen zu „mars“, „saturn“ und „pluto“ aus dem Index. => bessere Resultate

  18. Zweiter Versuch Anfrage:mars pluto saturn

  19. Das müsste man wissen:Wenige häufige Worte .... .... Seltene Suchbegriffe helfen der Suchmaschine

  20. Darf man in der Schweiz ohne Führerausweis ein Auto umparkieren, wenn man den Motor nicht anlässt?

  21. Das müsste man wissen:Jeder Vergleich braucht Normalisierung Dokument Anfrage Da der Rote Sumpfkrebs mit Raubfischen bekämpft werden kann, ist diese Massnahme dem Gifteinsatz gegen Sumpfkrebse vorzuziehen. Krebse bekämpfen mit Gift Normalisierung rot sumpf krebs raub fisch kaempf massnahm gift einsetz sumpf krebs vorzieh krebs kaempf gift

  22. Ganz viele Löcher ......

  23. Wer kann das erklären?

  24. Das müsste man wissen:Offene Fragestellungen - schlechte Normalisierung kann verheerend sein • Google ist so erfolgreich, weil präzisionsorientiert • Google ist so präzisionsorientiert, weil • die Suchbegriffe mit „UND“ verknüpft werden. • nur eine minimale Normalisierungstattfindet. • Bei der einfachen Google-Suche bleibt die Ausbeute auf der Strecke.

  25. Das müsste man wissen:Dokumentenbasierte Rangierung Ausdehnung Ozonloch Antarktis Anfrage: Dokument 1: Dokument 2: Packeis Die Ausdehnung des Packeises über der Antarktis beträgt im Winter über 20 Millionen Quadratkilometer. Ozonloch Das Ozonloch über der Antarktis erreichte im September 2001 eine Fläche von 29 Millionen Quadratkilometer.

  26. Das müsste man wissen:Dokumentenunabhängige Rangierung

  27. Das müsste man wissen:Geldbasierte Rangierung

  28. Das müsste man wissen: Internet Web Roboter Dokumente Indexierung von Dokumenten Anfragen Indexierung von Anfragen Index Vergleich von Anfragen mit Dokumenten Resultate Art des Informations-bedürfnisses Benutzer- schnittstelle

  29. Unsere Unterrichtserfahrung:Leute verstehen „Index“ nicht Das Problem: Index einer Suchmaschine ist eine Black-Box. Didaktische Konsequenz: • Index sichtbar machen • Experimente mit dem Index ermöglichen

  30. Was zeigt Soekia? Erfassen von Dokumenten Index Indexierung Ausbeute / Präzision Dokumentenbasierte Rangierung

  31. „Gezippter“ Ablauf einer Unterrichtseinheit mit Soekia

  32. Vorkenntnisse der Schüler/innen Alle haben schon verschiedene Suchmaschinen benutzt. Alle haben schon einmal den Blick hinter die Kulissen einer Webseite geworfen und wissen, dass Webseiten in html geschrieben sind. Ausbeute und Präzision wurden thematisiert. Lernziele: Wir lernen effizienter und effektiver suchen!

  33. 1. Teil: Index einer Suchmaschine Index entspricht dem Stichwortverzeichnis am Schluss eines Buches ....... Nur ist der Index einer Suchmaschine ein bisschen grösser ;-) Entdecken Sie die Funktionsweise von Suchmaschinen selber!

  34. Schnell einige html-Seiten erzeugen <html> <body> Das ist meine Webseite, abgespeichert als meineseite.html Für den Index spannend sind Worte mit vielen Formen: Fussball, Fussballer, Fussballerin, Fussballes, Fussbälle, Fussballs, Fussballspiel, …. </body> </html>

  35. Entdeckendes Lernen

  36. 2. Teil: Ausbeute und Präzision Wann wurde das Ozonloch entdeckt? Entdecken Sie die Bedeutung der Normalisierung selber!

  37. Lernaufgabe Normalisierung, Ausbeute und Präzision

  38. 3. Teil: Rangierung Warum erscheint Avis vor Hertz? Spielen Sie mit den verschiedenen Rangierungsprinzipien!

  39. Zum Abschluss: Spamwettbewerb

  40. www.educeth.ch/informatik/soekia

More Related