380 likes | 497 Views
Suchmaschinenlabor an der Uni Hannover. Derek Daniel. Introduktion. 1998 - Hotbot erfaßt 34% 1999 - nur noch 11% alle zusammen 42%. 1999. Metasuchmaschinen. Metacrawler SavvySearch MetaGer. Themen. MetaGer Forschungsportal Andere Projekte MESA de.* HannUFind. MetaGer.
E N D
Suchmaschinenlabor an der Uni Hannover Derek Daniel
Introduktion • 1998 - Hotbot erfaßt 34% • 1999 - nur noch 11% • alle zusammen 42% 1999
Metasuchmaschinen • Metacrawler • SavvySearch • MetaGer
Themen • MetaGer • Forschungsportal • Andere Projekte • MESA • de.* • HannUFind
MetaGer • 1995 angefangen • Deutschsprachig • 400,000+ Anfragen am Tag • ca. 90,000 externen Links auf MetaGer • 25 Suchmaschine abfragbar • AND, OR, String Syntax
MetaGer Kriterien 1. Parallele Suche (keine all-in-one Forms) 2. Ergebnis-Merging 3. Doubletten-Eleminierung 4. mindestens AND und OR Operatoren 5. Übernahme Kurzbeschreibung 6. Searchengine hiding 7. Möglichkeit vollständige Suche
Suchen standardmäßig “AND” “OR” möglich String in Titel “NOT” und “NEAR” nicht möglich Stopwörter Doubletten zusammengefaßt
Ranking Eigenes Rankingsystem Zusätzliche Überprüfung Spamfilterung Zeitliches Ranking Server Clustern Test auf Existenz
QuickTips vor Suchergebnisse ausgegeben 2 Sorten selbst ausgesucht von Menschen D-N-S Quicktip gibt Domainnamen zurück arbeitet weiter im Hintergrund
Beschleuniger Statt QuickTips, Beschleuniger Vorteil: viel schneller Nachteil: möglicherweise veraltet
Qcheck (Quickcheck) Existenz- und Inhaltsprüfung Filtert Suchmaschinenbetrüger
Probleme Geänderte Ausgaben Korrekte Syntax Ziele der Einzelsuchmaschinen Werbung Überlastung
Hardware Verteilte System Sun Enterprise E450 mit Solaris 4 CPUs 1.6GB RAM 155Mbit/s Anschluß bis 5 weitere Sun/Linux Servers
Themen • MetaGer • Forschungsportal • Andere Projekte • MESA • de.* • HannUFind
Forschungsportal Besonders für Forschung Problem des Deepwebs lösen folge jedes Link besonders der Art: www.anyurl.dom/path?parameters 2000 Benutzer am Tag 8 Millionen Pages
Beispiele Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/ andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/suchen.cfm www.uni-kassel.de/forschungsbericht/ (Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)
Beispiele Typische wissenschaftliches Dokument: www.evl.uic.edu/spiff/casa/ andere Forschungssuchmaschinen www.tt.uni-hannover.de/UniForKat/suchen.cfm www.uni-kassel.de/forschungsbericht/ (Suche: “Identifying and Evaluating Successful Changes in Work Design and Corporate Organisation”)
Suchen 2 Arten von Suchen Textsuche Einrichtungssuche Operatoren: + - | _ “” ()
Ranking Nach Institution Anzahl der Hits Adressen Institution wichtiger als Dokument? Suche auf einzelne Institution
Einschränkungen Statische Links auf dem Inhalt http Regelung Browser lesbar
Weitere Feature Forschungslandkarten Hochschulen Max-Planck-Gesellschaft Frauenhofer Gesellschaft …
Themen • MetaGer • Forschungsportal • Andere Projekte • MESA • de.* • HannUFind
Andere Projekte: MESA • Meta E-mail Search Agent • Eingabe Name, Ausgabe e-mail Adresse • Fragt 7 e-mail Suchmaschinen ab
Andere Projekte: de.* • Newsgroup Suchmaschine • Wird eingestellt wegen Google/Deja
Andere Projekte: HannUFind • Volltextsuche aller Webserver der Uni Hannover • Über 100 Webserver • ca. 100,000 HTML Seiten pro Woche erfaßt
Quellen • MetaGer Homepage • meta.rrzn.uni-hannover.de/suma.html • Internet Information Retrieval • www.uni-hannover.de/inet98/paper.html • Forschungsportal • forschungsportal.net • metager.de/cris2002/
FUnktioniert das FUnkLAN? • Beispiel: suche nach “hamster futter” • Beispiel: suche nach “identifying changes corporate ekkehart frieling” • google, altavista, metacrawler, metager, forschungsportal • Beispiel: suche nach “solar cells”