100 likes | 230 Views
Intelligente Anwendungen im Internet. Seminar WS 2007/8. Prof. Dr. Katharina Morik. Lehrstuhl für Künstliche Intelligenz Fachbereich Informatik Universität Dortmund http://www-ai.cs.uni-dortmund.de morik@ls8.cs.uni-dortmund.de. Was machen wir heute?. Einführung
E N D
Intelligente Anwendungen im Internet Seminar WS 2007/8 Prof. Dr. Katharina Morik Lehrstuhl für Künstliche Intelligenz Fachbereich Informatik Universität Dortmund http://www-ai.cs.uni-dortmund.de morik@ls8.cs.uni-dortmund.de
Was machen wir heute? • Einführung • Anforderungen für einen Schein • Vorstellung der Themen • Referatvergabe
Suchmaschinen • 1990: Archie, Veronica Suche auf ftp-Servern nach Programmen und Dateien, Erstellung eines Katalogs • 1993: WWW und erste WebCrawler, die das Web durchlaufen • 1994: Suchmaschinen Lycos, Yahoo, ... • 1998: Google – erste Suchmaschine mit Lernalgorithmus (PageRank) Suchmaschinen geben auf eine Anfrage eine geordnete Liste von URLs zurück.
Defizite üblicher Suchmaschinen • Keine Verwendung von Wissen über einen Sachbereich • Keine Rückkopplung durch Benutzerinteraktion • Keine Anpassung an bestimmte Benutzer (Personalisierung) • Die Dynamik des Webs wird wenig berücksichtigt • Die URL-Listen werden unstrukturiert zurückgegeben • Neue Zusammenarbeitsformen (p2p) werden nicht unterstützt • ...
Forschungsthemen • Neue Suchmaschinen • Änderungsverfolgung • Personalisierung • Web Usage Mining (untersuchen, was Benutzer mit dem Web tun) • Web Mining (untersuchen, was im Web steht) • Clustering • ...
Scheine • Referat zu einem Thema halten • alle Fachbegriffe im Text verstehen, ggf. dazu weitere Literatur lesen • Seminarteilnehmern das Thema ansprechend vermitteln • Schriftliche Ausarbeitung, bei der • alle anderen Vorträge in Bezug zu dem eigenen Thema gesetzt werden, • richtige Literatur richtig zitiert wird! Im Text: [1] oder [Jatowt et al. 2004], im Literaturverzeichnis: A. Jatowt, K.K. Bun, M. Ishizuka (2004) Change Summarization in Web Collections, Procs. of the 17th international conference on Innovations in Applied Artificial Intelligence, 653 - 662
Gutachtengarantie • So viele Tage, wie Sie nach dem Semester brauchen, um Ihre Ausarbeitung fertigzustellen, • So viele Tage habe ich danach, um das Gutachten zu machen. • Es liegt also an Ihnen, wann Sie Ihren Schein bekommen!
Referatvergabe • 16.10. McCallum et al. (1999), Vorwissen: Viterbi Algorithmus • 23.10. Menczer (2002), Vorwissen: Neuronale Netze, Multiagentensysteme, Information Retrieval evtl. 2-3 Studierende • 30.10. Joachims (2002) Vorwissen: SVM • 6.11. Jatowt et al (2004) Vorwissen: Co-citation evtl. 16.10., jedenfalls nur ½ Sitzung Joachims et al. (1995) Vorwissen: nearest neighbor • 13.11. Kappel et al. (2001) evtl. 2 Studierende
continued • 20.11. Cooley et al. (1999) Vorwissen: frequent set mining • 27.11.Büchner/Mulvenna (1998) Vorwissen: data cubes • 4.12. Paganelli/Paterno (2002) evtl. streichenBonchi et al. (2001) Vorwissen: frequent set mining, Decision tree learning, SQL • 11.12. Kosala/Blockeel (2000)Vorwissen: Information extraction, Latent Semantic Indexing, HIT/PageRank, Wrapper Induction evtl. streichen • 18.12. Liu et al (2006) Vorwissen: Statistik
continued • 8.1. Agarwal et al. (2006)Vorwissen: Naive Bayes, (transductive) SVM, Expectation Minimization, Dichtefunktion • 15.1. Charikar et al. (1997)Vorwissen:Komplexitätstheorie • 22.1. Mobasha et al. (1999) evtl. streichen Vorwissen: frequent set mining, • 29.1. Wurst et al. (2006)Vorwissen: clustering • 5.2. Abschlussbesprechung