1 / 68

Vorlesung: Informationswissenschaft

Vorlesung: Informationswissenschaft. Prof. Dr. Rafael Capurro FH Stuttgart, Hochschule der Medien www.capurro.de 2003. Übersicht. Einführung I. Der elektronische Informationsmarkt II. Grundbegriffe des Information Retrieval III. Datenbankanbieter (Hosts) IV. WWW-Navigation

leigh
Download Presentation

Vorlesung: Informationswissenschaft

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Vorlesung: Informationswissenschaft Prof. Dr. Rafael Capurro FH Stuttgart, Hochschule der Medien www.capurro.de 2003

  2. Übersicht Einführung I. Der elektronische Informationsmarkt II. Grundbegriffe des Information Retrieval III. Datenbankanbieter (Hosts) IV. WWW-Navigation V. Bibliotheksportale VI. Evaluierung elektronischer Informationsmittel R. Capurro, Vorlesung Informationswissenschaft

  3. Einführung • Ziel der Vorlesung ist eine Einführung in die bibliographischen Methoden der wissenschaftlichen Arbeit mit besonderer Berücksichtigung elektronischer Information. • Die Studierenden sollten am Schluss der Vorlesung in der Lage sein, selbständig eine wissenschaftliche Bibliografie zu einem Thema ihrer Wahl zu erstellen und die dafür benutzten Informationsmittel zu evaluieren. R. Capurro, Vorlesung Informationswissenschaft

  4. Einführung Das Informationsdilemma besteht darin, • "daß die Informationsräume der komplexen Informationsmärkte, dafür konzipiert, informationelle Unsicherheit zu beseitigen, diese eher erhöhen. • Aus diesem allgemeinen Dilemma werden viele weitere folgen, z.B. daß das Überangebot an Information kaum mehr als unterstützend angesehen wird, ja eher als Belästigung, als Data smog (Shenk 1997) empfunden und häufig eher zurückgewiesen als nach seinem Nutzen untersucht wird." (Kuhlen 1999, 23) R. Capurro, Vorlesung Informationswissenschaft

  5. Einführung • Das Programm der gegenwärtigen Informationswirtschaft besteht darin, wie Kuhlen mit Recht betont, "Vertrauen bei den Nutzern elektronischer Dienste zu gewinnen", denn "ohne Vertrauen, kein Geschäft" (Kuhlen 1999, 13-14). • Ein entscheidender Mechanismus sind dabei die elektronischen Informationsassistenten, die immer mehr die personalen Assistenten ersetzen. Dabei delegiert der Nutzer immer mehr seine Urteilskraft und delegiert seine informationelle Autonomie an elektronische Assistenten. R. Capurro, Vorlesung Informationswissenschaft

  6. Einführung • Dieser Verlust informationeller Urteilskraft stellt für Kuhlen die fundamentale Frage der Informationsethik dar (Kuhlen 1999, 16). • Sie besteht, mit anderen Worten, darin, uns selbst und anderen aufzuklären, wann und wie, angesichts des Informationsdilemmas, ein gesundes Mißtrauen zur Bildung von Informationsautonomie angebracht ist. R. Capurro, Vorlesung Informationswissenschaft

  7. R. Capurro, Vorlesung Informationswissenschaft

  8. I. Der elektronische Informationsmarkt 1. Institutionen des Informationsmarktes (nach Kuhlen) • Institutionen der Produktion von Wissen und Wissensobjekten (vorwiegend auf der Grundlage öffentlicher Finanzierung): Hochschul- und Forschungseinrichtungen, private Organisationen • Institutionen der Speicherung von Wissensobjekten: alle Arten von öffentlich zugänglichen Bibliotheken R. Capurro, Vorlesung Informationswissenschaft

  9. I. Der elektronische Informationsmarkt • Institutionen der Verteilung von Wissensobjekten: wie (traditionell) Verlage und Bibliotheken sowie die neuen elektronischen Mittler. • Institutionen zur Durchführung von Informationsarbeit: wie Datenbasenersteller, sowie alle Institutionen, die für andere Institutionen Informationsarbeit leisten (z.B. klassische Bibliotheken, digitale Bibliotheken, Portale) R. Capurro, Vorlesung Informationswissenschaft

  10. I. Der elektronische Informationsmarkt • Institutionen des Angebots für primäre Informationsprodukte: Produzenten von Handbüchern, Bibliographien und Datenbanken (in elektronischer Form) • Institutionen der Vermittlung von Information: klassische Anbieter elektronischer Datenbanken (Hosts) (Online- und CD-ROM Produkte) • Institutionen der Multimedia-Industrie R. Capurro, Vorlesung Informationswissenschaft

  11. I. Der elektronische Informationsmarkt • Institutionen der Wissensindustrie: Herstellung von wissensbasierten Komponenten • Institutionen für Basis- und Mehrwertdienste elektronischer Kommunikationsnetze: in Zusammenhang mit Internet-Diensten • Institutionen zur Produktion und Verteilung elektronischer Informationsbanken R. Capurro, Vorlesung Informationswissenschaft

  12. I. Der elektronische Informationsmarkt Informationsarbeit(nach Kuhlen): 1. ‘Redaptive’ (rezeptiv-adaptive) Informationsarbeit: • Sich der eigenen Informationsdefizite bewußt sein, • Das Informationsproblem artikulieren können (Belkin “anomalous state of knowledge” ASK for IR) • Wissen über Metainformationen (Suchmaschine, Bibliothek...) besitzen R. Capurro, Vorlesung Informationswissenschaft

  13. I. Der elektronische Informationsmarkt • Potentielle Relevanz der Ressourcen einzuschätzen wissen • Über entsprechende finanzielle Mittel und über die Kompetenz bei der Nutzung der technischen Ressourcen verfügen. • Die erarbeiteten Informationen in ihrer Relevanz und in ihrem Wahrheitswert richtig einschätzen. R. Capurro, Vorlesung Informationswissenschaft

  14. I. Der elektronische Informationsmarkt 2. Konstruktive Informationsarbeit: • Rekonstruktion: Den Weg der Information (aus externen Wissensressourcen) nachvollziehen. • Rekontextualisierung: Den potentiellen Mehrwert von Wissensrepräsentationen einschätzen. • Distribution: Das produzierte, rekonstruierte Wissen auf Informationsmärkten austauschen. R. Capurro, Vorlesung Informationswissenschaft

  15. I. Der elektronische Informationsmarkt • Organisation: Die Verteilung von Informationsprodukten verlangt nach entsprechenden betriebswirtschaftlíchen Organisationsformen bis hin zur Marktforschung. • Vermittlung, Aufbereitung, Präsentation, Aktualisierung/Pflege: Webdesign, Entwicklung von Suchmaschinen und Navigationsverfahren, Portale, Intranet-Tools u.a. R. Capurro, Vorlesung Informationswissenschaft

  16. I. Der elektronische... • Arten von Datenbanken • nach Art der gespeicherten Informationen • bibliographische DB (Literatur, Patente) • Fakten-DB (z.B. Wirtschaftsinformationen) • Referral-DB (z.B. über Firmen, Produkte) • Volltext-DB (z.B. Presse) • Multimedia-DB (z.B. Lexika) • nach dem Inhalt • Naturwissenschaften und Technik • Wirtschaft (etc.) R. Capurro, Vorlesung Informationswissenschaft

  17. I. Der elektronische... • Struktur der Datenbanken: • Name der DB • Art/Typ der DB • Anbieter der DB • Sachgebiete • Inhaltliche Beschreibung • Geographische Abdeckung • Zeitliche Abdeckung • Aktualisierung • Sprache(n) • Quellen • Zuwachs (pro Jahr) • Suchhilfen R. Capurro, Vorlesung Informationswissenschaft

  18. I. Der elektronische... • Struktur der bibliographischen DB: • Formale Angaben (AN= Accession Number, ED=Entry Date) • Bibliographische Angaben: TI (Titel), AU (Author), CS (Corporate Source), SO (Source), PY (Publication Year), PT/DT (Publication/Document Type), LA (Language), CN (Country of Publication) • Inhaltliche Angaben: AB (Abstract), CC (Classification Code), DE (Deskriptoren; CT=Controlled Termes, IT= Index Terms) R. Capurro, Vorlesung Informationswissenschaft

  19. II. Grundbegriffe des Information Retrieval • Information Retrieval = Wiederfinden von Informationen (Recherche) • genauer: IR umfasst die Repräsentation, Speicherung, Organisation von und den Zugriff auf Informationen mit dem Ziel, alle für die Suchfrage relevanten (vorhandenen) Informationen wiederzufinden. R. Capurro, Vorlesung Informationswissenschaft

  20. II. Grundbegriffe... • Vorbereitung der Recherche • Durchführung der Recherche • Nachbereitung der Recherche • Bewertung der Ergebnisse R. Capurro, Vorlesung Informationswissenschaft

  21. II. Grundbegriffe... • Vorbereitung der Recherche: • Ermittlung des Informationsbedarfs des Nutzers (“pre-search interview”) • Auswahl der Hosts/der Datenbanken • Ermittlung der (einmaligen und laufenden) Kosten: Verbindungskosten (Anschaltzeit/connect time), Kosten der jeweiligen DB, Grundgebühren,Sondertarife... • Formulierung der Suchfrage R. Capurro, Vorlesung Informationswissenschaft

  22. II. Grundbegriffe... • Durchführung der Recherche: • Kommando-Retrieval (schnell, gezielt, für profis geeignet) oder Web-Search (einfach, für Endnutzer ohne Vorkenntnisse geeignet) • Änderung der Recherchestrategie • Suche in anderen Hosts/Datenbanken • Benutzerhilfen: Seminare, Dokumentationen, Help Desk, Websites, Auflistung der Befehle, Übungs-DB R. Capurro, Vorlesung Informationswissenschaft

  23. II. Grundbegriffe... Suchstrategien: • Suche im Freitext (BI = basic index). Nachteil: Mehrdeutigkeit der Sprache, Mehrsprachigkeit. • Suche in ausgewählten Feldern z.B. • Autor, Jahr, Sprache... • Suche im kontrollierten Vokabular (=Thesaurus) (DE = Deskriptoren) R. Capurro, Vorlesung Informationswissenschaft

  24. II. Grundbegriffe... Suchstrategien: • Blockbildung (Komponentenzerlegung) • Spezifische-Wörter-Priorität: den prägnantesten Begriff zuerst • Niedrigste-Treffer-Priorität • Zitatbasierte Erweiterungsstrategie • Schrittweise Verfeinerung R. Capurro, Vorlesung Informationswissenschaft

  25. II. Grundbegriffe... Die wichtigsten MESSENGER-Kommandos: FILE Auswahl der Datenbank, z.B. => FILE COMPUSCIENCE E (EXPAND) Suche im Index, z.B. => expand open sources S (SEARCH) Suche unter Eingabe von Suchbegriffen (mit AND, OR, NOT) bzw. von Expand-Nr., z.B. => search open AND source D (DISPLAY) Ausgabe der gefundenen Dokumente, z.B. => D L1 1 BIB LOGOFF Ende des Dialogs R. Capurro, Vorlesung Informationswissenschaft

  26. II. Grundbegriffe... • SEARCH • Eingabe von einfachen Suchbegriffen • Trunkierungen (?, #) • Logische Operatoren (AND, OR, NOT) • Abstandsoperatoren (Adjacency) (ADJ, W(ith) • Suche in Feldern (Titel/TI, Autor/AU, Deskriptoren/DE); Thesaurus • Anzeige der Suchstrategie • Ausgabemöglichkeiten (Sortieren) R. Capurro, Vorlesung Informationswissenschaft

  27. II. Grundbegriffe... • Nachbereitung der Recherche • Nutzer-orientierte Überprüfung der Rechercheergebnisse • Aufbereitung der Rechercheergebnisse • Darstellung • Sortierung, data mining • Beschaffung der Originaldokumente (document delivery, Bibliotheken, Internet) • Nachbesprechung R. Capurro, Vorlesung Informationswissenschaft

  28. II. Grundbegriffe... Systemorientierte Bewertung: • Recall: Zahl der relevanten ausgegebenen Dokumente ./. Zahl der relevanten Dokumente im Speicher • Precision: Zahl der relevanten ausgegebenen Dokumente ./. Zahl der insgesamt ausgegebenen Dokumente R. Capurro, Vorlesung Informationswissenschaft

  29. II. Grundbegriffe... Benutzerorientierte Bewertung: • Individuelle Relevanz (= Pertinenz) • Neuigkeitsquote (‘novelty ratio’) • Verhältnis aller für den Nutzer gefundenen und relevanten Dokumente zu den ihm bekannten und relevanten Dokumenten (‘coverage ratio’) • Verhältnis aller vom Nutzer analysierten relevanten Dokumente, zu der Gesamtzahl relevanter Dokumente, die er gern hätte analysieren wollen (‘sought recall’) • Soziale Relevanz (‘community’) • Sachrelevanz (Fachgebiet) R. Capurro, Vorlesung Informationswissenschaft

  30. III. Datenbankanbieter (Hosts) • FIZ Karlsruhe / STN International • GENIOS • GBI • FIZ Technik • DIMDI • JURIS • DIALOG • LexisNexis • Questel-Orbit R. Capurro, Vorlesung Informationswissenschaft

  31. III. Datenbankanbieter FIZ Karlsruhe / STN International • Fachgebiete: Astronomie und Astrophysik, Energie, Kernforschung und Kerntechnik, Luft- und Raumfahrt, Weltraumforschung, Mathematik und Informatik und Physik • ca. 200 Fachdatenbanken www.fiz-karlsruhe.de R. Capurro, Vorlesung Informationswissenschaft

  32. III. Datenbankanbieter GENIOS: www.genios.de • Fachgebiete: Wirtschaft • ca. 120 Fachdatenbanken • Exklusiv: Quellen der Verlagsgruppe Handelsblatt R. Capurro, Vorlesung Informationswissenschaft

  33. III. Datenbankanbieter... GBI: www.gbi.de • Fachgebiet: Wirtschaft • ca. 160 Fachdatenbanken • Exklusivangebot: FAZ, Börsen-Zeitung R. Capurro, Vorlesung Informationswissenschaft

  34. III. Datenbankanbieter FIZ Technik www.fiz-technik.de • Fachgebiete: Elektrotechnik und Elektronik Informationstechnik Maschinen- und Anlagenbau, Werkstoffe, Textil, Medizinische Technik, Betriebsführung und -organisation • ca. 120 Fachdatenbanken R. Capurro, Vorlesung Informationswissenschaft

  35. III. Datenbankanbieter DIMDI: www.dimdi.de • Fachgebiete: Medizin und Biowissenschaften • ca. 100 Fachdatenbanken R. Capurro, Vorlesung Informationswissenschaft

  36. III. Datenbankanbieter JURIS: www.juris.de Fachgebiete: Rechtssprechung, Rechtswissenschaften R. Capurro, Vorlesung Informationswissenschaft

  37. III. Datenbankanbieter • DIALOG: www.dialog.com Fachgebiete: *alle* • LexisNexis: www.lexis-nexis.de Fachgebiete: Wirtschaft • Questel-Orbit: www.questel-orbit.com Fachgebiete: Patente, Naturwissenschaften, Wirtschaft R. Capurro, Vorlesung Informationswissenschaft

  38. IV. WWW-Navigation: Suchmaschinen • “Suchmaschinen: Sie stehen in der Tradition des Matching-Paradigma des Information Retrieval und basieren auf der Indexierung von Web-Seiten. • Die Indexierung zeichnet sich durch das Prinzip der Postkoordination aus, gegenüber dem Klassifikationsansatz, wo die Sachgebiete in einem vorgegebenen (oder 'präkoordinierten') System angeordnet sind.” (Quelle: Kuhlen 1999, 239) R. Capurro, Vorlesung Informationswissenschaft

  39. IV. WWW-Navigation: Suchmaschinen Hier spielen die META-Tags, d.h. jene Zusatzinformationen, die der Autor eines Dokuments selbst vergeben kann, eine besondere Rolle. Die identifizierten Elemente werden invertiert, d.h. in einer alphabetisch geordnete Liste umgewandelt, aus der bestimmte nicht-sinntragenden Wörter sowie Flexionen usw. eliminiert werden.” (Kuhlen 1999) R. Capurro, Vorlesung Informationswissenschaft

  40. IV. WWW-Navigation: Suchmaschinen • Dabei verfolgen die Such-Roboter (auch Spider, Wanderer oder Worms genannt) rekursiv (in unterschiedlicher Tiefe) die Links der WWW-Dokumente und verwenden lexikalische Methoden, um bestimmte Terme aus den Dokumenten (URL, Titel, Überschriften, Link etc.) auszuwählen. R. Capurro, Vorlesung Informationswissenschaft

  41. IV. WWW-Navigation • Suchmaschinenkataloge • Suchmaschinen • Metasuchmaschinen • Webkataloge • Evaluierung von Suchmaschinen R. Capurro, Vorlesung Informationswissenschaft

  42. IV. WWW-Navigation: Suchmaschinenkataloge Suchmaschinenkataloge: • Search Engine Colossus www.searchenginecolossus.com sind mehr als 1.300 Suchmaschinen nach Ländern eingetragen. • Die Suchfibel: www.suchfibel.de ordnet ca. 1.600 Suchmaschinen nach verschiedenen Kriterien. R. Capurro, Vorlesung Informationswissenschaft

  43. IV. WWW-Navigation: Suchmaschinen www.google.com "Die englischsprachige Google-Maschine sucht das Web in hierarchischer Reihenfolge ab. • Seiten, die viele Links enthalten, sind wichtiger und stehen ganz oben. Hinweise zum Suchen gibt's bei "Search Tips". • Service: Der praktische "Feeling Lucky"-Button bringt Sie ohne weiteres Klicken zur besten gefundenen Website. • Speed: Reaktionsgeschwindigkeit: 3,87 Sekunden. • Verfügbarkeit: 97,20 Prozent. • Stichprobe: 33,3 Prozent der Fragen mit dem ersten Treffer beantwortet Kunstwort: "Klompfastikumpi" gefunden. • Geheimtipp mit guten Ergebnissen bei Mainstrean-Themen. Note: 3” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  44. IV. WWW-Navigation: Metasuchmaschinen • “So funktioniert's: Meta-Suchmaschinen führen keinen eigenen Datenbestand, sondern durchsuchenmehrere Volltextsuchmaschinen, aber auch Web-Ktaloge und andere Datenbanken gleichzeitig. • Während des Suchvorgangs können Sie die Ergebnisse bereits auf Ihrem Bildschirm verfolgen: Dort wird dann etwa aufgelistet: "Yahoo: 5 Treffer, Altavista: 10 Treffer.." • Am Ende zeigen die Netzsammler alle gefundenen Websites.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  45. IV. WWW-Navigation: Metasuchmaschinen • “Vorteile: Ein riesiger Datenbestand kann zeitsparend durchsucht werden. • Nachteile: Die Ergebnisse hängen von der Qualität der abgefragten Suchmaschinen ab. Bei unspezifischen Anfragen liefern die Meta-Suchmaschinen oft zu viele oder unbrauchbare Treffer.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  46. IV. WWW-Navigation: Metasuchmaschinen www.metager.de "Die Suchmaschine über deutsche Suchmaschinen" durchforstet deutschsprachige Suchmaschinen - gleichzeitig und nicht hintereinander wie andere Metasucher. • Service: Die Funktion "Teste Treffer auf Existenz und sortiere nach Änderungsdatum" ist extrem hilfreich. • Speed: Reaktionsgeschwindigkeit: 12,62 Sekunden. • Verfügbarkeit: 100 Prozent. • Stichprobe: 83,3 Prozent der Fragen mit dem ersten Treffer beantwortet Kunstwort: "Klompfastikumpi" gefunden. • Ständig verfügbarer Top-Dienst bei den Meta-Maschinen. Note: 2” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  47. IV. WWW-Navigation: Webkataloge • "So funktioniert's: Während bei Suchmaschinen so genannte Searchbots das Netz automatisch nach Material durchackern, sitzen bei einem Web-Katalog Menschen. • Diese klicken sich durch Webseiten und indizieren sie, das heißt sie ordnen den Seiten Schlagwörter zu. • Wenn Sie sich zu einem Web-Katalog klicken und eine Suche starten, werden dort die hierarchisch vorsortierten Schlagwortkataloge durchforstet.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  48. IV. WWW-Navigation: Webkataloge • “Vorteile: • Fast jeder Treffer ist auch relevant, • unpassende Ergebnisse gibt es selten. • Sie erhalten ein differenziereres Bild und ersparen sich Blindgänger. • Nachteile: • Links nicht immer aktuell. • Qualität der Einträge variiert je nach Redakteur. • Die Suche nach sehr speziellen Wörtern ist nur eingeschränkt sinnvoll, da diese oft nicht verschlagwortet sind.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  49. IV. WWW-Navigation: Webkataloge www.web.de "Der deutsche Web-Katalog Web-de bietet die Suche per Stichwort oder Browsen in den redaktionellen Katalogen an. Sie können auch die Nachrichten, Chats und News-groups durchsuchen. • Service: Free-e-Mail, Newsgroups, Gruß-karten, Shopping-Hilfe, Wettervorhersagen, Telefontarife, WAP-Suche • Speed: Reaktionsgeschwindigkeit: 6,04 Sekunden • Verfügbarkeit: 97,12 Prozent • Stichprobe: 33,3 Prozent der Fragen mit dem ersten Treffer beantwortet • Kunstwort: "Klompfastikumpi" gefunden • Super-Serviceangebot, Defizite in der Geschwindigkeit Note: 3" (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft

  50. IV. WWW-Navigation: Evaluierung Evaluierungen im Netz: • Searchenginewatch.com • Searchengineshowdown.com R. Capurro, Vorlesung Informationswissenschaft

More Related