690 likes | 850 Views
Vorlesung: Informationswissenschaft. Prof. Dr. Rafael Capurro FH Stuttgart, Hochschule der Medien www.capurro.de 2003. Übersicht. Einführung I. Der elektronische Informationsmarkt II. Grundbegriffe des Information Retrieval III. Datenbankanbieter (Hosts) IV. WWW-Navigation
E N D
Vorlesung: Informationswissenschaft Prof. Dr. Rafael Capurro FH Stuttgart, Hochschule der Medien www.capurro.de 2003
Übersicht Einführung I. Der elektronische Informationsmarkt II. Grundbegriffe des Information Retrieval III. Datenbankanbieter (Hosts) IV. WWW-Navigation V. Bibliotheksportale VI. Evaluierung elektronischer Informationsmittel R. Capurro, Vorlesung Informationswissenschaft
Einführung • Ziel der Vorlesung ist eine Einführung in die bibliographischen Methoden der wissenschaftlichen Arbeit mit besonderer Berücksichtigung elektronischer Information. • Die Studierenden sollten am Schluss der Vorlesung in der Lage sein, selbständig eine wissenschaftliche Bibliografie zu einem Thema ihrer Wahl zu erstellen und die dafür benutzten Informationsmittel zu evaluieren. R. Capurro, Vorlesung Informationswissenschaft
Einführung Das Informationsdilemma besteht darin, • "daß die Informationsräume der komplexen Informationsmärkte, dafür konzipiert, informationelle Unsicherheit zu beseitigen, diese eher erhöhen. • Aus diesem allgemeinen Dilemma werden viele weitere folgen, z.B. daß das Überangebot an Information kaum mehr als unterstützend angesehen wird, ja eher als Belästigung, als Data smog (Shenk 1997) empfunden und häufig eher zurückgewiesen als nach seinem Nutzen untersucht wird." (Kuhlen 1999, 23) R. Capurro, Vorlesung Informationswissenschaft
Einführung • Das Programm der gegenwärtigen Informationswirtschaft besteht darin, wie Kuhlen mit Recht betont, "Vertrauen bei den Nutzern elektronischer Dienste zu gewinnen", denn "ohne Vertrauen, kein Geschäft" (Kuhlen 1999, 13-14). • Ein entscheidender Mechanismus sind dabei die elektronischen Informationsassistenten, die immer mehr die personalen Assistenten ersetzen. Dabei delegiert der Nutzer immer mehr seine Urteilskraft und delegiert seine informationelle Autonomie an elektronische Assistenten. R. Capurro, Vorlesung Informationswissenschaft
Einführung • Dieser Verlust informationeller Urteilskraft stellt für Kuhlen die fundamentale Frage der Informationsethik dar (Kuhlen 1999, 16). • Sie besteht, mit anderen Worten, darin, uns selbst und anderen aufzuklären, wann und wie, angesichts des Informationsdilemmas, ein gesundes Mißtrauen zur Bildung von Informationsautonomie angebracht ist. R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt 1. Institutionen des Informationsmarktes (nach Kuhlen) • Institutionen der Produktion von Wissen und Wissensobjekten (vorwiegend auf der Grundlage öffentlicher Finanzierung): Hochschul- und Forschungseinrichtungen, private Organisationen • Institutionen der Speicherung von Wissensobjekten: alle Arten von öffentlich zugänglichen Bibliotheken R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt • Institutionen der Verteilung von Wissensobjekten: wie (traditionell) Verlage und Bibliotheken sowie die neuen elektronischen Mittler. • Institutionen zur Durchführung von Informationsarbeit: wie Datenbasenersteller, sowie alle Institutionen, die für andere Institutionen Informationsarbeit leisten (z.B. klassische Bibliotheken, digitale Bibliotheken, Portale) R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt • Institutionen des Angebots für primäre Informationsprodukte: Produzenten von Handbüchern, Bibliographien und Datenbanken (in elektronischer Form) • Institutionen der Vermittlung von Information: klassische Anbieter elektronischer Datenbanken (Hosts) (Online- und CD-ROM Produkte) • Institutionen der Multimedia-Industrie R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt • Institutionen der Wissensindustrie: Herstellung von wissensbasierten Komponenten • Institutionen für Basis- und Mehrwertdienste elektronischer Kommunikationsnetze: in Zusammenhang mit Internet-Diensten • Institutionen zur Produktion und Verteilung elektronischer Informationsbanken R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt Informationsarbeit(nach Kuhlen): 1. ‘Redaptive’ (rezeptiv-adaptive) Informationsarbeit: • Sich der eigenen Informationsdefizite bewußt sein, • Das Informationsproblem artikulieren können (Belkin “anomalous state of knowledge” ASK for IR) • Wissen über Metainformationen (Suchmaschine, Bibliothek...) besitzen R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt • Potentielle Relevanz der Ressourcen einzuschätzen wissen • Über entsprechende finanzielle Mittel und über die Kompetenz bei der Nutzung der technischen Ressourcen verfügen. • Die erarbeiteten Informationen in ihrer Relevanz und in ihrem Wahrheitswert richtig einschätzen. R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt 2. Konstruktive Informationsarbeit: • Rekonstruktion: Den Weg der Information (aus externen Wissensressourcen) nachvollziehen. • Rekontextualisierung: Den potentiellen Mehrwert von Wissensrepräsentationen einschätzen. • Distribution: Das produzierte, rekonstruierte Wissen auf Informationsmärkten austauschen. R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische Informationsmarkt • Organisation: Die Verteilung von Informationsprodukten verlangt nach entsprechenden betriebswirtschaftlíchen Organisationsformen bis hin zur Marktforschung. • Vermittlung, Aufbereitung, Präsentation, Aktualisierung/Pflege: Webdesign, Entwicklung von Suchmaschinen und Navigationsverfahren, Portale, Intranet-Tools u.a. R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische... • Arten von Datenbanken • nach Art der gespeicherten Informationen • bibliographische DB (Literatur, Patente) • Fakten-DB (z.B. Wirtschaftsinformationen) • Referral-DB (z.B. über Firmen, Produkte) • Volltext-DB (z.B. Presse) • Multimedia-DB (z.B. Lexika) • nach dem Inhalt • Naturwissenschaften und Technik • Wirtschaft (etc.) R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische... • Struktur der Datenbanken: • Name der DB • Art/Typ der DB • Anbieter der DB • Sachgebiete • Inhaltliche Beschreibung • Geographische Abdeckung • Zeitliche Abdeckung • Aktualisierung • Sprache(n) • Quellen • Zuwachs (pro Jahr) • Suchhilfen R. Capurro, Vorlesung Informationswissenschaft
I. Der elektronische... • Struktur der bibliographischen DB: • Formale Angaben (AN= Accession Number, ED=Entry Date) • Bibliographische Angaben: TI (Titel), AU (Author), CS (Corporate Source), SO (Source), PY (Publication Year), PT/DT (Publication/Document Type), LA (Language), CN (Country of Publication) • Inhaltliche Angaben: AB (Abstract), CC (Classification Code), DE (Deskriptoren; CT=Controlled Termes, IT= Index Terms) R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe des Information Retrieval • Information Retrieval = Wiederfinden von Informationen (Recherche) • genauer: IR umfasst die Repräsentation, Speicherung, Organisation von und den Zugriff auf Informationen mit dem Ziel, alle für die Suchfrage relevanten (vorhandenen) Informationen wiederzufinden. R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... • Vorbereitung der Recherche • Durchführung der Recherche • Nachbereitung der Recherche • Bewertung der Ergebnisse R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... • Vorbereitung der Recherche: • Ermittlung des Informationsbedarfs des Nutzers (“pre-search interview”) • Auswahl der Hosts/der Datenbanken • Ermittlung der (einmaligen und laufenden) Kosten: Verbindungskosten (Anschaltzeit/connect time), Kosten der jeweiligen DB, Grundgebühren,Sondertarife... • Formulierung der Suchfrage R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... • Durchführung der Recherche: • Kommando-Retrieval (schnell, gezielt, für profis geeignet) oder Web-Search (einfach, für Endnutzer ohne Vorkenntnisse geeignet) • Änderung der Recherchestrategie • Suche in anderen Hosts/Datenbanken • Benutzerhilfen: Seminare, Dokumentationen, Help Desk, Websites, Auflistung der Befehle, Übungs-DB R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... Suchstrategien: • Suche im Freitext (BI = basic index). Nachteil: Mehrdeutigkeit der Sprache, Mehrsprachigkeit. • Suche in ausgewählten Feldern z.B. • Autor, Jahr, Sprache... • Suche im kontrollierten Vokabular (=Thesaurus) (DE = Deskriptoren) R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... Suchstrategien: • Blockbildung (Komponentenzerlegung) • Spezifische-Wörter-Priorität: den prägnantesten Begriff zuerst • Niedrigste-Treffer-Priorität • Zitatbasierte Erweiterungsstrategie • Schrittweise Verfeinerung R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... Die wichtigsten MESSENGER-Kommandos: FILE Auswahl der Datenbank, z.B. => FILE COMPUSCIENCE E (EXPAND) Suche im Index, z.B. => expand open sources S (SEARCH) Suche unter Eingabe von Suchbegriffen (mit AND, OR, NOT) bzw. von Expand-Nr., z.B. => search open AND source D (DISPLAY) Ausgabe der gefundenen Dokumente, z.B. => D L1 1 BIB LOGOFF Ende des Dialogs R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... • SEARCH • Eingabe von einfachen Suchbegriffen • Trunkierungen (?, #) • Logische Operatoren (AND, OR, NOT) • Abstandsoperatoren (Adjacency) (ADJ, W(ith) • Suche in Feldern (Titel/TI, Autor/AU, Deskriptoren/DE); Thesaurus • Anzeige der Suchstrategie • Ausgabemöglichkeiten (Sortieren) R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... • Nachbereitung der Recherche • Nutzer-orientierte Überprüfung der Rechercheergebnisse • Aufbereitung der Rechercheergebnisse • Darstellung • Sortierung, data mining • Beschaffung der Originaldokumente (document delivery, Bibliotheken, Internet) • Nachbesprechung R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... Systemorientierte Bewertung: • Recall: Zahl der relevanten ausgegebenen Dokumente ./. Zahl der relevanten Dokumente im Speicher • Precision: Zahl der relevanten ausgegebenen Dokumente ./. Zahl der insgesamt ausgegebenen Dokumente R. Capurro, Vorlesung Informationswissenschaft
II. Grundbegriffe... Benutzerorientierte Bewertung: • Individuelle Relevanz (= Pertinenz) • Neuigkeitsquote (‘novelty ratio’) • Verhältnis aller für den Nutzer gefundenen und relevanten Dokumente zu den ihm bekannten und relevanten Dokumenten (‘coverage ratio’) • Verhältnis aller vom Nutzer analysierten relevanten Dokumente, zu der Gesamtzahl relevanter Dokumente, die er gern hätte analysieren wollen (‘sought recall’) • Soziale Relevanz (‘community’) • Sachrelevanz (Fachgebiet) R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter (Hosts) • FIZ Karlsruhe / STN International • GENIOS • GBI • FIZ Technik • DIMDI • JURIS • DIALOG • LexisNexis • Questel-Orbit R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter FIZ Karlsruhe / STN International • Fachgebiete: Astronomie und Astrophysik, Energie, Kernforschung und Kerntechnik, Luft- und Raumfahrt, Weltraumforschung, Mathematik und Informatik und Physik • ca. 200 Fachdatenbanken www.fiz-karlsruhe.de R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter GENIOS: www.genios.de • Fachgebiete: Wirtschaft • ca. 120 Fachdatenbanken • Exklusiv: Quellen der Verlagsgruppe Handelsblatt R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter... GBI: www.gbi.de • Fachgebiet: Wirtschaft • ca. 160 Fachdatenbanken • Exklusivangebot: FAZ, Börsen-Zeitung R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter FIZ Technik www.fiz-technik.de • Fachgebiete: Elektrotechnik und Elektronik Informationstechnik Maschinen- und Anlagenbau, Werkstoffe, Textil, Medizinische Technik, Betriebsführung und -organisation • ca. 120 Fachdatenbanken R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter DIMDI: www.dimdi.de • Fachgebiete: Medizin und Biowissenschaften • ca. 100 Fachdatenbanken R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter JURIS: www.juris.de Fachgebiete: Rechtssprechung, Rechtswissenschaften R. Capurro, Vorlesung Informationswissenschaft
III. Datenbankanbieter • DIALOG: www.dialog.com Fachgebiete: *alle* • LexisNexis: www.lexis-nexis.de Fachgebiete: Wirtschaft • Questel-Orbit: www.questel-orbit.com Fachgebiete: Patente, Naturwissenschaften, Wirtschaft R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Suchmaschinen • “Suchmaschinen: Sie stehen in der Tradition des Matching-Paradigma des Information Retrieval und basieren auf der Indexierung von Web-Seiten. • Die Indexierung zeichnet sich durch das Prinzip der Postkoordination aus, gegenüber dem Klassifikationsansatz, wo die Sachgebiete in einem vorgegebenen (oder 'präkoordinierten') System angeordnet sind.” (Quelle: Kuhlen 1999, 239) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Suchmaschinen Hier spielen die META-Tags, d.h. jene Zusatzinformationen, die der Autor eines Dokuments selbst vergeben kann, eine besondere Rolle. Die identifizierten Elemente werden invertiert, d.h. in einer alphabetisch geordnete Liste umgewandelt, aus der bestimmte nicht-sinntragenden Wörter sowie Flexionen usw. eliminiert werden.” (Kuhlen 1999) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Suchmaschinen • Dabei verfolgen die Such-Roboter (auch Spider, Wanderer oder Worms genannt) rekursiv (in unterschiedlicher Tiefe) die Links der WWW-Dokumente und verwenden lexikalische Methoden, um bestimmte Terme aus den Dokumenten (URL, Titel, Überschriften, Link etc.) auszuwählen. R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation • Suchmaschinenkataloge • Suchmaschinen • Metasuchmaschinen • Webkataloge • Evaluierung von Suchmaschinen R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Suchmaschinenkataloge Suchmaschinenkataloge: • Search Engine Colossus www.searchenginecolossus.com sind mehr als 1.300 Suchmaschinen nach Ländern eingetragen. • Die Suchfibel: www.suchfibel.de ordnet ca. 1.600 Suchmaschinen nach verschiedenen Kriterien. R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Suchmaschinen www.google.com "Die englischsprachige Google-Maschine sucht das Web in hierarchischer Reihenfolge ab. • Seiten, die viele Links enthalten, sind wichtiger und stehen ganz oben. Hinweise zum Suchen gibt's bei "Search Tips". • Service: Der praktische "Feeling Lucky"-Button bringt Sie ohne weiteres Klicken zur besten gefundenen Website. • Speed: Reaktionsgeschwindigkeit: 3,87 Sekunden. • Verfügbarkeit: 97,20 Prozent. • Stichprobe: 33,3 Prozent der Fragen mit dem ersten Treffer beantwortet Kunstwort: "Klompfastikumpi" gefunden. • Geheimtipp mit guten Ergebnissen bei Mainstrean-Themen. Note: 3” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Metasuchmaschinen • “So funktioniert's: Meta-Suchmaschinen führen keinen eigenen Datenbestand, sondern durchsuchenmehrere Volltextsuchmaschinen, aber auch Web-Ktaloge und andere Datenbanken gleichzeitig. • Während des Suchvorgangs können Sie die Ergebnisse bereits auf Ihrem Bildschirm verfolgen: Dort wird dann etwa aufgelistet: "Yahoo: 5 Treffer, Altavista: 10 Treffer.." • Am Ende zeigen die Netzsammler alle gefundenen Websites.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Metasuchmaschinen • “Vorteile: Ein riesiger Datenbestand kann zeitsparend durchsucht werden. • Nachteile: Die Ergebnisse hängen von der Qualität der abgefragten Suchmaschinen ab. Bei unspezifischen Anfragen liefern die Meta-Suchmaschinen oft zu viele oder unbrauchbare Treffer.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Metasuchmaschinen www.metager.de "Die Suchmaschine über deutsche Suchmaschinen" durchforstet deutschsprachige Suchmaschinen - gleichzeitig und nicht hintereinander wie andere Metasucher. • Service: Die Funktion "Teste Treffer auf Existenz und sortiere nach Änderungsdatum" ist extrem hilfreich. • Speed: Reaktionsgeschwindigkeit: 12,62 Sekunden. • Verfügbarkeit: 100 Prozent. • Stichprobe: 83,3 Prozent der Fragen mit dem ersten Treffer beantwortet Kunstwort: "Klompfastikumpi" gefunden. • Ständig verfügbarer Top-Dienst bei den Meta-Maschinen. Note: 2” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Webkataloge • "So funktioniert's: Während bei Suchmaschinen so genannte Searchbots das Netz automatisch nach Material durchackern, sitzen bei einem Web-Katalog Menschen. • Diese klicken sich durch Webseiten und indizieren sie, das heißt sie ordnen den Seiten Schlagwörter zu. • Wenn Sie sich zu einem Web-Katalog klicken und eine Suche starten, werden dort die hierarchisch vorsortierten Schlagwortkataloge durchforstet.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Webkataloge • “Vorteile: • Fast jeder Treffer ist auch relevant, • unpassende Ergebnisse gibt es selten. • Sie erhalten ein differenziereres Bild und ersparen sich Blindgänger. • Nachteile: • Links nicht immer aktuell. • Qualität der Einträge variiert je nach Redakteur. • Die Suche nach sehr speziellen Wörtern ist nur eingeschränkt sinnvoll, da diese oft nicht verschlagwortet sind.” (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Webkataloge www.web.de "Der deutsche Web-Katalog Web-de bietet die Suche per Stichwort oder Browsen in den redaktionellen Katalogen an. Sie können auch die Nachrichten, Chats und News-groups durchsuchen. • Service: Free-e-Mail, Newsgroups, Gruß-karten, Shopping-Hilfe, Wettervorhersagen, Telefontarife, WAP-Suche • Speed: Reaktionsgeschwindigkeit: 6,04 Sekunden • Verfügbarkeit: 97,12 Prozent • Stichprobe: 33,3 Prozent der Fragen mit dem ersten Treffer beantwortet • Kunstwort: "Klompfastikumpi" gefunden • Super-Serviceangebot, Defizite in der Geschwindigkeit Note: 3" (Quelle: Tomorrow 5, 2000) R. Capurro, Vorlesung Informationswissenschaft
IV. WWW-Navigation: Evaluierung Evaluierungen im Netz: • Searchenginewatch.com • Searchengineshowdown.com R. Capurro, Vorlesung Informationswissenschaft