260 likes | 376 Views
Iuk Tagung in Ulm, 10. bis 13. März 2002. Vernetzung von verteilten Informationssystemen. Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg <hohlfeld@uni-oldenburg.de>. Vernetzung von verteilten Informationssystemen.
E N D
Iuk Tagung in Ulm, 10. bis 13. März 2002 Vernetzung von verteiltenInformationssystemen Michael Hohlfeld Institute for Science Networking Oldenburg GmbH an der C.V.O. Universität Oldenburg <hohlfeld@uni-oldenburg.de>
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Übersicht • Verteilte Informationssyteme • PhysNet-Aktivitäten • Das Projekt SINN • OAD: Open Archives Distributed • Ergebnisse aus CARMEN • Ein kleiner Ausblick ... Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Verteilte Informationssysteme • Warum verteilte Informationssysteme? • riesige Informationsmenge im WWW • Suchmaschinen nicht wissenschaftsspezifisch • zentrale Systeme benötigen große Rechenleistung • Verteilte Dienste nutzen relevante (fachspezifische) Webserver als verteilte Datenbank Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Vorteile verteilter Systeme • durch die Beschränkung des Daten-raumes sind Relevanz und Qualität sichergestellt • Inhalte verbleiben auf den Servern der Erzeuger, diese behalten so die Kontrolle • beliebig skalierbar Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Anforderungen an verteilte Systeme • Zugriff auf heterogene Datenräume • Vernetzung verschiedener fachspezifischer Informationsdienste • Stabilität und Schnelligkeit Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Das Projekt SINN SINN: Suchmaschinennetzwerk im Internationalen Naturwissenschaftlichen Netz • Aufbau eines weltweiten Spiegel-Systems von PhysNet • Vernetzung von global verteilten Harvest-Brokern und -Gatherern Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Aufgaben in SINN • Aufbau des Suchmaschinenetzwerkes mittels der Harvest-Replicator Technik • Entwicklung einer Sprache zum Anfragen-austausch (basierend auf XML-Query) • Kommunikation zwischen den Such-maschinen mittels eines XML-Protokolls Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 PhysNet Spiegel weltweit • weltweit neun Spiegel des PhysNet-Dienstes (HTML-Seiten) • in der Schweiz (EPS), den USA, England, Russland, Frankreich, Indien, Niederlande, Deutschland • weitere Spiegel sind in Vorbereitung • dienen als Vorläufer des späteren Suchmaschinennetzwerkes Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Stand der Dinge • Einarbeitung in die interne Diskussion der W3C Arbeitsgruppe XML-Query • aktive Mitarbeit geplant • noch kein stabiler Standard • internationaler technischer Workshop im Dezember 2001 • Erfahrungsaustausch und intensive Diskussionen mit den internationalen Partnern von SINN/PhysNet Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Ergebnisse des Workshops • Verbesserung der Spiegelsoftware • Netz-Topologie vorerst zu vernachlässigen • regionale Gatherer und unabhängige Broker • Synchronisation der Gatherer und Broker • Austausch von Konfigurationsdateien • bei Ausfall eines Brokers: Liste mit Verweisen zu den alternativen Brokern der anderen Standorte Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 SINN 2002 • Optimierung der Harvest-Suchmaschinen • Einbau eines Rankings • Programmierung eines Harvest-Moduls für die Kommunikation zwischen den Brokern • Entwicklung eines XML-basierten Query- und Anwserprotokolles und Programmierung eines Harvest-Moduls, welches XML-Qurey versteht • Planung und Durchführung einer weiteren internationalen Tagung Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Informationen zu SINN • SINN ist ein Vorhaben in Rahmen des DFN-Projektes „Einsatz von Netzdiensten im wissenschaftlichen Informationswesen“ • Mittel des bmb+f und des Landes Niedersachsen • www.isn-oldenburg.de/projects/SINN Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Das Projekt OAD Open Archives: Distributed services for physicists and graduate students • DFG/NSF Projekt, gemeinsam mit Virginia Tech • Zugriff auf verteilte Daten + Dokumente • als Austauschprotokoll das OAi-Protokoll Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 PhysDoc als Data-Provider • stellt als Data-Provider Daten OAi-konform zur Verfügung • Harvest-Gatherer sammelt • Daten werden offline konvertiert und in einem Metadatencontainer (SQL-DB) gespeichert • Normalisierung der Daten • einfache Qualitätsfunktion • OAi-konforme Ausgabe (XML on-the-fly) • beliebige Ausgabeformate möglich und für andere Austauschprotokolle gewappnet Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 PhysDoc als Service-Provider • stellt als Service-Provider eine Suchfunktion zur Verfügung, welche die frei zugänglichen (und gut strukturierten) Dokumente bzw. Metadaten von • PhysDoc • Teilen des arXiv Eprint Archives • und von IOPP umfasst. Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Das Projekt CARMEN Content Analysis, Retrieval and MetaData: Effective Networking • Sonderfördermaßnahme im Rahmen von Global-Info mit Mitteln des bmb+f • Weiterentwicklung der Inhaltserschließung durch neue Verfahrenstechniken mit starker Verbindung zum Retrieval Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Arbeitsbereiche in CARMEN • (Weiter-)Entwicklung von Werkzeugen zur Erzeugung von Metadaten mit Dokumentenupload • Methoden der Authentifizierung und der dauerhaften Adressierung (digitale Signaturen und Persistent Identifier) • Konkordanzen von Klassifikationen und Thesauri • Entwicklung von umfassenden Retrievalkomponenten • Retrieval auf Metadaten, Datensätzen mit XML-Struktur • Suchfunktionen für verschiedene Datentypen, Klassifikationen • automatische Klassifikation, ... • Fachübergreifende Informationssysteme Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Ergebnisse aus CARMEN • Verknüpfung der Dokumentendienste PhysDoc und MPRESS in AP9 • Crosskonkordanzen zwischen PACS und MSC Klassifikationen • Entwicklung einer gemeinsamen Suchoberfläche für PhysDoc und MPRESS Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Neues PhysDoc Suchinterface • findet Anwendung in PhysDoc • zusätzlich Anbindung an das OAi-Protokoll • verschiedene Suchmöglichkeiten: • Quick-Search über gesamten PhysDoc-Datenbestand • Strukturierte Suche über den gesamten Bestand von PhysDoc und MPRESS • Strukturierte Suche über die mit Metadaten versehenden Teile von PhysDoc, arXiv und IOPP Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Zum Schluss ein kleiner Ausblick ...
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Vortrag Online: <www.isn-oldenburg.de/talks/ulm_maerz02/> Weitere Informationen: Institute for Science Networking <www.isn-oldenburg.de> Projekt SINN <www.isn-oldenburg.de/projects/SINN> Projekt CARMEN <www.mathematik.uni-osnabrueck.de/projects/CARMEN> Projekt Open Archives distributed (OAD) <www.isn-oldenburg.de/projects/OAD> Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH
Vernetzung von verteilten Informationssystemen Iuk Tagung in Ulm, 10. bis 13. März 2002 Vielen Dank für Ihre Aufmerksamkeit ! Michael Hohlfeld, Institute for Science Networking Oldenburg GmbH