200 likes | 342 Views
Das MILESS Datenmodell einer Digitalen Bibliothek. http://miless.uni-essen.de/. Frank Lützenkirchen / Dieter Nastoll Universität Essen. Hochschul- rechenzentrum. Universitäts- bibliothek. Fachbereiche (Physik, Linguistik, ... ). Medien- zentrum. MILESS: Projektbeteiligte.
E N D
Das MILESS Datenmodell einer Digitalen Bibliothek http://miless.uni-essen.de/ Frank Lützenkirchen / Dieter Nastoll Universität Essen
Hochschul- rechenzentrum Universitäts- bibliothek Fachbereiche(Physik, Linguistik, ... ) Medien- zentrum MILESS: Projektbeteiligte
Lehr- und Lernmaterial istvorhanden, aber Ziele des MILESS Projektes: • Zentraler, einheitlicher Zugang für alle Fachbereiche, Suche und Navigation in einem homogenen System • Sachliche, systematische Erschließung in bibliothekarischer Qualität, Integration der Bibliothek in den Dokumentenworkflow MILESS: Intentionen und Ziele • oft mühsam auffindbar, verstreut in der Hochschule • keine systematische Ordnung
Archivierung und Sicherung, dauerhafte, zuverlässige Verfügbarkeit • Zentrale Plattform zur Verteilung von Materialien • Manipulationssicherheit, Digitale Signatur, Zugriffsschutz • Elektronische Dissertationen MILESS: Intentionen und Ziele Lehr- und Lernmaterial ist Ziele des MILESS Projektes: • oft flüchtig, Verfügbarkeit nicht garantiert • Pflege des Distributionssystems (Web-Server) aufwendig • Manipulationsgefahr, Urheberschutzprobleme
MILESS als „Digitale Bibliothek“ • Katalogsysteme: • Integration auf Metadatenebene, nur Nachweis (Link) • Keine Archivierung, keine Verfügbarkeitsgarantie • MILESS: • Dokumente werden im System selbst gehalten: Einheit von Metadaten und Inhalten • Verfügbarkeit der Inhalte kann garantiert werden • Keine ungültigen Verweise • Grundlage für zuverlässigen Einsatz in Vorlesung, Vor- und Nachbereitung, zur Schaffung von Zitierfähigkeit • Archivierung und Sicherung, Zugriffs- und Manipulationsschutz • Zusatzdienste werden ermöglicht, z. B. Suche im Volltext, nach Bildern (QBIC), ZIP-Generierung, ...
MILESS: Software-Komponenten Java Applets:Inhalte einbringen und bearbeiten HTML-Seiten: Suchmasken, Navigation, Inhalte anzeigen B R O W S E R MILESS Data Model Package(Java-Klassenbibliothek): Dokumente, Personen, Derivate, ... Servlet Communicator Java Servlets: Inhalte suchen, anzeigen, verwalten W E B - S R V MILESS Persistency Layer (Java-Klassenbibliothek): MILESS Daten-Objekte erzeugen, lesen, ändern, löschen, suchen C M IBM Content Manager/EIP API (C, C++, ActiveX, Java)
MILESS und Content Manager:Systemkomponenten HTTP OPAC-System Web-Server Web-Browser Java Servlet Engine:MILESS Server-Komponenten Java VM: AppletsMILESS Autoren-GUI HTML VideoChargerServer: Streaming von Audio/Video Daten (MPEG, ...) XML IBM Content Manager IBM 3494 Tape LibrarySystem Text Search Server:Volltext-Suche (Textindizes) Object Server:Dateien (PS, PDF, ...), zentral / dezentral Library Server:Metadaten (Titel, Autor, ...) IBM DB2 / Oracle TSM-Server: Langzeit-Archivierung
RS/6000 25T MILESS: Hardware-Basis RS/6000 SP Uni FDDIBackbone Frame 3 Frame 2 Frame 1 BWIN34 Mbit/s MILESS IBM CONTENT MANAGER Ethernet Ethernet Festplattensysteme SCSI RAID RAID 30 GB 30 GB SSA Scalable POWERParallel Switch SSA SSA SSA 58,5 GB 58,5 GB 36 GB RS232 Ethernet IBM 3494 Tape Library Kontrollworkstationsals HACWS-Cluster 3494-C2A 3494-L10 3494-D12 RS/6000 25T Ca. 800 Band- lager- fächer 3590 3590 3490 3490 3590 3590 HACWS-Cluster Stand 17.8.1998 NA
MILESS • MILESS Software ist in Java implementiert • MILESS Software selbst ist als Open Source verfügbar über • www.campussource.de (OpenSource-Börse am 1.4.2001 gestartet und vom Land NRW gefördert, Lehr- und Lernplattformen) • Erste Nachnutzung an anderen Universitäten in DFG-Projekten • MILESS ist Prototyp für das Projekt Bach Digital mit digi- • talisierten Autographen und Tonbeispielen an der Uni Leipzig • DFG Projekt „Digitale Online Video-Bibliothek“ Essen - Jena • Verteilte Digitale Bibliothek (Oberfläche, Objektverteilung) • Verbesserungen bei der Inhaltserschliessung und Segmentierung von digitalisiertem Video-Lehr-Material (insbes. Beispiele aus der Medizin)
MILESS Datenmodell • Dokumentenmodell ist Umsetzung des Dublin Core Element Set: • Creator, Publisher, Contributor, Title, Subject, Description, Source, Coverage, Rights, Type, Format, Date, Language • Ergänzt um Modell für Personen / Körperschaftsdaten: • Personen, Namensformen, Kontaktinformationen, ... • Ergänzt um Modell für Dokumenten-Derivate und Dateien • Ein Dokument in verschiedenen Formaten (HTML, PS, PDF, ...) • Metadatensatz ist abgestimmt auf / mit • Flexibles Modell auch für multimediale Dokumente Deutsche Bibliothek:Dissertationen Online
Architektur MILESS Datenmodell Classification Contact Category Document Role Legal Entity Derivate Person Coorperation DerivatePart
Titel, Dokumententyp, Sprache, Medientyp, Datumswerte, ... • Bis zu neun alternative Titel je Dokument, Sprache, Typ des Titels (main / alternative, translated), Länge beliebig, Volltextsuche im Titel • Angabe der Sprache(n) des Dokumentes anhand ISO 639-2 Liste • Mehrere Datumsangaben je Dokument: Datum der Erzeugung, der letzten Änderung, Gültigkeitszeitraum von / bis, Datum der Antragstellung zur Promotion, Datum der Prüfung (Dissertationen)
Autoren und Personendaten Bis zu je 10 Autoren, Herausgeber, Beitragende (Übersetzer, ...) je Dokument • Personen- / Körperschaftsdaten • Unterstützung mehrererNamensformen je Person, z. B. für verschiedene Schreibweisen, Nachname nach und vor der Heirat etc. • L/M/R-trunkierteSuche • Mehrere Kontakte (dienstl., privat) • Mehrere E-Mail- und Web- Adressen, Telefon, Telefax, Anschriften je Kontakt
Stichwörter, Klassifikationen • Freie Stichwörter / Schlagwörter • Unterstützung beliebiger hierarchischer Fachklassifikationen • Mehrfachzuordnung, parallele Verwendung mehrer Klassifikationen • Exakte Suche nach bestimmten Kategorien • Volltextsuche (Wörter, Phrasen) nach Kategorien und Stichwörtern
Stichwörter, Klassifikationen • Klassifikations- bäume können in MILESS integriert werden • Navigation durch die Hierarchie,Suche in der Hierarchie • Volltextsuche im Klassifikationssystem zum Auffinden von Kategorien ( z. B. PACS: ca. 2900 Kategorien )
Description, Source,Coverage, Rights • Description: Beschreibung oder Zusammenfassung (Abstract) • Source: Hinweis auf Herkunft (Freitext, ISBN-Angabe etc.) • Coverage: Räumlicher / zeitlicher Bezug des Dokumentes • Rights: Rechtliche Vermerke, Lizenzbedingungen etc. • Je bis zu 10 Angaben je Dokument, Länge beliebig • Freitext, URL (z. B. Verweis auf externe Zusammenfassung) oder andere Schemata, Sprache zu diesen Elementen erfaßbar • Volltextsuche in diesen Elementen
Unterstützung beliebiger Dateiformate • Skalierbarkeit des Systems: Spezielle Audio-/Videosoftware • Einsatz direkt in der Vorlesung: geringe technische Hemmschwelle MILESS: Intentionen und Ziele Multimediales Material: Ziele in MILESS: • Verschiedenste Formate • Audio / Videomaterialien: Große Datenmengen • Audio / Videomaterialien: Intensive Nutzung bisher nicht verbreitet
Dokumente und Derivate • Ein Dokument kann in mehreren Formaten (Derivate) vorliegen • Medientyp: Grobeinordnung, Formate: Genauere Angabe • Derivat kann in MILESS archiviert oder auch nur URL sein • Unterstützung beliebiger Dateiformate (erweiterbare Liste) • Beibehaltung der Verzeichnishierarchie des Derivates • Integrierter Verweis auf Plug-In-Sammlung, Anzeige Umfang • Generierung von zip-Archiven on the fly
Dokumente, Derivate, Dateien, Beschreibung der Formate Dokument 4711 „Nachweiss von atomarem Wasserstoff Medientyp: Text Derivat 12345 (derivat) Inhaltstyp: HTML-Dokument Derivat 12346 (derivat) Inhaltstyp: PDF-Dokument Derivat 12347 (derivat) Inhaltstyp: LaTeX-Dokument DerivateParts: - index.html HTML - images/abb1.gif GIF - images/abb2.jpg JPEG - kap1.html HTML DerivateParts: - wasserstoff.pdf PDF DerivateParts: - wasserstoff.tex LaTeX - images/abb1.eps EPS-Grafik - images/abb2.eps EPS-Grafik - layout.sty LaTeX Style
Weitere Modellbereiche -zukünftige Entwicklungsschritte • Modell zur Nutzer-, Rechte- Zugriffsverwaltung • Workflows zur Bearbeitung von Dokumenten • Digitale Signatur um Unverfälschtheit zu sichern • integrierte Versionsverwaltung • Strukturierte Dokumente: Buchmodell, Zeitschriftenmodell,..... • interne Dokumentstrukturen : Kapitel, Absatz • Beziehungen zwischen den Dokumenten : externe Aspekte