380 likes | 476 Views
Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management. Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität Oldenburg severien@uni-oldenburg.de. Berlin, 7.7.2000. Anforderungen an ein Dokumentenarchiv.
E N D
Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität Oldenburg severien@uni-oldenburg.de Berlin, 7.7.2000
Anforderungen an ein Dokumentenarchiv • benötigter Rahmen: • Standards: • MetaDaten • DC / vcard • RDF • XML • RDF • MathML • CML • DigSig • Dienste • information systems • qualifying systems • Werkzeuge • Suchmaschinen • dynamic thesauri • Upload-tools 2 Berlin, 7.7.2000
Dokument - mehr als nur ein Text • Beispiele: • Publikation - elektronisches Äquivalent zum Paper • Dissertation • PrePrint - EPrint • Conference Talk • Arbeitsbericht, Projektbericht, ... • Web-Seite, persönliche Homepage • ... 3 Berlin, 7.7.2000
Dokument - mehr als nur ein Text • Zusammensetzung: • Text • Multimedia • verschiedene Versionen des Dokumentes • verschiedene Formate (Dateiformate) • Anmerkungen • Metadaten • Verknüpfungen • ... 4 Berlin, 7.7.2000
Dokument - mehr als nur ein Text beispielsweise DOC-Datei 5 Berlin, 7.7.2000
Dokument - mehr als nur ein Text beispielsweise DOC-Datei Viewer-Formate beispielsweise HTML, PDF, PS, ... Archiv-Formate wie SGML 6 Berlin, 7.7.2000
Dokument - mehr als nur ein Text Ausgangsformat Viewer-Formate Archiv-Formate 7 Berlin, 7.7.2000
Dokument - mehr als nur ein Text • Metadaten (=Daten über Daten) • Beschreiben die Datei • Autor • Titel • Abstract • Datum • Linking (Verknüpfung) • ... HTML Ausgangsformat Viewer-Formate Archiv-Formate 8 Berlin, 7.7.2000
Dokument - mehr als nur ein Text • “Shadow-File” • Metadaten HTML Ausgangsformat Viewer-Formate Archiv-Formate 9 Berlin, 7.7.2000
Stichwort: Metadaten • Wozu Metadaten: • Beschreibung des Dokumentes • automatisiert lesbar • definierte Syntax • definierte Semantik • Dublin-Core • vcard • OAiMS • ... Standardisierung Internationalisierung 10 Berlin, 7.7.2000
Stichwort: Metadaten • Dublin Core - Beispiel einer Semantik: • wenige = 15 • genau = qualified • definierte • Begriffe • zum “Object-Description” http://purl.org/DC 11 Berlin, 7.7.2000
Stichwort: Metadaten Dublin Core - die 15 Elemente: Title Format Creator Identifier Subject Relation Description Source Date Language Publisher Coverage Contributor Rights Type September 1998 RFC 2413 12 Berlin, 7.7.2000
Stichwort: Metadaten Dublin Core - DC.Creator - die Definition: Name: Creator Identifier: Creator Definition: An entity primarily responsible for making the content of the resource. Comment: Examples of a Creator include a person, an organisation, or a service. Typically, the name of a Creator should be used to indicate the entity. 13 Berlin, 7.7.2000
Stichwort: Metadaten vcard: Beschreibung von Personen (RFC2426) Definierte Felder: FN, N, NICKNAME, PHOTO, BDAY, ADR, LABEL, TEL, EMAIL, MAILER, TZ, GEO, TITLE, ROLE, LOGO, AGENT, ORG, CATEGORIES, NOTE, PRODID, REV, SORT-STRING, SOUND, URL, UID, VERSION, CLASS, KEY Beispiel einer Felddefinition: N: Family Name, Given Name, Additional Names, Honorific Prefixes, Honorific Suffixes 14 Berlin, 7.7.2000
Stichwort: Metadaten • vcard: Beschreibung von Personen • im Shadow-File • Vorteil: fester Bestandteil des Dokuments • Nachteil: bei Änderungen aufwendig zu pflegen • extern: Datenbank oder Homepage • Vorteil: leicht pflegbar - evtl. durch die Person selbst • Nachteil: geht leichter verloren • rechtliche Probleme 15 Berlin, 7.7.2000
Stichwort: Beschreibung v. Personen Realisation einer externen Lösung • Personal Homepages • contain all needed information • names • links to publication lists • description of research-activities • Advantages • Information up to date • rights stay with author • Problems • highly incoherent syntax • personal layout • highly dynamic information • Solution • Professional Homepages • Upload Form • Metadata • Global Search 16 Berlin, 7.7.2000
www.physik.uni-oldenburg.de/EPS/PHP Personal Homepage Web-Form Qualified Professional Homepage Developed together with R. Schwänzl and J. Plümer 17 Berlin, 7.7.2000
www.physik.uni-oldenburg.de/EPS/PHP professionalized homepages Query D i s t r. I n f o r m. http Cache Cache: Necessary to min. answering time Maximum caching time: 1 week http http Answers Links Developed together with R. Schwänzl and J. Plümer 18 Berlin, 7.7.2000
Von HTML zu XML und RDF • Shadow-File in HTML • Vorteile • Alle Suchmaschinen verstehen HTML • Datei kann auch als “Inhaltsbeschreibung” für menschliche Nutzer dienen. • Alle notwendigen Werkzeuge gibt es schon • Nachteile • Lineares Datenmodell (Name - Value -Paare) 19 Berlin, 7.7.2000
. . . 20 Was gibt es schon an Werkzeugen? (Autorentools) www.physik.uni-oldenburg.de/EPS/mmm 20 Berlin, 7.7.2000
Was gibt es schon an Werkzeugen? (Documentmanagementsystems) • Erzeugung von MetaData • Document-upload • Dokumenten-Pflege 21 Berlin, 7.7.2000
XML und RDF • Welche Vorteile bieten XML und RDF? • XML als “Ergänzung” von SGML und HTML • XML bietet ein baumförmiges Datenmodell • RDF wird in XML repräsentiert • RDF dient der “Content-Description” • RDF bietet beliebig komplexe Datenstruktur 22 Berlin, 7.7.2000
hat als Autor wird behauptet von wurde programmiert von Xylo http://www.math.uos.de S O Tamal RDF - ein Beispiel X P Alion 23 Berlin, 7.7.2000
RDF in XML - ein Beispiel <?xml version="1.0"?> <RDF xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:DC="http://purl.org/dc/elements/1.0#"> <Description about="http://www.math.uos.de/" bagID=“X"> <DC:Creator>Xylo</DC:Creator> </Description> <Description about=“#X" DC:Creator=“Tamal"/> </RDF> ... 24 Berlin, 7.7.2000
Dokument • “Shadow-File” • Metadaten • Beschreibung HTML XML Dokumentenserver für solche Dokumente gibt es schon - inkl. aller notwendigen Werkzeuge Ausgangsformat Viewer-Formate Archiv-Formate 25 Berlin, 7.7.2000
Dokument • “Shadow-File” • (Metadaten) • Beschreibung HTML XML • “Shadow-File” • Metadaten • Authentizität Ausgangsformat Viewer-Formate Archiv-Formate 26 Berlin, 7.7.2000
Dokument - signierbare Elemente HTML XML • Metadaten • Autor(en) • Titel • ... Ausgangsformat Viewer-Formate Archiv-Formate 27 Berlin, 7.7.2000
Dokument - signierbare Elemente HTML XML • Metadaten • Autor(en) • Titel • ... Ausgangsformat Viewer-Formate Archiv-Formate 28 Berlin, 7.7.2000
Dokument - signierbare Elemente HTML XML • Metadaten • Autor(en) • Titel • ... Ausgangsformat Viewer-Formate Archiv-Formate 29 Berlin, 7.7.2000
Dokument - signierbare Elemente HTML XML • Metadaten • Autor(en) • Titel • ... Ausgangsformat Viewer-Formate Archiv-Formate 30 Berlin, 7.7.2000
Dokument - signierbare Elemente ggf. durch unterschiedliche Instanzen HTML XML • Metadaten • Autor(en) • Titel • ... Ausgangsformat Viewer-Formate Archiv-Formate 31 Berlin, 7.7.2000
Auf dem Weg zum „Web of Trust“ • Authentizität • Alle Beteiligten brauchen Zertifikate • Problematik wenig publik • Werkzeuge noch unvernetzt • DigSig in XML (W3C-Arbeitsgruppe) • Canonicalization • Hashing • MD5, ... • Signature • DSA, RSA • Encoding • Base64, HMAC, ... 32 Berlin, 7.7.2000
Auf dem Weg zum „Web of Trust“ DigSig in XML - Ein Beispiel <Signature> <SignedInfo> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <SignatureMethod Algorithm="http://www.w3.org/2000/01/xmldsig/dsa" /> <Reference IDREF="Creator_1"> <Transforms> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <Transform Algorithm="http://www.w3.org/2000/01/xmldsig/null" /> <Encoding Algorithm="http://www.w3.org/2000/01/xmldsig/base64" /> </Transforms> <DigestMethod Algorithm="http://www.w3.org/2000/01/xmldsig/sha1" /> <DigestValue>b6cbc1f60795623cd2978e1d3de00599a5d3</DigestValue> </Reference> </SignedInfo> <SignatureValue>89f6f699669da7f326cf5778a72e3fae</SignatureValue> <KeyInfo> <keyname>solo</keyname> </KeyInfo> </Signature> 33 Berlin, 7.7.2000
HTML XML Vom Dokument zum Dokumentenserver “Shadow-File” “Shadow-File” Ausgangsformat Viewer-Formate Archiv-Formate 34 Berlin, 7.7.2000
CARMEN - Global-Info www.physik.uni-oldenburg.de/carmen Dez.1999 - Okt. 2001 HTML XML Vom Dokument zum Dokumentenserver • Suchmaschine • Metamaker (HTML / XML) • Dokumenten-Uploader • DigSig-Tool • Dokumentenverwaltung “Shadow-File” “Shadow-File” Ausgangsformat Viewer-Formate Archiv-Formate 35 Berlin, 7.7.2000
S S B S B G G G HARVEST B B S B G Nutzer G G S S Suchmaschinen Anforderungen: • Vernetzbarkeit (lokal vs. global) • Format-Vielfalt • Auswertung der Metadaten • Konfigurierbarkeit Vernetzung 2. Art • Open-Archives-Initiative openarchives.org 36 Berlin, 7.7.2000
37 Berlin, 7.7.2000
Acknowledgement • EPS European Physical Society (PhysNet) • DFN (Eprint-Projekt) • DFG (Dissertationen-Online) • BMBF - Global-Info-Projekt (Carmen) • Roland Schwänzl, Judith Plümer (RDF-Beispiele) • Michael Kaplan (DigSig-Beispiele) • Eberhard R. Hilf, Kerstin Zimmermann, Michael Hohlfeld Further Information: severien@uni-oldenburg.de 38 Berlin, 7.7.2000