180 likes | 255 Views
Patrick Sahle Erfahrungen mit einem internationalen Standard zur Handschriftenbeschreibung: CEEC und MASTER. Grundlagen, Ziele, Verwendungsmöglichkeiten. MASTER - der Rahmen EU-Projekt Januar 1999 - Juni 2001
E N D
Patrick Sahle Erfahrungen mit einem internationalen Standard zur Handschriftenbeschreibung: CEEC und MASTER
MASTER - der Rahmen • EU-Projekt Januar 1999 - Juni 2001 • Verschiedene Projektpartner und assoziierte Partner (Bibliotheken, Universitäten [Humanities Computing]) • Hauptziel: Ermöglichung eines allgemeinen Handschriftenkataloges • Definition eines Standards für maschinenlesbare Handschriften- beschreibungen • Bereitstellung von Software zur Erstellung und Kontrolle (Validierung) dieser Katalogisate • Tests mit Beispielkatalogisaten und deren Bereitstellung im Internet • Schulung von Personal in den beteiligten Bibliotheken (und darüber hinaus)
MASTER - der Standard (allgemein I) • Technische Grundlage: Textauszeichnungssprachen (SGML/XML) • Internationaler, weitgehend etablierter Standard (ISO, W3C) • Ermöglicht einfache und komplexe Beschreibungen (Inhomogene Daten) • Erlaubt feldorientierte und textorientierte Daten • Grundsätzlich hierarchische Struktur aus “Elementen“ (die Struktur kann “über“ einen Text gelegt werden) • Die Beschreibung der Daten kann vom Allgemeinen zum Detail verlaufen (und dabei auf jeder Stufe stehen bleiben) • Ziel: • Möglichst allgemeine Verwendbarkeit • nicht software- oder nutzungsspezifisch • Möglichst hohe Kompatibilität zu anderen Standards • vor allem: TEI (Text Encoding Initiative); gemeinsames Ergebnis
MASTER - der Standard (allgemein II) • Inhaltlich • kein neues Katalogisierungskonzept, sondern ... • Integration (= Abstraktion) möglichst vieler bestehender Katalogisierungskonzepte unter einer allgemeinen Perspektive • zwangsläufige „Weichheit“ der Definitionen
MASTER - die Verwendung des Standards • Schaffung neuer Katalogisate (in welcher Tradition auch immer) • Retrokonversion alter (gedruckter) Katlogisate • Fernziel: • Erstellung eines allgemeinen Handschriftenkataloges • Aber: keine zentrale Leitung und Organisation zwingend erforderlich • Möglichkeit dezentraler Handschriftenkataloge (CEEC) • Möglichkeit der späteren Integration verschiedener Kataloge
Interpretationsspielraum bei der Anwendung • MASTER - der Standard (technisch) • Es ist eine DTD (Document Type Definition) • Eine DTD beschreibt die Struktur eines bestimmten Typs von Dokument (Hier: des Typs Handschriftenkatalogisat) • Durch die formale Definition der Struktur können die Daten mit der DTD geprüft (validiert) werden • Die in der DTD formal definierten Elemente werden außerhalb der DTD sprachlich erläutert • Beispiel: Handschrifteninhalt - msContents • The <msContents> element is used to describe the intellectual content of a manuscript or manuscript part. It comprises either a series of informal prose paragraphs or a series of more structured <msItem> elements, each of which provides a more detailed description of a single item contained within the manuscript. • Beispiel: Beschreibungskopf - msHeading • The <msHeading> element may simply hold a short summary title, `heading', or `tombstone' specifying a supplied title or heading applicable to the whole of a manuscript, or this may be complemented with other elements. • Beispiel: "Buchschmuck-Detail" - decoNote • Contains a note describing either a decorative component of a manuscript, or a fairly homogenous class of such components.
Identifikation der Handschrift Signatur, Bestand, alte Signaturen etc. Bibliographische Angaben (Liste) Einzelne Literaturangaben Allgemeine Angaben zur Handschrift Titel, Autor, Entstehungsort, Entstehungszeit etc. Äußere Beschreibung Beschreibstoff, Umfang, Zusammensetzung, Layout, Schriften/Hände, Buchschmuck, Einband, Zustand, Foliierung etc. Inhalte der Handschrift Einzelne Texte und Teile Geschichte der Handschrift Entstehung, Besitzgeschichte, Erwerbung etc. MASTER - der Standard (inhaltlich, Grobstruktur) Handschriftenbeschreibung / Katalogisat
MASTER - der Standard (inhaltlich, Verästelungen) • Verästelungen und Verfeinerungen der Datenstruktur • Weitere hierarchische Untergliederung der Elemente • Beispiel: msContents - msItem - msItem - decoNote • Elemente können Attribute haben • Beispiel: <decoNote type=“initial“ subtype=“figurative“ lang=“de“> • Die Elemente enthalten Text, der weiter ausgezeichnet werden kann • Beispiel: <decoNote>Auf <locus>fol. 24r</locus> eine <dimensions>4-zeilige </dimensions> I-Initiale, <person>Bischof Hildebald</person> darstellend.</decoNote>
Die Verwendung von MASTER in CEEC: Strategien und Praxis
Verwendung von MASTER in CEEC (grundsätzlich) • Der MASTER-Standard wird als Richtlinie verwandt • alle anderen Teile des MASTER-Projektes spielen für CEEC keine Rolle • “Verwendung“ bedeutet Anlehnung, nicht vollständige Übernahme der DTD. • Ziel: Abbildung der Konzepte der vorliegenden Kataloge in MASTER, soweit dies möglich ist • Grundunterschiede: In CEEC wird kein neuer Katalog erstellt • Keine kodikologische Arbeit, keine Integration der Informationen in einem neuen Katalog • Problem: parallele Informationen verschiedener Kataloge, die sich nicht vollständig ersetzen • Lösung: Erhaltung aller Kataloge und Verwaltung der Informationen über die Zuweisung von “Autoritäten“
Verwendung von MASTER in CEEC (praktische Vorgehensweise) • Entwurf eines allgemeinen Modells in Anlehnung an MASTER • Interpretation der MASTER-Dokumentation • Überführen der Kataloge in die Datenstruktur (bzw. umgekehrt) • dabei: Veränderungen unserer Interpretationen; neue Konzepte • Reduktion des allgemeinen Modells (der DTD) auf die Realität unserer Daten • Zweck: Kontrolle der Konsistenz der Daten • In Zukunft ggf. Erweiterungen des Modells (der DTD) • Einführung neuer Elemente, Attribute (z.B. Typologien) • Veränderung der Regeln (welches Element ist wo erlaubt?)
MASTER & CEEC (praktische Probleme - I) • Erweiterungen der MASTER-DTD • Neue Elemente • Andere Regeln • Andere Namen / Konzepte • Zusätzliche Verfeinerungen • Attribute, Typologien, Normalisierte Angaben • Effekte: • Divergenz der DTDs (MASTER, CEEC) • Offenes Ende der Datenaufbereitung
MASTER & CEEC (praktische Probleme - II) • Trotz der “Weichheit“ des Standards läßt er sich nicht immer zu 100% auf einen Katalogtext anwenden • Problem: Integration der Kataloge in die Datenstruktur führt zu einer Desintegration der ursprünglichen Katalogtexte • Lösung: Es wird teilweise eine parallele Textfassung angeboten
MASTER & CEEC (praktische Probleme - IIIa) • Wie kommen die Kataloge in den Computer? • Ausgangspunkt: Elektronische Fassung des Textes • Verwendung eines angepaßten Editors (MASTER) • Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen • Nacharbeiten und Kontrollen • Spätere Verfeinerungen (teils automatisch, teils von Hand)
Fett gedruckter Text nach der Signatur: Dies muß der Titel sein. Später werden alle Titel nach einem Doppelpunkt durchsucht, der den Titel noch in Autor und Titel differenziert.Umsetzung zu: <author>Origines</author><title>Opera selecta</title> Schlüsselwort “Sign.: Cod.“: “Cod. 3.“ ist die Signatur; Umformung zu: <idNo type=“signature“>Cod. 3.</idNo> Die letzte Zifferngruppe vor dem Seitenumbruch: Eine Seitenzahl MASTER & CEEC (praktische Probleme - IIIb) Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen 966 Sign.: Cod. 3. Origines: Opera selecta Pergament, 182 Bll., 24,2 x 18 cm 9. Jh. - fol. 1r-94r Homiliae XVI in Genesim; fol. 94v leer; fol. 95r-182v Homiliae XIII in Exodum - Cum dicit de salvatore et rogabant eum daemonia ... - ... Explicit Liber Exodi Textausgabe: GCS 29. Origines Werke. Bd. 6, S. 1-279. Lit.: Jaffé/Wattenbach, S. 2. 576
MASTER & CEEC (praktische Probleme - IIIc) Automatische Interpretation von Layout- und Textstrukturen als strukturelle und inhaltliche Informationen 966 Sign.: Cod. 3. Origines: Opera selecta Pergament, 182 Bll., 24,2 x 18 cm 9. Jh. - fol. 1r-94r Homiliae XVI in Genesim; fol. 94v leer; fol. 95r-182v Homiliae XIII in Exodum - Cum dicit de salvatore et rogabant eum daemonia ... - ... Explicit Liber Exodi Textausgabe: GCS 29. Origines Werke. Bd. 6, S. 1-279. Lit.: Jaffé/Wattenbach, S. 2. 576
MASTER & CEEC (praktische Probleme - IIIc) ... <listBibl authority="Zensus: 576"> <bibl> <title usage="short">Jaffé/Wattenbach</title>, <biblScope>S. 2</biblScope>. </bibl> <msIdentifier> <idno authority="Zensus: 576">Cod. 3.</idno></msIdentifier> <altName authority="Zensus: 576" type="catNo">966</altName> <msHeading authority="Zensus: 576"> <author>Origenes</author> <title>Opera selecta</title> <origDate>9. Jh.</origDate> </msHeading> <physDesc authority="Zensus: 576"> <support><material>Pergament</material></support> <extent>182 Bll. <dimensions type="leaves" authority="Zensus: 576">24,2 x 18 cm</dimensions></extent> </physDesc> <msContents authority="Zensus: 576"> <msItem><locus>Fol. 1r-94r</locus> Homiliae XVI in Genesim</msItem> <msItem><locus>Fol. 94v</locus> leer</msItem> <msItem><locus>Fol. 95r-182v</locus> Homiliae XIII in Exodum</msItem> <bibl type="edition">(Textausgabe: GCS 29. Origenes Werke. Bd. 6, S. 1-279.)</bibl> <incipit authority="Zensus: 576">Cum dicit de salvatore et rogabant eum daemonia ...</incipit> <explicit authority="Zensus: 576">... Explicit Liber Exodi </explicit> </msContents>