280 likes | 480 Views
TEI Header. Mats Dahlström Digitalisering av kulturarvet Januari 2008. Metadata. Data om data // information om dokumentet bibliografiska data Metadata för samlingar av dokument ett dokument ett dokumentsegment. Metadata / typ. Beskrivande metadata Strukturella metadata
E N D
TEI Header Mats Dahlström Digitalisering av kulturarvet Januari 2008
Metadata • Data om data // information om dokumentet bibliografiska data • Metadata för • samlingar av dokument • ett dokument • ett dokumentsegment
Metadata / typ • Beskrivande metadata • Strukturella metadata • Administrativa metadata • Rättshanteringsmetadata • Arkivaliska metadata
Metadata / funktion • Dokumentation • Bibliografisk kontroll: • Identifiering och (fr.a. maskinell) återvinning av resurser • Organisering av resurser • Interoperabilitet mellan system • Rättigheter • Bruksinformation • Information till sökmaskiner • Stöd för arkivering och bevarande Läs ”Minerva” om metadata!
Metadata / digitala objekt • Synliga / dolda metadata • Inbäddade / externa • “Tryckta” standarder: behov av metadaformat anpassade till digitala objekt • Flera försök att göra beskrivningen standardiserad, enhetlig, maskinläsbar (Dublin Core, PICS, TEI Header, RDF) • Dåligt stöd för metadata i SGML och HTML
<teiHeader> • Syftar till att ge en beskrivning av framför allt den elektroniska resursen men också av dess källor • Kraftfull och detaljrik, genom en stor uppsättning av både element och attribut • Obligatoriska respektive valfria element • Kap. 5 i Guidelines – kap. 20 i TEI Lite • Kap 6 i övn.mtrl, inklusive figur 6.1 + bilaga D
4 sektioner i TEI Header <teiHeader> <fileDesc> ... </fileDesc> <encodingDesc>...</encodingDesc> <profileDesc> ...</profileDesc> <revisionDesc> ... </revisionDesc> </teiHeader>
4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description
<fileDesc> • Obligatoriskt • Full bibliografisk information om den elektroniska filen och dess källa/or • Obligatoriska barnelement: • <titleStmt> • <publicationStmt> • <sourceDesc> • Valfria barnelement
<fileDesc>/<titleStmt> • Obligatoriskt • Identifierar den elektroniska filen, inte dess källa/or • Obligatoriskt barnelement: • <title> • Valfria barnelement, t.ex.: • <author> [dvs till verket, av vilket den elektroniska filen är en version] • <editionStmt> [dvs om den elektroniska utgåvan] • <respStmt> [dvs för den elektroniska utgåvan]
<titleStmt> <title>Author To Her Book: An Electronic Edition</title> <author> <name reg="Bradstreet, Anne">Anne Bradstreet</name> <date>1612-1672</date> </author> <respStmt> <resp>Header creation by <name>Ralph Bauer</name></resp> <resp>Encoded by <name>Ann Hanlon</name></resp> </respStmt> </titleStmt>
<fileDesc>/<publicationStmt> • Obligatoriskt element • Obligatoriskt innehåll: antingen en beskrivning av resursen eller minst ngt av barnelementen: • <publisher> [förlag, organisation] • <distributor> [individ(er), sällskap etc] • <authority> • Annat: • <availability> • <address>
<fileDesc>/<sourceDesc> • Obligatoriskt • Identifierar källan/orna till den elektroniska filen • Innehåller antingen beskrivning i text (<p>) eller ett el flera av barnelementen: • <bibl> [dvs till verket, av vilket den elektroniska filen är en version] • <biblFull> • <listBibl> • Ingen ”källa”?
<sourceDesc> <p>No source: created in machine-readable form.</p> </sourceDesc>
<sourceDesc> <bibl>The Works of Anne Bradstreet in Prose and Verse. Edited by John Harvard Ellis. (Charlestown: A. E. Cutter, 1867)</bibl> </sourceDesc>
<fileDesc>/ <sourceDesc> / <biblFull> • Innehåller en egen lite full genomgång av TEI:s file description, men alltså denna gång för källresursen
4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description
<encodingDesc> • Dokumenterar (val i) arbetet med den elektroniska texten och dess kod, t.ex. • <editorialDecl> (t.ex. normalisering av stavning, typ av rättelser införda) • <tagsDecl> (t.ex. märkfrekvenser) • <refsDecl> (t.ex. den princip som valts för kapitelnumrering etc) • <classDecl> (t.ex. ett klassif.schema)
4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description
<profileDesc> • 3 valbara barnelement: • <creation>(högst en) • <langUsage> • <textClass>(enligt <classDecl>) med barnelement, t.ex.: • <keywords> • <classCode scheme”…”>
4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description
<revisionDesc> • En ”logg” för uppdateringar, revisioner och andra ändringar som har gjorts med den elektroniska resursen. • Innehåller ett eller flera <change>. Varje <change> har: • <date> • <respStmt> (ett eller flera) • <item> (textbeskrivning av vad som gjorts)
<revisionDesc> <change> <date>1996-11-19</date> <respStmt><resp>xxx</resp> <name>ASM</name></respStmt> <item>Header Edited</item> </change> <change> <date>unknown</date> <respSstmt><resp>xxx</resp> <name>JPW</name></respStmt> <item>Basic Tei Lite tagging</item> </change> </revisionDesc>
TEI Headers kan … • Utgöra egna XML-dokument • Vara kraftfulla metadataresurser • Översättas (t.ex. via XSLT) till andra metadatascheman, t.ex. Dublin Core eller MARC 21 • Cf ”arkiv” – ”leverans”