180 likes | 308 Views
Dublin Core – formaatti ja sen soveltaminen. Tietoa tiedosta – Tietoa metatiedosta 10.4.2003 Juha Hakala juha.hakala@helsinki.fi. Sisältö. Dublin Core: hallintorakenne; yleistä DC-sovellusprofiilit Nykytilanne: Eurooppa, Suomi. Metadata Internet-ympäristössä. Globaali haku:
E N D
Dublin Core – formaatti ja sen soveltaminen Tietoa tiedosta – Tietoa metatiedosta 10.4.2003 Juha Hakala juha.hakala@helsinki.fi
Sisältö • Dublin Core: hallintorakenne; yleistä • DC-sovellusprofiilit • Nykytilanne: Eurooppa, Suomi
Metadata Internet-ympäristössä • Globaali haku: • Rakenteinen kuvailutieto (eli metadata) upotettuna verkkodokumentissa, hakurobottien käytettävissä -> monipuoliset hakumahdollisuudet • Tekijät luovat metadatan (esim. DC kuvailun) • Ajatus hyvä, käytäntö ontuu: metadatan luonti on vaikeaa • Paikalliset hakuympäristöt: mahdollisuuksia... • Paikalliset hakurobotit • Kuvailutyö dokumentin tekijällä (tai ammattilaisella, metadatan täydentäminen?)
Dublin Core 8 v. • Tunnettu (elektronisen aineiston) kuvailuformaatti • Pääfunktio: aineistojen kuvailu + tiedonhaku kohdistuu metadataan • Kehitys alkoi 1995, teknisesti ja organisatorisesti + standardoinnin kannalta asema nyt stabiili • Käytössä elektronisten aineistojen hankkeissa • eri kielet, aineistot • eri ympäristöt (kirjastot, arkistot, julkishallinto...) • http://dublincore.org
Dublin Core Metadata Initiative • OCLC vastuuorganisaationa; merkittävä taloudellinen tuki DCMI:lle (with no strings attached) • DC Board of Trustees - ylin hallintoelin • DC Directorate & Advisory Board – päivittäishallinto ja DCMI:n edustaminen • Stu Weibel, Makx Dekkers
Dublin Core Metadata Initiative (2) • DC Usage Board – sisällölliset linjaukset • Tom Baker, Traugott Koch etc. • application profile –määritysten, tarkenteiden hyväksyntä • DC Working Groups – kehitystyö • DCMI National Affiliate • Dublin Coren soveltamisen alueellinen tukeminen • HYK ensimmäinen maailmassa 05/2003-
Dublin Coren kehitystyö • Alin taso työryhmät (esim. usage, education, libraries...) • Usage board hyväksyy työryhmien työn • Konferenssi + workshop • Board of Trustees • strategiset linjaukset, talousasiat • Standardointi: ANSI/NISO, ISO, SFS • ISO-standardi 04/2003, NISO + SFS 2002 • Standardin luojat vs. implementoijat • soveltajille joustavuus tärkeää
Dublin Core - yleisiä periaatteita • Yhteinen semantiikka • Kansainvälinen sovellettavuus, monikielisyys • Laajennettavuus, joustavuus • Monelle eri alalle ja alueelle • Kuvailutiedon siirto, yhteensopivuus, ”vaihtomuoto”, ”Metadata for the masses” • Periaatteet tuovat mukanaan myös ongelmia • Metadatalla monia funktioita
Yhteinen semantiikka ja ydin • Kansainvälisesti sovitut kentät ja niiden määritelmät • 15 peruskenttää (ydin, core) • Tarkenteet • DC käännökset • Käyttötarkoitukset vs. yhteiset periaatteet ja standardit • DC:n yhteys muihin metadataformaatteihin
Laajennukset: sovellusprofiilit • DC Application Profiles: tiettyyn käyttötarkoitukseen ja funktioihin sovellettu joukko metadatakenttiä • Hyödyntää mahdollisesti useita nimiavaruuksia • vrt. XML namespaces • lisäkentät poimitaan muista formaateista (nimiavaruuksista) • Täysin uusille kentille tarvitaan oma nimiavaruus • Voi määritellä tallennettavan tiedon arvoja tai merkintätapoja, pakollisuuksia tms. • Voi tarkentaa tai ”jalostaa” standardimäärityksiä
DC-Library Application profile ”DC-Lib” • Tarkoitettu kirjastomaisiin DC-sovelluksiin • Viisi nimiavaruutta • Perus-DC + • yleiset tarkenteet • roolit tekijöille • muutama uusi date-tarkenne • useita id-tunnisteita • kohdeyleisö - audience (DC-ed) • holding location (fyysiset kappaleet)
Yhteensopivuus • DC-sovellusprofiilien eroavaisuudet, modulaarisuus • Mikä tahansa laajennettu ja tarkennettu Dublin Core -kuvailu voidaan palauttaa peruskentiksi • DC.Date.accepted -> DC.Date • Informaation menetys? • Ydin = yhteinen datasisältö kaikille sovelluksille • yli domain-rajojen voi olla hyvin kapea
Metadatarekisterit • Eri yhteisöjen tuottamien metadataformaattien (metadata schemas) ja sovellusprofiilien hallintaan • Apuväline metadatan kanssa painivalle henkilölle • formaatit, sovellusprofiilit, nimiavaruudet, mappaukset, sanastot • DCMI- registry • Schemas: http://www.schemas-forum.org/
Dublin Core - missä mennään? • Soveltuu paikallisiin tarpeisiin ja paikallisiin hakujärjestelmiin sekä myös yhteisten ratkaisujen perustaksi • Sovellusprofiilien luonti, uusia alueita • Standardointi valmis • Ennustaminen kuitenkin vaikeaa: • DC vuonna 2005? • käytössä mutta miten yleisesti? • kirjastoissa – missä järjestelmissä? arkistoissa? • toimi paikallisesti, ajattele globaalisti • Peruskysymys: kustannus - hyöty?
Yhteydet • Open Archival Iniative (OAI) • Digital Object Management Systems (DOMS) • Portaalit, kokoelmatason kuvailu • Semanttinen verkko, RDF • E-learning (IEEE-LOM) • Metadata/kirjastohankkeet, Z39.50 • Muut metadataformaatit (MARC, ONIX, EAD...)
Semantic Web, RDF • Tulevaisuuden verkko: rakenteisemmat, koneymmärrettävät verkkosivut (XML + RDF + semantiikan määrittely; ”Yleinen Suomalainen Ontologia”) • DC on semantiikkaa (kuvailutiedon semantiikka), mutta vaatii alleen asiasanastoon perustuvan ontologian • RDF (Resource Description Framework) Semantic Webin syntaksi ja alusta DC-kuvailuille • RDF-metadata • Adobe tukee: RDF-metadata pdf-dokumentissa
Dublin Core Euroopassa • Formaatin käännökset eri kielille • DCMI - EU: EU rahoitusta DC:n edistämiseksi? • Usage guidelines and best practice • Architecture and infrastructure • Eurooppalaiset hankkeet: monissa DC mukana • TEL, Renardus, Schemas... • UK, Saksa, Tanska, Italia
Dublin Core Suomessa • SFS-standardi (2001), HYK tukiorganisaationa • JHS 143 - Asiakirjojen metadata • soveltaminen arkistojen hankkeissa? • Hankkeissa: Suomi.fi, Opintoluotsi, VNK, Web-sivuissa, julkaisuhankkeissa, jne. • HYK:n Dublin Core sivut • http://www.lib.helsinki.fi/dublin_core/