200 likes | 346 Views
Travel Europeana Suomen Vanhat Matkailukirjat. Giuseppe Acerbi Travels through Sweden, Finland and Lappland to the North Cape in the years 1798 and 1799. Kansalliskirjasto Tiina Ison, pääsunnittelija - tiina.ison@helsinki.fi Konservointi ja Digittointikeskus. Jäsennys.
E N D
Travel EuropeanaSuomen Vanhat Matkailukirjat Giuseppe Acerbi Travels through Sweden, Finland and Lapplandto the North Cape in the years1798 and 1799 Kansalliskirjasto Tiina Ison, pääsunnittelija - tiina.ison@helsinki.fi Konservointi ja Digittointikeskus
Jäsennys • Kansalliskirjastondigtioitnipolitiikka 2010 • Kansalliskirjasatonaineistojenkäyttöönsaattaminen • Travel Europeanadigtitointihanke 2008-2010 • Kansalliskirjastonaineisto – VanhatMatkailukirjat • Kansalliskirjastondigitointiprosessitja metadata • Digitointiprosessitjakehityskokeiluja..
1. Kansalliskirjaston digitointipolitiikka 2010 Kansalliskirjaston strategisen tavoitteena on saattaa kulttuuriperintöaineisto laajaan verkkojakeluun edistäen mm : • Aineistojen mahdollisimman vapaan tutkimus-, opetus- ja kansalaiskäytön • Digitoitujen aineistojen luotettavuuden ja autenttisuuden turvaamisen • Digitoitujen aineistojen pysyvän ja kestävän saatavuuden, haettavuuden ja käytettävyyden • Digitoitujen aineistojen laaja verkkojakelu Kansalliskirjasto luo uusia prosesseja ja toimintamalleja.... • perinteisen analogisen aineiston hallinnoimisen ja säilyttämisen rinnalle digitaalisen aineiston tuottamiseen, käyttöön saattamiseen ja pitkäaikaissäilytykseen.
….kansalliskirjaston digitoitavia aineistoja • Aikakausilehdet • Historialliset sanomalehdet • Monografiat (mm Pelasta Kirja) • Pergamentit • Turun Väitöskirjat • Äänitteet (C-kasettia) • Peinpainatteeta • Travel Europeana (100 teosta Europeanaan 2010)
……digitointipolitiikan operationalisointi • Autenttisuus – lähdeaineistoa vastaava korvike (ID’t, seuranta). • Tunnistettavissa Kansalliskirjaston tuottamaksi - tuottajan maine • massa- ja erikoisdigitiointiprosessit – ylläpito ja kehittäminen • digitoinnin- ja jälkikäsittelyn tuotannon hallinnointi (eri linjat) • provenienssitietojen keruu, liittäminen ja tallennus (METS/PREMIS) – fyysinen ja digitaalinen provenienssi • METS profiilit eri aineistoille(monografiat) kuvaileva, rakenteellinen ja hallinnollinen metadata (määritys, metatyöryhmät) • rakenteistamisen laatutasot ja mittarit (osakohteet) • kahden tietueen malli, minimiluettelointi, luetteloinnin rikastaminen • PAS kelpoisia säilytyspakettien tuottaminen • yksilölliset tunnisteet, tekijänoikeus metadata sekä käyttöoikeus
…….digitoinnin tietotuotteet Kansalliskirjatonlinjaa digitointipolitiikassa tietotuotteita digitointituotannon tuottamina: • Digitoidut aineistot • Rakenteistetut aineistot sekä osakohteet • Yhteisöllinen rikastaminen • Digitoidut kokoelmat tutkimuskäyttöön • Digitoitujen aineistojen metadata ja rikastaminen • Digitoitujen aineistojen pitkäaikaissäilytys
2. Kansalliskirjaston digitoitujen aineistojen käyttöönsaattaminen • Kansalliskirjaston tavoitteena on tuottaa dataa standardi- sekä vaihtokelpoisessa muodossa jota voidaan saattaa käyttöön mahdollisimman laajaan jakeluun • Digitointituotannon taustajärjestelmät (Kansalliskirjaston digitoinitikeskus) tuottavaen digitoituja aineistoja joita voidaan saattaa käyttöön sekä: • Digitool(50 TravelEuteosta KansalliskirjstonDigitoolMonogratiat) • KDK • Europeana (Marraksuu 2010) • WDL • Kulttuuri Sampo ? • Yksi aineisto, maksimi saatavuus, haettavuus ja käytettävyys.
3. Travel Europeana digitointi hanke 2009-2010 Päätävoite: digitoida matkailuun ja turismiin liittyvää aineistoa ja saattaa käyttöön Europeaanan kautta. • Hanke rahoitus: European Commission: ‘Digital Libraries’ of the eContentplus Programme • Hanketta tukevat: EDL Foundation, CENL - The Conference of European National Librarians - ja LIBER - Association of European Research Libraries • Hankkeenaloitus 1stToukokuuta 2009. Hanke on 2-vuotinen. • Hankeentavoitteen on 1 miljoonaaobjektia. • Hankkeentavoitteita on lisäksi. ‘luodamalliesimerkkejädigitoinnin ‘best practice’ prosesseistasekäsyventää LIBER ja CENL (tutkimuskirjastojen) tukeaEuropeanalle.
....travel Europeana hankkeeseen osallistuvat National Library of Estonia Coordinator Austrian National LibraryEDL FoundationEremo srlLund University LibraryMoravian Library in BrnoNational Library of FinlandNational Library of LatviaNational Library of Poland National and University Library of Slovenia Kriittinen massa digitoituja aneistoja... National Library of The NetherlandsNational Library of WalesTrinity College LibrarySlovak National LibraryGoettingen State and University LibraryUniversity College LondonUniversity of InnsbruckUniversity Library of RegensburgUniversity and National Library of Debrecen WP 3: UCL London – LIBER organisaationiden aggregaatti. Digitool – ESE – Europeana. Paul Eyers.
4. Kansalliskirjaston Travel EU matkailuaineisto • Kansalliskirjaston aineisto on n 100 matkailuun liittyvää teosta, suomalaisten julkaisemaa tai keskittyy Suomeen ja etenkin Lappiin. • Materiaali on kansainvälisesti kiinnostavaa sisältäen ensimmäisiä matkakertomuksia Suomesta 1600–1800-luvuilta enimmäkseen Ruotsin vallan ajalta. kirjoja ja niihin liittyviä (avokkaita) kuvia, kuvauksia ja karttoja. ....Tekijänoikeusvapaata. • Matkailukirjat: monikielisiä kokteksti versioita - eri versiot, painokset mm Acerbi ja Topelius (suomi, ruotsi, saksa, englanti, venäjä, ranska). • Kokotekstit mielenkiintoisia myös ontologisoinnin kannalta koska sisältävät paikannimiä eri kielillä sekä historiallisessa kontekstissa.
.... matkailu aineisto esimerkkinä Acerbi Jos mun tuttuni tulisi, (goethe käänsi 1810) Ennen nähtyni näkyisi,Sille kättä käppäjäisin,Vaikk ois käärme kämmenpäässä,Sille suuta suikkajaisin,Vaikk ois suu suden veressä,Siitä kaulahan kapuisin,Vaikk ois kalma kaulan päällä,Vielä vierehen kävisin,Vaikk ois vierus verta täynnä. 1799 Acerbi Grand Tour Kuvaukset ja Kuvitukset Globaali toursimsi Kulttuurimatkailijat Kartat, reitit, paikannimet... Konteksti (i was here 1799 :)
5. Kansalliskirjaston taustajärjestelmä: digitointiprosessit Digitoinnin tuotantoprosessin EXPORT tiedostot sisältävät - :JPEG2000, lossless, PDF, OCR TXT, ALTO XML, METSXML ja MARCXML. METS export paketitlaadittumonographioillemäärittäenyhteensopivatstandarditja OAI-PMH vaihtokelpoisuuden • - kuvailevaa, hallinnollista, rakenteellistasekäpitkäaikaistametadatalle. - Mets Rights kehitystyöaloitettu (käyttö-näyttörajoitteet)
…METS profiilit: metadatan liittääminen • 1. Kuvaileva metadata (Travel Eu:ssa kehitetty) • luetteloiinti – Fennica (suomalaisille) • ISBD (International Standard Bibliographic Description) sääntöjä ’for older monographic resources’. Luotu tietue joka toiimii globaalilla tasolla • asiasanat ja YSO (englanti) • Abstrakti (englanti) • Povenienssi tiedot lisätty (alkuperä) • 2. Tekninen metadata • 3. Hallinnollinen metadata (tunnisteet) • 4. Rakenteellinen metadata (osakohteet) • Europeana Semantic Elements (Europeana Semantic Model) ? DC ?
….digitointiin liittyviä haasteita – Wanha teksti • Vanhat kirjainmuodot ongelma OCR:lle,vanhat nimimuodot • Teemojen ja relaatioiden tunnistaminen edellyttää automatisoinnin ja asiantuntijatyön yhdistämistä • Mahdollisia ratkaisuja: • Ohjelmistojen luominen jälkikäsittelynautomatisoimiseksi ja manuaalisenjälkikäsittelyn helpottamiseksi. • Ontologioiden ja valmiiden aihesanastojenhyödyntäminen
6. Digitointiprosessit ja kehityskokeilua …Acerbia prototyyppi kokeilua… (Mika Nyman & Eeva Murotmaa) • Tuottaa lisäarvoa massadigitoituun aineistoon • Verkkojulkaisemisen mahdollistaminen • Menetelmien kehittäminen ja prototyypin toteutus • TEI:n ja kieliteknologian käyttömahdollisuuksien selvittely • Sisällön muokkaaminen soveltuvaksi jakeluun semanttisessa webissä
……käytettyjä menetelmiä • Lähtökohtana OCR-digitointiprosessissaautomaattisesti syntyneet Alto-tiedostot • Välineiden luominen OCR-korjailua varten:– virheiden silmämääräinen tunnistaminen ja korjailu automaattisesti luodusta konkordanssista– Alto-tiedostojen automaattinen korjailu • Tunnistamisen kohteita:nimetyt entiteetit, teemat, suhteet • Sisällönkuvailun välineitä:Outline of Cultural Materials, CIDOC CRM
…..Acerbi Projektin toteutuksen viitekehys Tallenne Acerbin teosTarkoitteet Henkilöt, Paikat, TeematMetadataskeema TEIKäsitemallit CIDOC CRM, FRBR, FRAD, FRSADLuettelointisääntö RDAAiheauktoriteetti OCM
……TEI:n käyttö Acerbi-hankkeessa • Automaattisesti muodostetut TEI-dokumentit • Jokaisella sivulla ja sanalla oma tunniste • Mahdollisuus viitata mihin tahansa sanaantai sanojen yhdistelmään (segmenttiin) • Sanoihin tai segmentteihin voidaan viitatatekstin ulkopuolelle sijoittuvista annotaatioista • Annotaatiot voivat viitata ristikkäisiinsegmentteihin • Annotaatiot voivat muodostaa erilaisiatemaattisia kokonaisuuksia (esim. luonnon-kuvaukset, kansanelämä, mineraalit, kasvit) TEI=TextEncodingInitiative
Kansalliskirjaston digitointi keskus (Mikkeli)