310 likes | 621 Views
Sk ä nnimine ja digiteerimine lihtsate vahenditega. Koit Saarevet DAB nõunik/projektijuht 18. juuni 2008. Koolituse eesmärk. Anda ülevaade digimise olemusest, kasudest, probleemidest Anda mingi praktiline ettekujutus, kuidas digimine välja näeb
E N D
Skännimine ja digiteerimine lihtsate vahenditega Koit Saarevet DAB nõunik/projektijuht 18. juuni 2008
Koolituse eesmärk • Anda ülevaade digimise olemusest, kasudest, probleemidest • Anda mingi praktiline ettekujutus, kuidas digimine välja näeb • Vastata küsimustele, mis kuulajatel varasemas praktikas tekkinud
Kava • Digimisest üldiselt • Mis on digiteerimine? • Milleks digiteerida ehk digi eelised • Digimisprojekti juhtimine • Tekstidokumentide digimine • Praktilised näited • Küsimused (mitte ainult lõpus, vaid kogu aeg)
Mõistete seletus 1: digiteerimine • Digitaliseerimine = digiteerimine = digimine = ingl k digitizing = ingl k digitalizing • Reaalset maailma kirjeldavate pidevate signaalide (mõõtmistulemuste) viimine mittepidevale arvulisele kujule, võimaldamaks nende kasutamist arvutis. • Objekti, kujutise, dokumendi või signaali esitamine kindla hulga punktide või proovide kaudu. Analoogsignaalid on pidevalt muutuvad, seda nii signaali võimalike väärtuste arvu osas antud ajahetkel kui ka ajaperioodis võimalike ajahetkede arvu osas. Digitaalsed signaalid on mittepidevad nende mõlema nüansi osas ja seega tähendab digiteerimine originaalsignaalist teatava lähenduse loomist, mis kunagi ei esita originaali täielikult.
Mõistete seletus 2: skännimine • Skäneerimine = skaneerimine = skännimine = ingl k scanning • Kitsamalt: paberkandjal või filmilindil esitatud teksti, jooniste, fotode vm ainese digiteerimine skänneri (lameskänner, raamatuskänner vmt) abil. • Laiemalt: Ingl k scan tähendab millegi käsitlemist järjestikku samm-sammu haaval. Iga digiteerimisprotsess eeldab olemuslikult sellist teguviisi, seega on skänneerimine digiteerimise sünonüüm.
OSA 1: DIGITEERIMISEST ÜLDISELT Analoogne ja digitaalne • Analoogsignaal • pidevatoimeline • lõpmatu arv olekuid, mida saab igal ajahetkel mõõta • enamik looduslikke protsesse on pidevatoimelisedhttp://et.wikipedia.org/wiki/Analoogsignaal • Digitaalsignaal ehk arvsignaal • mittepidev ehk diskreetne • kindel arv olekuid kindlatel ajahetkedel • esitamiseks kasutatakse arvkoodi, enamasti kahend-ehk binaarkoodihttp://et.wikipedia.org/wiki/Digitaalsignaal
Analoog- ja digisignaali erinevused • Digi saab kopeerida kadudeta, analoogi praktiliselt mitte (n helikasseti kopeerimisel on koopia alati hoomatavalt kehvem originaalist, CD kopeerimisel aga kvaliteet ei muutu). Andmekandja füüsilise ja moraalse aegumise tõttu on aga kopeerimine vältimatu. • Digi on hästi otsitav (n täisteksti otsing e-raamatust)
Analoog- ja digisignaali erinevused • Digi on kiiresti navigeeritav (n arvutis mp3 kuulates saab liuguriga hetkeliselt loo sees soovitud kohta hüpata) • Digi on korraga kasutatav pea piiramatule hulgale, piiriks vaid arvutisüsteemi võimsus (n Saaga kirikuraamatuid kasutab korraga keskmiselt 70-100 inimest, samas kui kogu Rahvusarhiivis on alla 30 mikrofilmilugeri ja ühest filmist reeglina vaid 1-2 koopiat)
Digitaalse probleemid 1 • Digiteerimisprotsessis tekib põhimõtteline (st vältimatu) kvaliteedikadu
Digitaliseerimise protsess • Analoogsignaal
Digitaliseerimise protsess • Määrame mõõteintervalli
Digitaliseerimise protsess • Mõõdame signaali väärtused valitud intervalliga
Digitaliseerimise protsess • Määrame väärtuste mõõtmise astmed
Digitaliseerimise protsess • Ümardame mõõdetud väärtused lähima astmeni ja saamegi digitaalsignaali
Algne analoogsignaal Digiteerimisel saadud signaal Infokadu digiteerimisel t t
Digitaalse probleemid 2 • Ka digimaailmas tekitab enamik töötlusi pöördumatuid moonutusi • Järjestikuste töötluste puhul moonutused summeeruvad
Algne digitaalne kujutis (1 punkti laiused jooned 80-kordse suurendusega) Sama kujutis pöö-ratud 2° paremale. Ühtlane must on kohati muutunud halltoonideks Moonutused (infokadu) töötlemisel
Moonutuste summeerumine 1 • Töötlusele olemuslikud moonutused + võimalikud töötlusvead akumuleeruvad Aeg
Moonutuste summeerumine 2 Töötlus 1 Töötlus 2 Töötlus 3 Töötlus 4 Back to the Future, Remco Verdegem, ettekanne konverentsil Tools & trends in Digital Preservation, 1.-2.11.2007 Haag http://www.kb.nl/hrd/congressen/toolstrends/presentations/Verdegem.pdf
OSA 2: DIGIMISPROJEKTI JUHTIMINE Olulised aspektid • Digiteerimisprojekti planeerimine • Digiteerimise allikmaterjali väljavalimine • Digiteerimise ettevalmistamine • Originaalide käitlemine • Digiteerimisprotsess • Digitaalsete tagatiskoopiate säilitamine • Metaandmed • PublitseerimineHeade tavade käsiraamat, MINERVA projekt, 2004http://www.kul.ee/webeditor/files/headetavadekasiraamat.doc
MINERVA soovituste teine variant • Technical Guidelines for Digital Cultural Content Creation Programmes (MINERVA 2004)http://www.minervaeurope.org/structure/workinggroups/servprov/documents/techguid1_0.pdf • Sisaldab viiteid igat soovitust süvitsi käsitlevatele dokumentidele
Realistliku saamiseks teha pilootprojekt ja ise järgi proovida, mitte uskuda masina spetsifikatsiooni N: Zeutschel Omniscan 10000TT teeb paberite järgi ühe kaadri 5 sekundiga, tegelikkuses aga kulub keskmiselt 12, kuna pole arvestatud tööasendi taastamisele kuluvat aega Kulud 1: Mahuprognoos
Kulud 2: Digiteerimisvahendid • Digiteerimise riistvara • skänner • arvuti • valgustid (vajalikud fotoaparaadi kasutamisel) • statiivid, dokumendi aluslauad, töölauad • Digiteerimise tarkvara • skännimistarkvara (peab olema masstööle optimeeritud, n oskama failidele järjest nimesid panna) • tekstituvastus (tasuta vahendid on viletsad, soovitan FineReaderit, hind u 2700 EEK) • kasutuskoopiate masstootmine tagatisfailidest
Kulud 3: Failide hoidmine ja kasutamine • Salvestusruum • A4 dokument 256 halltooniga 300 dpi resolutsioonil on pakkimata kujul 8 MB. Kui kuus digida 10 000 kaadrit, siis kulub 80 GB. Selle hoidmine näiteks serveriketastel võib maksta mitutuhat krooni. • Heli ja video puhul on mahud veel 10 (heli) ja 100 (video) korda suuremad • Kasutuskeskkond • tarkvara loomine • serveri ja võrgu ülalhoid
Kulud 4: Palgad • Skäneerija • soovitatavalt tükitöö • plaani täitmise boonused • IT spetsialist • Projektijuht
Dokumenteerimine • Arhiivikirjelduste tekitamine • mõistlik on kirjeldusi hoida teatmestus ja seostada digitud kujutised teatmestuga viitekoodide kaudu • Digiteerimise metaandmete kasutamine • Protsess tuleb korralikult dokumenteerida • Juhiseid vt n http://www.ra.ee/digiaken/uploads/rameta.pdf • Failide nimetamine • kaose vältimiseks ja veebipõhiste kasutuskeskkondade loomiseks peavad failinimed olema süstemaatilised • vt n “RA digiteerimise tehnilised põhimõtted” (väljatrükk jaotusmaterjali lõpus)
Üldist • Tagatis- ja kasutuskoopia erinevus • tagatis teha võimalikult moonutusvaba ja mõistlikult kõrge kvaliteediga • kasutuskoopia genereerida tarkvara abil automaatselt (kvaliteet vastavalt hetkevajadustele, vajadusel töödelda ja ilustada) • Tööjuhend tegijale • masina operaator peaks töö käigus võimalikult vähe mõtlema ja otsuseid langetama
OSA 3: TEKSTIDOKUMENTIDE DIGIMINE Skänneritüübid • Lameskänner • odav • dokument tuleb paigaldada nägu allpool, seega ei sobi räbaldunud või paksu köitega originaalidele • Fotoaparaat • lihtne kasutada ja üsna odav • väga lai formaadivalik (saab ka A0 teha) • hea tulemuse saamiseks vaja statiive, valgusteid, objektiive jm abivahendeid • Raamatuskänner • kiire ja vastupidav • originaali mitte rikkuv valgus • väga kallis (150 000 – 2,5 mln EEK)
Skänneri valiku kriteeriumid • Originaalide väärtus ja seisund: kui palju võib valgust peale lasta • Resolutsiooni vajadus • tekstidokumentide puhul 300 dpi, fotode ja negatiivide puhul oluliselt kõrgem (vt “RA digiteerimise tehnilised põhimõtted” (väljatrükk jaotusmaterjali lõpus) • Värvivajadus • osa raamatuskännereid on halltoonides, mis on tekstidokumendile OK, aga fotodele ei kõlba • Planeeritav töömaht (kaadrit aasta kohta)
Skännerite võrdlus NB: Näites on peamiselt Epsoni mudelid, kuna HP ja Canon pole eluea andmeid avaldanud