220 likes | 501 Views
Digitalizacija. Jelena Petrović. Digitalizacija - konverzija analognog signala ili koda u digitalni signal ili kod Digitalni materijal – originalno digitalan (elektronski časopisi ili elektronske knjige) ili digitalizovan Mnoge biblioteke imaju projekte digitalizacije Sve je popularnija
E N D
Digitalizacija Jelena Petrović
Digitalizacija - konverzija analognog signala ili koda u digitalni signal ili kod Digitalni materijal – originalno digitalan (elektronski časopisi ili elektronske knjige) ili digitalizovan Mnoge biblioteke imaju projekte digitalizacije Sve je popularnija Glavni koraci: utvrđivanje tehničkih pojedinosti (hardver, softver, format datoteke, kompresija, obrada...), razmatranje standarda, cena projekta Glavne aktivnosti: digitalna konverzija, obrada (skladištenje, ogranizacija, procesiranje i pronalaženje informacija)
Prednosti i problemi vezani za projekat digitalizacije Prednosti Poboljšan pristup Očuvanje Problemi Kvalitet Kontrolisan pristup i upotreba Cena Autorska prava
Tipovi predmeta za digitalizaciju: štampa, crteži, fotografije, slike, manuskripti, muzejski materijal itd. Važno je znati osobine: stanje, osetljivost, veličina, font, da li sadrže ilustracije, da li se mogu izdvojiti strane Mogući problemi vezani za format i veličinu uramljene slike Može li se sigurno izvući iz rama, a ako ne, može li se digitalizovati u tom stanju? Treba li ram digitalizovati zajedno sa slikom?
Tehnička pitanja Hardver. Najčešće se koriste skeneri i digitalni fotoaparati. Izbor skenera zavisi od osobine materijala, rezolucije, palete boja, površine skeniranja, vremena skeniranja. Softver. Nakon što je slika kreirana, obrađuje se softverski (osvetljenje, boja, OCR), katalogizacija, indeksiranje, konverzija, kompresija. Izbor aplikacije zavisi od: Cene aplikacije i cene i vremena za obuku osoblja Hardvera Operativnog sistema i da li je Cross-Platform Import, eksport, kalibracija itd.
Kompresija Kako bitmape mogu postati velike, kompresija je način za smanjivanje. Postoji dva tipa kompresije: Kompresija podataka bez gubitka – koristi algoritme koji uočavaju elemente koji se ponavljaju unutar slike/teksta, tako da je bez gubitaka. Kada se datoteka dekompresuje, vraća se u prvobitno stanje Kompresija podataka sa gubitkom – većakompresija, ali uz gubitak kvaliteta, koji zavisi od sadržaja slike i stepena kompresije
Formatidototeka Izbrani format treba minimizirati gubitak informacije koliko je moguće. Zavisi od: Načina na koji je urađena digitalizacija Arhiviranja (mora biti standardan format) Obrade (format mora da podržava dalju obradu) Dostavljanja (na ekran, do štampača, preko mreže itd.) Tekstualni formati: ASCII (American Standard Code for Information Interchange)– tekstualni format, čitljiv iz bilo kog programa za obradu teksta. Standardne ekstenzije su: txt, doc, docx i odf Binarni – sadrži ne-ASCII karaktere. Može se koristiti za kompresovane datoteke, tekst, programe, sliku, muziku, filmove itd.
Standardni formati datoteka Formati slika PDF (Portable Document Format) – može sadržati tekst, slike, grafikone i koristiti različite fontove HTML – može prikazivati tekst i multimedijalne datoteke. Čita se pomoću internet pretraživača • Veličina nekompresovane slike = broj piksela x dubina boje. PPI (pikseli po inču) je mera rezolucije, najčešća rezolucija danas je 96ppi • Tipovi slika • Vektorske – od niza objekata: linija, elipsa, poligona itd. • Rasterske – od matrice piksela (svaki piksel se može obraditi pojedinačno; visoki stepen fotorealističnosti)
BMP - bitmapa, nekompresovan, veličina datoteke velika GIF – skladišti do 256 boja, dobar za slike sa manje boja, crteže, grafikone i jednostavne animacije JPEG – sa gubitkom kvaliteta, skladišti 24b boja, odgovarajuć za fotografije i slanje preko interneta PNG – bez gubitka kviteta, može imati do 32b boja, ima transparentni kanal. Može sadržati metapodatke TIFF – dobar format za velike slike. Podržava više tipova kompresije. Napravljen je kao baza za prikupljanje slika sa skenera
Formati za zvučne zapise WAV – podržava dosta različitih bitrate-a (kbps), ali su datoteke velike MIDI – standard za prenos između električnih instrumenata i računara. Veličina datoteke je mala MP3 – kvalitetni audio zapis u maloj datoteci OGG Vorbis – naslednik mp3-a, bolji kvalitet u istoj veličini datoteke FLAC – studijski digitalni snimak velikog kvaliteta
Formati za video zapise i sisteme video i audio zapisa MPEG – Movie Picture Expert Group je grupa ljudi koja generiše ISO standarde za kompresiju audio-video signala. Razlikujemo MPEG-1, MPEG-2, MPEG-3, MPEG-4 Quick Time – ISO, stvoren od strane Apple-a, ekstenzije su .qt i .mov AVI – ISO, stvoren od strane MS-a Theora i Dirac – novi slobodni formati, pogodni za HD video. Odlikuje ih visok kvalitet i visok stepen kompresije FLV – Flash video, mala veličina datoteke, često korišćen na internetu (YouTube)
Pristup digitalnoj informaciji Pronalaženje sadržaja vrši se pretraživanjem ili prelistavanjem Kategorije mogu biti bazirane na ključnim informacijama (autor, naslov itd.) ili na klasifikaciji po oblasti Traženje po rečima u tekstu zahteva indeksiran tekst, dok po autoru, naslovu ili opisu dovoljni su i metapodaci
Pretraga slika CBIR (content based image retrieval) je najbolja tehnika za pretragu slika po sadržaju, ali i najskuplja, pa se slike česće opisuju sledećim metapodacima: Naslov Datum nastanka Ime autora Boja i rezolucija Tip datoteke Osvetljenje i zasenčenje pri obradi Dimenzije Veličina datoteke Kontrast Model aparata sa kog je digitalizovana Stepen kompresije
Cena projekta Svaka digitalizacija iziskuje visoku cenu. Skeniranje je samo jedan korak. Cenu projekta treba pratiti pošto može narasti u toku procesa. Faktori koji utiču na krajnju cenu:
Zaključak Konverzija analognog izvora u digitalni oblik i njegovo skladištenje i obrada jeste bitan deo u stvaranju digitalne biblioteke. To je kompleksan proces koji zahteva organizacione i tehnološke veštine. Odgovarajuća organizacija i planiranje pomažu smanjenju cene celokupnog projekta digitalizacije.