430 likes | 542 Views
Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme). Zoran Svrtan, viši informatičar voditelj Informatičke službe Muzeja za umjetnost i obrt, Zagreb. Repozitorij – definicija. AKM repozitorij. Čuvanje i zaštita. Za kraj. vrlo popularna riječ
E N D
Imamo li repozitorij i što učiniti da bismo ga imali (i nakon kvara opreme) Zoran Svrtan, viši informatičarvoditelj Informatičke službeMuzeja za umjetnost i obrt, Zagreb
Repozitorij – definicija AKM repozitorij Čuvanje i zaštita Za kraj ...
vrlo popularna riječ • repository – 51 milijun odgovora • repositories – 10 milijuna • repozitorij – 91 tisuća • za usporedbu • museum – 224 milijuna • culture – 600 milijuna • library – 700 milijuna • sex – 663 milijuna 3/150
Repozitorij je spremište • digitalnog, elektroničkog materijala. • sužena definicija, primijenjena na specifični predmet prikupljanja: • Repozitorij je zbirka digitalnog materijala koja omogućuje sustavno upravljanje procesima objavljivanja, pristupa i pohrane (tog specifičnog) sadržaja. 4/150
brojni repozitoriji prisutni na mreži – Internetu • prikupljaju i daju mogućnost korištenja različitih sadržaja • knjižničari, informacijske znanosti • sadržaj • institucijski, orijentirani na arhive pojedinih institucija ili organizacija • tematski, okupljaju najrazličitije dokumente vezane uz određeno interesno područje. • dostupnost • mrežni, manje ili više javno dostupni repozitoriji • institucijski, lokalno dostupni repozitoriji, obično bogatiji sadržajima, najčešće nisu javno dostupni 5/150
Pitanja koja bi se mogla postaviti: • Trebaju li nam AKM repozitoriji? • Imamo li AKM repozitorije? • Što učiniti da bismo ih (i dalje) imali? 6/150
repozitoriji - vodeća uloga u nastupajućem informacijskom društvu • repozitorijske platforme mijenjaju samu prirodu obrazovnih procesa • "ex katedra" vs proces stalnog dopunjavanja znanja i samopoučavanja iz raznih izvora • klasični izvori znanja vs digitalni sadržaji • digitalni sadržaji dostupni na medijima za lokalnu upotrebu - CD, DVD ili na Internetu • Internet - medij koji svima daje podjednaku mogućnost pristupa informacijama 7/150
AKM zajednica, kao jedan od najvećih imaoca raznih kulturnih, povijesnih, arhivskih, itd. podataka idealni je izvor znanja, a znanje je "roba" koja se sve više cijeni. • Sumnje nema - trebaju nam - repozitoriji mogu pružiti mnoge potrebne informacije velikom broju korisnika. 8/150
pogledamo li na Internetu, naći ćemo: • repozitorij hrvatskih školskih knjižničara • Instituta Ruđer Bošković • raznih fakulteta • razne informatičarske stranice koje spominju repozitorije • ni traga muzejskim ili arhivskim repozitorijima • ne znači da ih nema ... samo ih nisam našao ili nisu imenovani repozitorijima, nego bazama podataka, arhivima i slično. 9/150
u smislu spremišta digitalnog materijala - sva naša računala i podaci na njima mogla bi se shvatiti kao repozitorij, malo neorganiziran, ali ipak - repozitorij. 10/150
stvaranje repozitorija • ozbiljan proces definiranja podataka koji se pohranjuju, • odabira softvera za realizaciju projekta, • definiranja formata i metapodataka, • razrješavanja autorskih prava, • popunjavanje početnim podacima, • objava (puštanje u rad) • onda možemo reći da imamo repozitorij. 11/150
Ministarstvo kulture RH pokrenulo je 2005. Nacionalni program digitalizacije arhivske, knjižnične i muzejske građe. • Prijedlog programa završen je u listopadu 2006. • u 2007. godini pokrenut je projekt "Hrvatska kulturna baština" • u 2008. javnosti je prikazan portal projekta www.kultura.hr 12/150
kooperativnost - zajednički rad na prezentaciji hrvatske baštine • svaka AKM institucija pomaže u slaganju mozaika hrvatske kulture • da bi se digitalizacija mogla provoditi standardizirano, osnovane su radne grupe za definiranje smjernica za pripremu projekta, odabir građe, odabir formata itd. 13/150
Zašto se uopće materijalna građa digitalizira? • digitalizacija radi zaštite izvornika • digitalizacija radi poboljšanja dostupnosti • digitalizacija radi stvaranja nove ponude • digitalizacija radi upotpunjavanja fonda 14/150
rezultat projekta – repozitorij (pa i ako se tako ne bude zvao) • preporučeno štivo: • Nacionalni program digitalizacije arhivske, knjižnične i muzejske građe • smjernice za • odabir i pripremu građe • norme i postupke u digitalizaciji • formate za dugoročnu pohranu • oblikovanje digitalnih zbirki 15/150
Uloga je repozitorija da pruži pouzdan, dugotrajan pristup digitalnim resursima, sada i u budućnosti. • brojni autori zabrinuti čuvanjem, održavanjem, pouzdanošću i trajnošću repozitorija • nakon stvaranja – održavanje i očuvanje 16/150
digitalna građa – lagana za čuvanje i multipliciranje, može se lako izgubiti, oštetiti ili nepovratno uništiti • kvar opreme (računala ili medija) bez odgovarajuće, unaprijed promišljene strategije čuvanja može dovesti do katastrofalnih posljedica • jednostavno rješenje - redovna izrada pričuvnih kopija može uspješno vratiti podatke. 17/150
Što je s promjenama tehnologije? • Što kada se pokvare uređaji? • Što kada mediji ne budu čitljivi? 18/150
Koji su mogući scenariji gubitka podataka u računalnom svijetu? • Ljudski faktor – neodržavanje, slučajno brisanje • Zastarijevanje • Zastarijevanje hardvera • Zastarijevanje softvera • Zastarijevanje formata • Zastarijevanje medija • Kvarovi • Kvar hardvera (izuzev diskovnog podsustava) • Kvar diskova • Kvar kontrolera • Kvar medija za backup 19/150
ljudski faktor - stalna edukacija i kontrola • bez obzira na uloženi trud greške uzrokovane ljudskim faktorom ne mogu se izbjeći • zastarijevanje - trajno investiranje i usvajanje najnovijih tehnologija • stalni veliki tehnološki napredak • oprema koja je danas nova i u pogonu, zapravo je već na rubu zastarjelosti • zastarjevanje softvera • zastarjevanje formata 20/150
mediji za pohranu • diskete • ZIP drive diskete • magneto-optički diskovi - WORM (Write Once Read Many) • CD i DVD • potreba za sve većim kapacitetima medija, razvijaju su novi mediji i standardi • nasljednik DVD-a - Blu-ray disk • u razvoju su holografski mediji • gdje je granica ? 21/150
nove tehnologije, glad za sve većim i boljim digitalnim fotografijama, dovode do potrebe za pohranjivanjem sve većih količina podataka • digitalizacija materijalne građe • danas uobičajeni, lako dostupni, ne preskupi, fotoaparati, sa slikom od 10 megapixela proizvode TIFF fotografiju od 28,5 MB. • 24 fotografije popuniti će jedan CD 22/150
Glavni “krivac” za rast količine podatakanesretan spoj dobre digitalne kamere i neobuzdanog korisnika
mediji za pohranu sve više i više nedostatni, bez obzira na svoj kapacitet. • Problem količine podataka, s tehničke strane, nije nerješiv. • Progres u elektronici dozvoljava stalno širenje kapaciteta za pohranu uz sve manju i manju cijenu po megabajtu podataka. 24/150
odabir medija za pohranu • repozitorij dostupan preko weba mora biti negdje pohranjen • naš poslužitelj • poslužitelj nekog od pružatelja internetskih usluga • Za pretpostaviti je da se podaci na tim poslužiteljima (bilo našim ili tuđim) redovito spremaju (bekapiraju) na odgovarajući način. • spremanje podataka našeg „neurednog repozitorija“ • svatko na računalu ima važnih podataka • trenutak spremanja na neki medij i odlaganje • odabir medija jednostavan i lagan – CD ili DVD • razočaranje – spremljeni podaci ne mogu se pročitati s medija! • Zašto? • Kupili smo najpovoljniji (čitaj: najjeftiniji) medij, snimili smo ga maksimalnom brzinom, na gornju površinu napisali smo sadržaj, ostavili medij u košuljici na stolu nekoliko dana i nakon toga ugurali u kutiju u nekom ormaru ili ladici. 25/150
početne tvrdnje proizvođača – 50 - 100 godina • korisnici često istiću kako su mediji koje su snimili već nakon kraćeg vremena (nekoliko mjeseci do nekoliko godina) postali djelomično nečitljivi, i to unatoč, naoko, besprijekornom stanju i pažljivom rukovanju • OSTA (Optical Storage Technology Association) ne preporuča vrijeme skladištenja nesnimljenih medija duže od 5 do 10 godina • pretpostavka - niti snimljeni medij ne bi trebao biti skladišten duži period 26/150
najnovija istraživanja trajnost procjenjuju na samo godinu dana • ne znači da će svaki medij potpuno propasti nakon godinu dana, ali statistički gledano povećana je vjerojatnost pojave grešaka na mediju • trajnost medija može se povećati odgovarajućim skladištenjem - potrebna je posebna prostorija, s klimatizacijom, kontrolom vlage ... ali garancije nema. 27/150
Zašto tako drastični pad procijenjene trajnosti CD i DVD medija? • vjerojatno je zbog smanjivanja cijene proizvodnje došlo do promjena u tehnologiji proizvodnje i materijalima koji se koriste što je rezultiralo smanjenom trajnosti medija • pokazalo se da su jeftini mediji znatno nepouzdaniji od skupljih medija, što bi trebalo potvrditi prethodnu tvrdnju 28/150
preporuka – koristiti “zlatne” medije • snimljene medije redovito kontrolirati • nakon godinu dana presnimiti (ako je potrebno i ranije) • očuvanje digitalnog sadržaja ne ovisi o mediju na kojem se čuva, tj. o očekivanom vijeku trajanja medija, nego o mogućnosti transfera sadržaja s jednog medija na drugi, i to što je češće moguće 29/150
kvar CD ili DVD medija, ili hard diska – postoje razni programi koji su u stanju pročitati sve ili dio podataka i sa oštećenih medija i uspješno ih spremiti • usluge poduzeća za spašavanje podataka s oštećenih medija • vrlo spor i mukotrpan posao • potrebno je procijeniti da li se isplati spašavanje podataka • u Hrvatskoj postoji samo jedno poduzeće koje se bavi ovim vrlo skupim i osjetljivim poslom 30/150
kvar računala • investicija u novo računalo • instalacija softvera • rekonstrukcija podataka • kvar diskovnog podsustava (diskova ili kontrolera) • problem pronalaženja odgovarajućih komponenti 31/150
poslužiteljska računala - SCSI (Small Computer Serial Interface) diskovi spojeni na odgovarajuće kontrolere • RAID (Redundant Array of Independent Disks) funkcije • diskovi povezani, podaci se zapisuju tako da se podatak razdijeli i istovremeno spremi na više diskova koristeći usput i algoritme za zaštitu i povrat podatka u slučaju kvara bilo kojeg od diskova • moguće su razne RAID konfiguracije, najčešće su: RAID 0, RAID 1, RAID 5 32/150
SCSI standard - mnoge revizije i unaprijeđenja. • postoji i nekoliko različitih vrsta konektora na diskovima. • ukoliko se pokvari kontroler na vašem 5 godina starom poslužiteljskom računalu i želite ga zamijeniti – bad luck • ako nemate sreće (niti backup) – podaci su izgubljeni. 33/150
ako se pokvari disk u istom takvom računalu – ista priča • potreban vam je disk istog ili većeg kapaciteta, ali obavezno istog konektora. • u današnje vrijeme brzog napretka elektronike, teško je nabaviti novi, ispravan, tehnološki nekoliko godina star uređaj • danas se u elektronici uređaji proizvode godinu dana (ako i toliko) i nakon toga se prodaju - kako to vole reći - do isteka zaliha. 34/150
do gubljenja podataka vrlo često dolazi zbog nepažnje • pazite da u „velikom spremanju“ ne obrišete i ono što niste namjeravali • ono što vam ne treba nemojte brisati – radije to preselite u mapu koju ćete nazvati Staro ili Nepotrebno ili Arhiva • ako vam treba još diskovnog prostora – kupite dodatni disk, kapaciteti diskova danas su dovoljno veliki, a diskovi su jeftini 35/150
jedini siguran način zaštite od gubitka podataka je izrada sigurnosnih kopija – backupa • backup je ime za redoviti periodični postupak izrade sigurnosnih kopija pomoću nekog od za tu svrhu namijenjenih programa ili za ručno kopiranje podataka • backupova ima nekoliko vrsta – Normal, Copy, Incremental, Differential, Daily 36/150
Normalni backup spremiti će odabrane datoteke i označiti ih kao spremljene, • copy će ih spremiti, ali ih neće označiti kao spremljene, • inkrementalni način će pogledati što se promijenilo od prošlog backupa, spremiti samo promjene i te datoteke će označiti kao spremljene, • diferencijalni backup će učiniti isto, ali neće obilježiti datoteke, • dnevni backup će spremiti samo ono što se promijenilo ili dodalo danas. 37/150
datoteke spremljene nekim od programa za backup, obično su spremljene u pakiranom obliku (zbog uštede prostora, poboljšane kontrole spremanja na medij i slično) i nisu direktno čitljive, nego ih istim alatom treba vratiti natrag (restore) • potreban velik oprez - da ne bi vratili i ono što nam ne treba - recimo starije verzije datoteka na kojima smo u međuvremenu radili 38/150
za naša poslovna računala možemo pojednostaviti stvar - uzmimo potpuni ili djelomični backup • potpuni backup će presnimiti kompletni sadržaj diska. To najčešće nije nužno, jer možda nije sve podjednako važno. • djelomični backup će presnimiti samo odabrane dijelove diska – recimo samo mapu s dokumentima • najjednostavnije učiniti običnim kopiranjem - postupak je jednostavan, a podaci su uvijek dostupni u obliku u kakvom su bili i na našem disku. Još jedna korist - ne trebaju nam posebni programi za backup. 39/150
preporučljiva minimalna strategija – kad osjetite potrebu (dakle ne radi se o redovnom postupku), napravite kopiju onoga za što mislite da vam je izuzetno važno (ne kopija svega i ne kopija cijelog određenog dijela) • srednja strategija bila bi redovito, periodično (ovisno o tempu stvaranja sadržaja) spremanje kompletne mape s podacima (ili svih mapa s podacima, ovisno o strukturiranosti spremanja podataka na disku). • maksimalna strategija, svakodnevno spremanje svega, ali taj pristup nema (uvijek) svoje opravdanje 40/150
da bi naši podaci bili sigurni, trajno dostupni i zaštićeni, potrebna je: • unaprijed promišljena strategija čuvanja i održavanja, kako podataka, tako i softverske i hardverske opreme • unaprijed osigurati sredstva dostatna za provedbu te strategije • potrebno se te strategije i pridržavati. • To je jedini način na koji možemo biti sigurni da će naši podaci, naši repozitoriji biti trajno dostupni nama i drugim korisnicima. A jel ima još puno ?