340 likes | 485 Views
Vård och långsiktigt bevarande av digitalt material. Jens Granlund. Innehåll. Lagringsmedier Dokumentformat Långsiktigt Digitalt Bevarande Säkerhet / Säkerhetskopiering Rutiner. Papper vs. Digitalt material. Papper kan läsas direkt av en människa
E N D
Vård och långsiktigt bevarande av digitalt material Jens Granlund
Innehåll • Lagringsmedier • Dokumentformat • Långsiktigt Digitalt Bevarande • Säkerhet / Säkerhetskopiering • Rutiner
Papper vs. Digitalt material • Papper kan läsas direkt av en människa • Digitalt material kräver en maskin som förstår sig på mediet och formatet • Vi vet rätt bra hur vi skall vårda och bevara pappersdokument svårare med digitalt • Flera kopior är en säkerhet: lätt, snabbt och billigt att kopiera digitalt. • Kopior av digitalt material är exakta kopior.Vid analog kopiering försämras materialet ofta från generation till generation.
Problem med att läsa digitalt material • Den digitala informationen är beroende av tekniken för att kunna uppfattas, den är endast maskinläsbar. Utan tillgång till och kunskap om nödvändig hårdvara, operativsystem och applikationsprogram i rätt versioner förblir informationen en samling otydbara binära tecken.
Förlorat material • Långtidslagring av digitala data är ett svårt och allvarligt problem för hela det moderna samhället och många frågor återstår att lösa. • Det strategiska konceptet för digitalt bevarande är och har länge varit öppna, leverantörsoberoende standarder och en kontinuerlig överflyttning av data till nya lagringsmedia. Detta medför dock stora kostnader, kontinuitetsproblem och risker vad gäller dataintegriteten. • Mycket data från datorns barndom har gått förlorat.
Lagringsmediums fysiska livslängd • Digitala lagringsmedia har (vanligen) kortare fysisk livslängd än papper och mikrofilm. • Disketter, CDn, hårdskivor mm. håller inte för evigt! • Det finns förväntad fysisk livslängd som varierar beroende på lagringsmedium.
Teknisk livslängd • Den digitala informationen har en teknisk livslängd. Hårdvara, mjukvara och filformat åldras hastigt. Det som är tillgängligt i dag kan redan om några år var oläsligt. Digitalt material kräver en mer aktiv övervakning än pappersbaserat arkivmaterial. • Exempel: har en fungerande 8 tums diskett, men: • Var hittar jag en diskettstation? Kan den anslutas fysiskt till datorn? • Drivrutiner för operativsystemet? • Kan filsystemet läsas? • Kan dokumentformatet förstås? • Har vi ännu samma teckenuppsättning?
Autenticitet • Digital information är lättare att kopiera, redigera och manipulera på annat sätt. Det kan därför vara svårt att fastställa ett digitalt dokuments autenticitet.
Kopiera digitalt material • Digital lagring gör det vanligtvis mycket snabbare, enklare och billigare att skapa flera kopior av materialet. • Jämför: böcker, fotografier, analogt lagrat ljud och film. • Föreklar skapande av säkerhetskopior. I princip borde digitalt material vara säkrare än analogt. • Hur är det i praktiken??? • Ibland är det säkrast att printa ut på papper ...
Exempel personliga fotografier • Vanligtvis har man vanliga analoga foton lagrade i fotoalbum och negativen lagrade i närheten... • Vem har negativen på annat håll än hemma? • 2 kopior ger bra skydd bara de lagras på olika håll. Digitala foton får inga (egentliga) negativ ... • Dyrt att ta kopior på negativ och pappersfoton (jämfört med digitalt lagrade) • Digitala foton kan mycket billigt kopieras t.ex. Till olika CDn eller DVD skivor, vilka kan placeras på olika håll. • Själv tar jag ut de viktigaste digifotona på papper (ej enbart av säkerhetsskäl)
Strategiska koncept för långtidslagring • Använd leverantörsoberoende standarder • Kontinuerlig överflyttning av data till nya lagringsmedia • Detta medför dock stora kostnader, kontinuitetsproblem och risker vad gäller dataintegriteten
Konvertering & migrering • Konvertering: förflyttning mellan olika versioner av ett program. • Till nyaste versionen, den förväntas stödas i många år ... • Migrering: Ny systemmiljö eller tillämpning. • Om ett medium överlever 50år, kan vi läsa det? • Med jämna mellanrum borde gamla data migreras till nu gällande systemmiljö och tillämpning
Lagringsmedier ändras • Medier som jag använt under min tid som datoranvändare. • (hålkort / hålremsor) • C-kasett !!! (1983) • Magnetband (stora öppna rullar) • DAT DDS, DDS3, DDS4, DLT (olika versioner) • Massor av bandtyper har existerat • Disketter 8 tum • Disketter 5 ¼ tum, olika format • Disketter 3 ½ tum • CD • DVD • Olika typer av skivminnen, ZIP, JAZZ • USB minnen. • Hårdskivor (olika typer och standarder) • Många av dessa är svåra att läsa idag
Lagring av media • Magnetiska och optiska databärare bör förvaras i + 15 grader C (+/- 2 grader) vid 30 % relativ luftfuktighet (+/- 5 %) • Magnetiska databärare skall dessutom skyddas mot skadlig elektromagnetisk påverkan. • Ju mer förvaringsklimatet avviker från rekommenderade värden, desto kortare blir den fysiska livslängden.
CD • En CD-ROM rymmer cirka 600 MB (megabytes). • En CD-skivas fysiska livslängd är beroende av dess kvalitet och kan även variera mellan enskilda exemplar. Längst håller skivormed guldlager i glas men den vanligaste materialkombinationen är zinklager i plast. • Förutsatt att förslutningen runt kanterna är helt tät kan en ordinär CD-skiva med zinklager i plast ha en förväntad livslängd på 20 - 50 år. En försiktig policy är att räkna med 10 år. • Tack vare den stora spridning CD-formatet fått på marknaden är risken liten att formatet och standarden plötsligt skulle försvinna. • Nya optiska lagringsmedia som DVD förutsätts vara kompatibla med CD-standarden. Prognoserna för den tekniska livslängden är alltså för närvarande god. • Kodak GOLD 100-tals år???
DVD • Digital Versatile Disc (DVD) är CD-ROM-skivans efterföljare. • Den har samma fysiska storlek men en lagringskapacitet som vida överstiger CD:n. För närvarande finns DVD-skivor som klarar att lagra 4.7 GB - 18 GB, d v s en kapacitet som motsvarar 8 - 30 CD. Den fysiska livslängden är densamma som för CD, och hållbarheten bör inte beräknas till mer än 10 år. • prognosen för den tekniska livslängden måste anses som god. • BlueRay och HD-DVD nästa.
Magnetband • De stora rullar med magnetband som en gång var symbolen för storebrorsamhället och den automatiska databehandlingen är idag så gott som helt försvunna. Data som finns på s k öppen rulle bör snarast migreras till annan typ av databärare.
Bandkassetter • Massor av typer • Bör skrivas om med jämna mellanrum
Disketter • Disketter olika typer, håller några år • Read error • ZIP, JAZZ • Dagens (bärbara)datorer saknar diskettstation (3 ½ tum).
Rutiner • System för att sköta konvertering och Migrering • Plan eller strategi • Principer för arkivering och gallring
Format för datalagring • Val av format har betydelse för den tekniska livslängden. • Hur ofta man måste konvertera eller migrera data • Finns inga riktigt bra lösningar, men vissa rekommendationer kan göras.
Långtidslagring av olika data • Texter: ASCII (1963) eller Unicode. • .TXT eller .RTF ej gärna t.ex. .DOC • PDF & SGML • Databaser: Som ej används aktivt (dumpas som t.ex. Textfiler) • Rastergrafik: TIFF eller JPEG • Ljud & Film: MPEG-1 och MPEG-2, MP3
Digital Negative (DNG) • Råfilsformaten blir allt vanligare inom digitalfotografin eftersom de ger yrkesfotografen bättre kreativ kontroll. Men kamerorna har många olika råformat – för vilka specifikationerna inte är allmänt tillgängliga; detta medför att inte alla råfiler kan läsas av alla program. Specialformaten utgör en osäkerhetsfaktor vid långtidsarkivering och kan försvåra användning av dem i komplexa arbetsflöden. • Lösningen på problemet? DNG-formatet (Digital Negative) är ett öppet arkiveringsformat för råfiler från digitalkameror. Genom att tillgodose behovet av en öppen standard för råfiler från olika kameramodeller kan DNG bidra till att bildfilerna kan öppnas även i framtiden
Säkerhetskopiering • Vad kopieras? • Hur ofta? • Till vilket medium? • I vilket format lagras data? • Var lagras kopiorna? • Hur länge sparas kopiorna? • Regelbundna rutiner! • Verifiering av säkerhetskopiorna!
Vad kopieras • I dagens läge lagras enorma mängder data på våra datorer. Om man tar regelbundna kopior och sparar många generationer, blir det dyrt att ta kopior på allt. • Man bör noga göra upp en plan på vad som skall säkerhetskopieras.
Hur ofta tas kopior? • En av de enklare frågorna: Hur mycket data är du beredd att förlora? • Nyhet: Continuous Backup (Countinuous Data Protection) • Backup genast då ändringar sker.
Till vilket medium • Hur dyrt? • Hur hållbart? • Om kopiorna skall lagras länge • Hur snabbt? • Viktigt om stora datamängder • Viktigt om man snabbt måste få tillbaka materialet
Var lagras kopiorna • För att uppnå hög säkerhet bör säkerhetskopiorna lagras på annat ställe än de data som säkerhetskopieras • Gärna minst 10km åtskilda • Gärna i låsta utrymmen • Gärna brandsäkert förvar • Gärna krypterade??? • Faror • Brand • Stöld • Skadegörelse • Naturkatastrofer • Krig • Datorvirus • Mjukvarufel
Hur länge lagras kopiorna? • Hur många veckor/månader/år vill man ha möjlighet att hämta tillbaka material från? • Om dator/skivminne går sönder är det oftast den senaste säkerhetskopian som är intressant. • Om information strukits/förstörts vid okänd tidpunkt, vill man kunna gå tillbaka och söka efter senast fungerande kopia. • Lagstiftning & andra regler
Hur många generationer sparas? • Vanligt fel: • Endast en säkerhetskopia sparas • Fel i data på datorn -> samma fel på säkerhetskopian • Felet har upptäckts för sent • Om man sparar flera generationer kan man gå tillbaka till fungerande version
Regelbundna rutiner • För att säkerhetskopieringen skall fungera, bör man ha rutiner som efterlevs. • Typexempel: Brukar ta säkerhetskopia varje fredag. • Maskin går sönder • Förra fredagen var jag på semester • Fredagen före satt jag i möte • Fredagen före det var jag på arbetsresa • Senast en kopia togs var för 2 månader sedan ... • Automatisera säkerhetskopieringen!
Verifiering av säkerhetskopiorna • Man måste använda säkerhetskopiorna eller på annat sätt verifiera att man verkligen har användbara data på backuperna. • Typexempel: • Kopior tas regelbundet • Någon kollar t.o.m. i loggfiler att kopieringen skett • Alla kopior är ändå obrukbara av någon orsak • Finns fall där man tagit 10-tals eller 100-tals kopior som alla är obrukbara, ingen har någonsin kollat att rutinerna och utrustningen fungerar, före katastrofen är ett faktum. • Automatisk verifiering är bra, men manuell verifiering är nödvändig!
Depåbibliotek • Lagring av pappersmaterial tar mycket utrymme och kostar ... • Nationalbiblioteket ansvar för kulturarvet i de flesta länder (pliktexemplar) • Inga pliktexemplar för elektroniskt material. • För tillfäller rekommenderas PDF och SGML som standard för dokumentlagring. Material som skall långtidsarkiverad borde konverteras till dessa format. • XML är en annan vedertagen standard