180 likes | 325 Views
Forelesning nr 29 - Backup. TDT4285 Planlegging og drift av IT-systemer Våren 2006 Anders Christensen, IDI. Definisjon.
E N D
Forelesning nr 29 - Backup TDT4285 Planlegging og drift av IT-systemer Våren 2006 Anders Christensen, IDI TDT4285 Planl&drift IT-syst
Definisjon Backup er å benytte redundant lagring av informasjon for å unngå at denne forsvinner ved en feiltagelse, et krasj el.l. (dvs for å nøytralisere single point of failure ifm lagring). TDT4285 Planl&drift IT-syst
Dimensjoner for backup • Omfang – alle eller bare viktige data? • Nivå – alle eller kun endrede data? • Grader – filinnhold eller også metadata? • Redundans – antall kopier av hver fil • Granularitet – hvor ofte tas backup • Versjonering – antall versjoner bakover • Endringsrate – % endringer i fildataene • Medium – hva slags medium kopieres det til TDT4285 Planl&drift IT-syst
Nivåer av backup Stor fil Basert på Basert på Filleting Nyfil Filleting Kjørefil Grov fil Inkr. backup Nivå 2 Inkr. backup Full backup Tid Nivå 0 Nivå 1 Tid Nyfil Stor fil Nyfil Stor fil Stor fil Filleting Filleting Kjørefil Filleting Kjørefil Grov fil Grov fil Grov fil TDT4285 Planl&drift IT-syst
Full og inkrementell backup Full backup: kopi av alle data Inkrementell backup nivå 1: kopi av alle nye/endrede data etter forrige fulle backup. Inkrementell backup nivå 2: kopi av alle nye/endrede data etter forrige backup på nivå 1. TDT4285 Planl&drift IT-syst
Trender innenbackup Versjonerte filsystemer Utvikling Versjonering Tape backup Billige disker TDT4285 Planl&drift IT-syst RAID
Tre grader av backup 1. Speilkopi Innhold, metadata og ”implementasjon” 2. Alle data Index Filinnhold Index Innhold og metadata Filinnhold 3. Fildata Filinnhold Kun filinnhold TDT4285 Planl&drift IT-syst
Metadata som kanskje kopieres • Access control lists (ACL) • Eierskap og gruppetilhørighet • Alle tidsstempler relatert til fila (typisk minst 3-4 for de fleste OS) • Informasjon om ”hull” i filer • Device-filer, spesialfiler og lenker • Filattributter (R/O, skjulte, systemfiler...) TDT4285 Planl&drift IT-syst
Backupmetoder Bruker er selv ansvarlig for å ta sin egen backup Alle versjoner av hver fil lagres Bruker Versjonering Harddisk Full Synkronisering Backup- database Tape backup Inkrementell Alle data lagres 1 gang i en database Tapestasjon 1 tape pr dag TDT4285 Planl&drift IT-syst
Anta schedule: Full hver mnd Inkr nivå 1 hver uke Inkr nivå 2 hver dag Taperotasjon 6mnd Worst case: en fil med en levetid på 1mnd finnes bare på en tape. For hver tape som blir defekt, hvor mange filer ”mistes” permanent? Sannsynlighet for restore gitt en fils levetid og et antall defekte taper? Redundans og granularitet TDT4285 Planl&drift IT-syst
Må hele fila tas backup av? Append Ford Juli Backup av hele fila Databasefil Opel Juni August Backup kun av tillagt post Mercedes Mai Volvo Backup kun av endret post April Citroen Mars Append-only loggfil Update Backup av hele fila Rolls Royce Februar Mazda Lada Januar TDT4285 Planl&drift IT-syst
Backup - proaktivt eller reaktivt? Proaktiv fase Reaktiv fase Tape Rutine Tidsnød Restore Backup Restoret harddisk Original harddisk Krasj Tidsakse TDT4285 Planl&drift IT-syst
Lokasjon for lagring av tape Innbrudd Branntilløp Utbrenning Nedbrenning Leirras Samme bygning Nabobygg Samme rom 1 2 3 4 5 Taperobot Brannsafe TDT4285 Planl&drift IT-syst
Arkivbackup • Ta et eget backupsett, som er separat fra daglig backup • Plukk ut et komplett sett fra daglig backup • Et utvalg taper som tilsammen dekker full backup av alt • Ta ut en RAID 1-disk fra backup-repository • Dobbeltlagre full backup av hvert disk til en egen arkiv-tapestasjon, og lagre som arkivbackup når den er komplett TDT4285 Planl&drift IT-syst
Tidsaspekter ved backup • Tar backup oftere enn restoring, så det er viktig å automatisere backup • Ofte tidsnød ved restore (reaktivt) • Ideelt sett er restore noe som brukere kan avlaste drift med (selvbetjening) TDT4285 Planl&drift IT-syst
Noen måltall • Tid for nattlig backupkjøring • Antall dager for en full backupsyklus, dersom inkrementell backup brukes. • Tid for å restore en enkelt, liten fil • Tid for å restore største disk/RAID • Overføringsrate ved restore • Komprimeringsgrad for dataene • Antall versjoner bakover, og tidsintervallet mellom dem TDT4285 Planl&drift IT-syst
Backup-schedule ved IDI • Full backup til tape hver 10. dag • Inkrementell backup til tape hver dag • Full/inkr tas vare på i 60 dager • Arkivbackup 3-4 ggr pr år. Inkrementell Dager Full Partisjoner TDT4285 Planl&drift IT-syst
Noen ops!-faktorer • Ingen har testet hvor lang tid full restore tar • Lisensen på backupprogramvaren har gått ut og ingen kan restore data • Ingen har sjekket for feilmeldinger i loggene, og alle tapene fra siste 5 mnd var tomme • Disksystemene gror raskere enn økningen på tapesystemenes kapasitet klarer å ta unna • Daglig backup tar litt mer en 24 timer. • Databasefila var i bruk og er inkonsistent TDT4285 Planl&drift IT-syst