200 likes | 405 Views
Fizičko modeliranje podataka. Klobučar Josipa, 979 Šarić Marija, 964 Šarić Martina, 1028 Viljevac Slaven, 991. Uvod. Polazi od logičkog modela, a rezultira izrađenim fizičkim modelom Fizički model je opis stvarne fizičke organizacije podataka Model ima oblik unutarnje sheme baze podataka
E N D
Fizičko modeliranje podataka Klobučar Josipa, 979 Šarić Marija, 964 Šarić Martina, 1028 Viljevac Slaven, 991
Uvod • Polazi od logičkog modela, a rezultira izrađenim fizičkim modelom • Fizički model je opis stvarne fizičke organizacije podataka • Model ima oblik unutarnje sheme baze podataka • Fizički slog
Uređaji i mediji za memoriranje podataka Primarna memorija • koristi se kao radna memorija za memoriranje programa i potrebnih podataka u vrijeme izvršavanja programa Sekundarna memorija • služi za trajno memoriranje podataka
Podaci se uvijek mijenjaju u radnom području u primarnoj memoriji, a zatim se tako promijenjeni prenose u bazu podataka na sekundarnu memoriju.
Mediji sa serijskim pristupom • Slogovi se obrađuju serijski, u redosljedu u kojim su memorirani na mediju • Tipični predstavnik je magnetska vrpca • Slogovi se grupiraju u blokove • Blok je jedinica podataka koja se kao cjelina prenosi između primarne i sekundarne memorije
Mediji s direktnim pristupom • Direktan pristup bilo kojem slogu • Tipični predstavnik je disk (meki, tvrdi, magnetski, optički)
Principi fizičkog modeliranja podataka • Cilj fizičkog modeliranja podataka: • fizička organizacija podataka • brz pristup slogovima • Aktivnosti fizičkog modeliranja: • Modeliranje strukture slogova • Segmentiranje i grupiranje slogova • Izbor metode pristupa slogovima • Optimizacija pristupnih puteva
Modeliranje strukture slogova • Struktura sloga u računalu definirana je formatiranjem • Načini formatiranja: • Pozicija polja fiksne duljine – strogi redoslijed • Pozicija polja varijabilne duljine – duljina prethodnih polja • Pozicija polja varijabilne duljine – indeksima • Pozicija polja varijabilne duljine – oznakama
Za smanjivanje potrebnog prostora za smještaj podataka koriste se tehnike kompresije podataka • Tehnike: • Korištenje kratica (EUR,USD, CHF...) • Izbacivanje nula • Zamjena sekvenci znakova koje se često pojavljuju • Statističko sažimanje
Segmentiranje i grupiranje slogova • Segmentiranje slogova –različiti dijelovi dugih slogova mogu se smjestiti na razl. fizičkim lokacijama • Grupiranje slogova • istog tipa: smještanje u datoteku- za sustav datoteka • razl. tipa: - smještanje u bazu podataka-za područje ili prostor - grupirati slogove koji se često zajedno obrađuju,tj. grupe ili klastere
Metode pristup slogova • Slogovi u datoteci obrađuju se jednom od slijedećih operacija: • Unos novog sloga u datoteku (WRITE NEXT/KEY) • Čitanje sloga u datoteci (READ NEXT/KEY) • Brisanje sloga iz datoteke (DELETE) • Promjena sadržaja sloga u datoteci (REWRITE)
Sekvencijalna metoda pristupa • U sekvencijalno organiziranim datotekama slogovi se određuju sekvencijalnio ili serijski
Direktna metoda pristupa • Slogovima se pristupa izravno • Adresa sloga se “izračunava” iz ključa sloga Adresa=f(ključ sloga) • Prostor kojeg zauzima adresa = blok, zona, interval • Kapacitet bloka je jedan ili više slogova
Direktna datoteka Statička • Podijeljena je na N blokova veličine L znakova • Prostor se popunjava sekvencijalno • Nedostaci:velik broj preljevnih slogova Dinamička • Ostvaruje se brz pojedinačni pristup slogovima, ali ostaje problem uređenog pristupa slogovima ili pristupa slogovima unutar zadanog raspona ključa
Indeksirana metoda pristupa • Indeksna datoteka stoga sastoji se od: • Indeksno područje • Područje podataka • Gradi se veći indeks s više razina na principu B stabla • Datoteka koja koristi B-stablo može se organizirati na više načina, uobičajena su 2: • Slogovi se nalaze u neuređenoj sekvencijalnoj dat., a zasebno se organizira sortiran gust indeks u obliku B-stabla • Slogovi se nalaze u uređenoj sekvencijalnoj dat., a zasebno ili u sklopu slogova s podacima organizira se rijedak sortiran indeks u obliku B-stabla
Povezivanje slogova pokazivačima • Pokazivač je polje u slogu koje sadrži fizičku adresu sljedećeg sloga • Lista slogova povezana pokazivačima predstavlja logičku sekvencijalnu datoteku
Distribuiranje podataka • Distribuirani informacijski sustav se sastoji od mreže računala u kojoj se obavlja distribuirana obrada ili postoji distribuiranost podataka • Distribuirana baza pobataka također može biti: • Homogena – sve lokalne baze podataka su upravljane istim SUBP-om • Heterogena – lokalne baze podataka mogu biti upravljane različitim SUBP-ovima
Četiri pristupa distribuciji podataka: • Centralizirani – jedna kopija locirana u jednom čvoru • Podjeljeni – jedna kopija podjeljena na disjunktne skupove smještena u različitim čvorovima • Replicirani – više kopija čiji se komplementi nalaze u pojedinom čvoru • Hibridni – kombinacija prethodnih pristupa
Literatura • Mladen Varga – Baze podataka: Konceptualno, logičko i fizičko modeliranje podataka, DRIP, 1994.