320 likes | 555 Views
Adatbázis rendszerek I. Adatkezelés és adatbázis kezelés alapfogalmai. K.L. …FBI und Deutsche Bank, alle haben unsere Daten da …(Kraftwerk). ügyfél menedzsment. ipari robot. adattároló. irányító szerver. szórakozás, oktatás. Több-rétegű struktúra. alkalmazás szerver. adatbázis szerver.
E N D
Adatbázis rendszerek I Adatkezelés és adatbázis kezelés alapfogalmai K.L.
…FBI und Deutsche Bank, alle haben unsere Daten da…(Kraftwerk) ügyfél menedzsment
ipari robot adattároló irányító szerver
Több-rétegű struktúra alkalmazás szerver adatbázis szerver WEB szerver kliens
Oracle Adatbáziskezelő jelenleg kb 40000 munkatársa van
Adat, Információ és Tudás Az információt jelsorozathoz kapcsolódó új jelentésnek, hasznos közlésnek tekinthetjük. statisztika < szintaktika <szemantika < pragmatika < apobetika Az információ hordozóját adatnak nevezzük, vagyis az adat a tények, fogalmak, feldolgozásra alkalmas reprezentációja. Tudás:ismeretek együttese, melyből új ismeretek következtethetők
DB/IS/KB rendszerek Adatbázis Tudásmenedzsment Információs rendszer
Adattárolás jellege szövegszerű strukturált szemi-strukturált Hello Péter! Képzeld Zolinak van egy nagyon jó CD-je, egy Kraftwerk lemez, azt hiszem Autobanh a címe. Talán 2500-ért vette a múltkor…. Adatbázis CD 1 Kraftwerk 2500 Zoli 4 Groove 3100 Laci 3 Enya 2700 Ani 6 Hobo 3600 Zoli <cím>Hello Péter!</cím> <CD> <eloado>Kratfwerk</eloado> <cím>Autobahn</cím> <ar>2500</ar> </CD> <CD><eloado>Groove </eloado><ar>3100</ar> </CD> K.L.
Adatbázis felépítése LETZTE BANK Adatbázis ?
Adatkezelési követelmények Nagy adatmennyiség VLDB (www.vldb.org) : 400 GB < kínai telefontársaság: 1TB-os tábla 108 lap, 5 km hosszú polc > 400 év 2005: EMC Corp. : 100 Tbyte DB, Standford : 500 TByte DB
Adatkezelési követelmények Hatékonyság időben: optimális válaszidő: < 2 s megtűrt válaszidő: < 20 s hellyel: minimális redundancia szabályozott redundancia www.tpc.org
Adatkezelési követelmények Konkurens hozzáférés konfliktus az erőforrások párhuzamos használatánál lost update jelensége A prog. B prog. ra rb számla 2 ua +5 ub +3 wa wa Egymás után ra ua wa 7 rb ub wb 10 Párhuzamosan ra rb ua ub wa 7 wb 5 K.L.
Adatkezelési követelmények - integritás őrzés az adatrendszer ne sértse meg az előre definiált szabályokat - statikus - dinamikus A Adatbázis - védelem adatvesztés elleni védelem másolatok, napló hozzáférés védelem bejelentkezés, titkosítás hozzáférés kontroll - hatékony fejlesztés rugalmasság szabványosság magas szintű programozási elemek K.L.
4: 4: 4: Adatrekord elérési módszerek N: rekordok darabszáma Soros elérés: O(N) 3 1 10 9 5 4 6 Indexelt elérés: O(log(N)) 5 6 1 3 4 9 10 Index szekvenciális elérés: O(log(N1)+ N2) 5 1 10 9 3 4 6
4: Adatrekord elérési módszerek Skip-lista elérés: O(log(N)) 3 1 10 9 5 4 6 B-fa elérés: O(log(N)) 60 10 40 100 5 3 19 30 - kereső fa , egy csomópontban M elem és M+1 pointer - jól kihasznált (min 50%), - csomóponton belül rendezett - logMN szint
Adatrekord elérési módszerek B-fa bővítés algoritmusa - alulról felfelé építkezik - kiegyensúlyozott - levél megkeresése - középső elem a szülőbe - testvér generálás - elemek szétosztása - pointerek kiigazítása 5 1,3,4 1,3,5,6,7,9 6,7,9 4 K.L.
Adatrekord elérési módszerek Hash szervezési módszer: O(1) + ? - a rekordot a kulcs értéke alapján közvetlenül határozza meg egy cím generáló hash függvény segítségével - a jó hash függvény egyenletesen teríti a rekordokat a hash táblában, pl. h(x) = x mod M - problémája a túlcsordulás kezelése: - túlcsordulási bucket láncolása - hash tábla és hash függvény átalakítás - virtuális hash: többszintű hash réteg 44 h(44) = 44 mod 41 = 3 hash tábla 40 0 2 1 K.L.
Gazdaságos megvalósítás - számos modul kidolgozása szükséges - egy-egy modul is nagy feladat - célszerű általános megoldást adni - integrált rendszer kezelő programrendszer: adatbázis kezelő kezelt adatrendszer: adatbázis CREATE TABLE .. K.L.
Adatbázis fogalma Az adatbázis egy integrált adatrendszer, mely több különböző egyed előfordulásainak adatait adatmodell szerinti struktúrában, perzisztens módon tárolja a kapcsolat leíró elemek mellett a metaadatokkal együtt, melyek a hatékonyság, integritásőrzés, az adatvédelem biztosítását szolgálják. Jelölése: DB (database) autok emberek jogosultság szerkezet napló DB K.L.
Adatbázis kezelő fogalma Az adatbázis kezelő rendszer olyan programrendszer, amelynek feladata az adatbázishoz történő szabályozott hozzáférés biztosítása és az adatbázis belső karbantartási műveleteinek végrehajtása. Jele: DBMS (database management system) - a DB csak a DBMS-en keresztül érhető el legálisan védelem integritás ellenőrzés optimalizálás naplózás párhuzamos hozzáférés ellenőrzés K.L.
Adatbázis-rendszer Az adatbázis kezelő, az adatbázis és az alkalmazói programok együttesét adatbázis-rendszernek nevezik SQL/... parancsfelület adatbázis-kezelő adatbázis K.L.
Adatbázis rendszerek kialakulása ANSI Oracle IBM SYBASE Informix ISO MS ODMG mySQL CODASYL Berkeley AshtonTate
ANSI SPARC modell Felh1 Felh2 Felh9 egyed Külső szint Globális séma TABLE Fogalmi szint Fizikai szint Fizikai szerkezet Index, rekord Biztosított függetlenségi szintek: - logikai : a külső szint és a globális szint között - fizikai : a globális szint és a fizikai szint között - hálózati : fizikai szinten belül K.L.
Adatbázis kezelő rendszer struktúrája SELECT * FROM AUTO ORDER BY RSZ SQL Kommunikációs réteg Utasítás értelmező CFG gráf DAC mátrix Hozzáférés ellenőrzés ECA modul Aktív szabály ellenőrző Optimalizáló QOG gráf QEP gráf Végrehajtó TM modul, zárolás Tranzakció vezérlő Naplózó modul Recovery modul IO rendszer read(), write()
Adatbázis tervezés főbb lépései ‘autók és tulajdonosok’ követelmény analízis A T szemantikai leírás adatmodell leírás normalizálás parancs kódolás create table A (R char(6) primary key,.. create table T ( T references A, … …. K.L.
Feladatok: 1. Mennyi az elemek minimális száma egy H mélységű M fokszámú B-fában? 2. Hogyan viszonyul egymáshoz teljes fa esetében az elem összehasonlítások darabszáma M1 és M2 fokszám esetében? 3. Mennyi annak a valószínűsége, hogy egy egyenletes elosztású hash függvény esetén túlcsordul egy megadott sorszámú rekesz, ha a rekeszek száma M és az elhelyezett elemek száma N 4. Mennyi annak a valószínűsége, hogy egy egyenletes elosztású hash függvény esetén túlcsordul valamely rekesz, ha a rekeszek száma M és az elhelyezett elemek száma N 5. Tudna említeni olyan esteket, amikor az objektumok kereséséhez a B-fa nem hatékony megoldás. 6. Tudna említeni olyan esteket, amikor az objektumok kereséséhez a B-fa nem alkalmazható.
Feladatok 1. Hasonlítsa össze az Excel és DBMS funkcióit 2. Mi lenne a következménye, ha az integritási szabályokat a DBMS-ben tárolnánk? 3. Milyen hátrányokkal járhat a DB alapú adatkezelés? 4. Önt szerint a tervezés, fejlesztés mely szintjei és milyen mértékben automatizálhatók? 5. Hogyan értelmezhető az a kijelentés, hogy a hagyományos filekezelés rekord szintű, a DBMS alapú pedig rekord szintű függetlenséget hordoz. Mi lenne a teljes függőség jellemzője?
Adatbázis rendszer előnyei - igényelt szolgáltatások biztosítása - védelem - integritásőrzés - párhuzamos hozzáférés - adatvesztés elleni védelem - hatékonyság - egységes kezelő felület - szabvány kezelő nyelvek - magas absztrakciós szint - rugalmasság - elrejti a tárolási részleteket a felhasználó elől - ANSI SPARC model K.L.