170 likes | 251 Views
Multidimenzionális Adatbázisok Alapjai. Ny írcsák Zoltán – F4CSMV alien@sch.bme.hu www.sch.bme.hu/~alien/olap. Mi a multidimenzionális adatbázis ?. A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását.
E N D
Multidimenzionális Adatbázisok Alapjai Nyírcsák Zoltán – F4CSMV alien@sch.bme.hu www.sch.bme.hu/~alien/olap
Mi a multidimenzionális adatbázis ? • A multidimenzionális adatbázis egy számítógépes szoftverrendszer, mely lehetővé teszi nagy mennyiségű adat hatékony és egyszerű tárolását. • az adatok egymással valamilyen módon összefüggenek • különböző nézetek – perspektívák, dimenziók - alapján tároljuk és vizsgáljuk őket
Az információ felhasználása A kapott információkból a menedzserek: • Stratégiákat állítanak fel • Trendeket ismernek fel • Üzleti döntéseket hoznak
Az alapvető cél • Vezetők által feltett kérdések, amik az üzleti életre vonatkoznak • Adatainkat különféle perspektívákból szemléljük • Nagy mennyiségű adatot érint • Gyors válaszidő szükséges • Átlátható formátumú eredményt akarunk
Relációs Adatbázis(miért nem jó ?) • Komplex lekérdezések • Több táblás join-ok • Indexelések • Lassú válaszidő • Nehezen átlátható eredmény
MODELL SZÍN ELADOTT MENNYISÉG MIKROBUSZ MIKROBUSZ MIKROBUSZ SPORT KUPÉ SPORT KUPÉ SPORT KUPÉ SEDAN SEDAN SEDAN KÉK PIROS FEHÉR KÉK PIROS FEHÉR KÉK PIROS FEHÉR 6 5 4 3 5 5 4 3 2 Egy relációs tábla ELADOTT MENNYISÉG – GLEASON KERESKEDÉS
“Cross-Tab” nézetek - Tömbök ELADOTT MENNYISÉG – GLEASON KERESKEDÉS • 2 dimenzió (perspektíva) : szín, modell – 3-3 elemmel • Egyszerűbb kinézet • Több információ nyerhető belőle ránézésre 6 5 4 MIKROBUSZ MODELL 3 5 5 KUPÉ 4 3 2 SEDAN KÉK PIROS FEHÉR SZÍN
Egy nagyobb tábla Nézzük az előbbi táblát, kiegészítve még egy dimenzióval! • Dimenzió : KERESKEDÉS • 3 db értékkel • Táblaméret : 3x3x3 = 27 • Probléma : áttekinthetetlen
Megjelenítés többdimenzióban ELADOTT MENNYISÉG – GLEASON KERESKEDÉS MODELL MIKROBUSZ 6 5 4 KUPÉ 3 5 5 SEDAN 4 3 2 GLEASON CARR CLYDE KERESKEDÉS KÉK PIROS FEHÉR SZÍN
Teljesítménybeli előnyök • Relációs esetben az egy rekord kikeresésének átlagos költsége 1000 rekord esetén : 500 • Multidimenzionális esetben 3 dimenziót feltételezve ez 5+5+5=15 • Költségcsökkenés 3300 %-os
IGEN Az mezők értéke ismétlődést mutat Eredendően összefüggő adatok, amikből fontos üzleti információt nyerhetünk NEM Különféle, nem ismétlődő értékek Tipikus relációs táblák, korrelálatlan adatok, kevés (rejtett) összefüggés Mikor használjuk, mikor ne ?
Műveletek multidimenzionális adathalmazon • Forgatás – új nézet egyszerű műveletel • Szűkítés (átméretezés) – a fontos elemekre fókuszálunk (redukált tömb) • Multidimenzionális lekérdezések • Hierarchikus felépítésnél – roll-up, drill-down
Szervezeti hierarchia SZERVEZETI DIMENZIÓ RÉGIÓ MIDWEST KERÜLET CHICAGO ST.LOUIS GARY KERESKEDÉS CLYDE GLEASON CARR LEVI
Multidimenzionális lekérdezések • Egyszerűbb nyelvezet • Átlátható eredmény • Gyors válaszidő • MDX (MultiDimensional eXpression)
Architektúra • Kliens-szerver • Multi user • OLTP és OLAP rendszerek külön Miért ? • OLTP – egyenletes terhelés, folyamatos, kis intenzitású query-k • OLAP – ritka, nagy intenzitású kérések, nagy adatmennyiséget érint • Szétválasztás nélkül a tranzakciós rendszer teljesítménye romlik
További jellemzők • Idő dimenzió – legtöbb rendszerben beépített támogatás van rá • Ritka adatok (sparse data) kezelése • Hierarchikus dimenziók • Partíciók • Kockák, virtuális kockák • Aggregátumok
Kereskedelmi szoftverek • TM1 • Oracle Express • MS OLAP Services (Analysis Services)