150 likes | 286 Views
MIBŐL (NEM) lehet (várat) adattárházat építeni. Kovács Zoltán Training360 Kft. z oltan.kovacs @training360.com. Az adatok természetes állapota. Nem egységes az adatszerkezet a különböző rendszerekben Az adatszerkezet változik Az adatérvényességi szabályok sokfélék, és nem állandóak
E N D
MIBŐL (NEM) lehet (várat) adattárházat építeni Kovács Zoltán Training360 Kft. zoltan.kovacs@training360.com
Az adatok természetes állapota • Nem egységes az adatszerkezet a különböző rendszerekben • Az adatszerkezet változik • Az adatérvényességi szabályok sokfélék, és nem állandóak • Az adatok minősége folyamatosan romlik • A felhasználói igények, szerepek sokfélék és változnak • DQS Rendet kell tenni! • MDS Rendet kell tartani!
Mit jelent a törzsadatkezelés? • Törzsadat (Master Data) • az üzleti tevékenységek szempontjából fontos központi adatok halmaza • vevők, szállítók, címek, termékek, árak, eszközök,… • Törzsadatkezelés (Master Data Management) • A törzsadatok központi kezelése • Az adatok minőségének folyamatos fenntartása • Adatmegosztás – előállítás és felhasználás • Példák • CRM – ERP objektumok megfeleltetése • Egységes címkezelés a szervezeten belül • Adattárház karbantartás
MIT TUD az MDS? ÉrvényesítésÜzleti szabályok kezelése,adatkonzisztencia biztosítása ModellezésEntitások, attribútumok, hierarchiák • MDS Excel Add-In Web UI • Törzsadatkezelés Adategyeztetés(DQS integrált) Szerepkörök kezelése Tranzakciók naplózása Verziókezelés Integráció és megosztás Adatelérés SQL nézetekkel Kötegelt betöltés átmeneti táblákba Módosítás API-n keresztül Workflow és értesítések Külső (CRM, ..) DWH Excel
Adattárházak és MDS • Adatérvényesítési szabályok központi kezelése • Előkészített adatbetöltő infrastruktúra • Kész infrastruktúra a dimenziók, hierarchiák karbantartására • Webes és Excel felület • Szerepkör alapú biztonsági rendszer • Tranzakciók naplózása • Átmeneti táblák • Integrációs nézetek • Verziókezelés • Excel felület
MDS - Ha már van adattárházunk • Hozzuk létre a megfelelő adatstruktúrát az MDS-ben • dimenziókat, • ténytáblákat, • egyéb entitások az adatérvényesítéshez. • Hozzuk létre az • üzleti szabályokat, • hierarchiákat, • integrációs nézeteket. • Állítsuk be a jogosultságokat • Módosítsuk a karbantartó eljárásokat • Átmeneti táblák -> MDS -> Integrációs nézetek
DEMO Adattárház karbantartása MDS-sel MDS modell létrehozása Entitások létrehozása Excel-ben, meglévő dimenzió alapján Adatmódosítás Excel-ben Adatérvényesítés Dimenzió frissítése integrációs nézeten keresztül
Adatminőség megoldás komponensek Az adathibák megkeresése, korrigálása. Duplikátumok azonosítása, megkeresése. Tisztítás Párosítás Profilozás Monitorozás Az adatok elemzése, és a lehetséges problémák felderítése. Az adatminőség folyamatos figyelése, biztosítása.
DQS koncepció • Tudásalapú • Tudásbázisra épül. • Szemantikus • Az adattartományok tartalmazzák a szemantikát. • Tudás-felderítés A tudás folyamatosan bővíthető a használat során. • Bővíthetőség • Felhasználói szabályokkal és külső referenciaadat-szolgáltatókkal. • Egyszerűség • Egyszerű felhasználói interfészek.
DQS FOGALMAK • Tudásbázis (KnowledgeBase) • Tartomány (Domain) • Elemi vagy összetett adatdefiníció • Lehetséges értékek halmaza (szinonímákkal) • Tartományi szabályok • Referencia adatok • Egyeztetési definíció (Matching Policy) • Adategyezőségi szabályok • Tudás-felderítés (KnowledgeDiscovery) • Meglévő adatok elemzése • Adattisztítás • Adatok ellenőrzése és javítása a tudásbázis alapján (Cleansing) • Egyező adatok keresése (Matching)
DQS folyamat • Tudásbázis létrehozása • Tartományok létrehozása • Adatok feltérképezése – meglévő adatokból • Szabályok definiálása • Referencia adatok megadása • Egyeztetési szabályok létrehozása • Adattisztítási feladatok létrehozása • Adattisztítási feladatok futtatása, nyomkövetése • Tudásbázis bővítése
DEMO Adattisztítás DQS-sel Tudásbázis létrehozása meglévő adatokból Adatok ellenőrzése és javítása Adatbetöltés MDS-be Duplikátumok szűrése Adatok betöltése