120 likes | 260 Views
Data Warehouse - indledning 8. semester forår 2010. v/ Jens Godik Højen,. Februar 2010 Fredag kl. 9.00. Information som underbygger beslutningsgrundlag. forretnings-drevet mål bag et data warehouse Data warehouse udgivelse Væsentlige dele af de samlede data warehouse
E N D
Data Warehouse - indledning8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00
Information som underbygger beslutningsgrundlag • forretnings-drevet mål bag et data warehouse • Data warehouse udgivelse • Væsentlige dele af de samlede data warehouse • Betydningen af dimensional modellering for data warehouse præsentation område • Fact og dimension tabel terminologi • Myter omkring dimensional modellering • Undgå faldgruber i udviklingen af data warehouse
Problemorienteret løsning bag data warehouse • Problemstillinger bag ofte stillede spørgsmål • Vi er i besiddelse af enorme mængder af data, men kan ikke komme i forbindelse med dem • Vi kan ikke kombinere data efter behov, (Slice/Dice) • To forskellige personer med samme data kommer med to forskellige svar? • Objektiv og subjektiv ??????
Hvad ønskes opnået? • DWH skal afhjælpe problemer med svart tilgængelige data • DWH skal formes efter virksomhedens kultur og krav til information • DWH skal kunne modstå krav til omskiftelighed og løbende tilpasninger • DWH skal sikre vitale data i forbindelse med driften af virksomheden • DWH skal fungerer som et fundament under vigtige beslutninger • Virksomheden skal have tiltro til og accepterer svar leveret af DWH
Data warehouse udgivelse • Sæt faste mål for hvad et DWH skal løse! • Forstå forretningsformålene i virksomheden • Forstå hvilke beslutninger der ønskes sat fundament under • Finde kompetente med-/mod-spillere til hjælp under udvikling • Finde nye brugere af DWH, hjælp dem på vej • Find de data der fungerer i et DWH, sikre dig adgang • Udvikling af simple datahøst metoder, og optimering af datatilgang • Sikre datavaliditet igen og igen og igen!!!!! • Fortsæt med at overvåge resultatet af output igen og igen og igen • Identificer nye datakilde muligheder og find en metode til indlejring • Sikre at resultater af DWH virker inden videreudvikling finder sted
Tre niveauer i et effektivt DWH • 1. niveau – hent data væk fra den oprindelige datakilde • 2. niveau – data staging area, ETL. Skille ad, rense, samle på ny • 3. niveau – upload til datapræsentationsserver • Hvorfor det? • Det er vigtigt at der er vandtætte skotter mellem virksomhedens registreringssystemer og data præsentationsområdet. Efterfølgende designes kuberne der skal sikre levering af data til et data Access værktøj
Metadata • Metadata er data om datakilden, dvs. det er ikke data om data • En form for opslagsværk over opbygningen af et DWH’s datastruktur design • Metadata kan/indeholder oplysninger om: • Systemtabeller • Partitionsinstillinger • Index • View’s • Sikkerhedsindstillinger • …
konforme Fact tabeller og konforme dimensioner • En række i en fact tabel svarer til en måling. • En måling er en række i en fact tabel. • Alle målinger i et fact tabel skal være det samme på samme granuleringsniveau. • De mest anvendelige elementer i en fact tabel består af numeriske og samlingsmulige værdier • Dimensionstabeller er vigtige additiver i forhold til fact tabellen. Robuste dimensions attributter sikre solide analytiske (slicing and dicing) muligheder. • Dimensionerne implementere brugergrænsefladen til det endelige DWH
Fem myter omkring DWH • dimensionelle modeller og data marts indeholder kun summariske data. • dimensionelle modeller og data marts er afdelingsorienteret og ikke anvendelig som en overordnet virksomhedsløsning. • dimensionelle modeller og data marts er ikke skalerbar. • dimensionelle modeller og data marts er kun fornuftige løsningsmodeller, når der er en forudsigelig brugsmønster. • dimensionelle modeller og data marts er svært at implementerer og fører ofte til spagettiprogrammerede løsninger
Tid til at du tænker dig rigtigt godt om • Undgå teknologiliderlighed! • Gennemfør hellere små succeser ned flerårige mastodont projekter! • Sikre tilstrækkelige midler til at kunne gennemføre et projekt (projektledelse er vigtig) • God performance på data giver tilbagevendende brugere. • Simple løsninger er kunst – komplekse løsninger er en sikker vej til fiasko • Overhold altid en fastlagt metodisk procedure….. • Anvend kun summeret data i datapræsentationsområdet! • At tro at virksomheden ikke ændre sig og at data derfor ikke skal tilpasses! • At tro at et DWH’s succes ikke er direkte forbundet med accept fra brugerens side !!!!!!!!!!!!!!!!!!!!!!!!!!!
Forslag til dimensioner • Konto • Dato • Afdeling • Medarbejder • Projekt • Datakilde • Organisation • Art, sted, formål • Handlinger • Oversættelser • Service • Kunder og kundetype • Valuta • …..