1 / 12

Data Warehouse - indledning 8. semester forår 2010

Data Warehouse - indledning 8. semester forår 2010. v/ Jens Godik Højen,. Februar 2010 Fredag kl. 9.00. Information som underbygger beslutningsgrundlag. forretnings-drevet mål bag et data warehouse Data warehouse udgivelse Væsentlige dele af de samlede data warehouse

sera
Download Presentation

Data Warehouse - indledning 8. semester forår 2010

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Data Warehouse - indledning8. semester forår 2010 v/ Jens Godik Højen, Februar 2010 Fredag kl. 9.00

  2. Information som underbygger beslutningsgrundlag • forretnings-drevet mål bag et data warehouse • Data warehouse udgivelse • Væsentlige dele af de samlede data warehouse • Betydningen af dimensional modellering for data warehouse præsentation område • Fact og dimension tabel terminologi • Myter omkring dimensional modellering • Undgå faldgruber i udviklingen af data warehouse

  3. Problemorienteret løsning bag data warehouse • Problemstillinger bag ofte stillede spørgsmål • Vi er i besiddelse af enorme mængder af data, men kan ikke komme i forbindelse med dem • Vi kan ikke kombinere data efter behov, (Slice/Dice) • To forskellige personer med samme data kommer med to forskellige svar? • Objektiv og subjektiv ??????

  4. Hvad ønskes opnået? • DWH skal afhjælpe problemer med svart tilgængelige data • DWH skal formes efter virksomhedens kultur og krav til information • DWH skal kunne modstå krav til omskiftelighed og løbende tilpasninger • DWH skal sikre vitale data i forbindelse med driften af virksomheden • DWH skal fungerer som et fundament under vigtige beslutninger • Virksomheden skal have tiltro til og accepterer svar leveret af DWH

  5. Data warehouse udgivelse • Sæt faste mål for hvad et DWH skal løse! • Forstå forretningsformålene i virksomheden • Forstå hvilke beslutninger der ønskes sat fundament under • Finde kompetente med-/mod-spillere til hjælp under udvikling • Finde nye brugere af DWH, hjælp dem på vej • Find de data der fungerer i et DWH, sikre dig adgang • Udvikling af simple datahøst metoder, og optimering af datatilgang • Sikre datavaliditet igen og igen og igen!!!!! • Fortsæt med at overvåge resultatet af output igen og igen og igen  • Identificer nye datakilde muligheder og find en metode til indlejring • Sikre at resultater af DWH virker inden videreudvikling finder sted

  6. En anden måde at vise Kimballs system – se side 7

  7. Tre niveauer i et effektivt DWH • 1. niveau – hent data væk fra den oprindelige datakilde • 2. niveau – data staging area, ETL. Skille ad, rense, samle på ny  • 3. niveau – upload til datapræsentationsserver • Hvorfor det? • Det er vigtigt at der er vandtætte skotter mellem virksomhedens registreringssystemer og data præsentationsområdet. Efterfølgende designes kuberne der skal sikre levering af data til et data Access værktøj

  8. Metadata • Metadata er data om datakilden, dvs. det er ikke data om data • En form for opslagsværk over opbygningen af et DWH’s datastruktur design • Metadata kan/indeholder oplysninger om: • Systemtabeller • Partitionsinstillinger • Index • View’s • Sikkerhedsindstillinger • …

  9. konforme Fact tabeller og konforme dimensioner • En række i en fact tabel svarer til en måling. • En måling er en række i en fact tabel. • Alle målinger i et fact tabel skal være det samme på samme granuleringsniveau. • De mest anvendelige elementer i en fact tabel består af numeriske og samlingsmulige værdier • Dimensionstabeller er vigtige additiver i forhold til fact tabellen. Robuste dimensions attributter sikre solide analytiske (slicing and dicing) muligheder. • Dimensionerne implementere brugergrænsefladen til det endelige DWH

  10. Fem myter omkring DWH • dimensionelle modeller og data marts indeholder kun summariske data. • dimensionelle modeller og data marts er afdelingsorienteret og ikke anvendelig som en overordnet virksomhedsløsning. • dimensionelle modeller og data marts er ikke skalerbar. • dimensionelle modeller og data marts er kun fornuftige løsningsmodeller, når der er en forudsigelig brugsmønster. • dimensionelle modeller og data marts er svært at implementerer og fører ofte til spagettiprogrammerede løsninger

  11. Tid til at du tænker dig rigtigt godt om • Undgå teknologiliderlighed! • Gennemfør hellere små succeser ned flerårige mastodont projekter! • Sikre tilstrækkelige midler til at kunne gennemføre et projekt (projektledelse er vigtig) • God performance på data giver tilbagevendende brugere. • Simple løsninger er kunst – komplekse løsninger er en sikker vej til fiasko • Overhold altid en fastlagt metodisk procedure….. • Anvend kun summeret data i datapræsentationsområdet! • At tro at virksomheden ikke ændre sig og at data derfor ikke skal tilpasses! • At tro at et DWH’s succes ikke er direkte forbundet med accept fra brugerens side !!!!!!!!!!!!!!!!!!!!!!!!!!!

  12. Forslag til dimensioner • Konto • Dato • Afdeling • Medarbejder • Projekt • Datakilde • Organisation • Art, sted, formål • Handlinger • Oversættelser • Service • Kunder og kundetype • Valuta • …..

More Related