1 / 12

Hvorfor Datawarehouse

Hvorfor Datawarehouse. Hvordan har salget i region A ændret sig over de sidste 5 år? Hvordan har sælgerne i område B klaret de sidste 2 år sammen- lignet med dem i område A Hvilket produkt vil sælge bedst næste år?. Hvad er det totale salg i område A?

kalyca
Download Presentation

Hvorfor Datawarehouse

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hvorfor Datawarehouse • Hvordan har salget i region A ændret sig over de sidste 5 år? • Hvordan har sælgerne i område B klaret de sidste 2 år sammen- lignet med dem i område A • Hvilket produkt vil sælge bedst næste år? • Hvad er det totale salg i område A? • Hvilken sælger fik højeste kommission i denne måned ? Spørgsmål man ikke umiddelbart kan få svar på i ERP systemer

  2. Datawarehouse karakteristika • Data er kategoriseret og lagret ud fra forretningsområder ikke ud fra operationelle applikationer • Data vedrørende et givet emne er defineret og lagret én gang • Data er lagret som en serie af snapshots, som hver repræsenterer et tidsinterval • Data vil ikke blive opdateret eller slettet

  3. Datawarehouse • Datawarehouse omfatter hele den proces, der skal gennemløbes, når data bearbejdes til brugbar information dvs. • Dataidentifikation • Datafangst • Datatransformation • Evt beregninger • Præsentation og distribution af information

  4. Databaserne • OLTP = On-Line Transaktion Processing • ERP databasen er designet til udtræk af data der understøtter de operationelle arbejdsprocesser • OLAP = On-Line Analytical Processing • Datawarehouse databasen er designet til udtræk af data der understøtter analytiske sammenhænge

  5. Operationelle contra Warehouse

  6. Datawarehouse miljø Rapport generator ERP system OLAP database Fysiske og metadata (beskrivelse af data) Analyseværktøj Øvrige interne og externe kilder 3.Parts produkter Datalagring Anvendelse Datafangst

  7. Data anvendelse • Rapportgenerator • Forklare hvad der skete • Analyseværktøj • Forklare hvor det skete • Forklare hvad der vil ske (datamining) • Ser efter skjulte mønstre i data

  8. Datawarehouse projekt • Afklaring af rammer • Formulering af overordnede mål • Kravspecifikation • Forretningsmæssige krav • IT mæssige krav • Tidsmæssigekrav • Design • Udvikling • Review • Vurdering af det iterative forløb • Holder kravspecifikationen Afklaring af rammer Kravspecifikation Design Udvikling Review Implementering Vedligeholdelse og drift

  9. Data Mining • Data mining er automatisk vidensopdagelse • Klassificering • Inddel data ind i foruddefinerede klasser • Forudsigelse • Forudsig/estimer ukendt værdi baseret på lignende tilfælde • Sammenligning • Finder ligheder/forskelle imellem klasse og konstrastklasse • Gruppering • Inddel data i grupper så ligheden indenfor de enkelte grupper er størst mulig og ligheden mellem grupperne er mindst mulig • Sammenhænge • Finder sammenhænge/afhængigheder mellem data

  10. Eksempler • Walmart: USAs (og verdens) største supermarkedskæde • Har DW med alle kassetransaktioner for de sidste 2 år (70TB!) • Bruger mining intensivt for at opnå forretningsfordele • Analyse af sammenhænge indenfor kassebon’er Opdagelse: Øl og bleer ofte på samme bon Mænd køber bleer med hjem, og skal ”lige ha’ en bajer med” Stil de dyre øl ved siden af bleerne Stil øl et stykke væk fra bleerne, med chips og videofilm imellem! • Weblog mining Hvad er sammenhængen mellem tid på dagen og requests? Hvilke brugergrupper tilgår mit websted? Hvor mange requests får mit websted om en måned?

  11. Form og farve til uoverskuelige statistikker • Store mængder af statistiske data kan være umulige at overskue og finde den sammenhæng i, der fører til en passende diagnose.Aalborg Universitet forsker bla. i 3D Visual Data Mining. • Der skabes kunstige verdener, hvor statiske data repræsenteres som tredimensionelle, visuelle objekter. • Objekter med egenskaber, for eksempel farve, form, orientation og tekstur. En visuel repræsentation giver analytikeren muligheder for at se forbindelser i større mængder data.

  12. Alert projekt • Data fra biomedicinske databaser kan sikre tidlig påvisning af bivirkninger Projektet har til formål at udvikle et nyskabende computerprogram, der kan påvise bivirkninger bedre og hurtigere end de nuværende indrapporteringssystemer. • For at nå målet, vil ALERT udnytte kliniske data i elektroniske patientjournaler fra mere end 30 millioner europæere (danskere, hollændere, englændere og italienere). • ALERT vil benytte data mining computerteknik til at analysere de elektroniske data med det formål at opdage kombinationer af medicin og mistanke om bivirkninger, som giver anledning til nærmere undersøgelse.

More Related