220 likes | 330 Views
B e n t M ø l l e r M a d s e n. OLAP / Multidimensionel analyse. Online Analytical Processing Aalborg Universitet, d. 27. marts 2007. Opsamling, rensning & bearbejdning af data. OLTP-systemer. Analyse-værktøjer. Produktions- system. Excel. DWH. OLAP. ERP. Rapporter. Tekstfiler.
E N D
BentMøllerMadsen OLAP / Multidimensionel analyse Online Analytical Processing Aalborg Universitet, d. 27. marts 2007
Opsamling, rensning & bearbejdning af data OLTP-systemer Analyse-værktøjer Produktions- system Excel DWH OLAP ERP Rapporter Tekstfiler Data Mining … Andre data-kilder Decision Support System
OLAP • Multidimensionalt syn på data • Hierarkier i dimensioner • Beregninger mellem fakta og indenfor dimensioner • Adskillelse af datastruktur og -præsentation • Fleksibel brugerflade • Rotation • Slicing and dicing • Drill-down/drill-up (på hierarkier) • Tabeller, krydstabeller/-tabuleringer og grafer • Hurtig tilgang til data • Understøttelse af flere brugere
Alternativer til OLAP • SQL & Application Express • Regneark
Karakteristika OLTP OLAP Typisk operation Indtastning/opdatering Analyser Datas alder Nuværende Historiske og nuværende Aggregeringsniveau Detaildata/atomare data Aggregerede data Datakrav til forespørgsel Minimale Store Forespørgsel-mønster Individuelle forespørgsler Iterative forespørgsler OLTP vs. OLAP
OLTP vs. OLAP • Eks. på OLTP-forespørgsel • Hvilke produkter solgte vi på sidste ordre til kunde nr. 84305? • Eks. på OLAP-forespørgsel • Hvem er de 3 bedste salgsmedarbejdere på omsætning i det jyske marked indenfor sko set over de sidste 12 måneder?
Produkter Område Jylland Sko Fyn & øerne Sjælland Overtøj Skjorter Bukser Andet Q1 Q2 Q3 Q4 Tid Kube-opfattelsen i OLAP
Sammenligning mellem (fakta-)tabel og kube Dimensioner Nøgler Maaned Marked Feb Mar Jan Produkt Jylland Sko Fyn Sjælland Skjorte Bukser
Produkt Marked Jylland Sko Fyn Sjælland Overtøj Skjorter Bukser Andet Q1 Q2 Q3 Q4 Tid Mange dimensioner Dimensioner Marked Tid Kanal Organisation Produktion Produkt Kategori Medarbejder
Ansvarlig Tid Produkt Marked Jan 2004 Sko bmm Feb 2004 Jylland Mar 2004 Overtøj Apr 2004 joe Maj 2004 Skjorter Fyn Jun 2004 hfl Jul 2004 Bukser Aug 2004 Sjælland Sep 2004 low Andet Okt 2004 Multidimensional Type Structures
Jylland Sko Sko Fyn Overtøj Sjælland Overtøj Skjorter Skjorter Bukser Bukser Andet Andet Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Jylland Sko Fyn Sjælland Overtøj Skjorter Bukser Andet Q2 Q3 Q4 Q1 Beregning mellem kuber Omsætning Pris Mængde
Produkt Dækningsbidrag Oms. Sko Var. Omk. DB Overtøj Skjorter Bukser Andet Q1 Q2 Q3 Q4 Tid Beregninger indenfor dimensioner Formler DB = Oms – Var. Omk Konsolideringsfaktor i Palo 1.0/1.5 Oms: 1.0 Var. Omk.: -1.0
Hierarkier • Rekursivt/Parent-Child/Ragged hierarki • Ofte samme art elementer i hele hierarkiet • Typisk stykliste og organisationshierarki
Hierarkier • Niveaubaseret hierarki • Kun samme art elementer indenfor et niveau • Typisk tid og geografi
OLAP • Måder at gemme data på i OLAP • ROLAP (Relational) • MOLAP (Multidimensionel) • HOLAP (Hybrid) • Summerede data i MOLAP model og atomare data i ROLAP løsning
OLAP-værktøjer • Oracle OLAP (MOLAP database) • Oracle Discoverer (ROLAP & MOLAP brugerfladeværktøj) • Microsoft SQL Server Analysis Services (MOLAP database) • Hyperion Essbase (nu købt af Oracle) • Applix TM1 (MOLAP) • MIS ALEA (MOLAP) • PARIS Technologies PowerOLAP (MOLAP) • Jedox Palo (MOLAP) (Open Source) • Pentaho Mondrian (ROLAP) (Open Source)
Palo • Gratis MOLAP database • Hukommelsesbaseret • Læse- og skrivemuligheder • Flere forskellige brugerflader til Palo databasen • Excel tilføjelsesprogram • Selvstændig Java klient (jpalo.com) • Web-/php-sider • Version 1.0c vs. 1.5 • Simpel og let tilgængelig • Hjemmeside: palo.net
Mangler i Palo 1.0 og 1.5 • Ingen brugerstyring (kun 1.0) • Ingen direkte understøttelse af attributter på dimensionselementer (kun 1.0) • Manglende mulighed for at opbygge formler/beregninger i Palo • Kun addition og subtraktion indenfor dimensioner i en kube • Denne mulighed vil eftersigende komme i version 2.0 planlagt til at udkomme denne sommer.
Værktøjer til load af data ind i Palo • Palo Excel tilføjelsesprogram • Specialversion af Kettle • Baseret på en ældre version 2.3.1 af Kettle • www.3a-strategy.com/public_files/kettle/ • IMP:Palo • Begrænset gratis udgave til PALO af et kommercielt ETL-værktøj specifikt rettet mod OLAP-databaser • Endnu ikke tilgængelig på hjemmesiden • www.imppalo.com
Data Mining værktøjer • SAS • SPSS Clementine • Gratis / open source • KNIME (installeret i Oracle menuen) • www.knime.org • Orange • Tanagra • Weka • Yale