1 / 92

IL DataWarehouse

IL DataWarehouse. Introduzione DataWarehouse. A cosa serve: Sistema di supporto alle decisioni Memorizza dati per la creazione di report avanzati ed analisi sofisticate . Deve essere sviluppato in base alle necessità del management. OLTP vs OLAP. Anche SAP R/3 è in grado di creare report.

ursala
Download Presentation

IL DataWarehouse

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. IL DataWarehouse

  2. IntroduzioneDataWarehouse • A cosa serve: • Sistema di supporto alle decisioni • Memorizza dati per la creazione di report avanzati ed analisi sofisticate. • Deve essere sviluppato in base alle necessità del management

  3. OLTP vs OLAP • Anche SAP R/3 è in grado di creare report. • Per esempio esiste il LIS (Logistic Information System) • R/3 è un sistema OLTP (On Line Transaction Processing). • La funzione degli OLTP è il supporto ai processi di business.

  4. OLTP vs OLAP • R/3 non è adatto per analisi avanzate. • La struttura dati di R/3 è costituita da numerosissime tabelle altamente normalizzate.

  5. OLTP vs OLAP • La struttura dati di R/3:

  6. OLTP vs OLAP • I sistemi DataWarehouse sono OLAP (On Line Analytical Processing). • La struttura dati degli OLAP è costituita da poche tabelle non normalizzate.

  7. OLTP vs OLAP • Le principali differenze:

  8. SAP BW Business Information Warehouse • È il DataWarehouse di SAP • Architettura: • La piattaforma di base (WebAS) è la stessa di R/3. • Ha gli stessi 3 livelli: Presentation (SapGui), Application, DataBase. • L’amministrazione del sistema è simile.

  9. SAP BW • Anche dal punto di vista funzionale BW è composto da 3 livelli: • Presentazione • BW server • Sorgenti dati

  10. SAP BW • I 3 livelli del BW:

  11. SAP BW • Livello di Presentazione: • Permette di creare e gestire i report. • Il componente principale è il Business Explorer, che fornisce strumenti per reporting e analisi. • È possibile accedere ai dati via Web. • È possibile utilizzare strumenti di terzi.

  12. SAP BW • BW server: • È il cuore del sistema. • Contiene il motore OLAP. • Contiene strumenti per l’estrazione e la gestione dei dati. • Memorizza i dati nelle apposite strutture.

  13. SAP BW • Sorgenti dati: • Sono esterne al BW. • La sorgente tipica è SAP R/3. • È possibile prendere i dati da sistemi generici. • Anche da flat files (ASCII, CSV).

  14. IL Modello Dati • Modello dati multidimensionale chiamato InfoCubo.

  15. IL Modello DatiL’InfoCubo • L’infocubo è l’oggetto centrale del modello dati multidimensionale. • È il contenitore di dati.

  16. IL Modello DatiL’InfoCubo • Un infocubo rappresenta un set di dati omogenei per un’area di business (Es. infocubo delle vendite etc.). • I report e le analisi sono basati sugli infocubi.

  17. IL Modello DatiL’InfoCubo • Esempio di InfoCubo:

  18. IL Modello DatiL’InfoCubo • Lungo gli assi cartesiani sono rappresentate le dimensioni (Es Regione, Prodotto ecc.). • Ogni dimensione raggruppa più caratteristiche (Es la dimensione Cliente potrebbe contenere il nome, l’indirizzo, l’area geografica ecc.).

  19. IL Modello DatiL’InfoCubo • Nel BW esistono due dimensioni sempre presenti: • Time • Infopackage

  20. IL Modello DatiL’InfoCubo • Se rilevante esiste anche la dimensione unit. • Le altre dimensioni sono liberamente definibili dall’utente. • Il numero massimo di dimensioni è 16, comprese le tre predefinite.

  21. IL Modello DatiL’InfoCubo • Il contenuto dell’infocubo sono i fatti, chiamati anche Key Figure. • Le caratteristiche e le dimensioni servono per individuare i fatti nell’infocubo.

  22. IL Modello DatiL’InfoCubo • In figura è illustrato il percorso che porta dall’infocubo verso i fatti.

  23. IL Modello DatiL’InfoCubo • È necessario scegliere l’infocubo che contiene le informazioni che si intendono analizzare.

  24. IL Modello DatiL’InfoCubo • È necessario selezionare le caratteristiche fra quelle presenti nell’infocubo.

  25. IL Modello DatiL’InfoCubo • In questo modo si ottiene un set ridotto di dati sui quali compiere le analisi.

  26. IL Modello DatiImplementazione • Il DataBase di BW è relazionale. • L’infocubo è implementato con un certo numero di tabelle. • Lo schema del DB è chiamato schema a stella.

  27. IL Modello DatiImplementazione • Lo schema a stella:

  28. IL Modello DatiImplementazione • Lo schema a stella è composto da: • Una tabella dei fatti. • Alcune tabelle delle dimensioni.

  29. IL Modello DatiImplementazione • La tabella dei fatti: • Contiene i fatti, cioè le quantità oggetto dell’analisi (Es Fatturato, volume vendite ecc.) • Contiene i riferimenti alle tabelle dimensionali (chiavi).

  30. IL Modello DatiImplementazione • La tabella dei fatti: • È messa in relazione con le tabelle delle dimensioni attraverso le chiavi. • La chiave primaria della tabella dei fatti è costituita da tutte le chiavi. • Ogni informazione (o fatto o key figure) è identificata univocamente dalla combinazione di tutte le dimensioni.

  31. IL Modello DatiImplementazione • La tabella dei fatti:

  32. IL Modello DatiImplementazione • Le tabelle dimensionali rappresentano le dimensione nell’infocubo. • Sono in relazione con la tabella dei fatti attraverso la chiave.

  33. IL Modello DatiImplementazione • Tabella dei fatti e dimensioni:

  34. IL Modello DatiImplementazione • Schema a stella e infocubo:

  35. IL Modello DatiImplementazione • In realtà BW utilizza uno schema a stella esteso. • È uno sviluppo dello schema a stella classico. • Si tratta di portare fuori dalle tabelle delle dimensioni le caratteristiche.

  36. IL Modello DatiImplementazione • Schema a stella classico ed esteso:

  37. IL Modello DatiImplementazione • Le tabelle delle dimensioni non contengono informazioni ma solo indici: • Il DIM lega la tabella dimensionale con la tabella dei fatti (come nello schema classico). • Il SID (indice Surrogato) lega le tabelle dimensionali alle caratteristiche.

  38. IL Modello DatiImplementazione • Ogni caratteristica è descritta dai master data. • I master data sono informazioni addizionali sulle caratteristiche. • Esistono tre tipi di master data e sono memorizzati in tabelle distinte, esterne all’infocubo.

  39. IL Modello DatiImplementazione • Schema a stella esteso:

  40. IL Modello DatiImplementazione • I masterdata si dividono in: • Attributi • Testi • Gerarchie • Inoltre è introdotta la SID table che mette in relazione i masterdata con le dimensioni.

  41. IL Modello DatiImplementazione • Schema a stella esteso e master data:

  42. IL Modello DatiImplementazione • Il principale vantaggio dello schema a stella esteso è una maggiore flessibilità.

  43. I DatiSorgenti dati

  44. I DatiSorgenti dati • I dati provengono da: • SAP R/3 od altri software SAP (anche un altro BW). • Software di terzi. • Files piatti (ASCII, CSV).

  45. I DatiETL • In generale il processo di ripresa dati è indicato con la sigla ETL: • Estrazione • Trasformazione • Loading

  46. I DatiSorgenti dati • In BW il processo avviene come indicato in figura.

  47. I DatiSorgenti dati • Il processo avviene in due componenti: la DataSource e l’InfoSource.

  48. I DatiStrutture dati • La Datasource include l’extraction source e la transfer structure. • I dati sono immagazzinati nell’extraction source e nella transfer structure e poi trasferiti nella transfer structure di BW (replica).

  49. I DatiStrutture dati • La transfer structure permette il trasferimento dati tra il sistema sorgente e BW. • Il trasferimento avviene tramite ALE e tRFC.

  50. I DatiStrutture dati • L’InfoSource comprende la Communication structure. • La Communication Structure ottiene i dati dalla transfer structure attraverso le transfer rules. • La Communication structure è indipendente dalla sorgente dati.

More Related