920 likes | 1.13k Views
IL DataWarehouse. Introduzione DataWarehouse. A cosa serve: Sistema di supporto alle decisioni Memorizza dati per la creazione di report avanzati ed analisi sofisticate . Deve essere sviluppato in base alle necessità del management. OLTP vs OLAP. Anche SAP R/3 è in grado di creare report.
E N D
IntroduzioneDataWarehouse • A cosa serve: • Sistema di supporto alle decisioni • Memorizza dati per la creazione di report avanzati ed analisi sofisticate. • Deve essere sviluppato in base alle necessità del management
OLTP vs OLAP • Anche SAP R/3 è in grado di creare report. • Per esempio esiste il LIS (Logistic Information System) • R/3 è un sistema OLTP (On Line Transaction Processing). • La funzione degli OLTP è il supporto ai processi di business.
OLTP vs OLAP • R/3 non è adatto per analisi avanzate. • La struttura dati di R/3 è costituita da numerosissime tabelle altamente normalizzate.
OLTP vs OLAP • La struttura dati di R/3:
OLTP vs OLAP • I sistemi DataWarehouse sono OLAP (On Line Analytical Processing). • La struttura dati degli OLAP è costituita da poche tabelle non normalizzate.
OLTP vs OLAP • Le principali differenze:
SAP BW Business Information Warehouse • È il DataWarehouse di SAP • Architettura: • La piattaforma di base (WebAS) è la stessa di R/3. • Ha gli stessi 3 livelli: Presentation (SapGui), Application, DataBase. • L’amministrazione del sistema è simile.
SAP BW • Anche dal punto di vista funzionale BW è composto da 3 livelli: • Presentazione • BW server • Sorgenti dati
SAP BW • I 3 livelli del BW:
SAP BW • Livello di Presentazione: • Permette di creare e gestire i report. • Il componente principale è il Business Explorer, che fornisce strumenti per reporting e analisi. • È possibile accedere ai dati via Web. • È possibile utilizzare strumenti di terzi.
SAP BW • BW server: • È il cuore del sistema. • Contiene il motore OLAP. • Contiene strumenti per l’estrazione e la gestione dei dati. • Memorizza i dati nelle apposite strutture.
SAP BW • Sorgenti dati: • Sono esterne al BW. • La sorgente tipica è SAP R/3. • È possibile prendere i dati da sistemi generici. • Anche da flat files (ASCII, CSV).
IL Modello Dati • Modello dati multidimensionale chiamato InfoCubo.
IL Modello DatiL’InfoCubo • L’infocubo è l’oggetto centrale del modello dati multidimensionale. • È il contenitore di dati.
IL Modello DatiL’InfoCubo • Un infocubo rappresenta un set di dati omogenei per un’area di business (Es. infocubo delle vendite etc.). • I report e le analisi sono basati sugli infocubi.
IL Modello DatiL’InfoCubo • Esempio di InfoCubo:
IL Modello DatiL’InfoCubo • Lungo gli assi cartesiani sono rappresentate le dimensioni (Es Regione, Prodotto ecc.). • Ogni dimensione raggruppa più caratteristiche (Es la dimensione Cliente potrebbe contenere il nome, l’indirizzo, l’area geografica ecc.).
IL Modello DatiL’InfoCubo • Nel BW esistono due dimensioni sempre presenti: • Time • Infopackage
IL Modello DatiL’InfoCubo • Se rilevante esiste anche la dimensione unit. • Le altre dimensioni sono liberamente definibili dall’utente. • Il numero massimo di dimensioni è 16, comprese le tre predefinite.
IL Modello DatiL’InfoCubo • Il contenuto dell’infocubo sono i fatti, chiamati anche Key Figure. • Le caratteristiche e le dimensioni servono per individuare i fatti nell’infocubo.
IL Modello DatiL’InfoCubo • In figura è illustrato il percorso che porta dall’infocubo verso i fatti.
IL Modello DatiL’InfoCubo • È necessario scegliere l’infocubo che contiene le informazioni che si intendono analizzare.
IL Modello DatiL’InfoCubo • È necessario selezionare le caratteristiche fra quelle presenti nell’infocubo.
IL Modello DatiL’InfoCubo • In questo modo si ottiene un set ridotto di dati sui quali compiere le analisi.
IL Modello DatiImplementazione • Il DataBase di BW è relazionale. • L’infocubo è implementato con un certo numero di tabelle. • Lo schema del DB è chiamato schema a stella.
IL Modello DatiImplementazione • Lo schema a stella:
IL Modello DatiImplementazione • Lo schema a stella è composto da: • Una tabella dei fatti. • Alcune tabelle delle dimensioni.
IL Modello DatiImplementazione • La tabella dei fatti: • Contiene i fatti, cioè le quantità oggetto dell’analisi (Es Fatturato, volume vendite ecc.) • Contiene i riferimenti alle tabelle dimensionali (chiavi).
IL Modello DatiImplementazione • La tabella dei fatti: • È messa in relazione con le tabelle delle dimensioni attraverso le chiavi. • La chiave primaria della tabella dei fatti è costituita da tutte le chiavi. • Ogni informazione (o fatto o key figure) è identificata univocamente dalla combinazione di tutte le dimensioni.
IL Modello DatiImplementazione • La tabella dei fatti:
IL Modello DatiImplementazione • Le tabelle dimensionali rappresentano le dimensione nell’infocubo. • Sono in relazione con la tabella dei fatti attraverso la chiave.
IL Modello DatiImplementazione • Tabella dei fatti e dimensioni:
IL Modello DatiImplementazione • Schema a stella e infocubo:
IL Modello DatiImplementazione • In realtà BW utilizza uno schema a stella esteso. • È uno sviluppo dello schema a stella classico. • Si tratta di portare fuori dalle tabelle delle dimensioni le caratteristiche.
IL Modello DatiImplementazione • Schema a stella classico ed esteso:
IL Modello DatiImplementazione • Le tabelle delle dimensioni non contengono informazioni ma solo indici: • Il DIM lega la tabella dimensionale con la tabella dei fatti (come nello schema classico). • Il SID (indice Surrogato) lega le tabelle dimensionali alle caratteristiche.
IL Modello DatiImplementazione • Ogni caratteristica è descritta dai master data. • I master data sono informazioni addizionali sulle caratteristiche. • Esistono tre tipi di master data e sono memorizzati in tabelle distinte, esterne all’infocubo.
IL Modello DatiImplementazione • Schema a stella esteso:
IL Modello DatiImplementazione • I masterdata si dividono in: • Attributi • Testi • Gerarchie • Inoltre è introdotta la SID table che mette in relazione i masterdata con le dimensioni.
IL Modello DatiImplementazione • Schema a stella esteso e master data:
IL Modello DatiImplementazione • Il principale vantaggio dello schema a stella esteso è una maggiore flessibilità.
I DatiSorgenti dati • I dati provengono da: • SAP R/3 od altri software SAP (anche un altro BW). • Software di terzi. • Files piatti (ASCII, CSV).
I DatiETL • In generale il processo di ripresa dati è indicato con la sigla ETL: • Estrazione • Trasformazione • Loading
I DatiSorgenti dati • In BW il processo avviene come indicato in figura.
I DatiSorgenti dati • Il processo avviene in due componenti: la DataSource e l’InfoSource.
I DatiStrutture dati • La Datasource include l’extraction source e la transfer structure. • I dati sono immagazzinati nell’extraction source e nella transfer structure e poi trasferiti nella transfer structure di BW (replica).
I DatiStrutture dati • La transfer structure permette il trasferimento dati tra il sistema sorgente e BW. • Il trasferimento avviene tramite ALE e tRFC.
I DatiStrutture dati • L’InfoSource comprende la Communication structure. • La Communication Structure ottiene i dati dalla transfer structure attraverso le transfer rules. • La Communication structure è indipendente dalla sorgente dati.