800 likes | 982 Views
Campus di Arcavacata. Università della Calabria. Corso di statistica. Dott. Massimiliano Giacalone. ARCAVACATA a.a 2009-2010. INDIRIZZO E-MAIL: massimiliano.giacalone@yahoo.it. Statistica
E N D
Campus di Arcavacata Università della Calabria Corso di statistica Dott. Massimiliano Giacalone ARCAVACATA a.a 2009-2010
INDIRIZZO E-MAIL: massimiliano.giacalone@yahoo.it
Statistica • Insieme di metodi finalizzati allo studio (mediante l’analisi) di fenomeni reali • Metodologia strumentale per l’analisi della realtà allo scopo di trarre leggi e regole generali per obiettivi predefiniti (Scienza o metodo?) • Scienza delle decisioni in condizioni di incertezza • …… in altre parole • “La statistica riguarda tutte le “operazioni” che rientrano in un processo di indagine finalizzato all’accrescimento della conoscenza “. • Perché l’indagine statistica?
Metodi statistici obiettivi informazioni risultati
Indagine Statistica • Fasi • Definizione degli obiettivi (generali, parziali) in funzione dei vincoli (di tempo, di costo) • Raccolta (Rilevazione) dei dati • Dati derivanti da misurazioni, da questionario, da basi di dati • Rilevazioni semplici o complesse
Elaborazione dei dati • Memorizzazione • Codifica/Ricodifica • Analisi statistica • Descrittiva/Inferenziale, • Univariata/Multivariata • Presentazione dei risultati • Riformulazione delle ipotesi di ricerca / Ridefinizione degli obiettivi
TERMINOLOGIA Rilevazioni statistiche Complesso delle operazioni rivolte ad acquisire una o più informazioni su un insieme di elementi (caratteri) oggetto di studio. Caratteristiche: - semplici/complesse - derivanti da risposte o da misure - globali (censimenti) / parziali (rilevazioni campionarie) Unità statistica: entità su cui viene condotta la rilevazione statistica Popolazione: insieme di tutte le unità statistiche facenti parte di un collettivo di riferimento Campione: sottoinsieme della popolazione
I Caratteri Statistici Insieme di fenomeni oggetto di studio riguardanti le caratteristiche che differenziano tra loro le unità statistiche L’espressione del carattere nelle unità statistiche si denomina modalità o intensità • Tipologie • Caratteri quantitativi (VARIABILI): assumono intensità rappresentate da numeri reali • Variabili continue • Variabili discrete • Caratteri qualitativi (MUTABILI): assumono modalità rappresentate da attributi non numerici • Nominali • Ordinali • Dicotomici • Tutti i caratteri possono essere resi dicotomici
Cosa si studia al corso di Statistica 1? • Statistica descrittiva: • Distribuzioni di frequenza • Rappresentazioni grafiche • Indici di posizione, variabilità e forma • Omogeneità ed eterogeneità • Relazioni statistiche (connessione, indipendenza in media, correlazione) • Statistica Inferenziale: • Probabilità • Variabili Casuali • Modelli per variabili casuali
La matrice (50 unità statistiche, 9 caratteri) Un campione di 50 aziende appartenenti alle imprese produttrici di beni di largo consumo. Rif.: M. Caputo (a cura di) Organizzare la logistica per l’Efficient Consumer Response, CEDAM, 1998
Sono stati riportati i settori merceologici elencati nella prima colonna della matrice dei dati sostituendo l’abbreviazione alla dicitura per esteso.
In simboli: Carattere osservato Numero di unità statistiche Numero di modalità/intensità di X i-esima modalità/intensità di X Frequenza assoluta della i-esima modalità xi Frequenza relativa della i-esima modalità xi
Distribuzione di frequenza I ) II )
Carattere qualitativo nominale: Rappresentazioni grafiche Diagramma a barre N.B. E’ possibile costruire il diagramma a barre riportando in ordinata le frequenze assolute OPPURE le frequenze relative, la forma della rappresentazione risulta invariata.
Carattere qualitativo nominale: Rappresentazioni grafiche Grafico a torta
Frequenza relativa cumulata: somma delle frequenze relative fino alla i-esima intensità. Si può calcolare per ogni tipo di distribuzione di frequenza. N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi
Rappresentazioni grafiche del carattere “Numero di stabilimenti”
Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi equiampie
Carattere “N. di stabilimenti”: costruzione della distribuzione in classi N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi e quantitativi discreti
Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi di diversa ampiezza e frequenza
Distribuzioni di frequenza per caratteri quantitativicontinui
Carattere quantitativo continuo FATTURATO
Rappresentazioni grafiche 1. Variabili qualitative Diagramma a barre Diagramma a torta • Variabili nominali o ordinali • Frequenze assolute o relative 2. Variabili quantitative discrete Diagramma a bastoni Diagramma a torta • Frequenze assolute o relative
3. Variabili quantitative continue 3.1 Istogramma rettangoli = classi base = ampiezza della classe di altezza = densità di frequenza hi area del imo rettangolo = frequenza della ima classe area totale A = n
Esempio 1: variabile X suddivisa in 2 classi di diverse ampiezza e frequenza Istogramma delle frequenze assolute Apparentemente sembrerebbe che le unità statistiche sono più concentrate nella prima classe, ma in realtà dovremmo tener presente che è vero che la frequenza nella prima classe è doppia rispetto alla frequenza nella seconda, ma è pur vero che la prima classe ha anche un’ampiezza doppia rispetto alla seconda.
Istogramma delle densità di frequenza (normalizzato) Rappresentando la densità di frequenza, invece, risulta evidente che le due classi sono perfettamente omogenee relativamente al modo in cui le unità statistiche si distribuisconotra di esse.
Istogramma normalizzato in cui la densità di frequenza è calcolata sulle frequenze relative base = ampiezza della classe di altezza = densità di frequenza hi area del rettangolo = frequenza relativa della classe area totale A = 1
Esempio 2 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equiampie n = 30
0 0 0,2 0,4 0,6 0,8 1 0,2 0,4 0,6 0,8 1 Istogramma delle frequenze relative Istogramma delle densità di frequenza In questo caso le due rappresentazioni sono ugualmente valide, ma solo in quanto le classi hanno la stessa ampiezza
Esempio 3 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equifrequenti n = 30 ni = 30 : 5 = 6
Istogramma delle frequenze assolute Istogramma delle densità di frequenza In questo caso è evidente che il primo grafico non è adeguato a rappresentare la distribuzione di frequenza.
In sintesi l’istogramma: • considera l’intensità con cui le frequenze si addensano all’interno delle diverse classi • è sensibile a cambiamenti dei criteri di raggruppamento delle intensità in classi • permette di confrontare “graficamente” diverse distribuzioni
Esempio 4: Confronto grafico tra diversi criteri di raggruppamento delle classi Carattere “Fatturato” A. Classi equifrequenti
Densità di Istogramma del fatturato frequenza (classi equiampie e densità di frequenza) 0.0020 0.0015 0.0010 0.0005 0.0 500 1000 1500 2000 classi di modalità f n = i h = i F f Classi i i d d n i i 103,0 | -- | 484,8 381,8 0,82 0,00215 0,82 484,8 -- | 866,6 381,8 0,10 0,00026 0,92 866,6 -- | 1.248, 4 381,8 0,04 0,00010 0,96 -- | 1.630,2 381,8 0,02 1248,4 0,00005 0,98 1630,2 -- | 2.012,0 381,8 0,02 0,00005 1,00 1,00 Totale B. Classi equiampie Come cambia la distribuzione se consideriamo 5 classi equiampie?
La gran parte delle aziende incluse nel campione ha un fatturato compreso tra 100 e 500 milioni (I classe). Domanda : La distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato può considerarsi uniforme? Risposta : consideriamo la seguente distribuzione in classi: -- |300, 300 -- |400, 100| -- |200, 200 -- |2.100 400 -- |500, 500 f n = Classi i h = i f F i i d d n i i 0,0050 100 | -- | 200 0,50 0,50 100 0,0010 200 -- | 300 0,10 0,60 100 0,0014 300 -- | 400 0,14 0,74 100 0,0010 400 -- | 500 0,10 0,84 100 0,0001 500 -- | 2.100 0,16 1,00 1.600 Totale 1,00 C. Classi di diversa ampiezza e frequenza
Confronto grafico: quale suddivisione in classi approssima meglio i dati originari?
Densità di frequenza Istogramma del fatturato (classi di diversa ampiezza e frequenza e densità di frequenza) 0.005 0.004 0.003 0.002 0.001 0.0 500 1000 1500 2000 classi di modalità Come si evince dall’istogramma, la densità di frequenza è più elevata in corrispondenza della prima classe (da 100 a 200 miliardi), per cui la distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato (100 – 500) relativa al caso delle classi equifrequenti NON può considerarsi uniforme.
Rappresentazione grafica Carattere “Fatturato” Classi equiampie