1 / 77

Corso di statistica

Campus di Arcavacata. Università della Calabria. Corso di statistica. Dott. Massimiliano Giacalone. ARCAVACATA a.a 2009-2010. INDIRIZZO E-MAIL: massimiliano.giacalone@yahoo.it. Statistica

Download Presentation

Corso di statistica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Campus di Arcavacata Università della Calabria Corso di statistica Dott. Massimiliano Giacalone ARCAVACATA a.a 2009-2010

  2. INDIRIZZO E-MAIL: massimiliano.giacalone@yahoo.it

  3. Statistica • Insieme di metodi finalizzati allo studio (mediante l’analisi) di fenomeni reali • Metodologia strumentale per l’analisi della realtà allo scopo di trarre leggi e regole generali per obiettivi predefiniti (Scienza o metodo?) • Scienza delle decisioni in condizioni di incertezza • …… in altre parole • “La statistica riguarda tutte le “operazioni” che rientrano in un processo di indagine finalizzato all’accrescimento della conoscenza “. • Perché l’indagine statistica?

  4. Metodi statistici obiettivi informazioni risultati

  5. Indagine Statistica • Fasi • Definizione degli obiettivi (generali, parziali) in funzione dei vincoli (di tempo, di costo) • Raccolta (Rilevazione) dei dati • Dati derivanti da misurazioni, da questionario, da basi di dati • Rilevazioni semplici o complesse

  6. Elaborazione dei dati • Memorizzazione • Codifica/Ricodifica • Analisi statistica • Descrittiva/Inferenziale, • Univariata/Multivariata • Presentazione dei risultati • Riformulazione delle ipotesi di ricerca / Ridefinizione degli obiettivi

  7. TERMINOLOGIA Rilevazioni statistiche Complesso delle operazioni rivolte ad acquisire una o più informazioni su un insieme di elementi (caratteri) oggetto di studio. Caratteristiche: - semplici/complesse - derivanti da risposte o da misure - globali (censimenti) / parziali (rilevazioni campionarie) Unità statistica: entità su cui viene condotta la rilevazione statistica Popolazione: insieme di tutte le unità statistiche facenti parte di un collettivo di riferimento Campione: sottoinsieme della popolazione

  8. I Caratteri Statistici Insieme di fenomeni oggetto di studio riguardanti le caratteristiche che differenziano tra loro le unità statistiche L’espressione del carattere nelle unità statistiche si denomina modalità o intensità • Tipologie • Caratteri quantitativi (VARIABILI): assumono intensità rappresentate da numeri reali • Variabili continue • Variabili discrete • Caratteri qualitativi (MUTABILI): assumono modalità rappresentate da attributi non numerici • Nominali • Ordinali • Dicotomici • Tutti i caratteri possono essere resi dicotomici

  9. Tipi di caratteri ed operazioni possibili

  10. Cosa si studia al corso di Statistica 1? • Statistica descrittiva: • Distribuzioni di frequenza • Rappresentazioni grafiche • Indici di posizione, variabilità e forma • Omogeneità ed eterogeneità • Relazioni statistiche (connessione, indipendenza in media, correlazione) • Statistica Inferenziale: • Probabilità • Variabili Casuali • Modelli per variabili casuali

  11. La matrice (50 unità statistiche, 9 caratteri) Un campione di 50 aziende appartenenti alle imprese produttrici di beni di largo consumo. Rif.: M. Caputo (a cura di) Organizzare la logistica per l’Efficient Consumer Response, CEDAM, 1998

  12. Sono stati riportati i settori merceologici elencati nella prima colonna della matrice dei dati sostituendo l’abbreviazione alla dicitura per esteso.

  13. In simboli: Carattere osservato Numero di unità statistiche Numero di modalità/intensità di X i-esima modalità/intensità di X Frequenza assoluta della i-esima modalità xi Frequenza relativa della i-esima modalità xi

  14. Distribuzione di frequenza I ) II )

  15. Carattere qualitativo nominale: Rappresentazioni grafiche Diagramma a barre N.B. E’ possibile costruire il diagramma a barre riportando in ordinata le frequenze assolute OPPURE le frequenze relative, la forma della rappresentazione risulta invariata.

  16. Carattere qualitativo nominale: Rappresentazioni grafiche Grafico a torta

  17. Frequenza relativa cumulata: somma delle frequenze relative fino alla i-esima intensità. Si può calcolare per ogni tipo di distribuzione di frequenza. N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi

  18. Rappresentazioni grafiche del carattere “Numero di stabilimenti”

  19. Suddivisione in classi

  20. Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi equiampie

  21. Carattere “N. di stabilimenti”: costruzione della distribuzione in classi N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi e quantitativi discreti

  22. Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi di diversa ampiezza e frequenza

  23. Distribuzioni di frequenza per caratteri quantitativicontinui

  24. Carattere quantitativo continuo FATTURATO

  25. Carattere “Fatturato”: Classi equifrequenti

  26. Carattere “Fatturato”: Classi equiampie

  27. Carattere “N.ro di stabilimenti”: Classi equiampie

  28. Rappresentazioni grafiche 1. Variabili qualitative Diagramma a barre Diagramma a torta • Variabili nominali o ordinali • Frequenze assolute o relative 2. Variabili quantitative discrete Diagramma a bastoni Diagramma a torta • Frequenze assolute o relative

  29. 3. Variabili quantitative continue 3.1 Istogramma rettangoli = classi base = ampiezza della classe di altezza = densità di frequenza hi area del imo rettangolo = frequenza della ima classe area totale A = n

  30. Esempio 1: variabile X suddivisa in 2 classi di diverse ampiezza e frequenza Istogramma delle frequenze assolute Apparentemente sembrerebbe che le unità statistiche sono più concentrate nella prima classe, ma in realtà dovremmo tener presente che è vero che la frequenza nella prima classe è doppia rispetto alla frequenza nella seconda, ma è pur vero che la prima classe ha anche un’ampiezza doppia rispetto alla seconda.

  31. Istogramma delle densità di frequenza (normalizzato) Rappresentando la densità di frequenza, invece, risulta evidente che le due classi sono perfettamente omogenee relativamente al modo in cui le unità statistiche si distribuisconotra di esse.

  32. Istogramma normalizzato in cui la densità di frequenza è calcolata sulle frequenze relative base = ampiezza della classe di altezza = densità di frequenza hi area del rettangolo = frequenza relativa della classe area totale A = 1

  33. Dati: 30 consumatori di succhi di frutta

  34. Esempio 2 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equiampie n = 30

  35. 0 0 0,2 0,4 0,6 0,8 1 0,2 0,4 0,6 0,8 1 Istogramma delle frequenze relative Istogramma delle densità di frequenza In questo caso le due rappresentazioni sono ugualmente valide, ma solo in quanto le classi hanno la stessa ampiezza

  36. Esempio 3 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equifrequenti n = 30 ni = 30 : 5 = 6

  37. Istogramma delle frequenze assolute Istogramma delle densità di frequenza In questo caso è evidente che il primo grafico non è adeguato a rappresentare la distribuzione di frequenza.

  38. In sintesi l’istogramma: • considera l’intensità con cui le frequenze si addensano all’interno delle diverse classi • è sensibile a cambiamenti dei criteri di raggruppamento delle intensità in classi • permette di confrontare “graficamente” diverse distribuzioni

  39. Esempio 4: Confronto grafico tra diversi criteri di raggruppamento delle classi Carattere “Fatturato” A. Classi equifrequenti

  40. Densità di Istogramma del fatturato frequenza (classi equiampie e densità di frequenza) 0.0020 0.0015 0.0010 0.0005 0.0 500 1000 1500 2000 classi di modalità f n = i h = i F f Classi i i d d n i i 103,0 | -- | 484,8 381,8 0,82 0,00215 0,82 484,8 -- | 866,6 381,8 0,10 0,00026 0,92 866,6 -- | 1.248, 4 381,8 0,04 0,00010 0,96 -- | 1.630,2 381,8 0,02 1248,4 0,00005 0,98 1630,2 -- | 2.012,0 381,8 0,02 0,00005 1,00 1,00 Totale B. Classi equiampie Come cambia la distribuzione se consideriamo 5 classi equiampie?

  41. La gran parte delle aziende incluse nel campione ha un fatturato compreso tra 100 e 500 milioni (I classe). Domanda : La distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato può considerarsi uniforme? Risposta : consideriamo la seguente distribuzione in classi: -- |300, 300 -- |400, 100| -- |200, 200 -- |2.100 400 -- |500, 500 f n = Classi i h = i f F i i d d n i i 0,0050 100 | -- | 200 0,50 0,50 100 0,0010 200 -- | 300 0,10 0,60 100 0,0014 300 -- | 400 0,14 0,74 100 0,0010 400 -- | 500 0,10 0,84 100 0,0001 500 -- | 2.100 0,16 1,00 1.600 Totale 1,00 C. Classi di diversa ampiezza e frequenza

  42. Confronto grafico: quale suddivisione in classi approssima meglio i dati originari?

  43. Densità di frequenza Istogramma del fatturato (classi di diversa ampiezza e frequenza e densità di frequenza) 0.005 0.004 0.003 0.002 0.001 0.0 500 1000 1500 2000 classi di modalità Come si evince dall’istogramma, la densità di frequenza è più elevata in corrispondenza della prima classe (da 100 a 200 miliardi), per cui la distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato (100 – 500) relativa al caso delle classi equifrequenti NON può considerarsi uniforme.

  44. 3.2 Funzione di ripartizione empirica

  45. Rappresentazione grafica Carattere “Fatturato” Classi equiampie

More Related