1 / 35

Completiamo i grafici

Completiamo i grafici. Diagramma logaritmico : variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute

kolya
Download Presentation

Completiamo i grafici

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Completiamo i grafici • Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna scala sarebbe adeguata), oppure se si vogliono evidenziare le variazioni in percentuale, piuttosto che quelle assolute • Diagramma di Pareto: serve per rappresentare la perdita economica (difettosità e loro costi). • Diagramma a scatola e baffi (box-plot): consente di visualizzare alcune caratteristiche della distribuzione statistica (campo di variazione, percentili, media aritmetica, mediana, massimo, minimo)

  2. Diagramma a scatola e baffi (box-plot) Diagramma a scatola e baffi (box-plot): consente di visualizzare alcune caratteristiche della distribuzione statistica (campo di variazione, percentili, media aritmetica, mediana, massimo, minimo) • Internamente alla scatola sono rappresentati: mediana e media aritmetica • Le linee esterne rappresentano il I e il III quartile (la distanza misura la dispersione della distribuzione) • La distanza tra ciascun quartile e la mediana rappresenta la forma della distribuzione • Se è diversa, la distribuzione è asimmetrica • Se la distribuzione è normale, media e mediana coincidono; le distanze tra I quartile e mediana e tra mediana e III quartile coincidono, cosi’ come minimo e I quartile, III quartile e massimo. In generale, queste distanze danno informazioni sulla forma della coda della distribuzione

  3. Esempio 2.14 Sia data una tabella che riporta il diametro (cm) di 25 tubi prodotti da 3 macchinari diversi.

  4. Esempio 2.14 Sia data una tabella che riporta il diametro (cm) di 25 tubi prodotti da 3 macchinari diversi. Per ottenere il diagramma, occorre innanzitutto determinare esplicitamente le statistiche di base

  5. Esempio 2.14 Sia data una tabella che riporta il diametro (cm) di 25 tubi prodotti da 3 macchinari diversi. Ora dobbiamo inserire il grafico. Selezioniamo le cellee inseriamo il grafico a linee (con indicatori). Cambiare l’opzione di Selezionata dati “Scambia colonne/righe”

  6. Esempio 2.14 Le 3 osservazioni sono unite da linee che non ci interessano. Per rimuoverle, nel menù Formato selezionare Serie dei dati selezionati , selezionare la linea, Colore Linea “nessuna”; Nel menù Layout, selezionare Analisi; poi indicare “LineeLinee di Min-Max” e poi “Barre Barre Crescenti-decrescenti”

  7. Sintesi dei dati in una tabella • Spesso si vuole effettuare una sintesi dei dati per ottenere indici che misurino gli aspetti più rilevanti. • Indici di posizione / misure di tendenza centrale • Indici di variabilità (cap. 4) • Indici di forma (cap.5)

  8. Principali indici statistici I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. Siano n osservazioni numeriche MODA MEDIANA MEDIA QUARTILI E PERCENTILI di posizione SCARTO QUADRATICO MEDIO VARIANZA RANGE ERRORE STANDARD INDICI di dispersione ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) di forma

  9. Indici: Schema riassuntivo di posizione • media: • moda: punto di max della distribuzione • mediana: valore sotto al quale cadono la metà dei valori campionari. Si dispongono i dati in ordine crescente e si prende quello che occupa la posizione centrale (N dispari) o la media dei 2 valori in posizione centrale (N pari) di dispersione • varianza • deviazione standard • range >0 coda a ds <0 coda a sin =0 simmetrica di forma • skewness (coeff. di asimmetria) • curtosi: misura quanto la distribuzione è appuntita > 0 più appuntita < 0 meno appuntita

  10. Le misure (indici) di variabilità • I valori medi (nelle varie forme) condensano i dati in un solo valore (spesso indicato come centro della distribuzione). • Purtroppo non è sufficiente per rappresentare le osservazioni effettuate. Quindi si affiancano indici che forniscono informazioni sulla dispersione, cioè sulla distanza delle osservazioni dal valore medio. • Minore è la distanza delle osservazioni dal centro • maggiore è la rappresentatività del valore medio • minore è la variabilità

  11. Se l’indice di variabilità è nullo alloratutti i valori sono uguali tra loro. • Per analizzare la distribuzione, occorre: • Calcolare valore medio • Valutare la dispersione: • Calcolare quanto distano le osservazioni dal valore medio • Calcolare quanto distano i valori tra loro Vedremo: Campo di variazione, varianza, scarto quadratico medio

  12. Campo di variazione (range) • E’ la differenza tra l’osservazione più piccola e quella più grande • In Excel usiamo max e min • Nella cella scriviamo (se A1:E2 è la matrice dati) =MAX(A1:E2)-MIN(A1:E2) PROVATE VOI SU UNA TABELLA PRECEDENTE

  13. Varianza • E’ la media dei quadrati degli scarti dalla media aritmetica • In Excel usiamo la funzione VAR(num1;num2;…) se gli argomenti sono un campione della popolazione. Se si tratta di tutta la popolazione, si usa la funzione VAR.POP • Come sempre, i valori testo e logici sono ignorati. Se si vuole considerarli, usare la funzione MEDIA.VALORI PROVATE VOI SU UNA TABELLA PRECEDENTE

  14. Scarto quadratico medio o deviazione standard • La varianza esprime un indice in funzione del quadrato dell’unità di misura delle osservazioni. • E’ preferibile calcolare la radice quadrata della varianza, detta deviazione standard (per mantenere la stessa unità di misura). • In Excel si usa la funzione DEV.ST(num1;num2;…) se gli argomenti sono un campione della popolazione. Se si tratta di tutta la popolazione, si usa la funzione DEV.ST.POP • Come sempre, i valori testo e logici sono ignorati. Se si vuole considerarli, usare la funzione DEV.ST.VALORI = PROVATE VOI SU UNA TABELLA PRECEDENTE

  15. Errore standard Sebbene lo strumento di statistica descrittiva negli strumenti di analisi è in grado di generare un report che include l'errore standard della media, non esiste alcuna funzione in Microsoft Excel per calcolare automaticamente il valore di per sé. Per calcolare l'errore standard della media, si può utilizzare= DEV.ST(matrice)/SQRT(Conteggio del campione) Fonte: http://support.microsoft.com/kb/214076/it

  16. Più piccolo/grande(k) PICCOLO(matrice; k) GRANDE(matrice; k)

  17. Misure di tendenza centrale • Spesso si vuole effettuare una sintesi dei dati per ottenere indici che misurino gli aspetti più rilevanti. • Indici di posizione (scorsa lezione; medie) • Indici di variabilità (cap. 4) • Indici di forma (cap.5)

  18. Misure di forma • Si tratta di misure che evidenziano se una distribuzione è simmetrica rispetto ad un valore e se risulta più o meno appiattita • Vedremo • Asimmetria e curtosi (appiattimento) rispetto ad alcune distribuzione note

  19. Asimmetria (skewness) • Indica l’assenza di specularità rispetto all’asse di simmetria della distribuzione • Esistono diversi indici di asimmetria • Si possono usare media aritmetica, moda e mediana (x, Mo, Me) per verificare se una distribuzione è asimmetrica o meno • Se coincidono, è simmetrica • Se Mo<Me< x, è asimmetrica positiva (coda verso destra) • Se x < Me<Mo, è asimmetrica negativa (coda verso sinistra)

  20. Asimmetria in Excel • Usa l’indice di simmetria aF (proposto da Fisher), in cui al denominatore compare la deviazione standard • Si tratta della funzione ASIMMETRIA(num1;num2;…) di almeno 3 argomenti e tale che la deviazione standard sia diversa da zero; se così non è, viene restituito un errore • aF= 0 simmetrica rispetto la media aritmetica • aF > 0 asimmetrica a destra • aF< 0 asimmetrica a sinistra

  21. Esempio asimmetria positiva Data la seguente tabella di voti riportati da 18 studenti

  22. Analisi dati Per convenzione, se la coda più lunga è a destra della media (cioè esistono molti valori con forti scarti positivi e pochi valori con deboli scarti negativi) si parla di asimmetria positivae si vuole che il valore dell'indice di asimmetria assuma segno positivo. Media = 5,4Asimmetria = 0,61 Il valore di asimmetria è maggiore di zero, quindi la curva si presenta così:

  23. Curtosi • Fa riferimento alla maggiore o minore gibbosità di una distribuzione, in prossimità del suo massimo (e quindi alla lunghezza delle code) • Per valutare l’aspetto della curva, si paragona ad una curva «normale» (teorica nota) avente stesse frequenza complessiva, media e deviazione standard • Si usa un altro indice di Fisher, che coinvolge la deviazione standard al denominatore: vale 0 se la curva è normale; positivo o negativo se è più appuntita o meno di una normale • In Excel è la funzione CURTOSI(num1;num2;…) di almeno 4 argomenti e tale che la deviazione standard sia diversa da zero; se così non è, viene restituito un errore

  24. CURTOSI: leptocurtica In nero la curva «normale» mesocurtica

  25. CURTOSI: platicurtica distribuzione platicurtica In nero la curva «normale» mesocurtica

  26. Statistica descrittiva (cap.6) • Molti indici trattati finora sono generati automaticamente da Excel, usando Statistica descrittivadel menù Analisi dei dati. • Proviamo • Etichette nella prima riga/Etichette nella prima colonna: deselezionarle se l’intervallo non contiene etichette (altrimenti selezionare quella appropriata, come nell’esempio 6.3)

  27. Esempio 6.1 La tabella seguente riporta il peso in grammi di un campione di 100 tavolette di cioccolato. Proviamo a richiamare la funzione Riepilogo statistiche

  28. Esempio 6.1 La tabella seguente riporta il peso in grammi di un campione di 100 tavolette di cioccolato. Proviamo a richiamare la funzione Riepilogo statistiche Non esistono duplicati

  29. Non esistono duplicati

  30. Esempio 6.3 La tabella seguente riporta la quantità (in quintali) di semilavorati stoccati in un magazzino negli ultimi 9 anni. Proviamo a richiamare la funzione Riepilogo statistiche • selezionare le celle escludendo la prima colonna

  31. Esempio 6.3 La tabella seguente riporta la quantità (in quintali) di semilavorati stoccati in un magazzino negli ultimi 9 anni.

  32. Funzioni del Riepilogo statistiche Manualmente: Non hanno funzione esplicita

  33. Esercizio • Esercizio 2 (Riepilogo statistiche) • La tabella nel file EsameRiepilogoStatisticheTavolette.xlsxriporta il peso in grammi di un campione di 100 tavolette di cioccolato. • a) Fornire una tabella delle statistiche studiate relative ai dati contenuti nella tabella, che contenga, oltre alle statistiche standard (media, mediana, …. Curtosi…) anche il Secondo più grande e il Terzo più piccolo, utilizzando la funzione Riepilogo statistiche. • b) Ripetere l’esercizio (di cui al punto a)) senza far uso della funzione Riepilogo statistiche, ma calcolando i valori necessari (media, mediana, etc.) con le opportune funzioni di Excel, in modo che la tabella risultante sia identica a quello fornita al punto a). • Mantenere il foglio Dati inalterato, e svolgere il punto a) in un foglio nominato Svolgimento a), e il punto b) in un foglio nominato Svolgimento b).

More Related