1 / 42

Applicazioni del foglio elettronico

Applicazioni del foglio elettronico. Statistica elementare a cura del prof . Giovanni Raho. La statistica. Un insieme di procedure fondate sulla matematica che permettono di analizzare gli eventi e trarne Leggi di collegamento tra eventi Leggi di previsione

gianna
Download Presentation

Applicazioni del foglio elettronico

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Applicazioni del foglio elettronico Statistica elementare a cura del prof. Giovanni Raho Informatica e statistica 2003 Prof. Giovanni Raho

  2. La statistica • Un insieme di procedure fondate sulla matematica che permettono di analizzare gli eventi e trarne • Leggi di collegamento tra eventi • Leggi di previsione • Modelli in cui le relazioni siano precisate attraverso metodi matematici. Informatica e statistica 2003 Prof. Giovanni Raho

  3. Problema ed informazione • Definire il problema • Individuare gli eventi che intervengono nel problema. • Caratterizzare gli eventi attraverso la definizione dei concetti. • Collegare i concetti per costruire une teoria. • La teoria ben formata: relazioni non contraddittorie tra concetti. Informatica e statistica 2003 Prof. Giovanni Raho

  4. Gli strumenti di verifica • Variabili e misure: • I concetti sono definiti attraverso le variabili. • Le variabili sono specificate attraverso le misure. • Le misure sono di diverso tipo • Metriche • Rapporti ed intervalli. • Ordinali • Nominali Informatica e statistica 2003 Prof. Giovanni Raho

  5. Uso delle misure • Eseguire operazioni tra le misure • Il termine operazioni va considerato in senso lato. • Sono operazioni: • Unione • Separazione • Operazioni aritmetiche • Operazioni razionali e irrazionali. Informatica e statistica 2003 Prof. Giovanni Raho

  6. Operazioni con le misure • Dipendono dal diverso tipo di misura • Scale di Misura • Addizione  Unione • Sottrazione  separazione • Moltiplicazione e divisione • Si introduce tra le misure un operatore che le trasformi in modo da poter esser adattate alle nostre esigenze. Informatica e statistica 2003 Prof. Giovanni Raho

  7. Operazioni di sintesi • Media aritmetica • Va valutata con un opportuno parametro: • Deviazione standard (dev ST in Excel) • La Deviazione standard misura l’attendibilità della media a. • Mediana (divide un gruppo ordinato in due parti) • Valutazione attraverso la differenza tra quartili (quattro parti) • Moda • Valutazione  valore minimo e massimo • Si vedano gli esempi applicativi col foglio elettronico. Informatica e statistica 2003 Prof. Giovanni Raho

  8. Scale di misura e sintesi • Scala metrica • Media aritmetica, Deviazione Standard • Scala ordinale • Mediana, quartili • Scala Nominale • Conteggio delle frequenze • Uso della MODA. Informatica e statistica 2003 Prof. Giovanni Raho

  9. La percentuale • Si tratta di una particolare misura usata per confrontare gruppi numericamente diversi. • Permette di cogliere le differenze con maggior immediatezza. • Analogia grafica: TORTA 75% Informatica e statistica 2003 Prof. Giovanni Raho

  10. I grafici • Permettono un confronto immediato di gruppi numericamente diversi • A lato un grafico a colonne o istogramma. 20 volte 40 volte Informatica e statistica 2003 Prof. Giovanni Raho

  11. Vari tipi di grafici per vari usi • Torta • Rappresentazione di una variabile secondo le percentuali • Barre – Istogrammi • Rappresentazione di due o più variabili secondo la frequenza dei loro valori. (vedi esempio precedente diapositive) • Barre impilate • Rappresentazione di due o più variabili secondo i valori di una terza. • Vedi nel libro di informatica analisi multivariata Informatica e statistica 2003 Prof. Giovanni Raho

  12. STATISTICA DESCRITTIVA I procedimenti sin qui descritti fanno parte della statistica descrittiva. Essa si occupa della presentazione di dati ed aiuta nella loro interpretazione. … Spesso si rinuncia al dettaglio per avere una visione generale del fenomeno … Informatica e statistica 2003 Prof. Giovanni Raho

  13. Grafici lineari • Oltre ai grafici areali descritti in precedenza in cui le occorrenze (frequenze) dei valori di una variabile sono presentate da aree di rettangoli o di settori circolari • I grafici lineari rappresentano l’andamento di un fenomeno (spesso rispetto al tempo) • Ricordare assi cartesiani Informatica e statistica 2003 Prof. Giovanni Raho

  14. Grafici lineari e sviluppo nel tempo Variazione pendenza Informatica e statistica 2003 Prof. Giovanni Raho

  15. Il grafico lineare Il grafico lineare rappresenta l’andamento dei valori di una variabile. Come tale può ricavare valori indirettamente e può introdurre alla previsione futura. Informatica e statistica 2003 Prof. Giovanni Raho

  16. Grafico lineare e linee di tendenza Si noti il collega,emto tra l’anda,mento della retta ed il coeff. angolare Informatica e statistica 2003 Prof. Giovanni Raho

  17. La linea di tendenza Se nello studio di un fenomeno ci si accorge che le variabili degli eventi successivi hanno misure con uno sviluppo regolare e … se si può supporre che le cause non siano modificate nel tempo … possiamo prolungare la linea che unisce i successivi momenti oltre le misure già effettuate. Informatica e statistica 2003 Prof. Giovanni Raho

  18. La linea di tendenza IL prolungamento del fenomeno nel tempo è favorito da alcuni algoritmi matematici che tengono conto delle oscillazioni di una variabile intorno a valori medi. La retta di regressione è l’esempio più noto di tale metodo di previsione. Informatica e statistica 2003 Prof. Giovanni Raho

  19. Linee di tendenza Si possono costruire con metodi matematici più o meno complessi linee di forma diversa … La cui forma è individuata dal grado dell’equazione rappresentativa La scelta della linea di tendenza che si avvicina di più ai valori rilevati può essere fatta col parametro R2. Informatica e statistica 2003 Prof. Giovanni Raho

  20. Linee di tendenza Nel caso di linea di tendenza lineare è possobile associare ad una successione di eventi il coefficiente angolare della retta come elemento di sintesi. Esempio: y=5x+3 l’andamento del fenomeno è crescente y = -6x + 3 l’andamento del fenomeno e decrescente y = -10x + 3 il fenomeno decresce più rapidamente della precedente Informatica e statistica 2003 Prof. Giovanni Raho

  21. Linea di tendenza ed R2 • R2 varia da • 0  nessuna aderenza a • 1  completa aderenza ai valori rilevarti Informatica e statistica 2003 Prof. Giovanni Raho

  22. L’andamento di una popolazione Informatica e statistica 2003 Prof. Giovanni Raho

  23. Grafico dell’andamento della popolazione linea di tendenza lineare ossia di 1° grado. RETTA  detta anche retta di regressione Informatica e statistica 2003 Prof. Giovanni Raho

  24. Andamento della popolazionetendenza di grado superiore al 1° Informatica e statistica 2003 Prof. Giovanni Raho

  25. La statistica e la probabilità Esame delle differenze e della causalità Nell’analisi di un fenomeno si usa spesso considerare contemporaneamente i valori di due o più variabili. Il metodo più semplice per valutare le possibili relazioni tra variabili è … Informatica e statistica 2003 Prof. Giovanni Raho

  26. L’uso ed il confrontodelle frequenze di un evento Informatica e statistica 2003 Prof. Giovanni Raho

  27. Grafico • Riunendo le due tabelle si può utilizzare un grafico a colonne per valutare i due fenomeni. Informatica e statistica 2003 Prof. Giovanni Raho

  28. Incrocio tra i valori di due o più variabili Informatica e statistica 2003 Prof. Giovanni Raho

  29. Lettura di una tabella 23 anziani hanno un’istruzione superiore 12 giovani hanno un’istruzione elementare Informatica e statistica 2003 Prof. Giovanni Raho

  30. Confronti tra frequenze in due variabili Informatica e statistica 2003 Prof. Giovanni Raho

  31. Andamenti di valori di una o più variabili Informatica e statistica 2003 Prof. Giovanni Raho

  32. Esercizio Si costruisca con EXCEL il grafico dei dati riprodotti in precedenza • Grafico a colonne Informatica e statistica 2003 Prof. Giovanni Raho

  33. Grafico a colonne impilate • Permette un’analisi all’interno di diverse categorie della distribuzione delle frequenze dei livelli di istruzione. Informatica e statistica 2003 Prof. Giovanni Raho

  34. Grafico a colonne impilate Categorie Informatica e statistica 2003 Prof. Giovanni Raho

  35. Analisi multivarata • Si tratta di un’analisi dei valori di due variabili in cui interviene una terza variabile discriminante per valutare gruppi di caratteristiche diverse. • Es. Il livello di istruzione rispetto all’età, può essere diverso se si considerano gruppi il cui reddito familiare (terza variabile discriminante) sia diverso Informatica e statistica 2003 Prof. Giovanni Raho

  36. Analisi multivariata Reddito alto Il diverso reddito introduce una variazione nella composizione dei gruppi Reddito basso Informatica e statistica 2003 Prof. Giovanni Raho

  37. Analisi multivariata • Si veda nel testo Lezioni di Informatica … Il paragrafo 7.7.5 pag. 131 L’uso dei grafici per l’analisi multivariata. L’esercizio n. 2 a pag. 106: Le tabelle dell’analisi multivarata. Informatica e statistica 2003 Prof. Giovanni Raho

  38. Metodi matematici • Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: • Calcolo del chi2 • Valuta la indipendenza tra i valori di due variabili attraverso la valutazione delle occorrenze contemporanee dei valori di due variabili • Può essere calcolato spezzando la formula in vari passaggi Informatica e statistica 2003 Prof. Giovanni Raho

  39. chi2 • Si applica da una tabella a due entrate • Attraverso i totali di riga, colonna e complessivi calcola le frequenze teoriche e le confronta con le frequenze osservate. • Risulta un parametro che va confrontato con parametri tabulati che permettono di valutare la probabilità di indipendenza tra due variabili. Informatica e statistica 2003 Prof. Giovanni Raho

  40. Normalizzazione dei dati • Si possono trasformare i dati grezzi di una ricerca prendendo come unità di misura la deviazione standard e punto di origine la media aritmetica dei dati grezzi. • Ciò risulta facile col foglio elettronico utilizzando la procedura copia Informatica e statistica 2003 Prof. Giovanni Raho

  41. Metodi matematici • Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: • Calcolo del coefficiente di Pearson • Valuta la relazione tra due variabili attraverso la valutazione delle occorrenze contemporanee dei valori delle due variabili. Informatica e statistica 2003 Prof. Giovanni Raho

  42. Elaborazione dei dati • Si veda anche le diapositive “Elaborazione dei dati” nella parte introduttiva al programma S. P. S. S.. ( diapositive 5 – 11) Informatica e statistica 2003 Prof. Giovanni Raho

More Related