420 likes | 568 Views
Applicazioni del foglio elettronico. Statistica elementare a cura del prof . Giovanni Raho. La statistica. Un insieme di procedure fondate sulla matematica che permettono di analizzare gli eventi e trarne Leggi di collegamento tra eventi Leggi di previsione
E N D
Applicazioni del foglio elettronico Statistica elementare a cura del prof. Giovanni Raho Informatica e statistica 2003 Prof. Giovanni Raho
La statistica • Un insieme di procedure fondate sulla matematica che permettono di analizzare gli eventi e trarne • Leggi di collegamento tra eventi • Leggi di previsione • Modelli in cui le relazioni siano precisate attraverso metodi matematici. Informatica e statistica 2003 Prof. Giovanni Raho
Problema ed informazione • Definire il problema • Individuare gli eventi che intervengono nel problema. • Caratterizzare gli eventi attraverso la definizione dei concetti. • Collegare i concetti per costruire une teoria. • La teoria ben formata: relazioni non contraddittorie tra concetti. Informatica e statistica 2003 Prof. Giovanni Raho
Gli strumenti di verifica • Variabili e misure: • I concetti sono definiti attraverso le variabili. • Le variabili sono specificate attraverso le misure. • Le misure sono di diverso tipo • Metriche • Rapporti ed intervalli. • Ordinali • Nominali Informatica e statistica 2003 Prof. Giovanni Raho
Uso delle misure • Eseguire operazioni tra le misure • Il termine operazioni va considerato in senso lato. • Sono operazioni: • Unione • Separazione • Operazioni aritmetiche • Operazioni razionali e irrazionali. Informatica e statistica 2003 Prof. Giovanni Raho
Operazioni con le misure • Dipendono dal diverso tipo di misura • Scale di Misura • Addizione Unione • Sottrazione separazione • Moltiplicazione e divisione • Si introduce tra le misure un operatore che le trasformi in modo da poter esser adattate alle nostre esigenze. Informatica e statistica 2003 Prof. Giovanni Raho
Operazioni di sintesi • Media aritmetica • Va valutata con un opportuno parametro: • Deviazione standard (dev ST in Excel) • La Deviazione standard misura l’attendibilità della media a. • Mediana (divide un gruppo ordinato in due parti) • Valutazione attraverso la differenza tra quartili (quattro parti) • Moda • Valutazione valore minimo e massimo • Si vedano gli esempi applicativi col foglio elettronico. Informatica e statistica 2003 Prof. Giovanni Raho
Scale di misura e sintesi • Scala metrica • Media aritmetica, Deviazione Standard • Scala ordinale • Mediana, quartili • Scala Nominale • Conteggio delle frequenze • Uso della MODA. Informatica e statistica 2003 Prof. Giovanni Raho
La percentuale • Si tratta di una particolare misura usata per confrontare gruppi numericamente diversi. • Permette di cogliere le differenze con maggior immediatezza. • Analogia grafica: TORTA 75% Informatica e statistica 2003 Prof. Giovanni Raho
I grafici • Permettono un confronto immediato di gruppi numericamente diversi • A lato un grafico a colonne o istogramma. 20 volte 40 volte Informatica e statistica 2003 Prof. Giovanni Raho
Vari tipi di grafici per vari usi • Torta • Rappresentazione di una variabile secondo le percentuali • Barre – Istogrammi • Rappresentazione di due o più variabili secondo la frequenza dei loro valori. (vedi esempio precedente diapositive) • Barre impilate • Rappresentazione di due o più variabili secondo i valori di una terza. • Vedi nel libro di informatica analisi multivariata Informatica e statistica 2003 Prof. Giovanni Raho
STATISTICA DESCRITTIVA I procedimenti sin qui descritti fanno parte della statistica descrittiva. Essa si occupa della presentazione di dati ed aiuta nella loro interpretazione. … Spesso si rinuncia al dettaglio per avere una visione generale del fenomeno … Informatica e statistica 2003 Prof. Giovanni Raho
Grafici lineari • Oltre ai grafici areali descritti in precedenza in cui le occorrenze (frequenze) dei valori di una variabile sono presentate da aree di rettangoli o di settori circolari • I grafici lineari rappresentano l’andamento di un fenomeno (spesso rispetto al tempo) • Ricordare assi cartesiani Informatica e statistica 2003 Prof. Giovanni Raho
Grafici lineari e sviluppo nel tempo Variazione pendenza Informatica e statistica 2003 Prof. Giovanni Raho
Il grafico lineare Il grafico lineare rappresenta l’andamento dei valori di una variabile. Come tale può ricavare valori indirettamente e può introdurre alla previsione futura. Informatica e statistica 2003 Prof. Giovanni Raho
Grafico lineare e linee di tendenza Si noti il collega,emto tra l’anda,mento della retta ed il coeff. angolare Informatica e statistica 2003 Prof. Giovanni Raho
La linea di tendenza Se nello studio di un fenomeno ci si accorge che le variabili degli eventi successivi hanno misure con uno sviluppo regolare e … se si può supporre che le cause non siano modificate nel tempo … possiamo prolungare la linea che unisce i successivi momenti oltre le misure già effettuate. Informatica e statistica 2003 Prof. Giovanni Raho
La linea di tendenza IL prolungamento del fenomeno nel tempo è favorito da alcuni algoritmi matematici che tengono conto delle oscillazioni di una variabile intorno a valori medi. La retta di regressione è l’esempio più noto di tale metodo di previsione. Informatica e statistica 2003 Prof. Giovanni Raho
Linee di tendenza Si possono costruire con metodi matematici più o meno complessi linee di forma diversa … La cui forma è individuata dal grado dell’equazione rappresentativa La scelta della linea di tendenza che si avvicina di più ai valori rilevati può essere fatta col parametro R2. Informatica e statistica 2003 Prof. Giovanni Raho
Linee di tendenza Nel caso di linea di tendenza lineare è possobile associare ad una successione di eventi il coefficiente angolare della retta come elemento di sintesi. Esempio: y=5x+3 l’andamento del fenomeno è crescente y = -6x + 3 l’andamento del fenomeno e decrescente y = -10x + 3 il fenomeno decresce più rapidamente della precedente Informatica e statistica 2003 Prof. Giovanni Raho
Linea di tendenza ed R2 • R2 varia da • 0 nessuna aderenza a • 1 completa aderenza ai valori rilevarti Informatica e statistica 2003 Prof. Giovanni Raho
L’andamento di una popolazione Informatica e statistica 2003 Prof. Giovanni Raho
Grafico dell’andamento della popolazione linea di tendenza lineare ossia di 1° grado. RETTA detta anche retta di regressione Informatica e statistica 2003 Prof. Giovanni Raho
Andamento della popolazionetendenza di grado superiore al 1° Informatica e statistica 2003 Prof. Giovanni Raho
La statistica e la probabilità Esame delle differenze e della causalità Nell’analisi di un fenomeno si usa spesso considerare contemporaneamente i valori di due o più variabili. Il metodo più semplice per valutare le possibili relazioni tra variabili è … Informatica e statistica 2003 Prof. Giovanni Raho
L’uso ed il confrontodelle frequenze di un evento Informatica e statistica 2003 Prof. Giovanni Raho
Grafico • Riunendo le due tabelle si può utilizzare un grafico a colonne per valutare i due fenomeni. Informatica e statistica 2003 Prof. Giovanni Raho
Incrocio tra i valori di due o più variabili Informatica e statistica 2003 Prof. Giovanni Raho
Lettura di una tabella 23 anziani hanno un’istruzione superiore 12 giovani hanno un’istruzione elementare Informatica e statistica 2003 Prof. Giovanni Raho
Confronti tra frequenze in due variabili Informatica e statistica 2003 Prof. Giovanni Raho
Andamenti di valori di una o più variabili Informatica e statistica 2003 Prof. Giovanni Raho
Esercizio Si costruisca con EXCEL il grafico dei dati riprodotti in precedenza • Grafico a colonne Informatica e statistica 2003 Prof. Giovanni Raho
Grafico a colonne impilate • Permette un’analisi all’interno di diverse categorie della distribuzione delle frequenze dei livelli di istruzione. Informatica e statistica 2003 Prof. Giovanni Raho
Grafico a colonne impilate Categorie Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivarata • Si tratta di un’analisi dei valori di due variabili in cui interviene una terza variabile discriminante per valutare gruppi di caratteristiche diverse. • Es. Il livello di istruzione rispetto all’età, può essere diverso se si considerano gruppi il cui reddito familiare (terza variabile discriminante) sia diverso Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivariata Reddito alto Il diverso reddito introduce una variazione nella composizione dei gruppi Reddito basso Informatica e statistica 2003 Prof. Giovanni Raho
Analisi multivariata • Si veda nel testo Lezioni di Informatica … Il paragrafo 7.7.5 pag. 131 L’uso dei grafici per l’analisi multivariata. L’esercizio n. 2 a pag. 106: Le tabelle dell’analisi multivarata. Informatica e statistica 2003 Prof. Giovanni Raho
Metodi matematici • Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: • Calcolo del chi2 • Valuta la indipendenza tra i valori di due variabili attraverso la valutazione delle occorrenze contemporanee dei valori di due variabili • Può essere calcolato spezzando la formula in vari passaggi Informatica e statistica 2003 Prof. Giovanni Raho
chi2 • Si applica da una tabella a due entrate • Attraverso i totali di riga, colonna e complessivi calcola le frequenze teoriche e le confronta con le frequenze osservate. • Risulta un parametro che va confrontato con parametri tabulati che permettono di valutare la probabilità di indipendenza tra due variabili. Informatica e statistica 2003 Prof. Giovanni Raho
Normalizzazione dei dati • Si possono trasformare i dati grezzi di una ricerca prendendo come unità di misura la deviazione standard e punto di origine la media aritmetica dei dati grezzi. • Ciò risulta facile col foglio elettronico utilizzando la procedura copia Informatica e statistica 2003 Prof. Giovanni Raho
Metodi matematici • Oltre ai metodi grafici EXCEL permette l’uso di metodi matematici quali: • Calcolo del coefficiente di Pearson • Valuta la relazione tra due variabili attraverso la valutazione delle occorrenze contemporanee dei valori delle due variabili. Informatica e statistica 2003 Prof. Giovanni Raho
Elaborazione dei dati • Si veda anche le diapositive “Elaborazione dei dati” nella parte introduttiva al programma S. P. S. S.. ( diapositive 5 – 11) Informatica e statistica 2003 Prof. Giovanni Raho