190 likes | 662 Views
Statistica con Excel. Procedure utili per l’analisi dati ottenute col foglio elettronico. Giovanni Raho. Fasi di una ricerca. Analisi del problema. Individuare la popolazione.
E N D
Statistica con Excel Procedure utili per l’analisi dati ottenute col foglio elettronico. Giovanni Raho Edizione 2011 prog. Giocìvanni Raho
Fasi di una ricerca • Analisi del problema. • Individuare la popolazione. • Estrarre un campione: vantaggio nell'esaminare un sottoinsieme della popolazione per generalizzare i risultati alla popolazione complessiva • Def. Scegliere alcuni elementi della popolazione • Dall’elenco dei soggetti si possono estrarre casualmente alcuni elementi. • Excel permette l’estrazione di campioni casuali. • Useremo le seguenti procedure: • Generazione di un numero casuale. • Estrazione di un campione da un elenco. Edizione 2011 prog. Giocìvanni Raho
Campione • Nelle scienze applicate il campione è la parte dell'oggetto della ricerca che dovrà essere sottoposta ad un esperimento • In statistica il campione è il numero di rilevazioni fatte per l'indagine • Modalità di selezione del campione • Scelta di comodo (campionamento per quote o conveniencesampling). • Scelta ragionata (campionamento ragionato o judgmentalsampling). • Scelta casuale (campionamento casuale o random sampling). • Scelta probabilistica (campionamento probabilistico o probabilisticsampling). Edizione 2011 prog. Giocìvanni Raho
Campione casuale • Ogni elemento della popolazione ha uguale probabilità di far parte del campione. • ... equi probabilità ... • Probabilità: rapporto tra numero degli eventi estratti e numero degli eventi possibili. • Es. 1/6 la probabilità di avere un numero dalle facce di un dado. • 1/40 la probabilità di estrarre un re di picche da 40 carte Edizione 2011 prog. Giocìvanni Raho
Campionamento in Excel • Casuale • Senza argomento genera un numero casuale tra 0 e 1 • Casuale tra • Genera un numero casuale tra due numeri da indicare. • Campionamento • Se si possiede l’elenco (numerico) dei soggetti è possibile usare la procedura campionamento ottenibile da l’Analisi dati che permette di generare un elenco di oggetti estratti casualmente. Edizione 2011 prog. Giocìvanni Raho
Variabili e misure • Individuare le variabili intervenienti. • Fissare le modalità di misura. • Ossia il modo col quale sono costruite le categorie • Misure metriche: si basano su un’unità di misura, sono espresse da numeri razionali e quindi permettono le esecuzioni di operazioni tra numeri. • Misure ordinali: in esse valgono le proprietà di maggiore e minore ossia è possibile stabilire una regola di ordinamento. • Misure nominali: in esse vale solo la proprietà delle classi di equivalenza: univocità dell’assegnazione ed esaustività. Edizione 2011 prog. Giocìvanni Raho
Analisi: sintesi • Determinare le possibili sintesi. • Valore centrale: • Media aritmetica per le misure metriche • Mediana per le misure ordinali • Moda per le misure nominali. • Grafico e percentuale: • Grafico a torta • Grafico a barre o istogramma (orizzontale o verticale) • Andamento di un fenomeno • Grafici lineari e linee di tendenza (regressione) Edizione 2011 prog. Giocìvanni Raho
Valori centrali • Il valore centrale / media di una raccolta di valori deve essere valutato: • Excel può calcolare: • S.D. per la media aritmetica (n-1) • Usando n-1 come numero n degli oggetti della ricerca. • S.D. pop (n) • Usando n come numero degli oggetti delle ricerca. • Deviazione interquartilica per la mediana. • Calcolando il primo ed il secondo ed il 3° quartile • Differenza tra valore minimo e massimo per la moda. Edizione 2011 prog. Giocìvanni Raho
Analisi: relazioni • Valutare le possibili relazioni tra le variabili. • Tabella di contingenza/ incroci. Numerosità dei valori comuni a due variabili. Tabelle pivot. • Forme di sviluppo nel tempo dei valori di una variabile: grafico lineare e linea di tendenza. • Coerenza dei valori ottenuti con prove diverse sugli stessi soggetti: Coefficiente di Pearson. Edizione 2011 prog. Giocìvanni Raho
Analisi: relazioni • Valutare le possibili relazioni tra le variabili. • In EXCEL esiste la possibilità di correlare i valori di due variabili con i grafico a dispersione. Edizione 2011 prog. Giocìvanni Raho
Legge di relazione • Fissando un’opportuna linea di tendenza. Edizione 2011 prog. Giocìvanni Raho
Valutazione di una relazione • Due variabili possono assumere valori tra loro dipendenti. • Il test può valutare l’indipendenza tra due variabili. • O la dipendenza. Edizione 2011 prog. Giocìvanni Raho
Test • Coefficiente di Pearson: • Valuta la correlazione tra due variabili. • Test del chi quadrato. • Valuta l’indipendenza tra due o più variabili, ossia la casualità delle relazioni apparenti. • Casualità significa non estensibilità di quanto trovato nel campione con la popolazione. Edizione 2011 prog. Giocìvanni Raho
Correlazione di Pearson • Il test di Pearson è direttamente ottenibile da EXCEL. • Vi sono tuttavia alcune approssimazioni che lo rendono diverso secondo l’edizione di EXCEL usata. • Useremo una opportuna formulazione del test di Pearson che ci permetterà di calcolare tale test direttamente. Edizione 2011 prog. Giocìvanni Raho
Correlazione di Pearson • Useremo per tale calcolo i punteggi normalizzati che permettono di stabilire i punteggi coerenti con la misura usata. Edizione 2011 prog. Giocìvanni Raho
Punteggi normalizzati • Punteggi ottenuti ricorrendo alla media e alla S.D. del gruppo esaminato. Edizione 2011 prog. Giocìvanni Raho