180 likes | 348 Views
Il chi quadro indica la misura in cui le frequenze osservate in ogni casella della tabella differiscono dalle frequenze che ci aspetteremmo se non ci fosse associazione fra i due caratteri. In altre parole verifica se esiste una relazione fra la variabile che distingue le righe e la
E N D
Il chi quadro indica la misura in cui le frequenze osservate in ogni casella della tabella differiscono dalle frequenze che ci aspetteremmo se non ci fosse associazione fra i due caratteri. In altre parole verifica se esiste una relazione fra la variabile che distingue le righe e la variabile che distingue le colonne.
Il chi quadro è pertanto definito dalla seguente χ2=Σ[(Xoss- Xatt)2/Xatt] = Σd2 / Xatt dove Xoss è il numero di individui osservati in ogni casella e Xatt è il numero degli individui attesi in quella casella.
Verifica di ipotesi relative a distribuzioni di frequenza “Goodness of fit” (“bontà dell’adattamento”) Test di indipendenza Organizzazione dei dati per Il test χ2 Il test χ2 (chi-quadro)
Distribuzione attesa • Assenza di preferenza • Assenza di differenze rispetto ad una popolazione nota
Il test χ2 /1 Calcolo della distribuzione attesa Distribuzione popolazione nota numero di soggetti in campione (n=120) Distribuzione attesa (H0)
Il test χ2 /2 Distribuzione osservata • Confronto fra distribuzione osservata e distribuzione attesa Distribuzione attesa
La statistica χ2 • Quando i valori osservati sono lontani da quelli attesi il valore di χ2 è elevato • Quando i valori osservati sono vicini a quelli attesi il valore è basso
La distribuzione χ2 • La tabella della distribuzione χ2 consente di identificare la zona critica per qualsiasi valore di gdl e per qualsiasi alfa • (Gdl= n. categorie – 1)
Laureati e titolo di studio dei genitori • Alfa = 0,05 • N. categorie = 3 • Gdl=2 • Chi2= 351,25 • Valore critico=5,99 • Si rifiuta l’ipotesi nulla
χ2 nella letteratura scientifica “La distribuzione dei figli di genitori laureati per titolo di studio era significativamente diversa rispetto a quella per la popolazione italiana (χ2(2,n=120)=29,02,p<0,05)” E’ necessario, inoltre, riportare i dati relativi alla distribuzione osservata
Esercitazione /1 • Ipotesi: le automobili sportive hanno più incidenti rispetto alle automobili di altro tipo
Esercitazione /2 Si rifiuta l’ipotesi nulla
Verifica dell’ipotesi Si rifiuta l’ipotesi nulla
Esercitazione /1 • Ipotesi: la “cecità ai colori” è determinata da un gene sul cromosoma Y (legato al sesso del soggetto)
Esercitazione /2 Dati osservati Dati attesi Si rifiuta l’ipotesi nulla Scarti^2 Scarti^2/Fa
Condizioni di validità del test χ2 • Campioni casuali • Osservazioni indipendenti • Per ogni “cella” il valore di fa deve essere superiore a 4