460 likes | 679 Views
Lezione 6 Inferenza statistica. parte 2 Stime per punti e per intervalli della varianza. la varianza. 1. 1 0 10. + 5%. la varianza, la tolleranza e lo scarto…. la varianza , la tolleranza e lo scarto …. 95 100 105.
E N D
1 1 0 10 + 5% la varianza, la tolleranza e lo scarto…
la varianza , la tolleranza e lo scarto … 95 100 105
Varianza campionaria corretta e stima puntuale di s 2 • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la varianza campionaria corretta per stimare il valore del parametro s 2 relativo all’intera popolazione. • il valore ottenuto viene indicato come “stima puntuale di s 2”
Varianza campionaria corretta e stima puntuale di s 2 • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la varianza campionaria corretta per stimare il valore del parametro s 2 relativo all’intera popolazione. • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
Incertezza dello stimatore Sn2 Ricordiamo che: “ Estraendo da una popolazione infinita per cui è definita la variabile casuale Xavente distribuzione normale con media m e varianza s2un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, la varianza campionaria corretta divisa pers2 fornisce una variabile casuale che segue una distribuzione “modificata di chi-quadro” con n - 1 gradi di libertà ”
f (C² ) C² Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2 Chiediamoci ora: “ Qual è la probabilità che, estraendo a caso un campione di n elementi da una popolazione su cui è stata definita una Xcon distribuzione normale, il rapporto fra la varianza campionaria corretta e la varianza relativa all’intera popolazione sia compreso nell’intervallo ?”
Incertezza dello stimatore Sn2 • partendo dall’espressione della probabilità dell’evento: • si sono ottenute le due espressioni equivalenti: • che giustificano la seguente affermazione:
Incertezza dello stimatore Sn2 Estraendo a caso un campione di n elementi da una popolazione infinita per cui è definita una variabile casuale Xcon distribuzione normale, media m e varianza s 2, c’è una probabilità pari a: che il valore ottenuto della varianza campionaria correttasia compreso nell’intervallo
Intervallo di confidenza per la varianza campionaria corretta Sn2 • Per il nostro scopo, cioè per individuare l’intervallo di confidenza della varianza, conviene sviluppare l’espressione dell’evento in modo diverso: si può scrivere la forma equivalente:
Intervallo di confidenza per la varianza campionaria corretta Sn2 ricordando che:
Intervallo di confidenza per la varianza campionaria corretta Sn2 dalla: si può scrivere la forma equivalente:
Intervallo di confidenza per la varianza campionaria corretta Sn2 • si è quindi ricavato che • è uguale a • o, in modo equivalente, è uguale a: • è quindi possibile fare la seguente affermazione:
Intervallo di confidenza per la varianza campionaria corretta Sn2 Estraendo a caso un campione di n elementi da una popolazione infinita per cui è definita una variabile casuale Xcon distribuzione normale, media m e varianza s2, c’è una probabilità a pari a: che l’intervallo casuale:contenga il valore della varianza s2 per l’intera popolazione. Ia è chiamatointervallo di confidenza allo a per la varianza
0,10 0,05 Intervallo di confidenza allo ... ? • per bassi valori di n la f (C 2 ) non è simmetricapertanto non è agevole individuare il valore di ev da cui si ottiene un intervallo simmetricocon una prestabilita confidenza • esempio: gdl = 10C2 0,05 = 0,394 da cui:ev» 0,6 da cui a= 0,85 e non 0,90 !!!
0,05 0,05 Intervallo di confidenza allo 0,90 • per bassi valori di n la f (C 2 ) non è simmetrica:si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili C 2a / 2 e C 21- a / 2 • esempio: gdl = 10a= 0,90
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili C 2a/2 e C 21 - a/2 corrispondenti alla confidenza scelta? corrisponde alla:
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili C 2a/2 e C 21 - a/2 corrispondenti alla confidenza scelta? l’intervallo cercato è:
Stima intervallo di confidenza con c2 • varianza campionaria: • avendo introdotto la distribuzione “chi-quadro” è stato possibile affermare che la variabile aleatoria c2segue tale distribuzione con n - 1 g.d.l..
Stima intervallo di confidenza con c2 • varianza campionaria: • se dispongo dei valori dellac2
Intervallo di confidenza per la varianza campionaria corretta Sn2 Estraendo a caso un campione di n elementi da una popolazione infinita per cui è definita una variabile casuale Xcon distribuzione normale, media m e varianza s2, c’è una probabilità a pari a: che l’intervallo casuale:contenga il valore della varianza s2 per l’intera popolazione. Ia è chiamatointervallo di confidenza allo a per la varianza
Intervalli di confidenza per media campionaria standardizzata con n finito e s 2sconosciuta E’ possibile sostenere che: estraendo a caso un campione { X1, X2, …, Xn } con n finito da una popolazione su cui è definita una variabile casuale Xcon distribuzione normale, media m e varianza s2 incognite, c’è una probabilità pari a 1 - a che l’intervallo casualecon T variabile distribuita secondo la t di Student conn -1 g.d.l.e con t1-a/2 il valore del suo quantile (1 - a/2)contenga il valore della media m della popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la media m
Riassunto stimatori campionari • varianza campionaria corretta: • se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , • allora la variabile casuale c2:segue una distribuzione di tipo “chi-quadro” con n -1 gdl.
f (c² ) c² La variabile c2
Riassunto stimatori campionari • varianza campionaria corretta: • se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , • allora la variabile casuale C2:segue una distribuzione di tipo “modificata di chi-quadro”con n -1 gradi di libertà.
f (C² ) C² La variabile C2
Riassunto stimatori campionari • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ? se la X ha distribuzione normale la probabilità cercata corrisponde alla :
Riassunto stimatori campionari • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ?
corrisponde alla area della regione campita in verde: Riassunto stimatori campionari • varianza campionaria corretta: • Qual è la probabilità che il rapporto fra i valori della varianza campionariacorretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ?
Riassunto stimatori campionari • varianza campionaria corretta: • Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo • con le nostre tavole:
Riassunto stimatori campionari • varianza campionaria corretta: • Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo • con le nostre tavole:
0,10 0,05 Intervallo di confidenza allo ... ? • per bassi valori di n la f (C 2 ) non è simmetricapertanto non è agevole individuare il valore di ev da cui si ottiene un intervallo simmetricocon una prestabilita confidenza • esempio: gdl = 10C2 0,05 = 0,394 da cui:ev» 0,6 da cui a= 0,85 e non 0,90 !!!
0,05 0,05 Intervallo di confidenza allo 0,90 • per bassi valori di n la f (C 2 ) non è simmetrica:si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili C 2a / 2 e C 21- a / 2 • esempio: gdl = 10a= 0,90
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili C 2a/2 e C 21 - a/2 corrispondenti alla confidenza scelta? corrisponde alla:
Intervallo di confidenza • varianza campionaria corretta: • Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili C 2a/2 e C 21 - a/2 corrispondenti alla confidenza scelta? l’intervallo cercato è:
Stima intervallo di confidenza con c2 • varianza campionaria: • avendo introdotto la distribuzione “chi-quadro” è stato possibile affermare che la variabile aleatoria c2segue tale distribuzione con n - 1 g.d.l..
Stima intervallo di confidenza con c2 • varianza campionaria: • se dispongo dei valori dellac2
Esercizio 6 Da questi valori si individuano gli estremi dell'intervallo di confidenza cercato mediante la: Sostituendo nella espressione i valori della varianza campionaria corretta, dei quantili della C 2 e dei gradi di libertà si ottiene infine: