190 likes | 398 Views
Cap. 18 Intervalli di confidenza Cioè come trarre ancora più informazioni dai dati campionari. Stima puntuale e stima intervallare.
E N D
Cap. 18 Intervalli di confidenzaCioè come trarre ancora più informazioni dai dati campionari
Stima puntuale e stima intervallare • A differenza della stima puntuale che produce un unico valore, la stima intervallare utilizza i dati campionari per produrre un intero insieme di valori che ragionevolmente contiene l’ignoto valore del parametro. • A favore della stima puntuale: • E’ sempre applicabile, cioè calcolabile a partire dai soli dati campionari. Non richiede informazioni o ipotesi ausiliarie sul fenomeno in Ue/o sulla v.c.Xche lo interpreta. • E’ semplice (in generale procede per analogia, utilizzando come stimatore del parametro di interesse il suo analogo campionario) • Però: • L’affidabilitàdella stima puntuale risiede tutta nella garanzia probabilistica offerta dalle proprietàteorico-formali del corrispondente stimatore. A livello pratico si può solo (a sua volta) stimare l’errore medio di stima con lo standard error. • La stima puntuale può dare una falsa impressione di precisione. L’informazione intervallare è meno rischiosa e di più facile utilizzo
Intervallo di confidenza (IC) • Gli IC sono però calcolabili solo se vale almeno una delle due seguenti condizioni: • La funzione di probabilitào di densità di X è nota (in genere, distribuzione normale) oppure è ipotizzabile con un elevato grado di sicurezza (popolazione normale) • La numerositàdel campione n è sufficientemente grande perchévalgano opportuni teoremi di teoria delle probabilità (grandi campioni).
Intervallo di confidenza per la media m con popolazione normale e s2 nota • Se è normale, anche è normale, con media m e varianza s2/n. • NB: avevamo dimostrato che la media e la varianza di sono comunque m e s2/n anche senza l’ipotesi di distribuzione normale, ma nulla sapevamo in quel caso circa la forma della distribuzione. • Possiamo allora standardizzare e utilizzare le relative tavole per trovare le probabilità associate a specifici intervalli:
Intervallo di confidenza per la media m con popolazione normale e s2 nota 0.95
Intervallo di confidenza per la media m con popolazione normale e s2 nota
Intervallo di confidenza per la media m con popolazione normale e s2 nota • L’IC per m ad un livello di confidenza del 95% è allora:
Intervallo di confidenza per la media m con popolazione normale e s2 ignota • La v.c. media campionaria studentizzata non ha più distribuzione normale, bensì una distribuzione chiamata T di Student, con n-1gradi di libertà • La forma è simile a quella della distribuzione normale, sempre a campana e simmetrica, ma con una varianza maggiore
Intervallo di confidenza per la media m, campione grande • Teorema Centrale del Limite (TCL):
Pianificazione della numerosità campionaria • Vogliamo decidere quanto deve essere grande il campione per fare con buona probabilità una buona stima. • Definiamo buona una stima in cui commettiamo un errore assolutonon superiore ad un certo margine massimo tollerato. • Per buona probabilità prendiamo il valore usuale del 95% (o del 90%, o del 99%)
Pianificazione della numerosità campionaria per fenomeni qualitativi (dicotomici) • Non vi è bisogno di ipotizzare la varianza di X. Infatti, • Dunque possiamo metterci nel «peggiore» dei casi (quello che produce una massima varianza), ovvero p = 0,5. Conseguentemente: