680 likes | 1.04k Views
Lezione 6 Inferenza statistica. parte 1 Stime per punti e per intervalli della media. la media campionaria come strumento di inferenza. Si definiscono “ stimatori ” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.
E N D
la media campionariacome strumento di inferenza • Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione. • I valori ottenuti mediante gli stimatori si dicono “stime” del parametro. • La media campionaria può essere usata come stimatore della media m dell’intera popolazione essendo uno stimatore corretto e consistente.
media campionaria e stima puntuale di m • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. • il valore ottenuto viene indicato come “stima puntuale di m ”
incertezza dello stimatore campionario • estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si può usare la media campionaria per stimare il valore del parametro m relativo all’intera popolazione. • come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
incertezza dello strumento di misura Fascia di valore (a meno di 60 ppm)
incertezza dello stimatore campionario • Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, il valore della media m della variabile X per la intera popolazione sia compreso nell’intervallo
Qual è la probabilità che, estraendo a caso un campione di n elementi dalla popolazione, l’intervallo casuale contenga il valore della media m della variabile X per la intera popolazione? incertezza dello stimatore campionario
incertezza dello stimatore campionario • Con quale “confidenza”, dopo aver estratto a caso un campione di n elementi dalla popolazione e calcolato il valore della corrispondente media campionaria, si può affermare che il valore della media m della variabile X per la intera popolazione è compreso nell’intervallo
incertezza dello stimatore campionario • La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare: “ Intervallo di confidenza ”
incertezza dello stimatore campionario • La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.
estraendo da una popolazione per cui è definita la variabile casuale Xavente densità f (x) qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionariafornisce una variabile casuale distribuita in modo normale, con media m e varianza s2 / n distribuzione della media campionaria
distribuzione della media campionaria • Avendo una popolazione per cui è definita la variabile casuale X con densità f (x) qualsiasi, media m e varianza s2 ed estraendo da essa un campione di n elementi a cui corrisponde l’insieme di vc. { X1, X2, …, Xn }, qual è la probabilità che la media campionariadifferisca da m per una quantità minore di ?
distribuzione della media campionaria • La risposta al quesito si ottiene individuando la probabilità dell’evento: • Tale probabilità è rappresentata dall’area della regione evidenziata in verde nel grafico sopra riportato.
il valore ricercato si ottiene da:in cui: distribuzione della media campionaria
il valore ricercato si ottiene da:in cui: distribuzione della media campionaria
distribuzione della media campionaria • sviluppando i calcoli si ottiene:con:
distribuzione della media campionaria • esplicitando l’espressione dell’evento si ottiene: • è quindi possibile fare la seguente affermazione:
estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon densità f (x) qualsiasi, media m e varianza s2, c’è una probabilità pari a0,68 che la media campionaria appartenga all’intervallo distribuzione della media campionaria
distribuzione della media campionaria • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:
distribuzione della media campionaria che può essere tradotta nelle seguenti affermazioni: • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che un intervallo di ampiezzacentrato sul valore della variabile casuale “media campionaria” contenga il valore della media m della popolazione.
intervallo di confidenza per la media • estraendo a caso un campione con n sufficientemente elevato da una popolazione per cui è definita una variabile casuale Xcon distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 0,68 che l’intervallo casualecontenga il valore della media m . • questo intervallo viene chiamato:intervallo di confidenza allo 0,68 per la media
intervallo di confidenza allo ( 1 – a) per la media in generale, se sono i quantili a/2 e 1 – a/2 per la media campionaria
intervallo di confidenza allo ( 1 – a) per la media con una confidenza pari a 1 – apossiamo affermare che
Proprietà della media campionaria teorema 4.4: • dato un campione di n elementi prelevato senza ripetizione da una popolazione composta da N elementi per cui è deifinita la variabile casuale X, posto : • si ha:
Distribuzione della media campionaria se n≈N se il numero n degli elementi del campione non è molto minore della numerosità N (finita) della popolazione.
Dalla lezione 4:Distribuzione della media campionaria teorema 4.3: • Sia data una popolazione su cui è definita una variabile causale X condensità f (x) ed avente media m e varianza s 2finite. • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, • allora, al tendere di n ad infinito, la media campionaria - segue una distribuzione normale - conmediam e varianzas 2 / n - qualunque sia la distribuzione della popolazione
Dalla lezione 4:Distribuzione della media campionaria • La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che: • quanto più il campione è numeroso, • tanto meglio la distribuzione della media campionaria approssima una distribuzione normale con media m e con varianza s 2 / n • in pratica si può ritenere che un valore di n non inferiore a 30 sia già sufficiente per approssimare la distribuzione della media campionaria con quella normale con media m e con varianza s 2 / n.
la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale”
la caratteristica comune di una popolazionee il suo modello probabilistico: la distribuzione “normale” • Il modello basato sulla distribuzione “normale” può essere usato per descrivere l’andamento della caratteristica comune di una popolazione quando i valori assunti da tale caratteristica sono determinati dalla azione di molteplici cause che agiscono indipendentemente le une dalle altre
Distribuzione della media campionaria • Sia data una popolazione su cui è definita una variabile causale X con distribuzione normale, media m e varianza s 2finite. • Detta: la media campionaria di un campione casuale di dimensione n estratto da essa, • allora, per qualsiasi n, la media campionaria - segue una distribuzione normale - conmediam e varianzas 2 / n
intervallo di confidenza per la media • Ricordiamo che: la “probabilità” dell’evento:è uguale alla “confidenza” con cui posso affermare:
Dalla media campionaria alla media campionaria standardizzata nota: • La determinazione del valore della probabilità di un evento analogo a quelli studiati richiede il calcolo di un integrale definito in cui figurano, oltre agli estremi di integrazione, tre parametri variabili in funzione della popolazione e del campione che ne viene estratto: i valori della mediam e della varianzas2della popolazione e la numerositàn del campione estratto. • Ciò rende di fatto impossibile fornire in forma tabulare i valori di probabilità degli eventi. • Per questi motivi si introduce la versione standardizzata della media campionaria.
è quindi facile costruire una variabile casualecon distribuzionenormale standard, cioè con media nulla e varianza unitaria. Dalla media campionaria alla media campionaria standardizzata • Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n
La probabilità che il valore della variabile Z sia compreso fra gli estremi a e b: si può facilmente ricavare dalle tabelle che ogni libro di probabilità e statistica riporta. Dalla media campionaria alla media campionaria standardizzata
Intervallo di confidenza a (1 – a ) : media campionaria standardizzata • se indichiamo con z1-a/2 il quantile 1 - a/2 della variabile Z : pertanto :
Intervallo di confidenza a (1 – a ) : media campionaria standardizzata • Per la simmetria della distribuzione della variabile Z : da cui :
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • se esplicitiamo la variabile Z:
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • da cui:
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • Esaminiamo l’evento di cui abbiamo determinato la probabilità:
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • da cui, con passaggi algebrici:
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata • La probabilità: • è uguale alla confidenza con cui possiamo affermare che:
Intervalli di confidenza a (1 – a ) : media campionaria standardizzata possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a1 - a che l’intervallo casualecon Z variabile normale standard e con z1-a/2 il valore del suo quantile (1 - a/2)contenga il valore della media m per l’intera popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la media