90 likes | 345 Views
Cap. 16 Campionamento ed errore campionario. Campionamento. L ’operazione di scelta casuale del campione di n unit à statistiche fra le N che compongono l’intera U è chiamata campionamento . Il numero n è detto numerosit à o ampiezza campionaria.
E N D
Campionamento • L’operazione di scelta casuale del campione di n unitàstatistiche fra le Nche compongono l’intera U è chiamata campionamento. Il numero n è detto numerositào ampiezza campionaria. • Campionamento casuale (bernoulliano): è il risultato di nestrazioni casuali da Ucondotte tutte nelle stesse condizioni cioè fra loro indipendenti. In pratica, si tratta di effettuare n estrazioni con reinserimento fra le N unità di Utra loro equiprobabili. • Campionamento casuale semplice: senza reinserimento. • Si può dimostrare che se n è sufficientemente grande in assoluto ma allo stesso tempo piccolo rispetto a N, il che è in genere ciòche accade, le due tecniche con o senza reinserimento portano a risultati equivalenti.
Variabilità campionaria ed errore campionario • Da U sono estraibili molti diversi campioni, spesso così tanti da poterli pensare in numero infinito. • Variabilità campionaria: ciascuno dei differenti campioni fornisce un’informazione parziale e potenzialmente differente circa il comportamento su Udel fenomeno che ci interessa. • Il processo di inferenza statistica avviene sotto l’effetto della variabilità campionaria perché i soli dati noti sono quelli del campione effettivamente estratto, che è uno fra i tanti possibili. • L’inferenza statistica comporta dunque necessariamente incertezza e rischio di errore (errore campionario). • Fare buona inferenza significa controllare e misurare l’errore campionario. • Nell’inferenza statistica che si basa su campioni casuali, l’errore campionario è controllato e misurato scientificamente con le probabilità.
L’oggetto dell’inferenza statistica • Quando si dispone solo di dati campionari (parziali e casuali), la distribuzione del fenomeno di interesse su U è ignota. • Per questo motivo interpretiamo il fenomeno sull’intera U con una v.c. • I reali valori delle sintesi statistiche del fenomeno di interesse su Uquali la media, la varianza ma anche la mediana, le percentuali ecc. sono anch’essi ignoti. Vengono chiamati parametri. • I parametri ignoti sono dunque l’oggetto dell’inferenza statistica.
X e Xi • X è la v.c. che interpreta il fenomeno su U. • La generica osservazione campionaria xi è il risultato dell’esecuzione di un esperimento casuale. E’ pertanto un evento casuale e puòcoincidere con uno (qualunque) dei possibili valori della v.c.X. • Allora, anche il risultato di ogni estrazione campionaria è interpretato da una v.c.Xiche chiameremo v.c.estrazione campionaria e di cui l’osservazione campionaria xirappresenta uno dei possibili valori. • Poichènel campione bernoulliano le estrazioni sono indipendenti, allora le v.c estrazioni campionarie Xisono tra loro indipendenti. • Infine, poichèxipuòcoincidere con uno qualunque dei possibili valori del fenomeno, a sua volta interpretato dalla v.c.X, si ha anche che ciascuna v.c. estrazione campionaria Xi è identica a Xe, in quanto identica, ha la stessa media e la stessa varianza.
Numero di campioni diversi di 3 studenti potenzialmente estraibili: Nn = 1000 (a) (b) (c) (d)
Obiettivi dell’inferenza statistica • Stima dei parametri, con l’obiettivo di usare i dati campionari per inferire il valore dei parametri ignoti • Verificadi ipotesi statistiche, con l’obiettivo di usare i dati campionari per inferire se èaccettabile o meno un valore che si ritiene ipotizzabile per i parametri ignoti.