240 likes | 473 Views
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica. Determinismo e casualità.
E N D
Cap. 15 Caso, probabilità e variabili casualiCioè gli ingredienti matematici per fare buona inferenza statistica
Determinismo e casualità • Ci si trova in situazione deterministica quando ènoto l’intero insieme di circostanze che determinano E. In questo caso Eèprevedibile a priori con certezza
Determinismo e casualità • Ci si trova in situazione casuale quando l’insieme di circostanze che determinano E è noto solo parzialmente. In questo caso Enon è prevedibile apriori con certezza:
Definizioni di base • La parte di circostanze ignote che impediscono di prevedere a priori con certezza il risultato Edefinisce il caso. • Esperimento casuale: esperimento condotto sotto l’effetto del caso. Di un esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti. • Evento elementare: ciascuno dei possibili esiti di un esperimento casuale. • Spazio campionario (W): l’insieme di tutti i possibili esiti (eventi elementari) di un esperimento casuale, elencabili a priori. • Evento casuale (E): un sottoinsieme dello spazio campionario. NB: il concetto di evento casuale è più generale del concetto di evento elementare. Un evento elementare è un singolo elemento di W. Un evento casuale è un sottoinsieme di cioè un insieme di eventi elementari: ne puòcontenere molti, alcuni, tutti, uno solo o anche nessuno.
Definizioni di base • Realizzazionedi un evento casuale (verificata a posteriori): uno degli eventi elementari necessariamente si verifica. Allora è W l’evento certo e Ø l’evento impossibile. • Esempio: • La probabilitàP(E)di un evento casuale E è un numero associato a Eche ne quantifica a priori il grado di incertezza ovvero la possibilitàdi realizzazione.
Probabilità • Definizione classica: P(E)è il rapporto fra il numero di casi favorevoli ad Ee il numero di tutti i casi possibili, posto che possano ritenersi tutti ugualmente possibili ( attenzione: circolarità!) • Definizione frequentista: L’evento Edi cui si vuole calcolare la probabilità P(E) è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni. Al termine di tali Nprove, Esi sarà verificato f volte (e non si sarà verificato le rimanenti N − f volte). P(E) è il valore intorno al quale tende a stabilizzarsi la frequenza relativa dopo un numero sufficientemente grande di prove: • La definizione frequentista è più ampia di quella classica: permette di considerare spazi campionari infiniti e calcolare la probabilità anche di eventi anche quando i casi possibili non sono tutti equiprobabili. • Bisogna però che l’esperimento sia ripetibile: quanto è un gran numero di volte? Come è possibile verificare che le condizioni siano le stesse?
Variabili casuali • La variabile casuale (v.c.) è lo strumento matematico che permette di concentrarci sulle sole caratteristiche dell’esperimento che interessano e che trasforma gli eventi casuali in numeri reali, conservandone la probabilità. • La v.c. formalizza le situazioni casuali – cioè gli eventi Ee le loro probabilità P(E) in analogia con quanto fa la v.s. nella statistica descrittiva.
Variabili casuali discrete • Sfruttando l’analogia tra v.c. e v.s. si possono trasferire molti concetti dalla statistica descrittiva alla statistica inferenziale: • V.c. discretaX: assume un numero finito (o infinito numerabile) di valori x che di solito sono numeri interi(in analogia con le modalità di una v.s.) • Funzione di probabilità (in analogia con le frequenze relative di una v.s.): • Funzione di ripartizione (in analogia con le frequenze cumulate relative di una v.s.): è la probabilità che la v.c.X assuma valori minori o uguali ad un generico valore x:
Variabili casuali discrete • Media (o valore atteso), varianza, deviazione standard (definite e calcolate come per le v.s. ma utilizzando le probabilità al posto delle frequenze):
Esempio • X : numero di teste nel lancio di due monete (bilanciate)
Variabile casuale binomiale • Una particolare v.c. discreta, con le seguenti tre caratteristiche: • l’esperimento casuale consiste nell’esecuzione di nprove indipendenti in cui cioèl’esito di ciascuna prova non influenza l’esito della prova successiva • Ciascuna prova puòavere come esito uno (e soltanto uno) di 2 eventi fra loro contrari ed esaustivi («successo» ed «insuccesso», con riferimento a fenomeni dicotomici) • E’ nota e costante in ciascuna prova la probabilità pdel successo • n e p sono i parametri della v.c. binomiale • Il generico risultato della serie di n prove (il generico evento elementare) è
Variabile casuale binomiale • Qual è la funzione di probabilità P(X=x) della v.c. binomiale? • Al generico risultato è associata la probabilità p(1-p)p…p(1-p)(1-p)…p = px(1-p)n-x • Ma la realizzazione X=x può capitare anche in un altro ordine, sempre con la stessa probabilità. • Qual è il numero di possibili combinazioni di xsuccessi e n − x insuccessi in ordine diverso? Il coefficiente binomiale:
Variabile casuale binomiale • Dunque la funzione di probabilità di una v.c. binomiale è • Si può dimostrare che:
Variabili casuali continue • Le v.c. continue assumono infiniti valori. Per identificarli, in analogia con le v.s. continue, bisogna fare riferimento ad intervalli. • Si parla in questo caso di funzione di densità di probabilità, f(x) (in analogia con le densità di frequenza relative di una v.s.). • La funzione di ripartizione F(x) è l’integrale della funzione f(x) (l’area sottostante). • Esempio: dado alternativo • NB: i singoli punti hanno probabilità pari a 0! La probabilità che X assuma valori in un intervallo è l’area sottesa al grafico di f(x) in quell’intervallo.
Variabile casuale normale • Assume tutti i valori reali: • È simmetrica, con media (e quindi anche mediana e moda) m e varianza s2 • I punti di flesso nella funzione di densità di probabilità sono m-s e m+s
Variabile casuale normale • Variazioni di m (a parità di s) determinano traslazioni di f(x) a sx e dx • Variazioni di s (a parità di m) determinano appiattimenti o innalzamenti di f(x)
Standardizzazione di una variabile casuale • E’ una operazione che permette di creare una v.c. con funzione di (densità di) probabilità con la stessa forma, ma media pari a 0 e varianza pari a 1. • Esempio: lancio di 2 dadi:
Variabile casuale normale standard(izzata) • Molti fenomeni (naturali e non) sono interpretabili come v.c. con distribuzione normale. Per calcolare le probabilità del verificarsi di specifiche realizzazioni (intervalli) bisogna guardare al valore della funzione di ripartizione, ovvero all’area sottostante alla funzione di densità. A prescindere dagli specifici parametri m e s , possiamo standardizzare la variabile e utilizzare i valori corrispondenti sulle tavole della normale standard.
Tavole della normale standard NB: i valori negativi non compaiono in quanto la v.c. è simmetrica