950 likes | 1.34k Views
Analisi Statistica dei Dati. G.Marsella. Elementi di teoria della probabilità. Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati attraverso la teoria della probabilità.
E N D
Analisi Statistica dei Dati G.Marsella
Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi)aleatori sono studiati attraverso la teoria della probabilità Probabilità di un evento semplice Un evento può risultare: Certo (si verifica sempre) -estrazione di una pallina nera da un’urna contenente solo palline nere Impossibile(non si verifica mai) -estrazione di una pallina bianca da un’urna contenente solo palline nere Probabile(può verificarsi o no) -estrazione di una pallina bianca da un’una contenente sia palline nere che bianche Eventi aleatori
Eventi e probabilità impossibile certo probabile P=0 0<P<1 P=1 Se E indica un evento l’evento corrispondente al non verificarsi di E rappresenta l’evento complementare E con la relazione P(E) = 1 – P(E) La prova genera l’evento con una certa probabilità
Eventi aleatori • Evento semplice= singola manifestazione di un fenomeno (misura,osservazione, risultato) che esclude altri eventi (eventi incompatibili: testa o croce nel lancio di una moneta) • Evento composto= è costituito da una combinazione di più eventi semplici. Possono verificarsi simultaneamente ovvero sono compatibili(l’evento testa di una moneta è compatibile con l’evento croce nel lancio di due monete)
Eventi aleatori • L’insieme di tutti gli eventi di un fenomeno costituiscono l’universo o spazio campione (Ω) delle possibilità. • Si usa il termine successo per segnalare che si è verificato l’evento considerato e insuccesso in caso contrario. Essi sono eventi incompatibili o mutuamente esclusivi
Spazio campionario • Lo spazio campionario associato al lancio di due monete comprende 4 punti che rappresentano i possibili risultati • Si chiama evento ogni sottoinsieme dello spazio campionario • TT • TC • CT • CC
Teoria e calcolo della probabilità • L’entità di successi in una serie di osservazioni (prove) può essere definita come frequenza relativa o (percentuale)calcolata come rapporto tra il numero di eventi favorevoli rispetto al numero di casi esaminati • Il grado diaspettativa circa il verificarsi di un evento E, ovvero la probabilità dell’evento P(E) è
La probabilità di un evento E è il rapporto tra il numero di casifavorevoli al verificarsi di E(n) e il numero di casi possibili (N), purché siano tutti equi - probabili Concezione classica della probabilità Es: probabilità di estrarre un asso da un mazzo di 52 carte = 4/52 = 0.08 probabilità di ottenere testa nel lancio di una moneta =1/2 = 0.5
Probabilità uscita testa Probabilità faccia 6 dado Qual è la probabilità che lanciando due volte una moneta si presenti prima la faccia testa poi la faccia croce 1°- TT 2°- TC 3°- CT 4°- CC p = p= p = Applicazioni della concezione classica
La probabilità di un evento è la frequenza relativa di successo in una serie di prove tendenti all’infinito, ripetute sotto identiche condizioni Nella concezione frequentista la probabilità è ricavata aposteriori dall’esame dei dati Concezione frequentista della probabilità Frequenza relativa su un gran numero di prove Es: qual è la probabilità post-operatoria dopo l’intervento xyz ? I dati su un decennio in un territorio presentano 30 morti su 933 interventi Frequenza relativa = 30/933= 3.22% = Probabilità di mortalità post-operatoria
Legge dei grandi numeri • P(E): ripetendo la prova un gran numero di volte si osserva che il rapporto f= m/n (frequenza relativa) dove m= numero di successi ed n= numero di prove tende ad avvicinarsi sempre più alla probabilità P(E) La frequenza relativa f al crescere del numero delle prove, tende, pur oscillando, verso un valore costante (stabilità della frequenza)
Elementi di statistica • La statistica è un’estensione del calcolo delle probabilità • Si parte dai concetti fondamentali • Si estende la definizione di probabilità • Si introducono delle nuove variabili
Estensione del concetto di probabilità • La probabilità viene fatta passare • da un numero razionale ... • ... ad un numero reale • La probabilità può essere infinitesima • Anche se poi si darà significato sempre alla probabilità finita • Tramite integrazioni
Estensione del concetto di probabilità • Si suppongono valide tutte le leggi delle probabilità già stabilite • Non si puòpiù definire la probabilità come rapporto fra casi favorevoli e casi possibili
Le variabili aleatorie • Una variabile aleatoria è una variabile... • ... reale • ... discreta o continua • ... associata ad una probabilità
Le variabili aleatorie • Una variabile aleatoria discreta • Assume i valori ... • ... con probabilità
Le variabili aleatorie • Esempio classico: il dado • Variata: un numero da 1 a 6 • Probabilità associata: 1/6
Si definisce • Valore atteso • Speranza matematica • Valore medio
La variabile aleatoria discreta può essere definita da una tabella • Esempio: • I numeri riportati sulle facce di un dado • Attenzione: i numeri potrebbero essere diversi • Anche le probabilità se il dado fosse truccato...
Ed ecco una rappresentazione grafica • Distribuzione • Spettro
Se si conoscono solo valori proporzionali alle probabilità occorrerà normalizzarli
Una variata continua • Assume valori reali in un dominio D con probabilità infinitesima • La è la funzione di distribuzione (spettro) • Funzione densità
Il dominio D sarà per noi, praticamente sempre, uno dei seguenti insiemi • Tutto l’asse reale • Il semiasse reale positivo • Un intervallo (e di solito chiuso) • Indicheremo in ogni caso l’estremo inferiore con low e quello superiore con high • Ecco degli esempi
In ogni caso vale la condizione di normalizzazione • ...ed in generale un valore atteso (“speranza matematica”) vale...
Il momento di ordine 0 corrispnde alla condizione di Normalizzazione
Funzioni di distribuzione • In sintesi, le principali caratteristiche di una funzione di distribuzione sono:
Le distribuzioni in generale • Di solito hanno quindi dei picchi • Il picco più alto si chiama moda della distribuzione • Un picco: unimodale • Poi bimodale, multimodale...
Le distribuzioni in generale • Si definisce la mediana • È definita con un’equazione integrale • Non gode di proprietà di linearità • Molto utile e potente soprattutto nell’analisi delle serie temporali
Le distribuzioni in generale • Poi ci sono i quartili • Mediane della mediana • Poi i percentili ...
Le distribuzioni in generale • Quasi sempre di una distribuzione si fornisce • La media • Lastandard deviation • Lamoda • A volte anche il momento secondo (o la sua radice) • Valore quadratico medio • È il caso delle velocità in un gas
Le distribuzioni in generale • Attenzione a non confondere • Facili a confondere se si usa il simbolo
Le principali distribuzioni discrete • Veramente importanti solamente due • Distribuzione di Bernoulli e binomiale • Distribuzione di Poisson, o degli eventi rari
La distribuzione di Poisson • È la distribuzione di eventi rari • È ciò che diviene la binomiale quando • Legge della distribuzione
La distribuzione di Poisson • Media • Varianza