250 likes | 572 Views
Analisi bivariata. Per ogni unità statistica si considerano congiuntamente due variabili: u.s. 1 2 3 4 5 6 … Età 25 32 41 28 51 29 … Sesso M M F M M M …. Perché?. Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno
E N D
Analisi bivariata Per ogni unità statistica si considerano congiuntamente due variabili: u.s. 1 2 3 4 5 6 … Età 25 32 41 28 51 29 … Sesso M M F M M M …
Perché? • Rappresentazione sintetica delle distribuzioni di due variabili / quantificazione di un fenomeno • Valutazione dell’andamento congiunto delle due variabili • Valutazione della relazione causa-effetto tra le due variabili
Tabella a 2 vie k x h Distribuzione congiunta Distribuzione marginale
Distribuzione condizionata di X a y1 Distribuzione condizionata di Y a x2
Relazione tra variabili • Forma: simmetrica X←→Y asimmetrica X→Y (causa-effetto / indipendente-dipendente) • Segno: variazione concorde X↑↓ Y ↑↓ + variazione discorde X↑↓ Y ↓↑ - (var. almeno ordinali…) • Forza:
Cenni di Calcolo delle Probabilità Definizione di probabilità Intuitiva: p.e. lancio una moneta, qual è la probabilità che esce testa? lancio un dado, qual è la probabilità che esce 5? e che esce un numero pari? e che esce 7? e che esce un numero compreso tra 1 e 6?
Terminologia Evento: manifestazione oggetto di attenzione Evento casuale: il risultato dell’esperimento casuale, ovvero di una situazione in cui si è operata una scelta o si è manifestato un evento senza una precisa regola, in modo casuale. certo – evento che si manifesta sicuramente impossibile – evento che non si manifesta sicuramente possibile – evento che si può manifestare incompatibili – due (o più) eventi che non si possono verificare contemporaneamente complementare – evento o insieme di eventi che si verifica in contrasto ad un altro Spazio campionario Ω: l’insieme di tutti i possibili risultati
Definizione classica: (Pascal e Fermat, XVII sec.) La probabilità di un evento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili, purché questi ultimi siano ugualmente possibili Se su n casi nA sono quelli relativi al verificarsi dell’evento A, la probabilità che si verifichi A è: • Qual è la probabilità di estrarre una pallina bianca da un’urna che contiene 3 palline bianche, 2 nere e 3 gialle? n=8 A=pallina bianca nA=3 pA=3/8=0,375
Definizione frequentista: Se si ripete un processo un gran numero di volte n e se un certo evento con caratteristica A si verifica nA volte, la frequenza relativa di successo di A è nA/n e sarà approssimativamente uguale alla probabilità di A. Se su 1235 osservazioni rilevo per 371 volte la caratteristica ‘pressione bassa’, allora la probabilità di osservare un soggetto con ‘pressione bassa’ verosimilmente sarà 371/1235=0,300
Definizione assiomatica: • Dato un processo che genera n risultati (eventi) mutuamente esclusivi, A1, A2, …, An, la probabilità di un dato evento Ai è data da un numero non negativo, ovvero: P(Ai) ≥ 0 • La somma delle probabilità di tutti gli eventi mutuamente esclusivi è uguale a 1: • Dati due eventi mutuamente esclusivi, Ai e Aj, la probabilità che si verifichi o Ai o Aj è uguale alla somma delle singole probabilità: P(Ai o Aj) = P(Ai) + P(Aj)
Relazione con la tabella a 2 vie • Le modalità sono mutuamente esclusive • Supp. uguale probabilità per ogni u.s. • P(F) = 0,24 • P(54-65) = 0,13 • P(42-53|M) = 0,322 • P(30-41 ∩ F) = 0,075 1. e 2. → probabilità marginale 3. → probabilità condizionata 4. → probabilità congiunta Simbologia: | → condizionamento ∩ → intersezione → contemporaneità (A e B ovvero B e A) U → unione → alternatività e contemp. (A, B, oppure A e B)
P(F) = 0,24 • P(54-65) = 0,13 • P(54-65|F) = 0,146 • P(F|54-65) = 0,269 • P(54-65 ∩ F) = 0,035 0,035 = 0,24 x 0,146 P(54-65 ∩ F) = P(F) x P(54-65|F) Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0
Legge del prodotto: P(A∩B) = P(B) x P(A|B) se P(B)≠0 P(A∩B) P(A|B) = ----------- se P(B)≠0 P(B) P(M o F) = P (M U F) = P(M) + P(F) = 0,76 + 0,24 = 1 Se non sono mutuamente esclusivi?? Es. M e 18-29… Legge della somma: P(A U B) = P(A) + P(B) – P(A ∩ B) Es. P(M U 18-24) = P(M) + P(18-29) – P(M ∩ 18-29) = = 0,76 + 0,160 – 0,120 = 0,80 (152) (32) (24)
Eventi indipendenti Es. A = essere M B = avere le ali P(B) non ha effetto su P(A) e viceversa → P(A|B) = P(A) P(B|A) = P(B) P(A ∩ B) = P(B) x P(A|B) = P(B) x P(A) Eventi complementari Es. A = essere M il complementare è = essere F…
Variabile casuale: variabile i cui valori non possono essere esattamente predetti. discreta: salti o interruzioni nei valori (conteggio…) continua: non ha salti o interruzioni (altezza…) (limite strumento di misura) Distribuzione di probabilità di V.C. discreta: Specificazione di tutti i valori possibili con le rispettive probabilità… • pi≡ fi • pi ≥ 0 per ogni i • ∑pi = 1 • P(Ai o Aj) = pi + pj per ogni i e j
graficamente… Prob. Cumulata: F(x) = P(X≤ x)
graficamente… Prob. Cumulata: F(x) = P(X≤ x)
Distribuzione di probabilità continue n→ ∞ d → 0 Area = 1
fa-b • funzione di densità per X v.c. continua: • f(x) ≥ 0 • Area = 1 • Area (a-b) = P(a ≤ X ≤ b)