710 likes | 923 Views
“Metodi per la Ricerca Sociale e Organizzativa”. Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti. LOGICA TRIVARIATA. Logica trivariata.
E N D
“Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti
Logica trivariata • Quando ad una relazione bivariata aggiungiamo una terza variabile operiamo un’analisi trivariata.
Perché considerare una terza variabile? Quando consideriamo un’ipotesi causale tra due fenomeni ed empiricamente corroboriamo l’esistenza di una relazione, non possiamo tuttavia escludere che i due fenomeni non siano dovuti ad un terzo che non abbiamo preso in considerazione.
La causa di un fenomeno in senso generico può essere definita come la somma totale delle condizioni , la totalità delle contingenze alla cui realizzazione segue invariabilmente il conseguente. (Campelli 1999) Tuttavia, “Nulla può meglio mostrare l’assenza di qualsiasi fondamento scientifico per la distinzione fra la causa d’un fenomeno e le sue condizioni della maniera capricciosa in cui scegliamo fra le condizioni quella che preferiamo chiamare causa “ (J.S.Mill)
Cause ed effetti ? 1.Il numero di pompieri impegnati nello spegnere un incendio è correlato con la stima finale dei danni provocati dall’incendio stesso. 2.I bambini nelle cui case vi sono più finestre mostrano migliori rendimenti scolastici.
Presenza di un effetto SPURIO, cioè di una terza variabile, antecedente alle due, che è la “vera” causa della relazione! 1. Considerando le dimensioni dell’incendio, la relazione tra numero di vigili del fuoco e stima dei danni sparisce. 2.Considerando la ricchezza patrimoniale dei genitori, la relazione tra numero di finestre e rendimento scolastico sparisce.
Posizione delle variabili • Una volta ipotizzata una relazione tra due variabili X “indipendente” e Y “dipendente”, l’altra o le altre variabili considerate possono assumere quattro posizioni: • variabili antecedenti, • variabili intervenienti, • variabili susseguenti, • variabili concomitanti.
Variabili antecedenti Quelle variabili che nell’ordine causale precedono sia X che Y. A X Y
Variabili intervenienti Quelle variabili che nell’ordine causale precedono Y ma seguono X. I X Y
Variabili susseguenti Quelle variabili che nell’ordine causale seguono sia Y che X. S X Y
Variabili concomitanti Quelle variabili che nell’ordine causale precedono Y ma sono correlate (senza direzione causale) ad X. C X Y
LOGICA degli effetti EFFETTO SPURIO: l’inserimento di una variabile di controllo Z, annulla la relazione tra X e Y. X Y Z X Y
LOGICA degli effetti EFFETTO SOPPRESSO: l’inserimento di una variabile di controllo Z, rende palese la relazione tra X e Y. X Y Z X Y
SCOMPOSIZIONE degli effetti Variabili categoriali e differenze di probabilità
Esempio 1 ESEMPIO 1. tra variabili dicotomiche.Incrocio tra titolo di studio e fiducia nel sistema giudiziario … X Y X Titolo di studio (L – H) Y Fiducia nel sistema giudiziario (S – N)
Esempio 1 … controllato per la variabile antecedente Z Z X Y Z Coorte di nascita (G – A)
Esempio 1 Effetto bivariato XY= Effetto causale netto + Effetto spurio dyx = dyx.z + d(yx)z Z d(yx)z dyx X Y X Y dyx.z
Esempio 1 Fonte: EB 60.1 Italia (30 e più anni)
Esempio 1 dyx Effetto bivariato: educaz. e fiducia giustizia In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità. dyx equivale alla differenza di probabilità sull’avere fiducia nella giustizia dato l’avere un titolo di studio alto piuttosto che basso.
Esempio 1 dyx Effetto bivariato: educaz. e fiducia giustizia Pr (Y=1 | X=2) – Pr (Y=1 | X=1) Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x) La categoria di riferimento è la “SI” (Y=1). dyx = 0,581 - 0,436 = 0,145
Esempio 1 dyx = 0,581 - 0,436 = 0,145 La relazione tra possesso della laurea (piuttosto che un titolo di studio inferiore) e fiducia nella giustizia (“si” piuttosto che “no”) è positiva.
Esempio 1 GIOVANI Z=1 ANZIANI Z=2
Esempio 1 Effetti condizionati di Z Considerando Z, troviamo diversi effetti di X su Y. dyx|z=1 = 0,593 -0,425 = 0,168 dyx|z=2 = 0,553 -0,448 = 0,105
Esempio 1 Effetto condizionato complessivo di Z Considerando che le numerosità in Z tra giovani ed anziani sono diverse, occorre ponderare gli effetti condizionati. Giovani= 388/685 = 0,567 quota di giovani (qg) Anziani= 297/685 = 0,433 quota di anziani (1 - qg) dyx.z = (0,168*0,567) + (0,105*0,433) = 0,141
Esempio 1 Effetto bivariato = Effetto causale + Effetto spurio dyx = dyx.z + d(yx)z d(yx)z Effetto spurio d(yx)z =dyx – dyx.z = 0,145 – (0,141) = 0,004
Esempio 1 L’effetto della variabile Z è sostanzialmente nullo, ossia la relazione tra titolo di studio e fiducia nella giustizia permane immutata anche a parità di fascia d’età. Non c’è effetto SPURIO. Z ~ 0 ~ 0 X Y +
Esempio 2 ESEMPIO 2. tra variabili dicotomiche.Incrocio tra genere e fiducia nei sindacati … X Y X Genere (M - F) Y Fiducia nei sindacati (S - N)
Esempio 2 … controllato per la variabile interveniente I condizione occupazionale (occupato/non occupato) I X Y Z Condizione occupazionale (O - D)
Esempio 2 Effetto bivariato XY = Effetto diretto + Effetto indiretto dyx = c+ a*b I a b X Y c
Esempio 2 N=1000
Esempio 2 dyx Effetto bivariato: genere e fiducia nei sindacati In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità. dyx equivale alla differenza di probabilità sull’avere fiducia nei sindacati dato l’essere femmina piuttosto che maschio.
Esempio 2 dyx Effetto bivariato: genere e fiducia nei sindacati Pr (Y=1 | X=2) – Pr (Y=1 | X=1) Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x) La categoria di riferimento è la “SI” (Y=1). dyx = 0,233 - 0,317 = -0,084
Esempio 2 dyx = 0,233 - 0,317 = -0,084 La relazione tra genere (essere femmina piuttosto che maschio) e fiducia nei sindacati (“si” piuttosto che “no”) è negativa.
Esempio 2 OCCUPATI I=1 Ni=1=750 NON OCCUPATI I=2 Ni=2=250
Esempio 2 Effetti condizionati di I Considerando I, troviamo diversi effetti di X su Y. dyx|i=1 = 0,308 - 0,339 = -0,031 dyx|i=2 = 0,095 -0,125 = -0,030
Esempio 2 Effetto diretto c a parità di I Considerando che le numerosità in I nella condizione occupazionale sono diverse, occorre ponderare gli effetti condizionati. Occupati= 750/1000 = 0,750 quota occupati (qo) Non occupati= 250/1000 = 0,250 quota non occupati (1-qo) dyx.i = (-0,031*0,750) + (-0,030*0,250) = -0,031
Esempio 2 Effetto bivariato XY = Effetto diretto + Effetto indiretto dyx = c+ a*b -0,084 = -0,031 + Effetto indiretto Effetto indiretto = -0,084 - (-0,031) = -0,053 I a b X Y c
Esempio 2 L’effetto indiretto della variabile I (occupazione) è circa due terzi (-0,053 di -0,084) dell’effetto complessivo tra genere e fiducia nei sindacati. Ciò significa che la tendenza a mostrare sfiducia nei sindacati da parte delle femmine è dovuta in buona parte alla condizione occupazionale. a*b = -0,053 I -0,084 X Y X Y c = -0,031
SCOMPOSIZIONE degli effetti Le correlazioni
Ipotizziamo che la variabile Z influenzi la relazione tra Y e X. Come misurare l’effetto di X su Y al netto di Z ? Z X Y X Y
Correlazioni tra le variabili: Matrice di correlazione, r.. osservati Z X Y
E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo costante” Z:
Coefficiente di correlazione parziale tra X e Y “tenendo costante” Z: Correlazione lorda Correlazione di Z su X e Y Misura quanto Z spiega di X eY Più la Z spiega X eY, più grande è il denominatore Residui di Z-X e Z-Y
E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo costante” Z: Matrice di correlazione, r.. osservati Z X Y
La correlazione tra X e Y tenendo sotto controllo Z diventa praticamente nulla. Z X Y
Correlazioni fra tre variabili Calcolare la correlazione parziale tra anni di scolarità e reddito
SCOMPOSIZIONE degli effetti Regressione e correlazione
X1 Y X2 Ipotizziamo un’antecedenza (lineare) causale:
La regressione trivariata La covariazione tra le variabili indipendenti X e la dipendente Y può essere ricostruita attraverso una figura complessa chiamata iperpiano. La regressione stima i valori dei parametri a e b che minimizzano i valori osservati e quelli predetti che costituiscono l’iperpiano. Più tecnicamente la regressione minimizza la somma degli errori di predizione al quadrato.