E N D
”…most current practices in quantitative data analysis in sociology do a very poor job of integrating theory and research. There has been an enormous progress in what we can do with data … Nevertheless, quantitative sociology remains very theory poor. In fact, the mainstream has regressed rather than progressed. Quantitative sociology is now less theoretically informed and less relevant for theoretical progress than it was three decades ago” • Aage B. Sørensen 1998, s. 238 • Noget af det der er gået galt: • Tankeløs anvendelse af komplekse statistiske teknikker • Fokus på at forklare variation i den afhængige variabel og ikke på at forstå sammenhænge
Specifikation af en sammenhæng Pct. that chooses freedom of speech as most important goal
Hvad kendetegner et godt redskab til analyse af samfundsvidenskabelige data? • det skal kunne håndtere nominelle og ordinale data • det skal kunne håndtere såvel kausale som symmetriske sammenhænge • det skal være let at forstå • (inspireret af Davis 1983)
Det skal kunne håndtere nominelle og ordinale data fordi det er næsten de eneste vi har i samfundsvidenskaberne • Datatyper • Nominelle: ingen mulighed for rangorden • Fx regioner, stilling • Ordinale: rangorden, men ingen information om afstand mellem kategorier • Fx meget enig, enig, hverken eller uenig, meget uenig • Interval: lige stor afstand mellem kategorier (ratio: interval med nulpunkt) • Fx alder (men i tolkningen vil det ofte være ordinale data: fx livsfaser) • Aritmetiske beregninger (gange, dividere) er uvenner med nominelle eller ordinale data
det skal kunne håndtere såvel kausale som symmetriske sammenhænge, for det er ofte svært at fastslå årsagssammenhæng i samfundsvidenskaberne • Kausalitet og forklaring • Meget sjældent eksperimenter, men teorier om sandsynligheder • Y x symmetriske (tillid til politiet tillid til domstole) • Y x Partivalg højre-venstreorientering
det skal kunne håndtere nominelle og ordinale data • det skal kunne håndtere såvel kausale som symmetriske sammenhænge • det skal være let at forstå • Alle tre kriterier er opfyldt med krydstabeller, men hvis man vil lave mere omfattende analyser (ud over tre-fire variable), bliver det uoverskueligt og derfor uforståeligt
DIGRAM program • En cykel med hjælpemotor • Cyklen: (Durkheim), Lazarsfeld, Rosenberg, (Davis, Hellevik, Aneshensel … ) • Hjælpemotoren: systematisering, estimationer og ikke faktiske tal, separationstesen, computerkraft • Fordele • Kategorielle, ordinale data • Alle variabler inde i modellen fra start • Symmetriske og asymmetriske relationer • Mulighed for flere afhængige variable • Visuelt • Let at forstå, let at bruge??
Analyse Valg af variable Opstille en model (antagelser om sammenhænge) Symmetriske eller asymmetriske relationer Tre variable (valg af 3. variabel og dens placering) Fire og mange flere variable (følger samme principper) Før du gå i gang med den egentlige modelanalyse Deskriptive analyser af data En variabel: beskrive fordelinger To variable: sammenhænge
Beskrivelse af variable Gennemsnit: tage bil 1,16; Sort arbejde: 3,80; Aktiv dødshjælp 6,81
To variable • symmetri: gensidig påvirkning. Den ene har ikke indflydelse på den anden • asymmetri: den ene påvirker den anden, men det omvendte er ikke tilfældet
Symmetriske relationer Typer • funktionel gensidig afhængighed (hvor der er trapper er der også elevatorer. Den ene er ikke årsag til den anden, men begge er funktionelle i høje huse) • Kausaliteten kan gå begge veje (børnetal og beskæftigelse) • I nogle tilfælde kan det måske være alternative indikatorer på samme begreb. Fx forskellige former for tro. I så fald muliggør det skalakonstruktion eller klassifikationer. • De to variable kan være dele af et kompleks. Fx folk der spiser stegt flæsk, lytter også til ABBA. Benyt fx korrespondanceanalyse. (men der kan også være en fælles årsag – kulturel kapital)
(2) Kausaliteten går veje Eksempel: børnetal og beskæftigelse for kvinder (Hypotetisk fordeling) (Davis eksempel: Desværre ser det ikke ud til at eksemplet holder empirisk i Danmark, 2008) Bedre eksempler? Forklaringen går begge veje Fuld tid -> få børn Mange børn -> deltid
Symmetriske relationer(3) alternative indikatorer på samme begreb Elementer i tro Pct af totalen Figur: kombinationer af de to variable y =,75; p= 0,000; n=1286
Symmetriske relationer(4) Et kompleks Læse romaner <-> gå i teateret Romanlæsning ofte Går i teateret sjældent sjældent ofte
Asymmetriske relationer Antagelse om kausalitet B kan påvirke A, men A kan ikke påvirke B A B Afhængig variabel (tro) Uafhængig variabel (køn)
Tabelopstilling: Den uafhængige variabel summeres til 100 pct.
Figurer: Den uafhængige variabel på x-aksen, den afhængige på y aksen
Antagelser om kausalitet • Variable med klare start og stop punkter. I så fald: y<- x hvis y er startet efter x er stoppet. Fx kirkegang som voksen <- religiøs opdragelse. • Sekvenser. y<- x hvis y følger efter x i en sekvens fx livscyklus holdninger til børns uddannelse <- holdninger til egen uddannelse; • Fikserede, relativt stabile tilstande y<- x hvis x er mere fikseret end y (hvis x ikke forandrer sig, men y gør) . A) helt fikseret Fx Holdning til abort <- køn B) ret stabilt fx kirkegang <- urbanisering; politiske holdninger <- religiøsitet (?) • Frugtbare variable (variable der kan forklare mange ting) påvirker mere begrænsede variable. Fx holdning til abort <- religiøsitet. • En ændring i x skal følges af en ændring i y (parforhold og lykke)
Tre variable Symmetriske klassifikation skala Asymmetriske Forklaringsformer
Tro på paradis er vigtig for at skelne mellem troende og ikke troende
Latent variabel Skala for kristentro? Antal ja-svar
Symmetriske. En latent variabel Konstruktion: spørgsmålsbatteriet Analyse en latent variabel
Asymmetriske relationer Fasthold den centrale (primære) sammenhæng /forskningsspørgsmålet Fastlæg rækkefølge mellem variablene
primær uafhængig variabel Afhængig variabel Tredje variabel x y z
primær uafhængig variabel Afhængig variabel Tredje variabel Valg af 3. variabel Teori Mindst en korrelation Placering i forhold til rekursiv struktur x y z
De to almindeligste 1) Mellemkommende variabel y z x Sammenhængen specificeres 2) Falsk korrelation Den oprindelige sammenhæng forsvinder / mindskes y x z
Rekursiv struktur skal fastlægges Mellemkommende variabel y z x Sammenhængen specificeres Falsk korrelation Den oprindelige sammenhæng forsvinder / mindskes y x z
1) Mellemkommende variabel y z x Sammenhængen specificeres (z) Teori: Zaller: ændring påvirkes af generelle holdninger Placering: holdning efter år Marginale sammenhænge Opposition går mere ind for ytringsfrihed Ingen ændring Ytringsfrihed politisk holdning år (1999,2008) (0,03) -.15 -.15 Flere går ind for ytringsfrihed
Stratificeres efter den variabel der specificerer sammenhængen Kun sammenhæng for regeringstro Tilslutning til ytringsfrihed vokser stærkt for de regeringstro, men den ændrer sig ikke for oppositionen. Tolkning: Framing af spørgsmålet om ytringsfrihed
Som figur (den primære relation opdelt på den mellemkommende variabel)
2) Falsk korrelation Den primære sammenhæng: teori: Heelas/woodhead Tro på liv efter døden Sus-uddannelse 0.23
2) Falsk korrelation Introduktion af 3. variabel får sammenhængen til at forsvinde 3. variabel skal være årsag til (kunne forklare, komme før i den rekursive struktur) til begge de to andre variable + være teoretisk relevant, her kønsteori. Den primære sammenhæng Tro på liv efter døden Sus-uddannelse køn 0,72 0.23 0.38 Kvinder vælger sus-uddannelser, kvinder er mere religiøse; sammenhængen mellem sus og tro forsvinder, når man kontrollerer for køn (den primære sammenhæng gøres betinget af en 3. variabel)
Falsk korrelation?? Marginalt Gamma: 0.23, p= 0,001
Eksemplet i Svends bog (12.2) Boligkvalitet Arbejde Kohorteår Kohorteår medfører at den oprindelige sammenhæng mellem boligkvalitet og arbejde forsvinder
c) To primære sammenhænge, ingen sammenhæng mellem de uafhængige variable. Forklare variationen i y Uafhængig variabel x1 Afhængig variabel y Uafhængig variabel x2
c) To primære sammenhænge, ingen sammenhæng mellem de uafhængige variable. Forklare variationen i y Uafhængig variabel x1 urbanisering -.23 Afhængig variabel y gudstro Uafhængig variabel x2 køn -.31
Pct. der siger at de tror på Gud fordelt på køn og urbanisering. 2008.
d) To primære sammenhænge, afhængige variable på samme niveau. Forklare sammenhængen mellem y1 og y2 Afhængig variabel y1 Uafhængig variabel x Afhængig variabel y2