1 / 59

Design kvantitativního výzkumu

UK FHS Historická sociologie, (LS 2010+). Design kvantitativního výzkumu. 2. Část Kauzalita, model vztahů; proměnné; problémy dotazování, konstrukce dotazníku (poslední aktualizace 9.9.2011 ) Jiří Šafr jiri.safr(at)seznam.cz. Struktura. Kauzalita Proměnné

okalani
Download Presentation

Design kvantitativního výzkumu

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UK FHS Historická sociologie, (LS 2010+) Design kvantitativního výzkumu 2. Část Kauzalita, model vztahů; proměnné; problémy dotazování, konstrukce dotazníku (poslední aktualizace 9.9.2011) Jiří Šafr jiri.safr(at)seznam.cz

  2. Struktura • Kauzalita • Proměnné • Model vztahů, úrovně analýzy, ecological fallacy • Dotazník: konstrukce a uspořádání • Problémy dotazování • Chybně formulované otázky • Terénní výzkum • Etika výzkumu DKV část 2

  3. Kauzalita Hledání příčin v sociálních vědách

  4. Sociální vědy Příčina → následek ? DKV část 2

  5. Korelace a kauzalita Kauzalita = příčinnost, vzájemná příčinná souvislosti mezi jevy Korelace = vzájemný vztah, souvislost, statistická závislost Pozor, sama o sobě nevyjadřuje směr vztahů! (příklad: marihuana a škola) DKV část 2

  6. 3 kritéria kauzality (P. F. Lazarsfeld) Většina sociálních vědců považuje dvě proměnné za kauzálně související, tj. jedna způsobuje druhou pokud: DKV část 2

  7. 3 kritéria kauzality • příčina časově předchází následek, • existuje mezi nimi empirická korelace (souběžné změny u obou proměnných), • tento vztah není výsledkem působení jiné třetí proměnné na obě původně pozorované proměnné. Pouze pokud jsou všechny tyto kriteria splněna platí kauzální vztah, jiná kritéria neexistují. [Babbie 1995: 71] DKV část 2

  8. Neadekvátní kriteria kauzality • Dokonalá korelace není kritériem kauzality. „Výjimky sice nepotvrzují pravidlo, ale ani ho bezpodmínečně nepopírají.“ • V pravděpodobnostních modelech existují v podstatě vždy výjimky z předpokládaného modelu. DKV část 2

  9. Dva typy příčin v pravděpodobnostních modelech • bezpodmínečně nutná příčina podmínka, která musí být přítomna pro následek, který přijde. • dostatečná příčina podmínka která, pokud je přítomna, bude dostatečně zajišťovat vliv, který uvažujeme. DKV část 2

  10. DKV část 2

  11. DKV část 2

  12. Korelace – nepravá příčina • Unique Prediction and Partial Correlation. • One would probably find a significant negative correlation between hair length and height in the population (i.e., short people have longer hair). At first this may seem odd; however, if we were to add the variable Gender into the multiple regression equation, this correlation would probably disappear. This is because women, on the average, have longer hair than men; they also are shorter on the average than men. Thus, after we remove this gender difference by entering Gender into the equation, the relationship between hair length and height disappearsbecause hair length does not make any unique contribution to the prediction of height, above and beyond what it shares in the prediction with variable Gender. Put another way, after controlling for the variable Gender, the partial correlation between hair length and height is zero. DKV část 2

  13. Nástrahy v dedukci kauzality • Provincionalismus • Ukvapené závěry • Potlačený důkaz • Falešné dilema DKV část 2

  14. K logice závěrů pomocí empirického výzkumu – reprezentativního výběrového šetření V kvantitativním výzkumu (a nejen sociologickém): • Nesledujeme jevy přímo ale pomocí zástupného indikátoru - „proměnné (znak)“.V nashromážděných datech popisujeme naměřené hodnoty znaku a nebo hledáme/ověřujeme vztahy mezi více proměnnými • To, že pracujeme s proměnnými nám přináší problémy a omezení:1. měření bývá „nepřesné“ z hlediska stavu skutečného jevu (problém validity), mimořádný problém to pak je u zjišťování názorů a postojů → pečlivá operacionalizace(postup jak budeme znaky měřit, zde navíc limitováni pouze na odpovědi zjistitelné skrze dotazník) • 2. nemůžeme podchytit a změřit všechny jevy mající potenciální vliv (komplexnost sociální reality) → redukovanýmodel vztahů. • Vždy jde o hromadné jevy („vysoká“ četnost ve „velké populaci“), tedy nikoliv o jednotlivé případy. • Pravděpodobnostní charakter našich empirických závěrů pak znamená, že s výjimkou kdy máme informace o celé populaci (cenzus), naše závěry učiněné na výběru-vzorku z populace platí s nějakou přijatelnou chybou pro celou populaci, tj. pouze pro tu, ze které jsme prováděli náš výběr (čas, teritorium, sociální skladba). DKV část 2

  15. Závěry týkající se kauzálního působení na základě výběrového „dotazníkového“ šetření Pokud chceme sledovat kauzální vliv A → B, pak: - Měříme A a B nezávisle na sobě (v případě dotazníku minimálně dvěma samostatnými otázkami). - V analýze sledujeme, jak se mění hodnoty znaku A podél hodnot znaku B. - Chceme-li více než konstatovat souslednost (korelaci) musíme si být jisti, že hodnoty A časově předcházely hodnotám B. Správně bychom tedy měli nejprve měřit hodnoty A v čase T1, a pak v čase T2 hodnoty B (nebo v sub-populacích, které byly a nebyly vystaveny vlivu A). Proto potřebujeme měřit (pozorovat či se dotazovat) v čase. Jistým řešením je sice „retrospektivní“ dotazování, ale to má své limity (značně nereliabilní a nevalidní). - Statistickými postupy pak odhalujeme či kontrolujeme vliv možných dalších proměnných (ty mohou vztah A → B zprostředkovávat/ potlačovat či jinak modifikovat). K tomu ovšem potřebujeme tyto další proměnné mít naměřeny v datech → již ve fázi přípravy výzkumu je musíme znát! → napomůže dobrý model vztahů na základě teorie. • Průřezový, tzv.Cross-sectional design výzkumusleduje populaci pouze v jednom časovém bodě. V principu tak můžeme zkoumat pouze rozdíly mezi případy/skupinami bez ohledu na jejich proměnu v čase. • Pro adekvátní posouzení kauzality je proto vhodný longitudinální panelový design, v němž sledujeme stejné respondenty/případy v čase (→ longitudinální data, časové řady). • Retrospektivní dotazování na situaci v minulosti (v rámci cross-sectional) je většinou nespolehlivé či zcela irelevantní (u názorů, postojů, hodnocení). DKV část 2

  16. Možnosti a omezení kauzálního usuzování na základě výběrového „dotazníkového“ šetření průřezového (cross-sectional) typu Nikdy se tedy neptáme v dotazníku v duchu „příčina-následek“jako např.: „Ovlivnilo vzdělání Vašeho otce stupeň vzdělání, kterého jste dosáhl/a?“ Například se ale můžeme v dotazníkovém šetření cross-sectional typu retrospektivně zeptat, jaké bylo vzdělání otce respondenta (čas T1) a sledovat, zda a jak souvisí s dosaženým vzděláním respondenta-potomka (čas T2). Vyloučíme-li ostatní vlivy, tj. kontrolujeme-li jejich vliv v analýze či v samotném designu výběrového vzorku, (např. ve městech byla úroveň vzdělání otců vyšší a proto tam pravděpodobně bude i více vzdělaných synů/dcer; zde lze mj. uplatnit stratifikovaný výběr: strata rozdělující populaci na 1.-města, 2- vesnice) můžeme usuzovat do jaké míry v dané populaci ovlivnilo vzdělání otců vzdělání jejich potomků. Ale i tak jsme nevyloučili další zprostředkující vlivy úzce spjaté se vzděláním rodiče jako např. hodnoty, výchovné přístupy, výběr základní školy atd. A navíc se musíme spolehnout na to, že údaj získaný z výpovědi syna/dcery v době jejich dospělosti o vzdělání otce je pravdivý a přesný (čemuž překvapivě ani v případě vzdělání tak být nemusí). A to si představte, že by nás zajímal vliv ekonomického kapitálu rodiny původu = příjmu rodičů! Závěry týkající se kauzálního působení učiněné na základě průřezových dat (cross-sectional) jsou vždy jen nepřímé. DKV část 2

  17. Krátká vsuvka, pro ty kdo to zatím nepochopili Princip ověřování hypotéz aneb Co je vlastně ta „korelace“ a proč se nesmím ptát respondentů „přímo na hypotézu“.

  18. Princip ověřování hypotéz druhého řádu (o vztahu proměnných A a B) 1. naměřím odděleně znak A a znak B, například pomocí dvou otázek v dotazníku • Pozor. Tyto znaky musí být provázány, tj. u každého případu (respondenta) musím mít v datovém souboru jedinečnou hodnotu A a B. 2. sleduji zda a jak spolu hodnoty A a B souvisí. Což mohu buď v grafu, tabulce nebo pomocí korelačního koeficientu (obecně koeficientu měřícího asociaci). A teď si to ukážeme na následujícím příkladu: DKV část 2

  19. Data a ověření vztahu 2 proměnných: „Sledování televize a věk“ (hypotetický příklad) • Výzkumná otázka: Souvisí sledování televize s věkem? • Hypotéza: S věkem roste doba strávená před televizní obrazovkou.Nebo také Častěji sledují televizi starší lidé. • Operacionalizace (znaků): A: Sledování televize = počet hodin u televize za běžný den v pracovním týdnu. Měřené pomocí otázky v dotazníkovém šetření (Peoplemetry nemáme  ): Kolik času celkově strávíte během průměrného všedního dne sledováním televize? B: Věk= (rok narození – rok výzkumu) Měřené pomocí otázky v dotazníkovém šetření: V kterém roce jste se narodil/a ? Pochopitelně bychom se mohli zeptat „Kolik je vám let?“, ale na tomto přístupu lépe vidíte princip operacionalizace. DKV část 2

  20. Naše data (datový soubor) kde máme proměnné: A – Věk B – Sledování TV (v hodinách za den) Obě naměřené pro každého respondenta zvlášť Vztah ověříme pomocí bodového X-Y grafu V něm zakreslíme hodnoty A a B pro každého respondenta Pouhým pohledem vidíme vzájemný vztah mezi hodnotami A a B. A to je ta korelace vyjádřená sklonem přímky mezi body (zde r =0,89). Platí, že čím starší je člověk, tím více se dívá na televizi. Našli jsme tedy poměrně silnou evidenci pro naši hypotézu. (ale pozor, takto jednoduché to v realitě není! O tom více v AKD I. a II.) Data a ověření vztahu 2 proměnných(hypotetický příklad) A jak se dozvíme v další části jde o znaky „kardinální“ tedy vyjádřitelné čísly. Existují také znaky povýtce kvalitativní, říkáme jim „nominální“, zde např. pohlaví) DKV část 2

  21. Měření jevů a kauzalita KATASTROFOU je „přímé ptaní se“ respondenta na příčinu a následek! Otázka proč (zejména u motivace) do dotazníku nepatří. Odpověď musí badatel hledat sám (ve svém modelu vztahů) a ne ptát se na ní rovnou respondenta. → Naměřit hodnoty znaků odděleně a pak hledat vztahy mezi nimi.(viz předchozí příklad Sledování TV a věk) DKV část 2

  22. Měření jevů a kauzalita – proč to není v sociálních vědách jednoduché Problém příčiny a následku: • Temporalita některých jevů a vliv diskurzu v médiích (např. volební preference, „nálada na pracovišti“ po pracovním úraze) • Výjimku tvoří „logické“ příčiny (znalost mimo naše data), např. vzdělání → příjem, pohlaví → používání rtěnky, ale důvěra v druhé lidi ↔ důvěra v instituce? Řešením je ideálně experimentální design, a nebo částečně: • Opakování měření (longitudinální design), pokud byl vliv nezávislé proměnné. • Retrospektivní dotazování je problematické. Lze pouze u objektivních a pamatovatelných indikátorů (např. vzdělání rodičů) • Silná teorie, podpořená předešlými empirickými důkazy DKV část 2

  23. Proměnné

  24. Znak – proměnná • měřitelný pojem se dvěma nebo více hodnotami • symbolické vyjádření vlastností DKV část 2

  25. Znaky musí splňovat podmínky: • Rozlišitelnost - min. 2 hodnoty, • Úplnost - ke každému stavu existuje hodnota • Jednoznačnost - dvě hodnoty nemohou odpovídat jednomu stavu vlastnosti DKV část 2

  26. Typy znaků – proměnných • Nominální • Pořadové (ordinální) • Intervalové DKV část 2

  27. DKV část 2

  28. Nominální znak • Kategorie jsou rovnocenné (na úrovni jmen) př.: pohlaví, jména, typ rodiny, barva vlasů, profese DKV část 2

  29. Pořadový (ordinální) znak • Kategorie lze seřadit do hierarchie • Lze se ptát: vyšší/nižší apod., ale ne o kolik př.: spokojenost, stupeň souhlasu DKV část 2

  30. Intervalový znak • číselné proměnné lze se ptát větší/ menší a o kolik př.: věk, příjem, počet dětí DKV část 2

  31. Dotazník konstrukce a uspořádání

  32. Dotazník? „Dotazník se v podmínkách postindustriální společnosti stává pomalu ale jistě nepoužitelným monstrem“. [Disman 1993: 87] • Co s tím? Vždy než začnete vymýšlet dotazník, ptejte se: • Nejsou již data k úloze co chci zkoumat pořízena někým jiným? • Je metoda dotazníku jedinou možnou technikou? • Obsahuje dotazník vše co potřebuji k zodpovězení RQ (hypotéz) a nic navíc, co by prodlužovalo dotazování? • Jak to udělat, aby dotazník respondenty „neobtěžoval“? DKV část 2

  33. Typy otázek • uzavřené (volba z nabízených odpovědí) • otevřené otázky (vlastní formulace) • polouzavřené (volba z nabízených odpovědí + možnost odpovědět volně) DKV část 2

  34. Příprava dotazníku 1. sestavíme seznam toho, co chceme vědět (dle přípravné fáze výzkumu) 2. první formulace otázek 3. otázky uspořádáme do bloků podle tématických okruhů DKV část 2

  35. Příprava dotazníku 4. upravíme hladké přechody mezi bloky otázek 5. doplníme identifikační otázky a úvodní oslovení 6. pilotáž dotazníku – ověření formulace otázek, srozumitelnost, kategorie odpovědí. DKV část 2

  36. Pravidla uspořádání dotazníku (dramaturgie sledu otázek) 1. záhlaví resp. první stránka: administrativní záležitosti (identifikační číslo) 2. úvodní část: nejprve širší snadné otázky, které musí respondenta zaujmout a získat jeho důvěru (otázky prolamující ledy) nezačínat demografickými charakteristikami DKV část 2

  37. Uspořádání dotazníku 3. střední část: méně zajímavé otázky 4. pozdější fáze dotazníku – únava respondenta: zajímavé otázky, změna formy dotazování (projektivní otázky, vizuální forma, sémantický diferenciál DKV část 2

  38. Uspořádání dotazníku 5. závěrečná fáze: může obsahovat citlivé nebo osobní dotazy, otevřené otázky 6. zcela na závěr: dotazy typu „zeptej se a uteč“ [Jeřábek 1993: 76] DKV část 2

  39. Problémy dotazování

  40. Pravidla pro uzavřené otázky 1. kategorie musí reprezentovat vyčerpávajícím způsobem všechny možné varianty odpovědí 2. všechny kategorie se musí vzájemně vylučovat, nesmí být možné zařadit se do více kategorií. DKV část 2

  41. Příklad Kolik kategorií bude mít otázka na respondentovo pohlaví? DKV část 2

  42. při větším výčtu redukujeme redundantní kategorie do „jiná odpověď“, nejlépe s žádostí o uvedení – vypsání možností DKV část 2

  43. Předběžné zavedení širokých kategorií je nebezpečné. Vždy lze redukovat sebraná data, ale obráceně to nejde. • rovnoměrnost pozitivních a negativních kategorií DKV část 2

  44. Chybně formulované otázky[Jeřábek 1993: 77-78; orig. podle Kaneová 1985] 1. Dvojitá „dvouhlavňová“ otázka (double-barrel question) – otázka vyžadující jednu odpověď o dvou nebo více věcech najednou. Jste šťasten ve svém manželství a práci? DKV část 2

  45. Chybně formulované otázky 2. Chybná nabídka odpovědí Vaše vlasy jsou žluté, purpurové, zelené nebo modré? DKV část 2

  46. Chybně formulované otázky 3. Zjišťuje všechno najednou Vyjmenujte prosím všechny místa, kde jste v posledních pěti letech pracoval, zastávané profese a funkce, váš plat a proč jste odešel/a. DKV část 2

  47. Chybně formulované otázky 4. Mlhavá otázka Chodíte často tančit? DKV část 2

  48. Chybně formulované otázky 5. Všeobjímající otázka Co si myslíte o Středním Východě? DKV část 2

  49. Chybně formulované otázky 6. Otázkav žargónu (hantýrce) Zdá se vám, že váš manžel má sebe-aktualizovanou autonomní strukturu osobnosti? DKV část 2

  50. Chybně formulované otázky 7. Hypotetická otázka Jaký druh vzdělání byste chtěl/a, aby mělo vaše dítě? DKV část 2

More Related