Analýza kvantitativních dat I. / Praktikum elementárního zpracování dat

UK FHS Historická sociologie, Řízení a supervize (LS 2014) Analýza kvantitativních dat I. /Praktikum elementárního zpracování dat Jak psát empirickou část odborného textu(např. seminární práce)Popisné statistiky a bivariátní vztahy Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 27/5/2014

K úpravě, formátování tabulek a psaní interpretací čtěte dokument Ukázky jak prezentovat tabulky a interpretovat vztahy proměnných http://metodykv.wz.cz/tabulky_intepretace_prezentace.pdf • K samotné konstrukci a interpretaci tabulek viz např. presentace: Kontingenční tabulky: Úvod. Třídění 2. stupně - analýza kategoriálních dat http://metodykv.wz.cz/spss2_tabulky.ppt Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz + ukázka interpretace výsledků http://metodykv.wz.cz/AKD1_mapa_bivaranalyz.ppt

Jak psát text z (kontingenčních) tabulek → interpretace a prezentace čísel v textu upraveno podle [Treiman 2009: 31-62], původně [Miller 2004]

Jak psát text z tabulek → interpretace čísel (1) • Tabulky popisujte především z hlediska věcného významu: čísla opisujte do textu jen pokud je třeba, aby bylo jasno, co/kde tabulka ukazuje. Pouhé opakování čísel z tabulky nestačí. Soustřeďte se na závěry „co čísla znamenají“. Smyslem je prezentovat a ověřovat myšlenky (hypotézy).Ale i tak musíte uvádět tolik čísel, aby se i nepoučený čtenář v tabulce zorientoval. Zdroj: upraveno podle [Treiman 2009: 31-62], původně [Miller 2004].

Jak psát text z tabulek → interpretace čísel (2) • Snažte se o jednoduchost. Popisujte data a formulujte závěry tak, aby tomu rozuměla i vaše babička. Nesrozumitelnost a zevrubnost není to samé. Opravdu elegantní vysvětlení jsou většinou jednoduchá. • Vyvarujte se frází, které nic neznamenají. Místo: „Nyní budeme zkoumat, jaký závěr lze učinit, zda A by mohlo mít nějaký efekt na B?“ → „Ovlivňuje A B?“ • Potlačte pasivní větné konstrukce. Místo: „Zjistilo se, že X souvisí s Y“ → „X souvisí s Y“ Místo: „Byla zkonstruována škála historického vědomí občanů ČR“ → „Zkonstruoval/a jsem škálu …“ nebo „Použil jsem škálu …“ • Vyvarujte se odborné hantýrky, pokud to nepomáhá porozumění textu. Pojmy-koncepty jsou tady od toho, aby precizovaly, standardizovaly a hlavně šetřily místo v textu (místo odstavce stačí slovo). Ale preferujte běžný jazyk, vždy tam, kde to funguje. Nadbytečné používání odborných termínů váš text neudělá vědečtější, jen odradíte čtenáře. Zdroj: upraveno podle [Treiman 2009: 31-62], původně [Miller 2004].

Jak psát text z tabulek → interpretace čísel (3) • Šetřete se zkratkami. Zkratky jsou výhodné v tabulkách (kde není moc místa), ale ušetření místa v textu za cenu zmateného čtenáře za to nestojí (ve zkratkách se vyžívají hlavně psychologové, ale pak se to špatně čte). • Rozhodněte se pro to, v jaké osobě budete psát. Nepoužívejte „My“, tam kde jde o „Já“. Píšete-li sami, pak v první osobě jednotného čísla. Lze ale psát „My“, pokud tím máte namysli sebe (autora) a čtenáře (např. „Jak vidíme v tabulce 1 …“). Psaní v prvním osobě není u nás vždy jediná možná varianta, ale postupně se stále více prosazuje. • Pojmy asociace a korelace popisují vztah mezi proměnnými (jako celky) nikoliv mezi konkrétními hodnotami. Tyto pojmy nepopisují jedno konkrétní políčko v tabulce (pro A x B). Odpovídající fráze je např.: „mezi A a B je pozitivní korelace“ nebo „pokud je vysoké A pak i B je vysoké“, „hodnoty A rostou s hodnotami B“, ale neplatí, tj. nepište: „mezi A a vysokými hodnotami B je korelace“.Také nikdy nepište: „A koreluje s B na 80 %“, protože toto je špatná interpretace korelačního koeficientu (když už tak, převeďte korelaci r (umocněním) na koeficient determinace r2 a poté jej můžete interpretovat jako podíl vysvětlené variance v hodnotách A na základě hodnot B). • Najděte si kolegu (zhruba na stejné odborné úrovni jako jste vy), se kterým si budete texty navzájem číst. Snažte se o zachování spravedlivé symetrie objemu/času čtení. Profitujete z toho jak jako autor tak i jako editor. Zdroj: upraveno podle [Treiman 2009: 31-62], původně [Miller 2004].

Sedm principů psaní „o číslech“ • Ustavte kontext pro čísla, která budete prezentovat tím, že specifikujete „Ws“ (Co/Kdo/Kde/Kdy?). • Zvolte adekvátní příklady a analogie. • Zvolte slovník (pojmy), které zavedete. Definujte synonyma pro koncepty, které budete užívat (a jen ty používejte v textu). Nahraďte matematicko-statistický slovník a symboly výrazy běžného jazyka srozumitelného pro netechnické čtenáře. • Rozhodněte se, zda čísla budete presentovat v tabulkách nebo grafech. Zamyslete se kolik času bude čtenář potřebovat na zpracování čísel → omezte ukazování čísel (opisování z tabulek do textu). Používejte krom čísel také slovní vyjádření (místo čísla s % lze slovně vyjádřené zlomky). • Uveďte čísla a interpretujte je v textu. Uveďte je a uveďte jejich význam a smysl. Interpretujte je a to ve vztahu k hlavnímu tématu. • Specifikujte směr a velikost asociace mezi proměnnými.Pokud je trend: roste/ klesá? Pokud rozdíly mezi skupinami/ místy: kdo má nejvyšší/ nejnižší hodnotu? • K popisu vztahu mezi mnoha čísly: sumarizujte celkový vzorec spíš než všechna jednotlivá čísla.Najděte nejlepší generalizaci pro data. Uveďte jí na příkladech čísel z tabulky grafu. A také, je-li, popište trend, který tomuto obecnému trenduneodpovídá (tj. výjimky z trendu/ vzorce asociace). Zdroj: [Miller 2005: 33]

Presentace tabulek s s popisnými statistikami(třídění prvního stupně) nejen pro závislou (vysvětlovanou) proměnnou

Popisné statistiky: jejich smysl a přiměřenost • V každém textu je třeba nejprve nějak popsat hodnoty (rozložení hodnot) proměnných, které budeme dále analyzovat bivariátně či vícerozměrně. • Děláme to vždy s maximální stručností a věcnou zacíleností: věnujeme se především závislé proměnné/ným, z nezávislých těm, které jsme sami konstruovali, či jsou jinak zajímavé/nesamozřejmé (např. nebudete u nezávislých proměnných popisovat, jaký je podíl věkových kategorií, ale můžete v textu zmínit jaký je podíl rodin s žádným, jedním a více dětmi) • Žádný text není možné zahltit nezáživným popisem populace a pak jen krátce řešit samotnou analýzu – výzkumné otázky/hypotézy. (To nemusí úplně platit pro výzkumnou zprávu, kde je detailní deskripce někdy podstatou.) • Deskriptivní popis (třídění prvního stupně, míry centrální tendence/variability atd.) lze spojit až s bivariátní analýzou. Tabulky s popisnými statistikami dáváme do přílohy. • Myslete vždy na čtenáře, aby váš text neodložil znuděn hned po přečtení prvních dvou-tří stránek. • Populaci/ výběrový soubor popisujte detailně pouze, pokud jde o váš vlastní výzkum, nebo nějakou specifickou populaci (nikdy nepopisujte na datech z celonárodního výzkumu např. kolik je mužů a žen, věkových skupin atd.)

Sdružená tabulka pro třídění 1. stupně • Pokud máme více proměnných se stejnými kategoriemi (např. baterie otázek), můžeme jejich četnosti presentovat v jedné sdružené tabulce. • V SPSS např. pomocí TABLES(starší jednodušší verze, stále funguje ale pouze přes syntax) nebo v novějších verzích CTABLES. Oboje vyžaduje specielní licenci. Alternativní řešení je několik FREQUENCIES a spojit pak dílčí tabulky v Excelu. TABLES /FTOTAL $t 'Celkem %‚ /FORMAT BLANK MISSING('.') /TABLES ( q3_a + q3_b + q3_c + q3_d ) BY (LABELS) + $t /STATISTICS CPCT ((F7.1) '%' ) /TITLE ="Jak moc baví dotázaného …". Zdroj: ISSP 2007, ČR

To samé pomocíCTABLES Zdroj: ISSP 2007, ČR * Custom Tables. CTABLES /VLABELS VARIABLES=q3_a q3_b q3_c q3_d DISPLAY=DEFAULT /TABLE q3_a [C][ROWPCT.COUNT PCT40.1, TOTALS[COUNT F40.0, ROWPCT.COUNT PCT40.1]] + q3_b [C][ROWPCT.COUNT PCT40.1, TOTALS[COUNT F40.0, ROWPCT.COUNT PCT40.1]] + q3_c [C][ROWPCT.COUNT PCT40.1, TOTALS[COUNT F40.0, ROWPCT.COUNT PCT40.1]] + q3_d [C][ROWPCT.COUNT PCT40.1, TOTALS[COUNT F40.0, ROWPCT.COUNT PCT40.1]] /SLABELS VISIBLE=NO /CLABELS ROWLABELS=OPPOSITE /CATEGORIES VARIABLES=q3_a q3_b q3_c q3_d ORDER=A KEY=VALUE EMPTY=INCLUDE TOTAL=YES POSITION=AFTER MISSING=EXCLUDE.

Popisné statistiky pro závislou i nezávislé proměnné Úsporný formát:základní tabulka třídění 1. stupně pro několik znaků dohromady.Máme zde počet platných případů,střední hodnotu(průměr), což nemusí být vždy adekvátní typu proměnné, směrodatnou odchylkua popis hodnot u kategoriálních znaků.Někdy se tato tabulka dává pouze do přílohy. Zdroj: [Katrňák 2006: 181]

Efektivní presentace tabulek • Jednou z možností je „sdružená“ kontingenční tabulka: Kombinované tabulky třídění 2. stupně pro několik nezávislých proměnných → bivariátní profil naší hlavní závislé proměnné(ých) • To se hodí zejména pro texty, kde musíme šetřit místem, jde o úspornou formu presentace.

Komplexní „profilová“ tabulka třídění 2. stupně (několik nezávislých znaků), pro dvě závislé proměnné Závislé proměnné jsou sice spojité-kardinální (dále analyzovány v OLS), zde ale pro přehlednost pouze % souhlasu a nesouhlasu. Nezávislé proměnné mají co nejmenší počet kategorií → přehlednost rozdílů. Alternativně by šlo ukazovat průměry závislé proměnné, ale takto máme z věcného hlediska mnohem lepší materiál k interpretaci. Vytvořeno v Excelu ze série kontingenčních tabulek z SPSS. V SPSS by bylo možno udělat celou tabulku pomocí modulu Tables. Zdroj: [Šafr, nepublikovaný rukopis]

Prezentace základních bivariátních vztahů Většinou máme jednu (či více) závislou-vysvětlovanou proměnnou a naše hlavní hypotézy (a v nich nezávislé znaky). Nejprve vztahy dané hypotézami můžeme sledovat jednoduše bivariátně.

Základní bivariátní vztahPříklad (oba znaky kategoriální-ordinální). závislá proměnná: vzdělanostní aspirace dítěte, nezávislá: aspirace rodičů Zdroj: [Katrňák 2006: 180]

Základní bivariátní vztahPříklad (oba znaky kategoriální: nominální a ordinální). závislá proměnná: způsob získání 1. pracovního místa, nezávislá: vzdělání Zdroj: [Hauberer, Šafr 2012: 58]

Základní bivariátní vztahPříklad: závislá proměnná(kardinální): Pro-čtenářské klima rodiny ve 2 dimenzích, nezávislá(kategoriální-ordinální): vzdělání Závislé proměnné jsou spojité-kardinální a standardizované na z-skóry, tj. mají stejnou metriku-rozsah (dále byly analyzovány v OLS). Pokud i nezávislá proměnná je kardinální, lze X-Y (scatterplot) graf, ale někdy je interpretačně zajímavější jednu z proměnných kategorizovat a pak ukazovat průměry v podskupinách. Zdroj: [Gorčíková, Šafr 2012: 75]

Pochopitelně jsou i jiné varianty kombinace znaků a možnosti prezentace Doplníme …

Jak psátempirickou část textu např. v seminární či diplomové práci

Jak začít – co napsat na úvod • Co je téma? Do jakého kontextu ho zasazujete? • Proč má smysl zabývat se právě tímto tématem? • Na co navazujete? Co je vaše inovace? • Pokud se tím někdo zabýval před vámi, k čemu došel? (konkrétní výsledky a jejich zobecnění, ne biografie-medailony autorů)

Postup jak (začít) psát … • 1. závislá proměnná(é) • s ní si vyhrajte, nepůjde již v hotovém textu měnit • Koncept/operacionalizace/jednotky/ rekódování, deskripce (variance, rozložení,…), zakotvení (porovnání s výsledky jiných výzkumů)

Postup jak (začít) psát … • Rozpracovat si projekt (diplomovou práci) na otázky • Podle těchto otázek udělat (pod)kapitoly (v 1. kroku stačí nadpisy + anotace) • otázky by měly být stupňovitě do sebe zapadající (→ co je třeba vyřešit nejdříve, co nelze bez jiného předchozího kroku, co naopak ano a co tedy lze odložit na později … ?)

Analýza kvantitativních dat I. / Praktikum elementárního zpracování dat

Analýza kvantitativních dat I. / Praktikum elementárního zpracování dat

Presentation Transcript

Evidence Based Evaluation of Anal Dysplasia Screening : Ready for Prime Time?

روش عناصر محدود Finite Element Procedures

Trace element characteristics of lavas from destructive plate boundaries.

Praktikum z elektrotechniky

ELEMENTLER

Java supports arrays An array is a collection of elements where each element is the same type. Element type can be primi

C3 – Chemicals in Our Lives

Defining the Atom

Indentify Your Elements

Element Symbol Practice

Warm-up: 1. What is an element? 2. What is a compound?

- an essential trace element

History of Finite Element Analysis

Praktikum Mikrobiologi Makanan

Properties of Carbon Element

PRAKTIKUM : MENGHITUNG KANDUNGAN ZAT GIZI PANGAN DAN KONSUMSI PANGAN

Chapter 5.7

LAPORAN RESMI PRAKTIKUM K I MIA DASAR 1

Praktikum Urin

Chapter 3 – Atoms and the Periodic Table

Section 3: Implementation of Finite Element Analysis – the Constant Strain Triangle

Priority Queues