Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně)

UK FHS Historická sociologie, Řízení a supervize (ZS 2012, 2013, 2014) Analýza kvantitativních dat I. (II.)Popisné statistiky v grafech 2.(třídění 2. a 3. stupně) Jiří Šafrjiri.safr(zavináč)seznam.cz posledníaktualizace 13. 4. 2014

Nejprve připomenutí:Grafy třídění 1. a 2.stupně

Sloupcový graf (Barchart) pro třídění 1. stupně v rámci příkazu Frequencies (pouze pro 1. stupeň) FREQUENCIES q14b /BARCHART = PERCENT. nebo přes zadání grafu (zde lze i třídění 2 a vyššího stupně) GRAPH /BAR(SIMPLE)=PCT BY q14b .

2.st.: Vstupní data grafu → kontingenční tabulka • Stále platí pravidlo o orientaci procent: Sloupcová %, pokud závislá proměnná je v řádcích a nezávislá ve sloupcích.(nebo obráceně: řádková % a závislá se sloupcích a v řádcích nezávislá) • Pozor, SPSS umí sloupcový graf rovnou v rámci příkazu CROSSTABS, ale pouze pro absolutní četnosti (my chceme %). CROSSTABSq14b BY s30/cel col /BARCHART.

Barchart pro třídění 2.stupněPříklad: Zájem o politiku podle pohlaví Nezávislá proměnná Součet v kategoriích = 100 % Raději si vždy zkontrolujte, zda součet %, tj. typ/orientace % je správně, buď vložením hodnot nebo pomocí CROSSTABS. Závislá proměnná Zdroj: ISSP 2007

Syntax: sloupcový graf třídění 2. stupně Příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají Chart Builder a Interactive, které je v podstatě možné zadávat pouze klikáním přes okna) Vycházíme ze základního zadání třídění 1. stupně: GRAPH /BAR(SIMPLE)=PCT BY vekkat. Přidat lze rozdělení do klastrů-rozdělených sloupců např. podle pohlaví (s30) GRAPH /BAR(SIMPLE)=PCT BY q14bBY s30. Pozor ale na orientaci procent (sloupcová vs. řádková) ! Frequency of cases in each category expressed as a percentage of the whole. Parametr: COUNT → absolutní četnosti, PCT → procenta

Grafytřídění 3. stupně

Grafy třídění 3.stupně: Závislá proměnná kardinální • Problém není pokud je závislá proměnná kardinální (číselná), pak ukazujeme průměry v pod / pod skupinách (2. a 3. kategoriální proměnné). GRAPH/BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30. GRAPH /ERRORBAR(CI 95)=prijem BY vzd4 BY s30.

Grafy třídění 3.stupně: Závislá proměnná kardinální • Pokud je jedna vysvětlující proměnná ordinální (na ose X), pak lze i liniový graf, který vyjadřuje trendy v podskupinách. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30 /INTERVAL CI(95.0).

Grafy třídění 3.stupně: Závislá proměnná kardinální GRAPH/BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30.

Jak v SPSS do grafu dostat třídění 3. stupně (pro %)?

Grafy třídění3.stupně: Závislá proměnná je kategoriální • Situace je komplikovanější, pokud všechny tři proměnné jsou kategoriální (tj. včetně závislé) • S výhodou můžeme využít podobný princip jako pokud bychom měli kardinální proměnnou a ukazovali průměry v podskupinách. → závislou proměnnou nejprve rekódujeme na dichotomii a pak ukazujeme % pro jednu – „pozitivní“ kategorii resp. pravděpodobnost (což je vlastně průměr z dichotomie 0/1). Alternativně lze v BARCHARTu (u ordinálních znaků) nechat zobrazit % nad/pod určitou hodnotou • Jenže to jde pouze tam, kde lze závislou proměnnou vyjádřit dichotomií (tedy tam kde lze kategorie slučovat, většinou, pokud je ordinální).

Vstupní data = konting. tabulka třídění 3.stupně. Závislá p. dichotomická: ne/zájem o politiku Jaký rozdíl v zájmu o politiku mezi muži a ženami uvnitř vzdělanostních kategoriích? → zájem o politiku (rekód na zájem/nezájem) podle pohlaví při kontrole vlivu vzdělání Nejprve je třeba závislou proměnnou rekódovat na dichotomii (zde zájem/nezájem o politiku) GRAPH /BAR(GROUPED)=PGT(0)(ZajPolit) BY s30 BY vzd3. a odpovídající konting.tabulka:CROSSTABS ZajPolit BY s30 BY vzd3/cel col.

Graf pro závislou proměnnou (v %) a 2 vysvětlující GRAPH/BAR(GROUPED)=PGT(0)(readEnj1) BYEgp3ROBYEU_3kat. • Funguje ale pouze pro dichotomickou závislou proměnnou, zde Čte pro radost kódovanou (0=nečte/ 1=čte)→ ukazujeme podíl s hodnotou vyšší než 0 → PGT(0). → zobrazí procento případů s hodnotou vyšší než 0. • Nebo obráceně pro „ne-čtenáře“ PLT(1)→ zobrazí procento případů s hodnotou nižší než 1.

Graf se závislou a 2 vysvětlujícími proměnnými Čtení pro radost (denně) u patnáctiletých žáků podle sociální třídy rodičů v evropských zemích. PISA 2009.

Sloupcový graf (%) pro závislou a2 nezávislé proměnné. Názory rodičů na důležitost dalšího studia po maturitěpodle vzdělání rodičů a typu studia, ČR 2003, procenta souhlasu Zdroj: PISA 2003; N = min 3468

To samé pomocí Chart Builder * Chart Builder. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=skoly COUNT()[name="COUNT"] PA1_Vzd3[LEVEL=ORDINAL] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: skoly=col(source(s), name("skoly"), unit.category()) DATA: COUNT=col(source(s), name("COUNT")) DATA: PA1_Vzd3=col(source(s), name("PA1_Vzd3"), unit.category()) COORD: rect(dim(1,2), cluster(3,0)) GUIDE: axis(dim(3), label("Školy")) GUIDE: axis(dim(2), label("Percent")) GUIDE: legend(aesthetic(aesthetic.color.interior), label("Vzdělanostní aspirace žáků (dle ", "profese 1, přímý kód)")) SCALE: cat(dim(3), include("1", "2", "3", "4")) SCALE: linear(dim(2), include(0)) SCALE: cat(aesthetic(aesthetic.color.interior), include("1", "2", "3")) SCALE: cat(dim(1), include("1", "2", "3")) ELEMENT: interval(position(summary.percent(PA1_Vzd3*COUNT*skoly, base.coordinate(dim(3)))), color.interior(PA1_Vzd3), shape.interior(shape.square)) END GPL.

3D graf & panely: závislá proměnná a 3 nezávislé Aspirace patnáctiletých na studium na VŠ podle aspirací rodičů a jejich vzdělání, studenti ZŠ a VG, ČR 2003, procenta Zdroj: PISA 2003

Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. Zdroj: PISA 2007

Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=vekkat[LEVEL=nominal] vzd4[LEVEL=ordinal] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Heat Map"[LOCATION=LOCAL] MAPPING( "color"="prijem"[DATASET="graphdataset"] "rows"="vekkat"[DATASET="graphdataset"] "columns"="vzd4"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="Heat Map: vzd4-vekkat-prijem" DEFAULTTEMPLATE=NO.

3 D-density: vztah dvou číselných proměnných GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=isei[LEVEL=ratio] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="3-D Density"[LOCATION=LOCAL] MAPPING( "z"="prijem"[DATASET="graphdataset"] "x"="isei"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="3-D Density: prijem-isei" DEFAULTTEMPLATE=NO.

Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně)

Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně)

Presentation Transcript

painful anal conditions

Benign Anal and Colonic Disorders

Statistické zpracování dat RNDr. Eva Reiterová, Ph.D.

TREATMENT OF ANAL FISSURES

Anal Sphincter Exercises and Correct Defaecation

ANAL FISSURE

Fistulotomy and Setons

Brisinda G et al . (2004) Treating chronic anal fissure with botulinum neurotoxin

Tahapan perkembangan Psikoseksual menurut Freud

Anal Fissure What? When? Why?

HPV-Related Disease: Separating Fact From Fiction

What’s New from Down Under

Řešení úloh ze statistiky

Korpusová lingvistika ( 4 ) Základy korpusové statistiky

Tassapong Raiyawa, MD.

Něco pro gurmány aneb statistiky á la Verde

Srovnání reality a „statistiky“ v odměňování českého lékaře

Základy statistiky

Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz

Ohlédnutí za rokem 2005

Základy Statistiky

Úvod do pravděpodobnosti a statistiky