1 / 21

Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně)

UK FHS Historická sociologie, Řízení a supervize (ZS 2012 , 2013, 2014 ). Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně). Jiří Šafr jiri.safr(zavináč)seznam.cz. poslední aktualizace 13. 4. 2014. Nejprve připomenutí: Grafy třídění 1. a 2.stupně.

delta
Download Presentation

Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UK FHS Historická sociologie, Řízení a supervize (ZS 2012, 2013, 2014) Analýza kvantitativních dat I. (II.)Popisné statistiky v grafech 2.(třídění 2. a 3. stupně) Jiří Šafrjiri.safr(zavináč)seznam.cz posledníaktualizace 13. 4. 2014

  2. Nejprve připomenutí:Grafy třídění 1. a 2.stupně

  3. Sloupcový graf (Barchart) pro třídění 1. stupně v rámci příkazu Frequencies (pouze pro 1. stupeň) FREQUENCIES q14b /BARCHART = PERCENT. nebo přes zadání grafu (zde lze i třídění 2 a vyššího stupně) GRAPH /BAR(SIMPLE)=PCT BY q14b .

  4. 2.st.: Vstupní data grafu → kontingenční tabulka • Stále platí pravidlo o orientaci procent: Sloupcová %, pokud závislá proměnná je v řádcích a nezávislá ve sloupcích.(nebo obráceně: řádková % a závislá se sloupcích a v řádcích nezávislá) • Pozor, SPSS umí sloupcový graf rovnou v rámci příkazu CROSSTABS, ale pouze pro absolutní četnosti (my chceme %). CROSSTABSq14b BY s30/cel col /BARCHART.

  5. Barchart pro třídění 2.stupněPříklad: Zájem o politiku podle pohlaví Nezávislá proměnná Součet v kategoriích = 100 % Raději si vždy zkontrolujte, zda součet %, tj. typ/orientace % je správně, buď vložením hodnot nebo pomocí CROSSTABS. Závislá proměnná Zdroj: ISSP 2007

  6. Syntax: sloupcový graf třídění 2. stupně Příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají Chart Builder a Interactive, které je v podstatě možné zadávat pouze klikáním přes okna) Vycházíme ze základního zadání třídění 1. stupně: GRAPH /BAR(SIMPLE)=PCT BY vekkat. Přidat lze rozdělení do klastrů-rozdělených sloupců např. podle pohlaví (s30) GRAPH /BAR(SIMPLE)=PCT BY q14bBY s30. Pozor ale na orientaci procent (sloupcová vs. řádková) ! Frequency of cases in each category expressed as a percentage of the whole. Parametr: COUNT → absolutní četnosti, PCT → procenta

  7. Grafytřídění 3. stupně

  8. Grafy třídění 3.stupně: Závislá proměnná kardinální • Problém není pokud je závislá proměnná kardinální (číselná), pak ukazujeme průměry v pod / pod skupinách (2. a 3. kategoriální proměnné). GRAPH/BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30. GRAPH /ERRORBAR(CI 95)=prijem BY vzd4 BY s30.

  9. Grafy třídění 3.stupně: Závislá proměnná kardinální • Pokud je jedna vysvětlující proměnná ordinální (na ose X), pak lze i liniový graf, který vyjadřuje trendy v podskupinách. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30 /INTERVAL CI(95.0).

  10. Grafy třídění 3.stupně: Závislá proměnná kardinální GRAPH/BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30.

  11. Jak v SPSS do grafu dostat třídění 3. stupně (pro %)?

  12. Grafy třídění3.stupně: Závislá proměnná je kategoriální • Situace je komplikovanější, pokud všechny tři proměnné jsou kategoriální (tj. včetně závislé) • S výhodou můžeme využít podobný princip jako pokud bychom měli kardinální proměnnou a ukazovali průměry v podskupinách. → závislou proměnnou nejprve rekódujeme na dichotomii a pak ukazujeme % pro jednu – „pozitivní“ kategorii resp. pravděpodobnost (což je vlastně průměr z dichotomie 0/1). Alternativně lze v BARCHARTu (u ordinálních znaků) nechat zobrazit % nad/pod určitou hodnotou • Jenže to jde pouze tam, kde lze závislou proměnnou vyjádřit dichotomií (tedy tam kde lze kategorie slučovat, většinou, pokud je ordinální).

  13. Vstupní data = konting. tabulka třídění 3.stupně. Závislá p. dichotomická: ne/zájem o politiku Jaký rozdíl v zájmu o politiku mezi muži a ženami uvnitř vzdělanostních kategoriích? → zájem o politiku (rekód na zájem/nezájem) podle pohlaví při kontrole vlivu vzdělání Nejprve je třeba závislou proměnnou rekódovat na dichotomii (zde zájem/nezájem o politiku) GRAPH /BAR(GROUPED)=PGT(0)(ZajPolit) BY s30 BY vzd3. a odpovídající konting.tabulka:CROSSTABS ZajPolit BY s30 BY vzd3/cel col.

  14. Graf pro závislou proměnnou (v %) a 2 vysvětlující GRAPH/BAR(GROUPED)=PGT(0)(readEnj1) BYEgp3ROBYEU_3kat. • Funguje ale pouze pro dichotomickou závislou proměnnou, zde Čte pro radost kódovanou (0=nečte/ 1=čte)→ ukazujeme podíl s hodnotou vyšší než 0 → PGT(0). → zobrazí procento případů s hodnotou vyšší než 0. • Nebo obráceně pro „ne-čtenáře“ PLT(1)→ zobrazí procento případů s hodnotou nižší než 1.

  15. Graf se závislou a 2 vysvětlujícími proměnnými Čtení pro radost (denně) u patnáctiletých žáků podle sociální třídy rodičů v evropských zemích. PISA 2009.

  16. Sloupcový graf (%) pro závislou a2 nezávislé proměnné. Názory rodičů na důležitost dalšího studia po maturitěpodle vzdělání rodičů a typu studia, ČR 2003, procenta souhlasu Zdroj: PISA 2003; N = min 3468

  17. To samé pomocí Chart Builder * Chart Builder. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=skoly COUNT()[name="COUNT"] PA1_Vzd3[LEVEL=ORDINAL] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: skoly=col(source(s), name("skoly"), unit.category()) DATA: COUNT=col(source(s), name("COUNT")) DATA: PA1_Vzd3=col(source(s), name("PA1_Vzd3"), unit.category()) COORD: rect(dim(1,2), cluster(3,0)) GUIDE: axis(dim(3), label("Školy")) GUIDE: axis(dim(2), label("Percent")) GUIDE: legend(aesthetic(aesthetic.color.interior), label("Vzdělanostní aspirace žáků (dle ", "profese 1, přímý kód)")) SCALE: cat(dim(3), include("1", "2", "3", "4")) SCALE: linear(dim(2), include(0)) SCALE: cat(aesthetic(aesthetic.color.interior), include("1", "2", "3")) SCALE: cat(dim(1), include("1", "2", "3")) ELEMENT: interval(position(summary.percent(PA1_Vzd3*COUNT*skoly, base.coordinate(dim(3)))), color.interior(PA1_Vzd3), shape.interior(shape.square)) END GPL.

  18. 3D graf & panely: závislá proměnná a 3 nezávislé Aspirace patnáctiletých na studium na VŠ podle aspirací rodičů a jejich vzdělání, studenti ZŠ a VG, ČR 2003, procenta Zdroj: PISA 2003

  19. Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. Zdroj: PISA 2007

  20. Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=vekkat[LEVEL=nominal] vzd4[LEVEL=ordinal] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Heat Map"[LOCATION=LOCAL] MAPPING( "color"="prijem"[DATASET="graphdataset"] "rows"="vekkat"[DATASET="graphdataset"] "columns"="vzd4"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="Heat Map: vzd4-vekkat-prijem" DEFAULTTEMPLATE=NO.

  21. 3 D-density: vztah dvou číselných proměnných GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=isei[LEVEL=ratio] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="3-D Density"[LOCATION=LOCAL] MAPPING( "z"="prijem"[DATASET="graphdataset"] "x"="isei"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="3-D Density: prijem-isei" DEFAULTTEMPLATE=NO.

More Related