630 likes | 944 Views
行動計量学演習 Ⅱ ~ SPSS tables と Exact Test の巻~. 行動計量学講座 B3 紺谷幸弘. まずは tables から …. SPSS tables とは 勝手に表を組んでくれるスグレモノ 例えばこんな具合に↓. 具体的に何ができますか. マウス一つで大体の表組みが思いのまま !! マウス一つで平均や分散などのデータの要約までしてくれる !! 多重回答の表までできてしまう !!. 実際に SPSS Tables を動かしてみよう. 次のスライドから実際(仮)に SPSS Tables を使ってみましょう
E N D
行動計量学演習Ⅱ~SPSS tablesとExact Testの巻~ 行動計量学講座 B3紺谷幸弘
まずはtablesから… • SPSS tablesとは • 勝手に表を組んでくれるスグレモノ 例えばこんな具合に↓ SPSS tablesとExact Test
具体的に何ができますか • マウス一つで大体の表組みが思いのまま!! • マウス一つで平均や分散などのデータの要約までしてくれる!! • 多重回答の表までできてしまう!! SPSS tablesとExact Test
実際にSPSS Tablesを動かしてみよう • 次のスライドから実際(仮)にSPSS Tablesを使ってみましょう • 今回はその例として列パーセントをやりたいと思います こんなの SPSS tablesとExact Test
実際のローデータ 入力場面 SPSS tablesとExact Test
1.ここを選択 ↓ クリック SPSS tablesとExact Test
2.こんな箱が出ます この箱を ダイアログボックス といいます 3.行変数として扱いたいものを 選択して… 4.ここをクリック SPSS tablesとExact Test
5.行変数として 追加されます 6.列変数にしたい変数も 同じ要領で… SPSS tablesとExact Test
7.行変数と 列変数を 指定できたら… 8.ここをクリック!! SPSS tablesとExact Test
10.ここをクリックすると… 9.「列%」を選んで… SPSS tablesとExact Test
11.ここに統計量が追加されます 12.ここをクリック!! SPSS tablesとExact Test
F.ここをクリック!! すると... SPSS tablesとExact Test
列の%の表が出来てしまうのです!!! なんて便利なんだ... SPSS tablesとExact Test
一つのダイアログボックスであることを示します一つのダイアログボックスであることを示します 別紙のマニュアルとの関連 ダイアログボックス名を示します ボタンであることを示しています 上の操作を行うと 下のダイアログボックスが開くことを表しています 注意書きです それではいよいよ説明に… SPSS tablesとExact Test
↑性別と出身地が 積み重ね ↑性別と出身地 が入れ子 大事な概念(1) • 入れ子と積み重ね(1) SPSS tablesとExact Test
A B ↑積み重ねの状態 B 大事な概念(2) • 入れ子と積み重ね(2) • 「AがBの入れ子になっている状態」とは A AがBの入れ子になっている状態 (AがBの中に入っている状態) SPSS tablesとExact Test
行・列・層とは 行→表の長さ 列→表の幅 層→表の奥行き 層 層 層 列 列 行 行 大事な概念(3) 列 行 SPSS tablesとExact Test
上位の次元 下位 上位の次元 上位の次元 下位 下位 下位 下位 下位 下位の次元 下位 下位 下位 ↑行次元 ↑入れ子の場合 ↑列次元 大事な概念(4) • 次元とは • 簡単に言えば階層のこと • 高い階層=上位の次元 • 低い階層=下位の次元 SPSS tablesとExact Test
変数について(1) • カテゴリ変数(categorical variable) • セルの定義に用いられる変数 • 観測値が質的な値をとるような変数 • 集計変数(summary varible) • 数量を表す基数 • 観測値が量的な値をとるような変数 • 行(列、層)変数(row (column, layer) variable) • 行(列、層)を定義している変数 • 管理変数(controlling variable) • 別の変数が入れ子になっている変数 • 入れ子の状態で下位の変数を持つ変数 SPSS tablesとExact Test
性別 性別 男 女 男 女 車の所持 車の所持 無し 有り 有り 無し ちょっと横道管理変数について • 下位変数を持てば全て管理変数というわけではない • 別の変数でなければならない ↑別の変数が入れ子になっていない = 性別は男(女)の管理変数ではない ↑別の変数が入れ子になっている = 性別は車の所持の管理変数である SPSS tablesとExact Test
変数について(2) • 度数変数(frequency variable) • 度数のこと • 要約変数(summary statistics) • 要約統計(平均とか分散など)によって算出された値 • ダミー変数(dummy variable) • 値が有効かそうでないか(欠損値かどうか)を1と0を用いて区別している変数 SPSS tablesとExact Test
変数について(3) • 目標変数(target variable) • ダミー変数に名前を付けた変数 • 多重カテゴリ変数(multi-category variables) • 多重回答をカテゴリとしてコード化した変数 • 詳しくは後述 • 2分変数(dichotomies) • 多重回答を2種類の変数(1と0、yとnなど)としてコード化した変数 SPSS tablesとExact Test
そろそろ本題に… • SPSS tablesの機能を三つに大分すると… • 基本的なテーブル表手続き • テーブル表の中の全変数に機能を均等に適用するテーブル表 • 総合的なテーブル表手続き • 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にできるテーブル表 • 多重回答変数をテーブル表にするときもこれを使う • 度数表手続き • 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有しているようなデータのときに使う SPSS tablesとExact Test
基本的なテーブル表手続き(1) • ほとんどの表作成はこれで事足りる • 基本的な使い方はどの手続きもほとんど同じ これができれば全部の手続きができるようになる!! SPSS tablesとExact Test
基本的なテーブル表手続き(2) • 積み重ねと入れ子について • 行や列に別の変数を追加すると、同次元の別の変数(積み重ね)になる • 入れ子にしたほうが表自体は簡潔になる • 次元を減らせることも(主に層次元) • 変数の位置について • 従属変数は行、独立変数は列におく →強調したい変数を列に置く(横に並べる) • 入れ子の場合は従属変数を独立変数の入れ子にする →従属変数についての詳しいデータが得られる SPSS tablesとExact Test
↑積み重ねはカテゴリ毎の合計値 ↑入れ子は全部を通しての合計値 基本的なテーブル表手続き(3) • パーセントについて • 列パーセント:列の合計が100% • 行パーセント:行の合計が100% • 層パーセント:層の合計が100% ※但し、積み重ねのデータの場合にはカテゴリごとの合計が100%になるようになる(列%の場合)↓ SPSS tablesとExact Test
基本的なテーブル表手続き(4) • 合計について • グループ合計:欠損値を無視した合計 • 表合計:欠損値も含めた合計値 ※欠損値がない時は表合計の必要はない ↑あっ!! SPSS tablesとExact Test
基本的なテーブル表手続き(5) • 並べ替えについて • どの統計量を指定しても、度数によって並べ替えられる • 合計列、合計行の両方が昇順(降順)になるようになる ↑縦も横も度数で昇順になっている(標準偏差は無視) SPSS tablesとExact Test
↑こんな具合に… 基本的なテーブル表手続き(6) • 要約統計量について • 別の変数ごとの集計変数の要約統計量を求めることができる(サブグループ化)↓ • 例えば虫歯の本数の要約統計量を男女別に見たりとか… SPSS tablesとExact Test
暗算が簡単になり、 表が見やすくなる 基本的なテーブル表手続き(7) • 表の提示ルールについて(1) -四捨五入した数字を用いる ・有効数字は2桁くらいで -比較する数字は近くに配置 -統計量は列に配置(統計量ラベルは列上部 に配置) -表の中の規則的・例外的なデータは脚注で要約 SPSS tablesとExact Test
基本的なテーブル表手続き(8) -表全体に関する表記には、見出しを使う • 表の提示ルールについて(2) -異なる種類の区分けには格子線かスペースを 使う ・ 区分けする項目が多いときにはスペース、少ない ときには格子線 -記号やラベルには意味のわかりやすく、覚え やすいものを使う ・略語なんてもってのほか -ラベルは統一する -主な層は同ページで比較できるようにする SPSS tablesとExact Test
度数表手続き(1) • どんな時に使うんだ • 一連の質問の選択肢が全て同じ場合に使う • Ex )質問紙の5件法 • 基本的なテーブル手続きではできんのか • できます • じゃあ何で使うんだ • 便利なんです SPSS tablesとExact Test
度数表手続き(2) • どこが便利なんだ • サブグループの定義が簡単 • サブグループとは(復習):ある度数変数において別のカテゴリで入れ子にすること • それだけです SPSS tablesとExact Test
総合的なテーブル表手続き(1) • どんな時に使うんだ • 変数ごとに積み重ねと入れ子を使い分けたいとき • 変数ごとに異なる統計量を使い分けたいとき • 複雑な合計を使いたいとき SPSS tablesとExact Test
総合的なテーブル表手続き(2) • 統計次元と要約次元について • 総合的なテーブル表手続きに独特の概念 • 次元について • 行次元とか列次元とか • 統計次元とは • 変数の統計量を指定できる次元のこと • 要約次元とは • 変数の要約統計量を指定できる次元のこと こんな説明で分かるかいや… SPSS tablesとExact Test
計算して出した値は行か列に揃え なければならないということです 要するに… SPSS tablesとExact Test
総合的なテーブル表手続き(3) • 総計も出せるぞ!! • テーブル表が積み重ねになっているとき有用 • ダミー変数を使う(ちょっと面倒) • 次はいよいよ多重回答だ!!! SPSS tablesとExact Test
総合的なテーブル表手続き(4) • 多重回答とは • 一人の回答者に一つの質問に対して複数の回答権を持たせるような質問形式 • アメリカの国勢調査では自由回答形式の質問に回答後、同じ話題の具体的質問にはい・いいえで答える形式質問(以下Y/N形式)に回答という形式が取られている →この二つの形式それぞれについて説明 SPSS tablesとExact Test
変数3 変数4 総合的なテーブル表手続き(5) • 自由回答をどのように変数化するか(1) • 答える順について変数を作る↓ 変数1 1.大ケガをした 2.子どもが入院した 変数2 Q.過去一年間で あなたや家族が抱えた、 最も深刻な問題は何ですか? 1.クルマが盗まれた 1.微分ができない 2.酒が飲めなくなった 3.ガッツが足りない 4.小遣いが足りない 5.トマトが食べられない 切り捨て 回答者ら 質問者 SPSS tablesとExact Test
総合的なテーブル表手続き(6) • 自由回答をどのように変数化するか(2) • 前スライドのようにして集められた4つの変数内のカテゴリを7つの一般的なカテゴリに再割り当てする(1991 U.S. General social Survey.savに従う) このようにして定義された変数を という 多重回答カテゴリ変数 ※いくつもある多重カテゴリ変数をまとめて多重回答グループという SPSS tablesとExact Test
総合的なテーブル表手続き(7) • Y/N形式をどのように変数化するか はい→1いいえ/無回答/該当なし→0として一つの変数に定義 このように定義された変数を という 2分変数 SPSS tablesとExact Test
総合的なテーブル表手続き(8) • 多重回答グループのパーセントについて • 応答数とデータ数の二種類 • 応答数:分母が回答者の数→合計が100%を超える • ケース数:分母が回答の数→合計は100%になる SPSS tablesとExact Test
次はいよいよ Exact test だ!! SPSS tables のまとめ(再掲) • 基本的なテーブル表手続き • テーブル表の中の全変数に機能を均等に適用するテーブル表 • 総合的なテーブル表手続き • 設定(入れ子、積み重ね、統計量など)を変数ごとに個別にできるテーブル表 • 多重回答変数をテーブル表にするときもこれを使う • 度数表手続き • 複数のカテゴリ変数が存在し、いずれも同じカテゴリを共有しているようなデータのときに使う SPSS tablesとExact Test
Exact testの説明の前に… Exact test の利点をより深く理解できるように… • 現在よく用いられている近似法(asymptotic method)について考えてみましょう SPSS tablesとExact Test
要するに… 近似法について(1) • 近似法(漸近法とも言う)とは • 大標本理論を踏まえた方法 • 大標本理論(large sample theory)とは • サンプル数が無限に大きくなった状態では望ましい推測方式が得られるという観点から、サンプル数が十分に大きいときの推測方式を論ずる理論 • 漸近理論(asymptotic theory)と同じ サンプル数が多くないとお話になりません SPSS tablesとExact Test
近似法について(2) • 近似法にはその他にも色んな制約が… • サンプルは無作為抽出じゃないといかん • サンプルに偏りがあったらいかん • サンプルが正規分布に従っていないといかん などなど… SPSS tablesとExact Test
近似法について(3) • 前提条件を満たしたデータはあるのか? • 前提を満たすこと自体が非常に困難 • 前提を無視して得た結果は本当に信用できるのか? SPSS tablesとExact Test
近似法について(4) • 過去の先人たちはどうしてたんだ →経験的に規則を作っていました • Chocran(1954)によると • 自由度1のとき期待値が5未満であればカイ2乗検定は適さない • 2×2以上のクロス表においては5未満の期待値が全体の20%以上、もしくは1未満の期待値が一つでもあるときはカイ2乗検定は適さない ↑こんな感じでね… SPSS tablesとExact Test
近似法について(5) でも!! どれだけ気をつけても規則を破ってしまうデータもある!!! どうする!? この問題を打破するために考案されたのが なのです SPSS tablesとExact Test
Exact Testとは何なんだ • Crosstabsとnonparametricを使った,分布に頼らない検定方法 • データ数が少なくても検定できる • データが偏っていても検定できる • データが正規分布に従わないときにも検定できる • とにかく色々使える すごいぞ!! SPSS tablesとExact Test