650 likes | 849 Views
社会統計 第 11 回 多重分割表分析の論理(第 10 章). 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp. イントロダクション. ここまでは,主に,2変数間の関係を検討してきた 2変数の分割表 1要因分散 分析 第 10 章と第 11 章では,3変数以上の関係を検討する. 多変量解析 ( multivariate analysis ) 多重分割表 ( multivariate contingency table ) 重回帰 分析 ( multiple regression analysis ).
E N D
社会統計 第11回多重分割表分析の論理(第10章)社会統計 第11回多重分割表分析の論理(第10章) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp
イントロダクション • ここまでは,主に,2変数間の関係を検討してきた • 2変数の分割表 • 1要因分散分析 • 第10章と第11章では,3変数以上の関係を検討する.多変量解析(multivariate analysis) • 多重分割表(multivariate contingency table) • 重回帰分析(multiple regression analysis)
10.1 . 付加変数の統制 • イギリスでは,コウノトリの多い地域では,出生率が高い.コウノトリが赤ちゃんを連れてくるのだろうか? • 参考:太郎丸『カテゴリカル・データ解析入門』第6章 • 10.1.1節では,イギリスではなくオランダとしている. • Xと Yに共変動(covariation)が見られても,それは直ちに因果関係の存在を意味しない. • Xが Yに影響(間にZ を媒介する場合も含む) • Y がX に影響 • 第3の変数Z が XとY の両方に影響
都市化が進むと,コウノトリの数は少なくなり,出生率も下がる.都市化が進むと,コウノトリの数は少なくなり,出生率も下がる. コウノトリの数 都市化の程度 出生率
コウノトリの数と出生率の間に因果関係がまったく存在しないことは,常識的に明らか.コウノトリの数と出生率の間に因果関係がまったく存在しないことは,常識的に明らか. • これは明らかに,みかけの共変動 • 一般に,2変数間の関係を明確化するために,この関係に混入しうる第3の変数の影響を統制する必要がある.
2変数の真の関係を明確にするために,他の変数(Z)の影響を統制したい.2変数の真の関係を明確にするために,他の変数(Z)の影響を統制したい. • 2変数間の真の共変動がどれだけあるかを確かめるには,みかけ上の共変動から他変数に起因する部分を除去する必要がある. • 実験における変数の統制 • 恒常化:どの条件においても,変数の影響を一定にする • 無作為化:変数の影響をランダムにする.
調査研究では,実験のような変数統制ができないことがほとんど.調査研究では,実験のような変数統制ができないことがほとんど. • 研究対象となる人あるいはものの属性を,研究者が物理的に操作できない. • 2変数の関係に影響すると考えられる付加変数を確定し,その付加変数を測定し,統計的操作によって付加変数の影響を統制する.
2変数関係に影響する要因のすべてを識別して分析に加えることは不可能.2変数関係に影響する要因のすべてを識別して分析に加えることは不可能. • したがって,付加変数として何を取り上げるかを決めるために,理論が極めて重要となる.
2変数間関係に他変数が混入するパターン • 疑似関係(疑似相関) • 媒介関係 • 複合因果
10.1.1. 疑似関係 • 疑似関係(spuriousness):2変数X とY の共通原因となっている別の変数 Zが存在するために,2変数X と Yの間に相関関係(疑似相関,spurious correlation)が見られること. • 例:コウノトリの数(X)と出生率(Y) • 因果関係を主張するために必要なこと • 時間的順序 • 理論的説明 • 疑似相関の検討
興味ある2変数間に因果関係はないが,共通する原因変数が2変数間に共変動をもたらしている場合,その共通原因の影響を統計的に一定に保つことによって,見かけ上の共変動を除去できる.興味ある2変数間に因果関係はないが,共通する原因変数が2変数間に共変動をもたらしている場合,その共通原因の影響を統計的に一定に保つことによって,見かけ上の共変動を除去できる. • 統計的統制を行っても共変動関係が残れば,2変数間に因果関係が存在する可能性は高くなる.
10.1.2. 媒介関係 • 媒介関係(intervening relation):独立変数と従属変数を媒介する変数が存在する関係. • 例:年齢(X)と道徳的保守性(Y)を信仰の強さ(Z)が媒介.信仰の強さを一定にすれば(たとえば,信仰の程度が同程度の人を集めれば),年齢と道徳的保守性の共変動は小さくなる. X Z Y 媒介関係
直接効果と間接効果 直接効果 Y X 間接効果 Z 直接効果がなくても,Xと Yの相関を疑似相関とは言わない.間接的とはいえ,因果関係が存在するから.
媒介関係と疑似関係 Y X Y X Z Z
疑似関係と媒介関係は,第3の変数の影響を一定に保ったときに興味ある2変数の共変動関係が小さくなるという点において同じ.疑似関係と媒介関係は,第3の変数の影響を一定に保ったときに興味ある2変数の共変動関係が小さくなるという点において同じ. • しかし,関係の実質的意味は異なる. • 疑似関係なのか媒介関係なのかは,統計分析からは決定できない.理論や,解釈のしやすさから決まる.
10.1.3. 複合因果 • 人間の行動が単一要因によるものだと断定する社会理論はほとんどない. • 複合因果(multiple causation):原因となる変数が複数ある因果関係 • 興味ある従属変数に対して,複数の独立変数が持つ,複合的で同時的な関係を検討する.
検討されるもの • 独立変数(要因)の集合全体としての効果 • 疑似関係や媒介関係を統制したときの,独立変数それぞれの効果(相対的な重要性) • 要因の組み合わせの効果(交互作用) • 分析方法 • 多要因の分散分析 • 重回帰分析 • 多重分割表の分析(疑似関係,媒介関係の分析によく用いられる)
10.2.2×2 表における第3の変数の統制 • 多重クロス表:3変数以上の変数のクロス表 • 2変数間の関係がクロス表に整理されているとする.このとき,第3の変数の影響を検討するために,3重クロス表を用いる. • 立体的な表を作ることは難しいので,第3の変数の値に応じて,2重クロス表を複数作成する. • ここでは,どの変数も2値変数である場合を説明する.2×2×2表
10.2.1. 仮想例:家族の信仰と10代の性行動 • 零次の表(zero-order table):統制される変数がない分割表 • 信仰の強さと婚前性交の間に相関関係 ファイ係数:φ = -0.26
家族の信仰と婚前性交との関係に,何らかの第3の変数は存在するか?家族の信仰と婚前性交との関係に,何らかの第3の変数は存在するか? • 性体験を促す機会が頻繁にあるかどうかが,婚前性交の有無に影響するのでは? • 信仰深い家庭は,行動への束縛が強く,そうした機会が少ないのでは? • 自動車を日常的に使用しているかどうかを,第3の変数として検討してみてはどうだろうか.
第3の変数の影響を検討するために,1次の表(first-order table)を作る. • 第3の変数のカテゴリごとに,興味ある2変数のクロス表を作成する. • 次数は統制される変数の数を表す. • これにより,第3の変数の影響を一定にして(第3の変数の影響が同じ部分ごとに),興味ある2変数間の関係を検討できる.
10.2.2. 第3変数に効果がない場合 • 1次の表(下位表)で認められる関係が,零次の表で認められる関係と変わらなかったとする(次のスライド).このとき,第3の変数は(零次の表での)共変動に効果を持たない. • 条件つき相関係数(conditional correlation coefficient):第3の変数ごとに作った分割表(下位表)におけるファイ係数.これらの値はほぼ同じで,零次の表でのファイ係数と変わらない. • オッズ比も変化していない.(確かめてみよ)
ファイ係数:φ = -0.27 ファイ係数:φ = -0.25
統制される変数(自動車の使用)と,興味ある2変数それぞれとのクロス集計表を作成してみる.統制される変数(自動車の使用)と,興味ある2変数それぞれとのクロス集計表を作成してみる. • 1次の表での周辺度数を使って作成できる. • 信仰深い家庭では,そうでない家庭に比べ,自動車を自由に使用させているのか? • 自動車を日常的に使用している若者は,そうでない若者に比べ,婚前性交の経験率が高いのか?
ファイ係数:φ = -0.006 ファイ係数:φ = -0.006
10.2.3. 第3変数が部分的効果を持つ場合 • 下位表において,興味ある2変数の関係は依然として認められるが,その関係の強さが弱くなったとする.(次のスライド) • このとき,第3の変数は,2変数間の連関を部分的に説明する. • 家族が信仰深くてもそうでなくても,自動車を使用することで,婚前性交の経験率が上昇する. • 興味ある2変数の共変動関係は,弱くはなったが残っている.
ファイ係数:φ = -0.16 ファイ係数:φ = -0.17
10.2.4. 第3の変数による完全な説明 • 2つの下位表におけるファイ係数がゼロ.つまり,第3の変数の影響を一定にすると,興味ある2変数間の関係が消失したとする. • このとき,第3の変数は,興味ある2変数間の関係を完全に説明する. • 家族の信仰は10代の若者が自家用自動車を日常的に使用できるかを規定し,自動車使用機会が婚前交渉の主要な決定因となる.
ファイ係数:φ = 0.00 ファイ係数:φ = 0.00
練習問題 • 第3変数の効果がない場合の表をつくりかえたように,第3変数による完全な説明が成り立つ場合の表を作り変えよ(テキスト表10.4を作り変える).2つの下位表の周辺度数を用いればできる.ファイ係数も計算してみよ. • 信仰と自動車使用機会の表 • 自動車使用機会と婚前性交の表
ファイ係数:φ = -0.43 ファイ係数:φ = 0.60
周辺度数分布において,Xと Z,および,Zと Yに関連があるために,Xと Yの間に関連が現れた. • 周辺度数による elaboration(後述) • X(家族の信仰)と Z(行動への束縛)の関連について,次のスライドを参照.
ファイ係数:φ = 0.00 ファイ係数:φ = 0.00
第3の変数が,元の2変数(X,Y)のいずれともゼロでない相関を示すときだけ,この第3の変数を媒介変数として,もとの2変数の共変動を説明できる可能性がある.第3の変数が,元の2変数(X,Y)のいずれともゼロでない相関を示すときだけ,この第3の変数を媒介変数として,もとの2変数の共変動を説明できる可能性がある. • 一般には,2変数の相関が正なら,第3の変数とこれら2変数との相関はどちらも正か,あるいは,どちらも負.(そうでないこともありうる) • 2変数の相関が負なら,第3の変数との相関は,一方が正で他方が負. (そうでないことも)
第3の変数による完全な説明は,媒介関係の場合だけでなく,2変数の相関が疑似関係であるときにも見られる.第3の変数による完全な説明は,媒介関係の場合だけでなく,2変数の相関が疑似関係であるときにも見られる. • 第3の変数を媒介変数と考えるか,2変数の共通原因と考えるかは,理論や解釈のしやすさによる.統計的な結果からは決められない.
10.2.5. 第3変数の交互作用効果がある場合 • 2つの下位表で連関の程度(ファイ係数,オッズ比)が大きく異なる. • 零次の表と比べると,たとえば,一方の下位表では連関が減少し,もう一方の下位表では連関が増大する. • 連関が逆方向(プラスとマイナス)になることもある. • 交互作用効果(interaction effect):第3の変数の値によって,興味ある2変数の関係が異なる.
ファイ係数:φ = -0.42 ファイ係数:φ = 0.00
ファイ係数:φ = -0.12 ファイ係数:φ = -0.04
3重クロス表を構成してみないと,交互作用効果の発見はできない.3重クロス表を構成してみないと,交互作用効果の発見はできない. • 2変数 Xと Yの単純相関が,条件つき相関と,どのように,どれぐらい異なるのかは,3重クロス表を構成しなければわからない.
10.2.6. 条件つき効果のまとめ • グラフを利用すると,3重クロス表から明らかになった関係が,よりわかりやすくなることが多い(テキスト p.239 ,図10.2) • 2要因分散分析で学習した図と本質的に同じ.
第3の変数を導入して3重クロス集計を行い,関連の分析を深化させることを,elaboration と呼ぶ. • 零次の表での関連が疑似相関かどうか • 原因と結果の間を媒介する変数は何か • どんな条件のもとで,零次の表での関連が明確になるか
疑似相関を暴いて,零次の表での単純関連の見かけ性を説明するタイプの elaboration を,explanation と呼ぶ. • 媒介関係の分析は,独立変数と従属変数の間の間接的な因果関係をより詳しく解釈することに役立つので,interpretation と呼ばれる. 注意:テキスト(p.284)では,explanation とinterpretation の意味を区別していない.
交互作用効果を明らかにする elaboration は,specification と呼ばれる. • 特に,第3の変数が独立変数 Xと関連を持たない場合.たとえば,第3の変数が性別,独立変数が年齢の場合.
10.3. 偏相関係数 • 条件つき相関係数は,第3の変数 Zのカテゴリごとに,Xと Yの相関係数を計算したもの. • 第3の変数 Zの影響を一定にしたときの, Xと Yの関連の強さを表す指標はないだろうか? • 第3の変数 Zのカテゴリごとに計算される数値ではなく,条件つき相関係数を合算したもの. • Xと Yそれぞれから Zと関連した部分を除去したときの,Xと Yの相関.
偏相関係数(partial correlation):第3の変数を統制したときの,興味ある2変数間の相関係数. • 3変数とも連続変数の場合に定義された式だが,これを離散変数間の相関にも適用する.
変数 Xと Yの相関係数 [XY] は,いくつかの要素の,ある種の和である. • [XY: z1]:第3の変数 Z のカテゴリが z1 であるときの,Xと Yの条件つき相関係数.[XY:z2] も同様. • [XZ]:Xと Zの相関係数.[ZY] も同様. ここが偏相関係数 [XY: Z]
通常の数式のように変形(移項)すると,以下の式が得られる.これは,偏相関の定義式で分母を無視した形である.通常の数式のように変形(移項)すると,以下の式が得られる.これは,偏相関の定義式で分母を無視した形である.
[XZ] および [ZY] の両方がゼロでないとき,疑似関係あるいは媒介関係による elaboration が可能になる.偏相関係数の値は,零次の表での単純相関 [XY] よりも小さな値になる.
[XZ] または [ZY] がゼロであるなら,偏相関係数の値は,零次の表での単純相関 [XY] と近い値になる.[ZY] = 0 とすると,
偏相関係数がゼロなら,[XY] は[XZ]と [ZX] の積に等しい.