660 likes | 1.12k Views
SEMFAQ: 共分散構造分析に関する10の質問. 三浦麻子 × 狩野裕 (大阪大学 大学院人間科学研究科) 配布資料. 日本GD学会 第50回大会@京都. 1. SEM によるパス解析は “ must” なのか?. 重回帰分析の繰り返しによるパス解析をした 論文を投稿したのですが,査読者から「 SEM による パス解析をやり直せ」と言われました なんとか実行はできたのですが, 適合度が低く ,とてもじゃないですが論文に載せられたもんじゃありません こんなとき,私はどうすればいいのでしょう? 論文 取り下げ &もう一度データ 取り直し なんでしょうか?. 1.回答.
E N D
SEMFAQ:共分散構造分析に関する10の質問SEMFAQ:共分散構造分析に関する10の質問 三浦麻子×狩野裕 (大阪大学 大学院人間科学研究科) 配布資料 日本GD学会第50回大会@京都
1.SEMによるパス解析は“must”なのか? • 重回帰分析の繰り返しによるパス解析をした論文を投稿したのですが,査読者から「SEMによるパス解析をやり直せ」と言われました • なんとか実行はできたのですが,適合度が低く,とてもじゃないですが論文に載せられたもんじゃありません • こんなとき,私はどうすればいいのでしょう? 論文取り下げ&もう一度データ取り直しなんでしょうか?
1.回答 • Yes. “must”である • 不適合の理由を特定し,モデルを改善する • モデルが不適切 • 直接効果の欠落 • 未観測の剰余変数の存在 • 層別を示唆(交互作用の存在) • 偏相関が説明できていない • 誤差共分散
誤差共分散の設定 • 誤差間に共分散を設定する
2.標準化尺度のEFA・CFA • 質問紙調査の場合,既存の標準化された尺度を使うことがよくあります • このような場合にも,先行研究の構造が再現されるかどうかを確認するために探索的因子分析をしていたのですが,なんだか変な気がします • まず検証的因子分析をして構造を確認してから,場合によっては探索的にやりなおす方がよいのでしょうか?
2.回答 • Yes and No • Establishされている尺度についてはEFA・CFAを行う必要はない • 理屈上 • 日本でもestablishしているか • EFAやCFAによってサンプルの妥当性をチェック
EFA versus CFA • CFAでは より厳しいチェックが行われる • CFAをやるべきかどうかは,どこまで「厳しさ」を要求するか,に依存 • 尺度を吟味したあと • SEMへ移行するなら,CFAが必須 • 古典的方法を利用するなら,EFAでもよいのではないか • 合計得点を算出して分析するなど
しかし • 信頼性が不十分のとき • 尺度分析の結果 • 誤差の制御が必要 • 多重指標を利用したSEMで分析する必要 • 尺度解析においてもCFAが必要に
3.適合度が悪いモデルは「ダメダメ」なの?3.適合度が悪いモデルは「ダメダメ」なの? • 仮説モデルにしたがってSEMをすると,適合度がいまいちよくありません.全然ダメなら捨てるのですが,どうも微妙なラインなんです • 試行錯誤すると,どうやら仮説にやや合わないモデルの適合度が高いようです • こんなとき,私はどちらのモデルを選べばよいのでしょう? 本心を言えば,前者を選びたいのですが…
3.回答 • 気持ちはよくわかる • 仮説モデルの適合度を向上させるためにあらゆる手段を講じる • このような事態はSEMに限ったことではない • e.g., 回帰分析で重要な変数の効果が非有意 • 統計解析における共通の悩み • それゆえ,分析は自動化できない
あらゆる手段 • 適合度を低めている部分の同定 • モデルの部分評価 • 粗データの吟味 • 誤差相関 • 層別(交互作用) • 未観測交絡変数 • 観測変数の選択 • parceling • SEMの専門家に訊く
コメント • 適合度の小さいな違いは実質的な意味はない • 適合度の良いモデルが複数個ある場合は,分析者の責任において最終モデルを選択 • ランダムな現象を扱うことの限界 • 研究分野によって基準は異なる • 各分野のコンセンサス • 先行研究の適合度を参考にする • 研究が積み重ねられている分野 • More confirmatory nature.より厳しい基準 • 新しい研究分野 • Less confirmatory nature.やや緩い基準
4.欠損値のあるデータの処理方法 • いくつか欠損値が含まれたデータを用いてSEMをやりたいと思っています • 欠損値の処理方法には場合によっていくつかあるようですが,明らかに実施時に特殊な事情がある場合以外はどうしたらいいのでしょう? • また,欠損値の処理方法を論文に明記すべきでしょうか? そこまで書いている論文を見たことが(まだ)ありません
4.回答 • 欠測が1割程度ならばLD • 相当数の欠測がある場合はFIMLを用いる • 欠測のプロセスに関してMARを仮定 • MARの仮定が崩れていても,共分散構造分析においては,そこそこ使える • 経験則だが • LD,FIMLは明示する必要あり
LDとFIML • Listwise Deletion (LD) • 一つでも欠測のあるobservationは,分析から外して分析する • 捨てられるデータがもったいない • 統計的推測の精度が低くなる • 欠測が多いと分析できないことがある • MCARである必要 • Full Information Maximum Likelihood (FIML) • 観測されたデータにもとづく最尤法 • AMOSなどSEMの代表的なプログラムで利用可 • MARでよい
統計理論から • Missing Completely At Random (MCAR) • どの値が欠測するかは完全にランダムである • LD, PDは,このときのみ使える • Missing At Random (MAR) • どの値が欠測するかはデータに依存してもよいが,欠測値には依存しない • FIMLの適用が薦められる • Nonignorable Missing • どの値が欠測するかが欠測した値に依存する • 欠測のメカニズムにモデリングが必要
5.調査データでの「因果関係の同定」 • 調査データの多くは,一時点で採取された認知データであり,本来は因果関係は論ずることができないことはよくわかっています • しかし私たちはそれを知りつつも,SEMを使って因果関係があるかのように議論を進めています • こんなことをしていいのか?という根本的な疑問がふと頭をかすめることがあるのですが…
5.回答 • SEMは強力な因果推論の道具 • 交絡変数がないという前提 • パス図が正しいという前提 • 調査データにもとづく因果推論の限界 • 未観測交絡(剰余)変数の存在を否定できない • 因果の大きさ(因果関係のあるなし) • パス係数の推定と検定 • 第三変数のモデル化が容易 • 因果の方向 • 適合度にもとづくモデル比較により,因果の方向を決定 • 当該モデルの適合と逆方向のモデルの不適合
実例 • 「スマートさ」から「うつくしさ」への影響が強い
対応策 • 十分な検討の下で,正確なパス図を作成 • 大幅なモデル探索はしない • 強い結論を主張しない • ...という関係が示唆された • 縦断的データを取るデザインを考える • 調査データの分析は積み重ねることが大事
6.双方向因果モデル(にわとりたまご) • よくテキストで見るパスモデルは,因果の方向が一定であることが多いようですが,双方向の因果モデルというのはSEMでうまくモデリングできるのでしょうか? いわゆる鶏と卵の関係のようなモデルです
6.回答 • YES • 縦断的データの場合 • パス解析 • 横断的データの場合 • 双方向因果モデル • しかしながら • 調査データにもとづく因果方向の決定は難しい
縦断的データの利用 • 2時点でデータをとり,時間差を利用する • 民主主義⇒経済発展 or 経済発展⇒民主主義
政治的社会化モデル 出典:Asher(1976). Causal Modeling. Sage
7. 「不適解」地獄から抜け出したい!! • 突然ですが,不適解に泣かされています • データの打ち込みや読み込み,あるいはモデルの記述などつまらない原因はすべて探りましたが,どれも問題ないようです • こんなとき不適でない解を導き出す努力として,私たちには一体何ができるのでしょう?
7.回答 • 不適解とは(improper solutions) • 誤差Eや撹乱項Dの分散が0または負の値に推定 • 相関の推定値が,絶対値1以下でない • 基本的には,これらを最終解として報告してはならない • 原因を切り分けてから対応する
原因と対応 • 不適解は何らかの不適切性を表す • 単純ミスなど • モデルが不適切(model misspecification) • 潜在変数モデル固有の問題 • サンプル変動 • この場合のみ,V(e)≧0などとして解を報告する • その他・不明
4. サンプル変動 • サンプル変動によって不運にも偶然不適解となってしまった • 残念!! • 不適解がサンプル変動によることが確定した場合は,V(e)=0 とおいた解を報告できる場合がある
サンプル変動のための条件 • サンプル変動による不適解と判断できるためには • さらなるモデルの改良が考えられない • 絶対値が大きすぎない.少しマイナス • V(e)±2SEが原点を含んでいる • 測定モデルで不適解が生じた場合は,因子を合計得点で置き換えてみて,推定値などが大きく変化しないことを確かめる • 上記の条件が満たされていても,モデルが小さいと,論文を出版するのは認められにくい
8.よりどりみどりすぎる 適合度指標 • AMOS(EQS,CALIS)を使っていますが,プログラムを走らせると,大量の適合度指標が出てきます • 残念ながらすべての適合度指標を載せるだけの紙幅は論文にありません • 私たちが主張したいことはこのモデルが正しいということに尽きるのですが,一体どの指標(たち)を記述すれば必要かつ十分でしょうか?
8.回答 • 適合度指標にはいくつかの側面がある • 同じ性質を持つ指標を複数報告しない • 側面を代表する指標を報告する • カイ2乗値 • GFI,CFI,RMSEA • モデル局所評価も必要 • 適合度はモデルの全体的評価 • パスの有意性 • R^2の大きさ
使い方 • カイ2乗値 • 大標本のときは見ない • GFI,CFI • 一般に,0.90 or 0.95 以上を要求する • see Bentler & Bonnet (1980), Hu (1999) • RMSEA • 0.05以下⇒OK • 0.10以上⇒不適 • see Browne & Cudeck (1993)
Reference • Hu, Li-tze and Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(1), 1-55. • Bentler, P.M. & Bonnet, D.G. (1980). Significance tests and goodness of fit in the analysis of covariance structures. Psychological Bulletin, 107, 238-246 • Browne, M.W. & Cudeck, R. (1993) Alternative ways of assessing model fit. In K.A. Bollen & J.S. Long [Eds.] Testing Structural Equation Models. Beverley Hills, CA: Sage, 132-162
9.適合度指標の検定ってないの? • 私は今,SEMを使って書かれた論文の査読を依頼されています • あるモデルが「適合度が高い」とされているのですが,その根拠として示されている適合度指標が本当に高いのかどうかわかりません.論文によって基準とする値にもばらつきがあるように思えてなりません • 適合度指標が本当に高いことを示せる検定などはないのですか?
9.回答 • カイ2乗値による検定がそれにあたる • 歴史的には • カイ2乗検定の限界が指摘され,その代替として適合度指標が提案されてきた
RMSEA • RMSEAは,点推定値だけでなく信頼上限と下限を出力する(信頼率90%) • 信頼上限が0.10以下かどうかという判断基準もよく用いられる • 以下の検定もできる • H0:RMSEA=0 (exact fit) • H0:RMSEA≦0.05 (close fit)
10.SEM論文の「正しい」書き方 • さて,試行錯誤の艱難辛苦を乗り越えて,SEMをおこなったモデリング結果を論文に書こうと思います • 「すべてを丁寧に書く」のがベストなのは分かり切っていますが,それだけの紙幅はありません • 論文を読む人のことを考えた場合にどのような情報が必要かを,できれば優先順位つきで教えてください
10.回答 • 必須項目 • 心理学・行動学の知見にもとづく初期(仮説)モデルの記述 • 最終モデルの記述 • 適合度,パス係数の有意性 • 読者がduplicateできるようにする • 初期モデルと最終モデルとの違いを説明 • モデルの変遷や経過を全て記述する必要はない
オプション • 直接効果なし • パスを引いても非有意 • 因果の方向 • 対立モデルが適合しない • 男女差なし • 多母集団同時分析
重要FAQ:詳細解説編 SEMによるパス解析が“must”な理由 双方向因果モデルの構築 さまざまな適合度指標の特徴と適切 な使い方
FAQ1 SEMによるパス解析が“must”な理由
詳細:直接効果の欠落 • LM検定や適合度指標で改善のための指針を得ることができる
f2 f1 未観測の剰余変数の存在
集団A:適合度○ 0.4 0.5 集団B:適合度○ 0.6 0.5 層別を示唆(交互作用の存在) A+B:適合度× 0.5 0.5
補足 交互作用と交絡_1 A+B:適合度○ A+B:適合度×
X21 X21 B B r=0.4 r=0.6 0.4 A A r=0.4 r=0.4 X11 X11 0.3 補足 交互作用と交絡_2
誤差共分散_1 • 誤差間に共分散を設定する
誤差共分散_解説 • パスの意味 • 直接効果を表現したもの • 誤差共分散を置くことが多い • 偏相関が残ることが多いから • 交絡要因として導入したもの • 測定モデル • 誤差共分散なしが一般的
FAQ6 双方向因果モデル (にわとりたまご)