890 likes | 1.13k Views
処置前-処置後データ分析における 回帰効果の再検討. 鳥居稔○ 狩野裕 大阪大学大学院人間科学研究科 (torii@koko15.hus.osaka-u.ac.jp). 発表の目的. 実験場面における回帰効果を考える 回帰効果は 処置効果と交絡している場合がある 処置効果を見るために、しばしば回帰効果を 調整する必要がある. キーワードは「回帰効果」. 内容. 回帰効果について 回帰効果とは何か 回帰効果を克服するための方法 共分散分析 SEMによる潜在曲線モデル. 処置前ー処置後データについて どのようなデザインか 一般的にどのように分析されるか.
E N D
処置前-処置後データ分析における回帰効果の再検討処置前-処置後データ分析における回帰効果の再検討 鳥居稔○ 狩野裕 大阪大学大学院人間科学研究科 (torii@koko15.hus.osaka-u.ac.jp)
発表の目的 • 実験場面における回帰効果を考える • 回帰効果は処置効果と交絡している場合がある • 処置効果を見るために、しばしば回帰効果を調整する必要がある • キーワードは「回帰効果」
内容 • 回帰効果について • 回帰効果とは何か • 回帰効果を克服するための方法 • 共分散分析 • SEMによる潜在曲線モデル • 処置前ー処置後データについて • どのようなデザインか • 一般的にどのように分析されるか
処置前ー処置後データとは • 何らかの「処置」の効果を検証するために取られる • 通常、統制群と実験群の2つに分け、実験群のみ処置を施す • 同一個体を対応づけて、処置を施す前後の測定値を比較する • 各個体間のばらつきを調整し、精度よく処置効果を検証することができる • 特徴
事例紹介 • 実験 • タッチタイピングにおけるイメージトレーニングの効果の検証 • 出典は行動工学講座卒業生、神志那氏(1997, 卒業論文) • 2X2分割法 • 統制群(31名)、実験群(30名) • 測定するのはタッチタイピングの課題遂行時間 • 処置前-処置後データを両群において得る
事例紹介 • 実験 • 「処置」の内容 • 実験群 • ビデオ映像を用いたイメージトレーニングを数分間行う • 統制群 • 無関係のビデオを数分間観る • リハーサルを行うことを妨害するため
両群の課題遂行時間のグラフ (秒) 519.2(329.9) 389.3(232.4) 344.8(229.8) 286.3(181.8)
分散分析 • 一般線型モデル(GLM) • GLMとは • 固定効果だけのモデル • Y=Xβ+ε 固定効果。例えば対人不安高群と対人不安低群 GLMはランダム効果の中で最も典型的な「被験者効果」は固定効果によって模していた
分散分析 • 線型混合モデル(MixedModel) • MixedModelとは • 固定効果と(誤差以外の)ランダム効果とを同時に持つモデル • Y=Xβ+Zγ+ε ランダム効果。例えば被験者効果。複数あってもよい。
分析 • MixedModel>GLM • MixedModelが完全に勝っている • GLMを完全に抱合 • モデルが適切であるうえに、モデリングが柔軟 • 反復測定データ、特に経時データにもってこい 岸本淳司(1996). PROC MIXED入門 Verbeke and Molenberghs(編) / 松山・山口(編訳)(2001) 医学統計のための線型混合モデル-SASによるアプローチ- MixedModelになれよう(「医学統計のための線型混合モデル」輪講発表資料あります) http://koko15.hus.osaka-u.ac.jp/~kanekiyo/mixed/
MixedModelによる分散分析 • 被験者内共分散構造について • 2時点だから2つの分散、1つの共分散 • 同じ人からデータを取っているので共分散は0ではない • GLMは複合対称性(Compound Symmetry)を仮定 • 定分散、定非対角要素;この場合2つの分散を同じと見なして推定(パラメータは2)
MixedModelによる分散分析 • 被験者内共分散構造について • CSの仮定は正しいか? • 無構造(UN) VS 複合対称性(CS) • 処置前の分散と処置後の分散が等しいかどうかの検定に等しい • 尤度比検定 χ^2(df)= 63.5(1) , p≒0 • 明らかに適合度が悪化
MixedModelによる分散分析 • 被験者内共分散構造について • グループ別に推定すると? • UNVS 群別UN • 尤度比検定 χ^2(df)= 16.5(3), p≒0.001 • グループ別に推定するのが良い • なぜか? • 実は実験効果の効き方に由来する • 後述
MixedModelによる分散分析 • 被験者内共分散構造について • 特に仮説はないので複雑な共分散構造を決定してしまわずに、固定効果に対する標準誤差の推定量として共分散構造の誤特定にロバストなサンドウィッチ推定量(Liang and Zeger, 1986)を用いることにする
交互作用が有意 処置前の群間差が有意 処置後の群間差は非有意 固定効果の検定 • 交互作用・単純主効果の検討 • 群(実験群,統制群)×時点(pre, post)の交互作用 • 時点ごとの群の単純主効果
交互作用は有意 • 実験群の方がより下がる • イメージトレーニング効果の検証ができた ・・・の?
問題 • 処置前値に有意差 • 群への割付けは無作為であったが、処置前値が偏ってしまった(実験群>統制群) • ひょっとしたら・・・ • 交互作用は処置前値に差があるせいかも? • 実験群の方がより回帰効果が強かったからでは? • イメージトレーニングの効果と交絡
回帰効果について考える • 回帰分析について考える • xからyを予測するときの予測回帰式は(xとyが2次元正規分布すると仮定して) XとYを標準化すると、次ページの図のように書ける
y=xの直線 1.0 y=rxの直線 回帰直線 0.5 0 -0.5 xがxの平均から遠くなるほど、 E(Y|X=x)はyの平均に近づく -1.0 -1.5 -1 1 0
Galton(1886)の予測回帰式(インチをセンチメートルに変換)Galton(1886)の予測回帰式(インチをセンチメートルに変換) 回帰効果とは • 例1:Galton(1886)・・・回帰分析の始祖 • 親子の身長 • 身長の高い両親を持つ子供は、やっぱり身長が高いけど、親ほどには高くない 両親の平均身長が全体の平均値173.5cmよりも1cm高い174.5cmの場合、その 子供の身長の条件付平均は全体の平均値173.0cmよりも0.74cm高いに過ぎない →子供の全体の平均値へ回帰している→回帰分析の名前の由来
回帰効果とは • 例2:中間試験と期末試験の成績 • 中間試験で成績の良い人は期末試験ではちょっと下がる • 例3:準決勝と決勝戦の実力 • 決勝戦で発揮される実力は準決勝よりもやや劣る • 例4:2年目のジンクス • 2年目には1年目ほどの目立った活躍はできない
回帰効果@実験データ • 今回のタッチタイピングデータでは • 実験群の方が処置前値が有意に高い • 一体、どのような問題が生じると考えられるだろうか
処置後値 y=xの直線 回帰直線 処置前値が平均より上の人が実験群 に偏っていたとすると、実験群は回帰 効果が統制群に比べて強く、処置効果 がなかったとしても処置後値は統制群 よりも多く減少すると考えられる 処置前値 統制群 実験群
回帰効果@実験データ • タッチタイピング速度が上がったのは、処置効果によるものなのか、回帰効果によるものなのかわからない • 実験効果と回帰効果の交絡 • 各群の効果の内訳 • 実験群 : 練習効果,回帰効果,処置効果 • 統制群 : 練習効果,回帰効果 • 今回のデータでは • 実験群の方が処置前値が有意に高い • 実験群は統制群よりも回帰効果が大きいと考えられる
まずは定式化 • 処置後値をモデル化 • 処置後値を従属変数、処置前値を独立変数とする回帰モデル 処置後の期待値 処置前の期待値
まずは定式化 • 処置後値をモデル化 • e:実験群、c:統制群とする 実験群における処置後の期待値 実験群における処置前の期待値 統制群における処置後の期待値 統制群における処置前の期待値
まずは定式化 • Fを真の母集団分布とする • 「真の」という意味はスクリーニング(トランケーション)がなく、「全サンプルが観測されうる」という意味 • 真の母集団分布における処置前値の期待値が各群で等しいとき 両群で共通であることがポイント
X=xの処置前後差(の期待値) • X=xにおける処置前後差(の期待値) • 実験群の場合 ・・・・・・・① • X=xにおける実験群の「練習効果,回帰効果,実験効果」
処置前後差 • X=xにおける処置前後差(の期待値) • 統制群の場合 ・・・・・・・② • X=xにおける統制群の「練習効果,回帰効果」
処置前後差の差 • X=xにおける各群の処置前後差の差 • ①-②を計算すると・・・ ・・・・・・・③ X=xにおける回帰効果が各群で等しければ • X=xにおける「処置効果」。これが推定目標となる。
回帰効果が問題となるのは・・・ • 処置前において、真の母集団分布における期待値が等しいにも関わらずどちらかの群が偏って観測されるとき • 例1:無作為割付けしたにも関わらず処置前にたまたま偏りが生じた • 処置前値の真の母集団分布における期待値は同じ • 例2:クラスの中で、中間試験の成績が30点未満の学生にのみ補習授業を受けさせる • 補習を受ける群の真の母集団は「クラス全員の学生」 • 補習を受けない群の真の母集団も「クラス全員の学生」 • 中間試験成績の真の母集団における期待値は同じ
偏りのある母集団 • 観測される処置前値Xに偏りが生じる(真の母集団分布Fの一部が観測される)とき、偏りのあるXの母集団分布をG(≠F)とする • 例2で言うと、クラス全員の学生における中間試験成績の分布がF、補習を受ける群の中間試験成績の分布がG(このとき補習を受けない群の中間試験成績の分布をG’とするとこれもFの一部) • 「偏り」は例1のような「たまたま」であっても、例2のような「意図的なスクリーニング」であってもよい
偏りのあるときの期待値 • 処置後値をモデル化 • X~G(≠F)のとき 実験群 においてX~Gのときの処置後値の期待値 統制群
共変量を固定(調整)したうえで処置後値の期待値の差(群間差)を見ている。これは・・共変量を固定(調整)したうえで処置後値の期待値の差(群間差)を見ている。これは・・ 処置後値 まさに共分散分析である 統制群 ・ ・ 実験群 x 処置前値
共分散分析が有効 • 仮定 • 処置前値の真の母集団分布Fが同じ • 処置前の真の母集団における期待値が等しくなり、X=xのときの回帰効果が各群で等しくなる • ポイント • 処置前値の真の母集団における期待値の推定が不要 • Xに偏りがあってもバイアスなく偏回帰係数が推定可能
重 仮定についてもう少し深く • 処置前の真の母集団分布Fが同じ • 手元にある偏りのあるデータからは検証不能 • そう言えるだけの根拠がいる • 例1:無作為割付をしたという事実が大きな根拠 • 例2:補習群、非補習群は「クラス全員の学生」という真の母集団の部分集合なので自明 • 仮定が崩れるとき共分散分析は不適 • 例:性別や国籍といった属性で群別している場合
基本は岩崎(2002) • 共分散分析一般の仮定である「共変量の偏回帰係数は一定」のもとで、同様の結論を導いている • しかし、「共変量の偏回帰係数は一定」という仮定は本質的な仮定ではない • 交互作用があるという重要な知見である
模式図 処置効果を切片の差 で推定する 特性値 共分散分析は各群に共変量と特性値の関係性を表す 平行な回帰直線を当てはめて、その直線の距離 (群間差)を検討する 統制群 ・ ・ 実験群 共変量
模式図 特性値 「回帰直線が平行でないとき共分散分析をやってはいけない」と いう話を聞くことがあるが、それは切片の差を推定することに 意味がないということ。交互作用がある、つまり共変量の値に よって処置効果が異なるという知見は重要(後述) 統制群 切片の差に 意味はない! ・ ・ 実験群 共変量
シミュレーション1 • 共分散分析は有効か? • 実験群の方が処置前値が高く、処置効果がない(且つ両群に練習効果がある)というような処置前-処置後データを作る
シミュレーション1 • 共分散分析は有効か? • 実験群(30名) • 処置前値(pre)~N(150, 202) • このときたまたま偏りが生じ30人中25人が160より上だったとする • 処置後値(post): 処置前値の期待値 処置後値の 期待値 140+0.7(pre-150)+e 練習効果:-10 回帰係数: 0.7 e~N(0,102) 回帰係数 実験効果はなし!
シミュレーション1 • 共分散分析は有効か? • 統制群(30名) • 処置前値(pre)~N( 150, 202) • 処置後値(post):140+0.7(pre-150)+ee~N(0,102) 練習効果:-10 回帰係数: 0.7
平均値のグラフ 170.5 153.9 149.4 139.9
交互作用が有意 処置前の群間差が有意 処置後の群間差が有意 シミュレーション1 • MixedModelによる分散分析 ・交互作用と単純主効果の検討
シミュレーション1 • 分散分析 • 交互作用は有意 • 処置前値、処置後値にはどちらも有意 • しかし、その差は短くなっている • この結果から、実験効果はあったと言ってしまうのではないでしょうか
交互作用は非有意 交互作用項を外して郡間 差を見ると非有意 シミュレーション1 • 共分散分析 • 共変量(pre)と主効果(群間差)の検討 推定値(S.E) pre : 0.79(0.08) 群間差 : 2.75(2.92) 真実を反映している