790 likes | 999 Views
心理学の基礎 (6) 因子分析の基本問題. 香川大学経済学部 堀 啓造 日本心理学会第回大会 2000年11月6日. 1.主成分分析・因子分析 (直交モデル). 主成分分析はデータの集約 因子分析は潜在因子を仮定する この違いを示す。. データの作成. 全く相関しない乱数データを多数作る。 N=1000 の変数を任意に作成する。 SPSS 使用 互いに独立な正規乱数生成マクロ http://www.ec.kagawa-u.ac.jp/~hori/spss/ spss.html#ranzero. V1. E1. F1因子. V2. E2. V3.
E N D
心理学の基礎(6)因子分析の基本問題 香川大学経済学部 堀 啓造 日本心理学会第回大会 2000年11月6日
1.主成分分析・因子分析(直交モデル) • 主成分分析はデータの集約 • 因子分析は潜在因子を仮定する • この違いを示す。
データの作成 • 全く相関しない乱数データを多数作る。 • N=1000 の変数を任意に作成する。 • SPSS使用 • 互いに独立な正規乱数生成マクロ • http://www.ec.kagawa-u.ac.jp/~hori/spss/ spss.html#ranzero
V1 E1 F1因子 V2 E2 V3 E3 =0.6× +0.8× V4 E4 V5 E5 V6 E6 F2因子 V7 E7 =0.5× V8 +0.87× E8 V9 E9 V10 E10
第1因子 compute x1=0.6**2. compute w1=sqrt(x1). compute w2=sqrt(1-x1). compute v1=w1*f1+w2*e1. compute v2=w1*f1+w2*e2. compute v3=w1*f1+w2*e3. compute v4=w1*f1+w2*e4. compute v5=w1*f1+w2*e5. 第2因子 compute x1=0.5**2. compute w1=sqrt(x1). compute w2=sqrt(1-x1). compute v6=w1*f2+w2*e6. compute v7=w1*f2+w2*e7. compute v8=w1*f2+w2*e8. compute v9=w1*f2+w2*e9. compute v10=w1*f2+w2*e10. 変数の作成(v1~v10)
相関行列 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V1 1.00 0.36 0.36 0.36 0.36 0.00 0.00 0.00 0.00 0.00 V2 0.36 1.00 0.36 0.36 0.36 0.00 0.00 0.00 0.00 0.00 V3 0.36 0.36 1.00 0.36 0.36 0.00 0.00 0.00 0.00 0.00 V4 0.36 0.36 0.36 1.00 0.36 0.00 0.00 0.00 0.00 0.00 V5 0.36 0.36 0.36 0.36 1.00 0.00 0.00 0.00 0.00 0.00 V6 0.00 0.00 0.00 0.00 0.00 1.00 0.25 0.25 0.25 0.25 V7 0.00 0.00 0.00 0.00 0.00 0.25 1.00 0.25 0.25 0.25 V8 0.00 0.00 0.00 0.00 0.00 0.25 0.25 1.00 0.25 0.25 V9 0.00 0.00 0.00 0.00 0.00 0.25 0.25 0.25 1.00 0.25 V10 0.00 0.00 0.00 0.00 0.00 0.25 0.25 0.25 0.25 1.00
0.36*5 0.25*5 1.00+0.36*4 1.00+0.25*4
主成分分析を行う • FACTOR • /VARIABLES v1 to v10 /ANALYSIS v1 to v10 • /PRINT extraction • /CRITERIA MINEIGEN(1) ITERATE(25) • /EXTRACTION pc.
因子分析はモデルをきれいに再現させた。 • 主成分分析はもとのモデルよりも負荷量・共通性とも大きくなる。 • 主成分分析がデータの記述であることを示すにはもう一つつっこむ必要がある。 • 変数の数を減らしてみる。 • v9,v10をカット
主成分分析と因子分析の違い • 主成分分析は関係する変数の数が変わると負荷量・共通性が変わる。 →主成分分析は記述 • しかも,数値はその因子に関連する変数の数によって意味が違っていて,結果を誤読するおそれがある。 • 因子分析は関係する変数の数が変わっても負荷量・共通性の値は変化しない。
2.主成分分析と因子分析の直交解・斜交解 • 斜交解が適切な場合におこる問題を指摘し,斜交解が適切であることを示す。 • 特に主成分分析は斜交解が適切な場合におおきな問題を抱えている。回転をしない解の問題を指摘する。 • 斜交回転は 直接oblimin(0)
compute a1=0.5. /*因子 compute a3=0.3. /*g compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v6=w1*f2+w3*f5+w2*e6. compute v7=w1*f2+w3*f5+w2*e7. compute v8=w1*f2+w3*f5+w2*e8. compute v9=w1*f2+w3*f5+w2*e9. compute v10=w1*f2+w3*f5+w2*e10. compute a1=0.3. /*因子 compute a3=0.3. /*g compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v16=w1*f4+w3*f5+w2*e16. compute v17=w1*f4+w3*f5+w2*e17. compute v18=w1*f4+w3*f5+w2*e18. compute v19=w1*f4+w3*f5+w2*e19. compute v20=w1*f4+w3*f5+w2*e20. exec. データの作成
(sqrt(0.5)) V1 E1 F1因子 V2 E2 V3 E3 +0.71× +0.45× V4 E4 G因子 V5 E5 =0.55× V6 E6 F2因子 V7 E7 +0.55× V8 +0.63× E8 V9 E9 V10 E10 (sqrt(0.3)) (sqrt(0.3))
r=.433 0.894= sqrt(0.3+0.5) 0.775= sqrt(0.3+0.3)
一般因子がある場合,主成分分析(回転をしない本来のもの)は,意味もなく,2つの因子をひっつける。これは単に分散を最大化するためのもの。一般因子がある場合,主成分分析(回転をしない本来のもの)は,意味もなく,2つの因子をひっつける。これは単に分散を最大化するためのもの。 • だから,解釈する意味はないと考えたほうがいい。 • 実際にはいろんな複雑な関係があるから,解釈したくなる。 • 意味づけできるものでも分散最大化の人工的なものと抑える。
r=.397 r=.433
主成分分析変数の数を減らす • 因子分析の負荷量は変化しないが, • 主成分負荷量は変化する。
主成分間相関・因子間相関 • 主成分分析 5+2 .383 • 主成分分析 5+5 .397 • 因子分析 5+5 .433 • 因子分析 5+2 .433 • 主成分分析の主成分間相関はもとのモデルを再現できないし,変数の数によって変化する
F1 V1 E1 V2 E2 V6 E6 F2 V7 G因子 E7 = V11 E11 F3 V12 E12 V16 F4 E16 V17 E17
compute a1=0.6. /*因子 compute a3=0.3. /*g */ compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v1=w1*f1+w3*f5+w2*e1. V2~v5 compute a1=0.4. /*因子 compute a3=0.3. /*g */ compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v11=w1*f3+w3*f5+w2*e11.v12~v15 4因子データ(2,4は前と同じ)
主成分を解釈したくなるが,あくまで分散最大化するためのもの主成分を解釈したくなるが,あくまで分散最大化するためのもの • 意味がなくても結合するのである。 • 但し,第1主成分は主として一般因子
Varimax 回転と直接oblimin • Varimax 解には小さな負荷量がつく。 • 小さな負荷量であっても必ずしも無視できるものではない。
因子間相関 r=0.433
Varimax 回転 直接oblimin
階層因子 1次因子 変数 因子 変数 高次因子 変数 変数 因子 変数 変数
高次因子 • 因子間相関行列から計算 • 一般因子の負荷量の設定は同じ:sqrt(0.3)=0.548 • F1=0.577*0.949 =0.548 • F2=0.613*0.894 =0.548 • F3=0.655*0.837 =0.548 • F4= 0.707*0.775=0.548 • 絶対量でなく比率
参考:Statistica の階層因子分析 変数大幅に省略(各因子の1変数のみ記載) sqrt(0.5)= 0.707 sqrt(0.4)= 0.632 sqrt(0.3)= 0.548 sqrt(0.6)= 0.775 sqrt(0.3)= 0.548
斜交の図(省略) • promax k の指定:3,4,6,8 kが大きい方が単純解 • 直接oblimin γまたはδ=0 指定 -方向は直交解に近くなる +方向はより斜交 0がもっともよい(promax よりも単純解)
promax k=3 r=0.373 θ=68.1°
promax k=4 r=0.428 θ=64.7°
直接oblimin γ=0 r=0.442 θ=63.7°
第2部 因子抽出法 (1) ML 最尤法 (2)ULS 最小2乗法=反復主因子法 (3) 非反復法 (Kano, 1990; Cudeck,1991) Cudeck(2000)
(1)最尤法(ML) (a) 多変量正規分布を前提 はっきりと正規分布からはずれる場合には使わない→最小2乗法 (b) 検定法がいろいろある→good (c) 変数が非常に多いときにはよくないかもしれない。Cudeck(2000)では50以内。 (d) 不適解になる可能性が他の方法より多い→bad であり 診断としては good (e)初期値を変えたら不適解でなくなるかもしれない
(2)最小2乗法(ULS) (a) 収束すれば反復主因子法,Minres などと同じ結果。 (b) 反復主因子法に比べ収束がはやい (c) 多変量正規分布の前提がない (d) どの因子数でもそれなりにフィットする (これは欠点) (e) 不適解
(3)不適解「共通性が1を超えました」 (a) 反復主因子法をやってみる (不適解か?) (b) 非反復因子分析(Kano, 1990; Cudeck, 1991) (c) 不適解がどうして起こっているか検討する 狩野裕(1998).不適解の原因と処理:探索的因子分析 大阪大学人間学部紀要, 24, 303-327. (d) 因子数を減らしてみる (e) その因子の変数の減(またはなくす) (f) 主成分分析または非反復の主因子法 (g) その因子の変数増 (再調査) (h) サンプル増(良性の場合)(再調査)
第3部 因子数の決定 因子分析と主成分分析との違いは分かった。 しかし,因子数をうまく決定しないと因子分析は結局意味ないよ。 探索的因子分析なんて風水みたいなもんじゃない。
1.因子数決定の主たる方法(1) 市川雅教,1990in 柳井・繁桝・前川・市川『因子分析ーその理論と方法』朝倉書店 (1)対角1の相関行列の固有値1以上の数 (2)相関行列の対角にSMCを入れて固有値0以上の数 (3)スクリープロット (4)共通因子により説明される割合 (5)尤度比検定 (6)情報量AIC
1.因子数決定の主たる方法(2) Cudeck, R. (2000). Exploratory factor analysis. In Handbook of applied multivariate statistics and mathematical modeling. Academic Press. (1)Eigenvalues Greater than Unity (2)Scree Test (3)Test of Exact Fit (4)Root Mean Square Error of Approximation (RMSEA)