430 likes | 801 Views
June 9 2000. 3相データの分析っ!. 行動計量学講座 B3 宮村 理. 3相データ分析. 主成分分析・因子分析の拡張パタン 2 次元から 3 次元への拡張 縦断的(時系列)データ,多特性 ‐ 多方法データ,SD法などを分析するために使用 従来の因子分析で解析する場合もあり. 縦断的データ. ・時系列にそってデータをとる 例:小学校のクラス一つを対象とし、その児童と親の意識調査を継続的に行う 結果、子どもの意識は徐々に親の意識に近づいていく. 多特性 ‐ 多方法データ. 同じ特性の測定を、異なる方法によって行うことで得られる
E N D
June 9 2000 3相データの分析っ! 行動計量学講座 B3 宮村 理
3相データ分析 • 主成分分析・因子分析の拡張パタン • 2次元から 3次元への拡張 • 縦断的(時系列)データ,多特性‐多方法データ,SD法などを分析するために使用 • 従来の因子分析で解析する場合もあり
縦断的データ ・時系列にそってデータをとる 例:小学校のクラス一つを対象とし、その児童と親の意識調査を継続的に行う 結果、子どもの意識は徐々に親の意識に近づいていく
多特性‐多方法データ • 同じ特性の測定を、異なる方法によって行うことで得られる • 目的は、方法間の差を知ること
SD法 • 被験者にいくつかの尺度上で、複数の概念に対するイメージを評定させる • 心理学実験でやりました
3相データのカタチ • 同一個体群,同一変量群、異条件下での反復測定データ • すなわち 反復に際しては 個体群,変量群はともに同一 ⇒ 変量が別のものになったり,個体が変わったりすれば,3相 データとは呼べない 時系列データは条件(時間)のみが変化 多特性‐多方法データは条件(方法)のみが変化 SD法では条件(概念)のみが変化
Xq Xk X2 X1 Visual 3相データ !!‐3相データのカタチ‐ p n×p 行列が q 個 n
例えばこんな 稲のデータ がある 個体群 → 稲の種類 変量群 → 計測方法 条件 → 地域 (7ヵ所) 稲のデータ 稲のデータ
3次元データ x114:koshihikariの 収量 を 宮崎 で調査したデータ 条件4 個体1 変量1
求められる分析結果‐次元縮小‐ ・ 分析結果の解釈 -simple is beautiful- 各相に多数の変数→ 解釈が困難 ↓ 少数の潜在変数で説明する結果が欲しい 稲的に言うと 「稲の発育にどんな要因が影響しているのか知りたい」
求められる分析結果‐条件間の差を知る‐ 2相データと異なり 条件 の相が加わっている ↓ 条件間での差 を示す結果が欲しい
多母集団2相データ 3 相データ に似たものとして 多母集団 2 相データ がある 多母集団 2 相データ: 個体は変化 変量は同一 条件は変化 例:海洋志向性の国際比較 多母集団 2 相データ: 個体は変化 変量は同一 条件は変化 例:関東と関西における そばとうどんの志向 3相データでは 同一 関東の人と関西の人とで個体が異なる
多母集団 2相データ分析的分析 3相データであっても 多母集団2相データとして扱い 分析することがある 平均をとってならしてしまう 3つの相のうち 一つを落として 2相とみる せっかくの情報が分析前から縮約されてしまう
3相データを3相データ分析 本来3相データなのだから やはりここはそれを生かした 分析をしたいぞ 得られた情報は 活用する 捨てたくないっ
モデル‐2つの流れ‐ • 3相因子分析モデル • Tuker (1964) の記述モデル • Bloxom (1984) の階層因子分析モデル • PARAFACモデル • Harshman (1970) によって考案される • Carroll, Chang (1970) • Sands, Young (1980)
3相因子分析モデル‐行列表現1‐ 添え字の約束 ここでは以下にしたがう n > s p > t q > u
3相因子分析モデル‐行列表現2‐ n → s p → t q → u A,B,f は因子パタン行列 と次元を縮約したもの
独自因子得点行列ε いわゆる誤差項 共通因子以外のものは全部 ここ に放りこんじゃう 独自因子間の 相関はない
3相因子分析モデル‐考え方‐ 核行列 C は理想的個体 a の 理想的変量 b による 理想的条件 c の下での測定値 当然、 誤差も 加わる 行列 A,B,Fはパタン行列 条件の違いを A,B,Fで表す
3相因子分析モデル‐考え方2‐ ポイント : 個体,変量,条件の 3つ全てについて 次元を縮約している
PARAFACモデルParallel Factors Factor Analysis
PARAFACモデル‐行列表現1‐ 重み付け 因子パタン超行列 超行列:行列を要素とする行列 今はあまり気にしないこと
PARAFACモデル‐行列表現2‐ 重み付け 因子得点ベクトル 因子パタン行列
PARAFACモデル‐共通因子パタン行列Λ‐PARAFACモデル‐共通因子パタン行列Λ‐ あるいは 因子負荷量 のこと
é ù 最終的に m 個の因子に まとめるわけです f 1 ê ú = f M ê ú ê ú f ë û m PARAFACモデル‐因子得点ベクトルf‐
PARAFACモデル‐重み付き因子得点行列‐PARAFACモデル‐重み付き因子得点行列‐ ここで条件による違いを表現している
PARAFACモデル‐独自因子得点行列ε‐PARAFACモデル‐独自因子得点行列ε‐ いわゆる誤差項 共通因子以外のものは全部 ここ に放りこんじゃう 独自因子間の 相関はない
PARAFACモデル‐考え方‐ ポイント1:条件の違いを w による重み付けで表現している ポイント2:次元が縮約されるのは 個体と変量 の 2つであり 条件はそのまま
モデルの解法‐パラメータの推定‐ 様々な手法が提案されている 基本的には 最小2乗法で求める 3相因子分析モデルでは F, A, B, Cを PARAFACモデルでは F, Λ, Wを 推定する
CFH‐PARAFAC で分析‐具体例:稲のデータ‐ CFH-PARAFAC:パラメータ推定法の1つ 詳細については 林・林 (1982)
1.43 Panbira (バングラディシュ) Belle Panta (アメリカ) Bluebelle (アメリカ) Tainan 3 (台湾) 2次元目 0.00 Koshihikari (日本) Norin 29 (日本) Taichung Native 1 (台湾) IR 8 (インドネシア+中国、 フィリピン) -1.00 4.08 5.00 7.13 1 次元目 結果1 図1 稲の種の布置 ジャポニカ因子とインディカ因子
1.44 1000粒重量 穂数 出穂まで日数 収量 2次元 0.00 穂長 稈長 -1.61 -0.89 2.16 1次元 結果2 図2 変量の布置 円状の布置⇒変量は互いに独立⇒よい指標であろう
-2.28 BEAUMONT (アメリカ) ORISSA (インド) 2次元 埼玉 佐賀 新潟 -5.00 宮崎 TAIPEI (台湾) -5.40 -1.29 0.00 1.83 1次元 結果3 図3 地域の布置 条件(地域)による重み付けも妥当であろう
参考文献 • 因子分析その理論と応用 • 柳井晴夫 重桝算男 前川眞一 市川雅教 朝倉書店 (1990) • PARAFAC とその応用 • 林知己夫 林文 (1982) 数理科学 No.225 32‐36 • 人間行動の計量分析多変量データ解析の理論と応用 • 柳井晴夫 岩坪秀一 石塚智一 編 (1990) 東京大学出版会 • SASによる統計解析 (因子分析の項) • 吉田 狩野 原田(2000)科学技術出版
Special Thanks • 役に立ったぞっ 「行列になれよう !」 • 清水さま • 無理やり相談相手になっていただいた • 宮本さま • BGM まわしつづけた • Michael Jackson • お米大学 AND YOU! End…
次回予告 • 「多変量解析になれよう!」 において 3相データの分析を扱います 今回省いた より数学的な話をメインにして 鋭意資料を作成中 • 日時は (予定では) July 10 2000 15:00~です ☆勉強しておきます ちゃんちゃん♪