90 likes | 278 Views
統計学II 3章 1変量から多変量へ その2 ( とEXCELでの統計解析 ) Multivariate Data Analysis. 2006 年度後期 工学院大学 統計学II 参考書:多変量統計解析入門、杉山高一著、朝倉書店 EXCEL でやさしく学ぶ多変量統計解析、室淳子 + 石村貞夫著、 東京図書 第 2 版 2004 年 12 月 授業内容: http://datamining-statistics.blog.ocn.ne.jp/yamashita/ の中のカテゴリ「多変量統計 / 統計学II」. 1. 多変量データの基本分析.
E N D
統計学II3章 1変量から多変量へ その2(とEXCELでの統計解析)Multivariate Data Analysis 2006年度後期 工学院大学 統計学II 参考書:多変量統計解析入門、杉山高一著、朝倉書店 EXCELでやさしく学ぶ多変量統計解析、室淳子+石村貞夫著、 東京図書 第2版 2004年12月 授業内容:http://datamining-statistics.blog.ocn.ne.jp/yamashita/の中のカテゴリ「多変量統計/統計学II」
1 多変量データの基本分析 X1 X2 X3(またはY) 1)平均ベクトル 2)分散共分散行列 EXCELの分散共分散行列sij*n/(n-1)と調整する。 スポーツとダイエットは高い正の相関を持つ ストレスとスポーツは高い不の相関 ストレスとダイエットも高い不の相関を持つ 3)相関行列
2 ・2つの変数間の線形関係の度合いを定量的に表わしたものをrijと書き、ピアソン(Pearson)の相関係数と呼ぶ。 ・このrijは-1~+1の値を取り、目安としてピアソンの相関係数は以下の3つの種類である。 ①正の相関では、0.2<r≤1 (弱い正の相関: 0.2<r≤0.4、ある程度の正の相関: 0.4<r≤0.7、強い正の相関: 0.7<r≤1) ②負の相関では、-1≤r<-0.2 (弱い負の相関: -0.4<r≤-0.2、ある程度の負の相関: -0.7<r≤-0.4、強い負の相関: -1<r≤-0.7) ③無相関では、-0.2≤r≤0.2。
各変数の標準化 3 分散の平方根は標準偏差
4 標準化した多変量データの基本分析 1)平均ベクトル 2)分散共分散行列 EXCELの分散共分散行列sij*n/(n-1)と調整する。 標準化前の相関行列と同じ 3)相関行列 同じ
標準化とは、変数間の測定単位・スケール(散らばり・ばらつき)の違いや平均(中心的位置)の違いを一定にすること。標準化とは、変数間の測定単位・スケール(散らばり・ばらつき)の違いや平均(中心的位置)の違いを一定にすること。 各変数の平均0、分散と標準偏差1にする。 多変量データ分析では標準化や非標準化をうまく使い分けて分析していく。 5 ダイエットの影響を除いたストレスとスポーツの相関が知りたい 相関行列と偏相関行列 スポーツX1 X1 X2 X3(またはY) ストレスX3 (またはY) スポーツの影響を除いたダイエットとストレスの相関が知りたい ダイエットX2
相関行列 6 相関行列の逆行列 偏相関行列 計算 偏相関係数:他の変数の影響を除いた後のxiとxjの相関係数 例 www.aoml.noaa.gov/phod/docs/wang_etal_grl.pdf
7 偏相関行列 ダイエットの影響を除いたストレスとスポーツの相関が知りたい スポーツX1 ストレスX3 (またはY) スポーツの影響を除いたダイエットとストレスの相関が知りたい ダイエットX2 ダイエットの影響を除いたら、ストレスとスポーツの相関が減少した。偏相関係数で、相関係数(偽相関がある場合がある)では見られない、多変量間の複雑さを見ることができる。