130 likes | 278 Views
統計学II 3章 1変量から多変量へ ( とEXCELでの統計解析 ) Multivariate Data Analysis. 2006 年度後期 工学院大学 統計学II 参考書:多変量統計解析入門、杉山高一著、朝倉書店 EXCEL でやさしく学ぶ多変量統計解析、室淳子 + 石村貞夫著、 東京図書 第 2 版 2004 年 12 月 授業内容: http://datamining-statistics.blog.ocn.ne.jp/yamashita/ の中のカテゴリ「多変量統計 / 統計学II」. 1. 多変量データ解析. 母集団. 無作為に抽出. 標本.
E N D
統計学II3章 1変量から多変量へ(とEXCELでの統計解析)Multivariate Data Analysis 2006年度後期 工学院大学 統計学II 参考書:多変量統計解析入門、杉山高一著、朝倉書店 EXCELでやさしく学ぶ多変量統計解析、室淳子+石村貞夫著、 東京図書 第2版 2004年12月 授業内容:http://datamining-statistics.blog.ocn.ne.jp/yamashita/の中のカテゴリ「多変量統計/統計学II」
1 多変量データ解析 母集団 無作為に抽出 標本 母集団を推定・検定 標本 母集団の小型版(母集団の代表) 調査の対象となるデータ 現代社会で扱うデータはほとんど多変量データで、お互い何らかの関連性を持っている。 統計学I(基本):1変量、2変量解析 統計学II:多変量データを解析
2 多変量データ ・調査や実験から得られるデータには、多項目の情報があり、これらはお互いに関連性を持ったり、従属性または因果関係を持ったりすることが多い。これからの項目を変数と呼ぶ。 ・今回は先ず量的な変数を扱う。 ・量的な変数または量的なデータとは、計量値や連続データとも呼ばれ、年数、時間、長さ、重さ、割合などのように、順序が定義された単位を持つ測定値または単位を持たない尺度・比率のことである。
3 ・今、yと記述する変数を結果係の情報とし、xが頭文字となる変数を、例えばx, x1,x2,…,xp、原因系の情報とする。
4 多変量データ分析と1変量データ分析 一般問題の対象となるデータ、多変量データである。 例題1: X1 X2 X3(Y) EXCELでやさしく学ぶ多変量統計解析、室淳子+石村貞夫著
5 例題2:
6 多変量データの基本分析 1)平均ベクトル X1 X2 X3
7 2)分散共分散行列 Sは標本の分散共分散行列といい、Sの対角線のSiiはXiの分散(Siiの平方根はXiの標準偏差)、非対角線のSijはxiとxjの共分散という。
3)相関行列を求める: 8 分散共分散行列 平均ベクトル Rは標本の相関行列といい、Rの成分rijはxiとxjの相関係数という。
9 母集団 無作為に抽出 標本 母集団を推定・検定 標本 標本平均ベクトル、標本分散共分散行列、標本の相関行列 母平均ベクトル、母分散共分散行列、母集団の相関行列
10 件数が多かったら(縦軸は相対度数%) 曲面に注目! 2次元の度数分布図(縦軸は度数・件数)
11 2変量の正規分布の確率密度関数:σijは母集団の共分散 相関r=0のとき 相関r=0.7のとき 相関r=0のとき、一方の分散が4倍 相関r=0.7のとき、一方の分散が4倍
12 曲面は多変量正規分布 標本のサイズn⇒N 無限大に近い。