1 / 39

統計学入門2

統計学入門2. 関係を探る方法 講義のまとめ. 今日の話. 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士. 多変量データ. データの型と関連を探る道具. 質的・質的 ・・・  クロス集計表 量的・量的 ・・・  散布図・相関係数 質的・量的 ・・・  条件付分布   グループ別平均   相関比. クロス集計表の例. クロス集計表. 条件付き分布.

lynne
Download Presentation

統計学入門2

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 統計学入門2 関係を探る方法 講義のまとめ

  2. 今日の話 • 変数間の関係を探る • クロス集計表の検定:独立性の検定 • 散布図、相関係数 • 講義のまとめ と キーワード • 「統計学入門」後の関連講義・実習 • 社会調査士

  3. 多変量データ

  4. データの型と関連を探る道具 • 質的・質的 ・・・  クロス集計表 • 量的・量的 ・・・  散布図・相関係数 • 質的・量的 ・・・  条件付分布   グループ別平均   相関比

  5. クロス集計表の例

  6. クロス集計表

  7. 条件付き分布 • 2つの変数X, Yがあり、X = x となる場合にのみYの分布を考えたとき、その分布を X = x があたえられたときの Yの条件付き分布という

  8. 条件付き分布 変数X 変数Y X=Bが与えられたときの、Yの条件付き分布

  9. 周辺分布

  10. 同時分布

  11. 独立 • 2つの変数が独立であれば、   周辺分布は、いかなる条件付き分布とも   同じになる

  12. クロス集計表

  13. クロス集計表:()内は%

  14. クロス集計表

  15. 練習問題:独立になるように...

  16. 積事象の確率 P(AB)=P(A)P(B|A) =P(B)P(A|B) • P(A|B) : • Bの下でのAの条件付確率 • P(B|A) : • Aの下でのBの条件付確率

  17. 事象AとBが独立 P(AB) = P(A) P(B) P(A|B) = P(A) P(B|A) = P(B)

  18. 独立期待度数

  19. 独立期待度数 独立であるという仮定の下での(i,j)セルの確率

  20. 独立性の検定 • 観測度数と独立期待度数の比較 ただし、

  21. 独立性の検定 • 観測度数と独立期待度数の比較 独立であるという前提で計算された値と どの程度離れているかを評価する

  22. p 値の計算と検定結果 • 検定統計量の分布は、自由度(a-1)(b-1)のc2分布 • c2分布の分布点を求める関数 =CHIDIST(c2 , df) p値を設定された有意水準(通常は5%)と比較し、p値が小さい場合は独立でないと判断する

  23. 量的データの関連を探る • 散布図 • 相関係数 (-1から1の範囲の値) • 直線的な関係を表す尺度 • 符号 ・・・ 関係の向き • 絶対値 ・・・ 関係の強さ

  24. Y yi ( xi , yi ) xi X 散布図

  25. 散布図 • 点の散らばり具合をみて、変数間の関連を探る

  26. 相関係数 • 2つの量的変数の直線的関係の • 向き (符号) • 強さ (絶対値)  をあらわす

  27. Excelでの相関係数の計算 • ワークシート関数(XとYの相関を求める) • =CORREL(Xの配列,Yの配列) • 分析ツール

  28. 分析ツール:相関 入力範囲に分析するデータの範囲を指定 3つ以上の変数を指定することも可能

  29. 相関係数の解釈上の注意点 • 相関があっても因果があるとは限らない • 非線形の関係は表現できない • 第3の変数の存在を意識すること • 外れ値に対し、頑健でない

  30. 確認のための演習 • ITLSの下記のページにアクセスして、頑健性のなさをチェックしてみよう! • http://www.sci.kagoshima-u.ac.jp/~itls/JAVA/java_ss/1746e/ 注意:アプレットの下の方に提示されている coefficient of determination     は、相関係数の2乗の値

  31. 量的データと質的データの関連 • 一般的な方法 • 質的データが与えられた下での、連続データの条件付分布を比較する • 条件付分布が同じであれば(似ていれば)、無関係であると判断する

  32. 層別グラフ

  33. データの型と関連を探る道具 • 質的・質的 ・・・  クロス集計表 • 量的・量的 ・・・  散布図・相関係数 • 質的・量的 ・・・  条件付分布   グループ別平均   相関比

  34. 3つ以上変数がある場合の分析 • 多変量解析 • 2・3年次以降の関連科目 • 社会調査法 • データサイエンス • 社会調査実習 • 多変量解析 • (オペレーションズ・リサーチ)

  35. 講義のまとめ:キーワード • 確率と分布 • 2項分布、正規分布(*) • 母集団と標本 • 標本分布(*) • 統計的推定 • 標本誤差(*) • 推定 • 点推定、区間推定(*) • 信頼区間、信頼度 • 統計的検定 • 2種類の過誤(*) • 有意水準(*) • 有意確率(p値)(*) • 平均と比率の検定

  36. 社会調査士 • 2003年度 認定機構 設立 • 社会調査士資格認定機構 http://wwwsoc.nii.ac.jp/jcbsr/ • 指定された科目の単位習得と卒業が資格取得の条件

  37. 必要とされる科目 • 社会調査法A, B • 統計学入門(1), (2) • データサイエンス・多変量解析から1科目 • 社会調査実習

More Related