410 likes | 712 Views
確率と統計. メディア学部 2011 年 2011 年 12 月 22 日(木). この資料は数学的な話が中心です。. 確率分布. 検定を行う際、確率計算が必要になります。 そのためには、分析対象が従うそれぞれの確率値の在り様 ( 確率分布 ) を知り、その 性質・特徴を上手く利用することになります。. 例えば. 1つのサイコロを 500 回投げたとき、偶数の目が100回出る確率 P を求めるとき、 定義では を計算しなければならない。うっそ!. 興味ある人は計算してみてください。. 参考情報. オープンソースのツールを使うことも考えてみよう
E N D
確率と統計 メディア学部2011年 2011年12月22日(木) この資料は数学的な話が中心です。
確率分布 • 検定を行う際、確率計算が必要になります。 • そのためには、分析対象が従うそれぞれの確率値の在り様(確率分布)を知り、その性質・特徴を上手く利用することになります。 東京工科大学 確率と統計2011
例えば • 1つのサイコロを500回投げたとき、偶数の目が100回出る確率Pを求めるとき、定義では を計算しなければならない。うっそ! 興味ある人は計算してみてください。 東京工科大学 確率と統計2011
参考情報 • オープンソースのツールを使うことも考えてみよう • 数式計算ソフトウェア Maxima • 数値計算ソフトウェア Scilab • 統計計算ソフトウェア R など 東京工科大学 確率と統計2011
いろいろな確率分布 • 2項分布 • 正規分布 • ポアソン分布 • 一様分布 • χ2分布(カイ自乗分布 • t分布(ティー分布) • F分布(エフ分布) などなど 東京工科大学 確率と統計2011
1. 2項分布 • 1回の試行において、事象Aの起こる確率がp、起こらない確率がqとする。このとき、n回の反復試行で事象Aがk回起こる確率は、次のようになる。この分布を と書く。 教科書 p.97 参照のこと 東京工科大学 確率と統計2011
例 • 1枚の硬貨をn回投げる。 東京工科大学 確率と統計2011
2項分布B(n, p)の平均と分散 • 平均 = np • 分散 = npq 有名かつ便利な公式 教科書 p.101 式 (2) 参照のこと 東京工科大学 確率と統計2011
公式の利用例 • サイコロを500回振る。3の倍数の目が出る回数の平均(期待値)は、公式より 東京工科大学 確率と統計2011
2.正規分布 • 測定誤差や身長のデータのヒストグラムを作ると釣鐘型になる。このときのヒストグラムの形を近似的に表す曲線を正規分布曲線とい、このときの分布を正規分布という。正規分布曲線は、平均μと分散σ2できまるので、N(μ, σ2 ) と書くことがある。 東京工科大学 確率と統計2011
キーワード • 分布関数 • 確率密度関数 • 正規分布曲線(定義) • 正規分布の特徴 • 標準化 など 東京工科大学 確率と統計2011
正規分布のグラフ 東京工科大学 確率と統計2011
正規分布のグラフ 教科書 p.102 図3 参照のこと 左右対称 変曲点 ほとんどゼロ 東京工科大学 確率と統計2011
正規分布曲線の式 東京工科大学 確率と統計2011
正規分布曲線の式 平均 標準偏差 東京工科大学 確率と統計2011
重要な性質 • 左右対称 • X=σは変曲点(上凸と下凸の変わり目) • 平均 = 中央値 = モード 東京工科大学 確率と統計2011
他の重要な性質 • (次ページ以降を参照のこと) 東京工科大学 確率と統計2011
正規分布のグラフ 68% 東京工科大学 確率と統計2011
正規分布のグラフ 95% 東京工科大学 確率と統計2011
正規分布のグラフ 99.7% 東京工科大学 確率と統計2011
ちょっと一言 • 図形の面積は定積分によりもとめられる。 東京工科大学 確率と統計2011
標準化の公式 N(μ,σ2) N(0,1) 東京工科大学 確率と統計2011
標準化の公式 平均ゼロ、分散1 (標準正規分布) 平均μ、分散σ2 (正規分布) N(μ,σ2) N(0,1) 東京工科大学 確率と統計2011
標準化の公式 平均ゼロ、分散1 (標準正規分布) 平均μ、分散σ2 (正規分布) N(μ,σ2) N(0,1) これについての情報が標準正規分布表として与えられている。 東京工科大学 確率と統計2011
練習問題 • 正しく作られたコインを100回投げるとき、表が40回から60回出る確率を求めよ。 東京工科大学 確率と統計2011
ヒント: • コイン投げの繰り返しは2項分布B(n,p)となるので、定義に従って計算しても良い。 • 繰り返しの回数が多い場合は、平均がnp、分散がnpqの正規分布N(np,npq)で近似できる。 • この事実を使うと比較的楽に確率が計算できる。 東京工科大学 確率と統計2011
答え: • μ= np = (100)×(1/2) = 50 • σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52 • Z=(X-μ)/σ = (X – 50) / 5 とすると • Z1=(40-50)/5 = -2 • Z2=(60-50)/5 = +2 • 標準正規分布曲線の -2 ~ +2 の部分の面積が求める確率。 • 標準正規分布表(教科書p.295)より約0.95 (= 0.4772×2) 東京工科大学 確率と統計2011
以上のことを別の言い方で表すと... 東京工科大学 確率と統計2011
図で表すと... • (黒板で説明します) 東京工科大学 確率と統計2011
確認問題 • 正しく作られたコインを400回投げるとき、表が150回以上230回以下出る確率を求めよ。 東京工科大学 確率と統計2011
発展問題 • 両側検定と片側検定について以下の問に答えよ。(1)両側検定とは何か。(2)片側検定とは何か。(3)コインを何回か投げた結果に基づいて、コインが正しく作られているかを調べたい。このときは、両側検定を使うべきか、片側検定を使うべきか。 東京工科大学 確率と統計2011
問題のヒント:教科書のp.163~167をよく読むこと。両側検定、片側検定の区別、使い分けは重要なので、何かの機会に一度調べておくことを勧める。問題のヒント:教科書のp.163~167をよく読むこと。両側検定、片側検定の区別、使い分けは重要なので、何かの機会に一度調べておくことを勧める。 東京工科大学 確率と統計2011
正規分布の話は今日はここまで 東京工科大学 確率と統計2011
今日の挑戦問題 • ある人種では4つの血液型が知られており、各血液型を持つ人の割合は0.16, 0.48, 0.20, 0.16であるという。一方、他の人種の人についても同様の調査をしたところ、それぞれの血液型を持つ人は180, 360, 130, 100 人だった。これら人種間で血液型の人数比は同じだろうか? 東京工科大学 確率と統計2011
挑戦問題問題のヒント • カイ2乗検定を利用する。 • 教科書第10章を参照のこと。 • 教科書 p.229 の問題2と同じ。 • 自由度の求め方を覚えると良い。 • カイ2乗分布の表は教科書p.298 。 • (カイ2乗検定は利用価値が高いですので、是非覚えて使ってください。) 東京工科大学 確率と統計2011
練習問題 • ある図書館での本の貸し出しを調べたら以下のようになった。「曜日により貸し出し冊数は変わらない」かどうか検定せよ。なお、有意水準を5%とせよ。 東京工科大学 確率と統計2011
練習問題のヒント T=135 + 108 + 120 + 114 + 146=623 東京工科大学 確率と統計2011
その他 • カイ2乗検定の1つに、分割表(教科書p.225)があります。便利なのでマスターしてください。授業でもやりましたよね! • カイ2乗検定は、分散分析の特殊な場合となっています。分散分析はさらに強力な手法ですので、是非勉強しましょう。 • 統計は慣れることが大切です。継続的に勉強してください。理論よりまず実践です。 東京工科大学 確率と統計2011
最後に • 統計を知っている人と知らない人とでは、今後大きな差になってきます。統計をすべて勉強することは無理です。自分に関係のある分野で、必要なものから順次慣れていってください。 練習あるのみ 次回4つ目のレポート課題を提示する予定です。 東京工科大学 確率と統計2011