190 likes | 273 Views
数理 統計学. 西 山. 推定には手順がある. 信頼係数 を決める 標準誤差 を求める ← 定理8 標準値の何倍の誤差を考慮するか 95 %信頼区間なら、概ね ±2 以内 68 % 信頼区間 なら、標準誤差以内. 教科書: 151 ~ 156 ページ. 区間推定 のまとめ: 95%信頼区間. 標準誤差. 1.96 を四捨五入して2としても、推定結果はほぼ同じ. 母集団の分散が分らない場合は、不偏分散を使う. サンプル数 が 10 個未満なら、必ず T 分布の数値表 を見て、 1.96 を修正しないといけない. 練習問題.
E N D
数理統計学 西 山
推定には手順がある • 信頼係数を決める • 標準誤差を求める← 定理8 • 標準値の何倍の誤差を考慮するか • 95%信頼区間なら、概ね±2以内 • 68%信頼区間なら、標準誤差以内 教科書:151~156ページ
区間推定のまとめ: 95%信頼区間 標準誤差 1.96を四捨五入して2としても、推定結果はほぼ同じ 母集団の分散が分らない場合は、不偏分散を使う サンプル数が10個未満なら、必ずT分布の数値表を見て、 1.96を修正しないといけない
練習問題 ある弁当屋で売っている幕の内弁当を5個買って、重量を測ったところ、以下のデータが得られた。 718, 717, 722, 703, 714 (グラム) この幕の内弁当全体では、平均何グラムにしているのだろうか?
【解答】 サンプル(5個)の結果をまとめると 結論 全体の平均重量は、▲▲グラムから〇〇グラムの範囲にある確率が95%である。
【例題】○○率の推定 ある人気ドラマをみたかどうかを、300人のサンプルに対して質問したところ、90人の人が「みた」と答えた。社会全体では、何%程度の人がこのドラマを見ただろうか。 信頼係数は95%で答えてください。
知りたいのは社会全体の視聴率です 視聴率は30%だと、 いまわかった 社会全体のことは調べてませんから、 分かりません
▲▲率調査のデータはゼロイチ・データ300人のデータ▲▲率調査のデータはゼロイチ・データ300人のデータ [1] 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 [35] 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 1 1 0 1 0 0 0 0 0 0 0 1 [69] 1 1 0 1 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1 [103] 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 1 0 0 0 1 1 1 0 1 0 1 0 0 0 0 0 0 0 0 [137] 0 1 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0 1 0 1 0 1 0 0 0 [171] 0 1 1 1 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 0 0 1 1 0 0 0 1 1 0 0 0 0 [205] 1 0 0 0 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 1 0 0 0 0 1 0 [239] 0 0 1 0 1 1 1 0 1 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 1 1 1 1 0 1 0 0 0 1 [273] 1 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0 1 0 0 1 0 0 1 0 1 0:みない、1:みた
▲▲率調査の標準誤差母集団(=日本国内)で30%で実験▲▲率調査の標準誤差母集団(=日本国内)で30%で実験 1万回のサンプリング実験 [1] 0.3002947 > sd(jikken) [1] 0.02619087 不偏で標準誤差0.026
母集団分布 ➡ 標準誤差が基本のロジック定理8母集団分布 ➡ 標準誤差が基本のロジック定理8 母集団 サンプル300人の平均のサンプリング分布 正規分布 期待値 標準誤差
ゼロイチ・データから分かること問題への解答ゼロイチ・データから分かること問題への解答 点推定 視聴率は30%位である( 誤差 標準誤差は2.6%位である 最大誤差 標準誤差の2倍まで考慮する(信頼係数95%)
区間推定のまとめ: 95%信頼区間 標準誤差 正規分布で当てはめるなら1.96倍が厳密 母集団の分散が分らない場合は 推定値を作って、代わりに使う サンプル数が10個未満なら、必ずT分布の数値表を見て、 2倍より大きな誤差を考える
練習問題 札幌地区在住者を対象に、ある人気ドラマをみたかどうかを、300人のサンプルに対して質問したところ、60人の人が「みた」と答えた。札幌圏では、何%程度の人がこのドラマを見ただろうか。区間推定をしなさい。 信頼係数は95%で答えてください。
解答のポイント サンプルの結果 標準誤差 母平均(μ)=0.20±2×0.023 95%信頼区間
(統計的)仮説検定 ある弁当屋で売っている幕の内弁当は、重さが720グラム、標準偏差が3グラムであるように作られている。いま無作為に5個の弁当の重さを測ると下のデータが得られた。 718, 717, 722, 703, 714 (グラム) おかしなところ、問題(ミス、手抜きなど)はないか?
実験が最近主流の方法要するに『こんなサンプルは出るのか』を問う実験が最近主流の方法要するに『こんなサンプルは出るのか』を問う 前提: 母平均 µ=720、(母)標準偏差 σ=3 > mean(jikken2); sd(jikken2) [1] 720.0082 [1] 1.328692 > min(jikken2) [1] 715.5866 1万回サンプリングをしても、平均714.8グラムという結果は出ない。どこかおかしい! 誤差
R: 実験の手順 > rnorm(5,720,3) [1] 723.0571 720.1133 725.3042 722.4727 725.7328 > mean(rnorm(5,720,3)) [1] 719.2437 > jikken2 <- replicate(10000,mean(rnorm(5,720,3))) > hist(jikken2,main="",xlab="",ylab="",breaks="FD") > mean(jikken2); sd(jikken2) [1] 720.0082 [1] 1.328692 > min(jikken2) [1] 715.5866
『仮説検定』のキーワード • 帰無仮説 前提していること:母平均(720)、母分散() • 有意 大すぎる誤差、「出ないはずの結果である」 • 有意水準 十分小さな確率、有意と判断する基準 • 棄却と採択 有意と判断➡前提を「誤り」と結論 採択=結果は「誤差の範囲」とみなす
今回の結論 帰無仮説 正常な状態(平均720グラム、標準偏差3グラム) 有意性(Significance) 5個のサンプルの平均714.8グラムは有意である 結論 サンプルによれば、製造には問題が発生している