470 likes | 590 Views
統計の基礎 第9回 確率の基礎/二項 分布 6月 17 日. 確率の基礎 【 目標 】. 確率 の考え方を理解し、確率を求める方法を習得する。. 【 構成 】. 1.はじめに(確率の把握) (1) 日常的確率の理解 (2) 確率の把握 (3) 統計と確率 2.確率の諸用語 (1) 用語 (2) ベン図 3.確率の公式 (1) 公理 (2) 定理 (3) ベイズの 定理. 1.はじめに(確率の把握) (1) 日常的確率の理解. 相対度数で判断 ・ ・・コイン、サイコロの例 から 全体で 100% 「 100p %」の表記.
E N D
統計の基礎第9回確率の基礎/二項分布6月17日統計の基礎第9回確率の基礎/二項分布6月17日
確率の基礎【目標】 • 確率の考え方を理解し、確率を求める方法を習得する。
【構成】 1.はじめに(確率の把握) (1)日常的確率の理解 (2) 確率の把握 (3)統計と確率 2.確率の諸用語 (1)用語 (2)ベン図 3.確率の公式 (1) 公理 (2) 定理 (3)ベイズの定理
1.はじめに(確率の把握)(1) 日常的確率の理解 • 相対度数で判断 ・・・コイン、サイコロの例から • 全体で100% • 「100p%」の表記
(2) 確率の把握 ①理論的確率 • 事象の頻度の計測 ・・・限度あり • 標本空間の全事象を数え上げそれぞれが等しく起こるとする 「同様に確からしい」を根拠とする
②実験的確率(体験的確率) • 結果としての比率 ・・・・毎回異なる • 実験を無限に繰り返した場合に近づく値→確率 • 日常的には困難 大規模調査・実験の繰返し 近年では大量の情報収集
③主観的確率 • ヒューリスティックな判断 カン、期待 例えばギャンブラーの判断
※確率は直感的には分からない • 説明しても、説明者と同じ理解構造にならないと通じない • 一旦、理解したと思っても、しばしば分からなくなる
※確率は直感では分らない ・ベースレート問題※確率は直感では分らない ・ベースレート問題 • 40歳の女性が乳がんにかかる確率は1%。 • 乳がん患者が、X線検査で陽性になる確率は90%である。 • 乳がんではなかったとして、それでも検査結果が陽性になる確率は9%である。 • あなたの検査結果が陽性と出た場合、実際に乳がんである確率は?
・現在像の誤解 • 対等な個別事象を識別できない (理論的判断も容易でない) モンティホール問題 3人の囚人問題
モンティホール問題 • 3つのドア、後に車、ヤギ、ヤギ • あなたは1つのドアを選択 • 後を知っている司会者が残りのドアのうちヤギのドアを開く • あなたは選択を変えるか
3人の囚人問題 • 王様の結婚により、3人の死刑囚のうち一人に恩赦、無作為に選出・・・1/3 • 囚人が、看守から他の囚人のうち恩赦にならない者の名前を聞く。 • 恩赦にならないのは、 他の一人の囚人か自分・・・・・1/2?
・条件設定の曖昧さ • 二人とも女の子の確率 無条件 上は女 1人は女
・ヒューリスティックな判断_1具体的な内容の選択・ヒューリスティックな判断_1具体的な内容の選択 どちらの災害がより起きそうか • a.「1000人が津波で死亡する東海大地震」 • b.「1000人が死亡する日本国内での大地震」
・ヒューリスティクな判断_2(人間的で必ずしも合理的でない)な判断をしがち・ヒューリスティクな判断_2(人間的で必ずしも合理的でない)な判断をしがち • 負け続けのギャンブラー 今後こそは • 勝ち続けのギャンブラー 今度も • 宝くじの購入(?)
・ビッグ・データの危うさDNAの一致による犯人断定・ビッグ・データの危うさDNAの一致による犯人断定 • 一致は10万人に一人 • 犯人に間違いないと考えてよいか • この都市の人口は100万人
※検討の歴史は古くない・・・不確実性を計測する発想は新しい※検討の歴史は古くない・・・不確実性を計測する発想は新しい • ギリシャ・ローマでは発展しなかった • カルターノ「偶然のゲームに関する書」16世紀 • カール・ピアソン 19世紀
(3) 統計と確率 • 統計は確率の問題であり、 かなり外れることもある
2.確率の諸用語(1) 用語 • 事象 偶然性を伴う実験の結果 例えば、コイン投げの結果 • 根元事象 それ以上細分できない単一の事象 • 複合事象 2回のコイン投げなど
標本空間 事象を検討する場 • 全体集合 起こりうるすべての結果(事象)の集合 {} • 部分集合 • 排反 同時に起こらない事象(の集合)
余事象 A’⇒ A∪A’全体集合 • 和事象 ∪ cup • 積事象 ∩ cap(同時確率) • 空事象φ A∪A’
3.確率の公式(1) 公理 ①0≦Pr(A)≦1 範囲 0~1 ②Pr(Ω)=1総和 排反事象の総和=1 ③A∩B=φ ⇒ Pr(A∪B)=Pr(A)+Pr(B) 生起確率=根元事象の総和
(2) 定理 ①加法 Pr(A∪B)=Pr(A)+Pr(B)-Pr(A∩B) ②条件付き確率 Pr(B│A)=Pr(A∩B)/Pr(A) ③乗法 • Pr(A∩B)=Pr(B│A)*Pr(A)
ツリーダイアグラム 枝分かれした事象の確率を乗法で求めていく
(3)ベイズの定理 • ある事象が起こった時の 特定の原因が起こった(起こっている)確率 • Pr(A│B)=Pr(A)*Pr(B│A)/Pr(B)
3つの確率が分かっている場合に最後の確率をみつけだす3つの確率が分かっている場合に最後の確率をみつけだす • 40歳の女性が乳がんにかかる確率は1%。 • 乳がん患者が、X線検査で陽性になる確率は90%である。 • 乳がんではなかったとして、それでも検査結果が陽性になる確率は9%である。 • あなたの検査結果が陽性と出た場合、実際に乳がんである確率は? • A;健康者、 'A;患者 • B;陽性、 'B;陰性
P(A)=健康者比率=99% • P(B│A)=健康者陽性比率=9% • P(B)=陽性比率=健康者比率×健康者陽性比率+患者比率×患者陽性比率 =99%×9%+(1-99%)×90%
陽性者健康比率 = P(A│B) =P(A)・P(B│A)/P(B) =(99%×9%)/( 99%×9%+(1-99%)×90%) =90.8%
二項分布【目標】 • ベルヌーイ試行の確率について考えるとともに、Excelでのシミュレーションを理解する。
【構成】 1.ベルヌーイ試行 2.ツリー図から確率を考える 3.順列組合せから確率を求める 4.Excelによる確率計算とシミュレーション
1.ベルヌーイ試行 • 結果が二種類のみの試行 (これを繰り返す試行) 例 コイントスの表・裏 サイコロで奇数・偶数 サイコロで2以下・3以上 紅白玉の抜出しで紅・白
一般に特定の結果が起こる確率をpとし、 他の結果の確率をq=1-pとする。 説明上、片方の結果を「成功」、 他方を「不成功」と表現する。
2.ツリー図から確率を考える • 試行毎に枝分かれするツリーを描く • 確率の検討は、根元事象を数え上げることが基本。 • 各枝端に達する確率は p^i*q^(n-i)
3.順列組合せから確率を求める • 一定回数の試行を何度も繰り返した場合で、成功がi回の場合の確率 →成功がi回となる枝を数える • 繰返し回数n個の数からi個取り出す 組合せの数に相当
階乗n! • 順列 n個の数の並べ方 n! • n個の内i個だけの数の並べ方 →後部のn-i個の枝別れを落す n!/(n-i)! • i個の組合せ→i個の並べ方 i! • n個のうちi個の組合せ方 n!/((n-i)!*i!)
求める確率 n!/((n-i)!*i!)*p^i*q^(n-i) • この確率の分布 → 二項分布 Excel_File (binomdist.xlsx)
4.Excelによる確率計算とシミュレーション →Excel_file二項分布シミュレーショ(ex091_1.xlsx) • 確率計算・・・理論確率 n!/((n-i)!*i!)*p^i*q^(n-i) に値を入れ ヒストグラムを作成する • n!/((n-i)!*i!) →BINOMDIST(成功数、試行回数、成功確率、形式) 形式 0;確率密度、1;累積確率
シミュレーション・・・実験確率 • 成功の場合1、不成功の場合0を出す 乱数 RAND()[0.1)の値 F9キーで再計算 確率pで成功 INT(RAND()+p)
一定回数並べ成功の回数を数える SUM() • 一定回数の試行を多数回繰返し成功回数の出現頻度を数える COUNTIF() • ヒストグラムを描く
【提出課題】 6月17日出題 • 一定回数のベルヌーイ試行を繰り返すシミュレーションを行い、成功回数のヒストグラムを描く。
【時間末レポート】 6月17日 • サイコロを振り、 出た目を二乗した得点が当たる試行を繰り返した場合に 期待される平均値を求めてください。 • (計算過程も明記すること。)