180 likes | 267 Views
確率 入門. 0.「確率」と「統計」. 統計学 A: 記述統計・相関・回帰 サイコロ実験の例 Q. サイコロを5回投げたときに,少なくとも1回3 の目が出る確率は ? 「確率」と「統計」 確率屋さん「サイコロの各目が出る確率は1/6で ある。だから, p=1-(5/6) 5 」と考える。 統計屋さん「サイコロを100回投げて,各目の出方 を観測してみよう。この目の数学的なモデルをどの ような ものとして考えたらいいのか ? それを判定するための基準を考えなければならない」と考える。 統計学 B では,「確率」を勉強します。 「経済学」と「確率」 選択の確率
E N D
0.「確率」と「統計」 • 統計学A:記述統計・相関・回帰 • サイコロ実験の例 • Q.サイコロを5回投げたときに,少なくとも1回3 • の目が出る確率は? • 「確率」と「統計」 • 確率屋さん「サイコロの各目が出る確率は1/6で • ある。だから,p=1-(5/6)5」と考える。 • 統計屋さん「サイコロを100回投げて,各目の出方 • を観測してみよう。この目の数学的なモデルをどの • ようなものとして考えたらいいのか? • それを判定するための基準を考えなければならない」と考える。 • 統計学Bでは,「確率」を勉強します。 • 「経済学」と「確率」 • 選択の確率 • 経済学とは,選択の科学である(ジョセフ・スティグリッツ) • 統計学は,科学の文法である(カール・ピアソン)
よくある「選択」の例1-1 • 質問1.皆さんが,就職をするにあたり,SPI等を受験します。これらは,択一問題です。 • 「三択問題では,わからない場合も,①デタラメでもいいので埋めておく,②時間がもったいないので,スキップして次の問題に移る • (確率として計算する) • 「少なくとも」1問が正解である確率は? • 起こりうるすべての場合の数(積の法則):3×3×3×3×3=243通り • 「少なくとも」→余事象を計算 • 少なくとも1問正解であるという事象Aとすると,余事象A-はすべて不正解 • 2×2×2×2×2=32 • P(A)=1-P(A-)=1-32/243=211/243≒0.87
よくある「選択」の例1-2 • 5問中3問が正解の確率は? • 5個のなかから正解となる3個を取り出す組み合わせの数は? • nCr=nPr / r! • 5C3=(5×4×3)/(3×2×1)=10 • このなかの1つの組み合わせ例.問1.正解,問2.正解,問3.正解,問4.誤,問5.誤 • の場合の印の付け方 1×1×1×2×2=4通り • 印の付け方 10×4=40 • 5問中3問が正解の確率: P(A)=40/243≒0.16
よくある「選択」の例2 • 10本中3本が当たりくじがある。 • 引いたくじは,元に戻さないものとして,3人(A.B.C)でくじを引くものとする。何番目に引くのが,くじにあたる確率が高いか?
1.順列と組み合わせ(例.武道編) • 空手の技で,a.上段 きざみ突き,b.中段 逆突き,c.前蹴りの3つの技がある。その連続技のパターンを考える。 • その連続技の組み合わせは,どのようなものがあるのか? • 3×2×1=6通り • n(n-1)(n-2)=n! • この6通りの攻撃に対して,防御を考えればいい! • より具体的には,攻撃は,2つの連続技が多い(3つ連続して攻撃する前に反撃を受ける)。 • また,蹴りには,前蹴りだけでなく,回し蹴りもある! • 技の種類は,4つ。そこから2つの連続技が繰り出される。 • 防御すべき攻撃パターンはいくつか。 • 4 × 3 = 12通り • N個の異なるもののなかから,r個抽出して並べる(r<=n)。順列(permutation) • nPr =n(n-1) -----(n-r+1) • 受け身には,両手・両足を使うことができる。その場合,同時に複数の攻撃に対して,受けをとることができる。その場合問題となるのが,4つの技から繰り出される2つの技である。つまり,「c前蹴り→b中段突き」でも,「b中段突き→c前蹴り」でもいいのである。 • N個のものからr個を抽出する「組み合わせ(combination)」 • nCr=nPr / r! • 標本空間(sample space)・事象空間(event space) • 実験・観察のあるゆる可能な結果を表す点の集合 • サイコロの場合: {x l x= 1 , 2 , 3 , 4 , 5 , 6}
2.確率(例.テニス編) • 確率の評価法に関するアプローチ • テニスのゲームで,いつどの位置にポーチに出るか! • 相手のステップ,フォーム,予測される打点位置 • 例.中心からクロスに打つ確率は? • ・先験的アプローチ(a priori probability) :古典的アプローチ • nA / n :例.サイコロ • ・経験的アプローチ(empirical probability) • P{A}lim(n→∞) nA /n • ・主観的アプローチ(subjective probability) • ・公理的アプローチ • 公理とは:数式で記述される約束事 • 公理1. 0≦P{A}≦1 事象A • 公理2. P{S}=1 事象全体の集合S • 公理3. P{A1∪A2 ∪ A3 ∪ ----}=P{A} ∪ P{B} ∪ P{C} ------ • 事象A1,A2,A3のいずれかが起こる確率は,それぞれの事象が起こる確率の和に等しい • →それぞれの事象が排反であるならば。排反:同時には起こらない
確率の考え方 • 確率の評価法に関するアプローチ • *確率の評価法に関するアプローチ • ・先験的アプローチ(a priori probability) :古典的アプローチ • nA / n :例.サイコロ • ・経験的アプローチ(empirical probability) • P{A}lim(n→∞) nA /n • ・主観的アプローチ(subjective probability) • ・公理的アプローチ • 公理とは:数式で記述される約束事 • 公理1. 0≦P{A}≦1 事象A • 公理2. P{S}=1 事象全体の集合S • 公理3. P{A1∪A2 ∪ A3 ∪ ----}=P{A} ∪ P{B} ∪ P{C} ------ • 事象A1,A2,A3のいずれかが起こる確率は,それぞれの事象が起こる確率の和に等しい • →それぞれの事象が排反であるならば。排反:同時には起こらない • →ベン図によって理解することが出来る。→後述
3.標本空間と確率 • 加法定理/和事象/積事象・同時確率/排反 • 例:サイコロを2回投げて目の和が5になる確率 • 例:サイコロの目の和の確率 • 実験1.通常のサイコロ • サイコロを二回投げる • 標本空間 36通り • 各組み合わせが出る確率 1/36 • 2回の目の和が7になる確率事象 P{A} = 6/36=1/6 • 2回のうち少なくとも1回1が出る確率事象 P{B} = 11/36 • 実験2.いかさまサイコロ • 2回の目の和が7になる確率事象 P{A} = 4/36=1/9 • 2回のうち少なくとも1回1が出る確率事象 • (1,1) 4/36 = 1/9 • (1,2) (1,3) (1,4) (1,5) (2,1) (3,1) (4,1) (5,1) 2/36 = 1/18 • 残り 1/36 • 1/9 + (1/18 ×8)= 5/9 • 余事象(complementary event) • P{A-}=1-P{A} • 1=P{S}=P{A}+ P{A-} A B
加法法則/同時確率 • 和事象A1∪A2 (A1+A2 ) • P{A1+A2} • →A1,A2のいずれかの事象が起こる確率 • 積事象・同時確率(joint probability)P{A1A2} • P{A1+A2}= P{A1}+ P{A2}- P{A1A2} • A1,A2に互いに共通点がない • →互いに排反(mutually exclusive)である • 例題によってベン図を使って理解する(教科書P108) • ある箱に,100個の品物が入っている。今。この品物の不良品をキズの種類によって,A1型のキズ・A2型のキズに分ける。A1型のキズ 10個 ・A2型のキズ 6個 ・A1,A2両方のキズがあるもの3個 • 問1・この箱から抜き出された1個の品物がA1型のキズをもっていることがわかっているとき,それがまたA2型のキズを持つ確率はいくらか? • P{A1}=10/100 P{A1A2}=3/100 P{A2|A1}= P{A1A2} / P{A1} =(3/100)/(10/100)=3/10 • 問2・A2型のキズをもっていることがわかっているとき,それがまたA1型のキズを持つ確率はいくらか? • P{A2}=6/100 P{A1A2}=3/100 P{A1|A2}= P{A1A2} / P{A2} =(3/100)/(6/100)=3/6=1/2 標本空間 A1 A1,A2 A2
乗法定理:結合確率,周辺確率(以降,発展問題)乗法定理:結合確率,周辺確率(以降,発展問題) • 加法法則の議論では,少なくとも1つの事象が起こる確率に関心があるときに利用できた。しかし,多くの場合が,いくつかの事象のすべてが発生する確率に関して関心を持つ。 • アパートローン債権について考えるのであれば,あの特定の集団の同時に発生するデフォルト確率を求めたい場合もある。 • 結合確率 • 加法法則の議論で,事象Aおよび事象Bが同時に発生する確率を用いた。これは,結合確率のケースであり,2つ以上の事象の結合生起の確率として定義される。アパートローン債権のデフォルト確率のケースで考える。アパートローン債権がデフォルトする原因としては,アパート経営そのものはうまくいているとしても,他の事業に失敗することでデフォルトしてしまうケース,アパート経営そのものに失敗してデフォルトしてしまうケース,またはその二つが重なることでデフォルトするケースと様々な原因が考えられる。ここでは,ノンリコース・ローンとして,アパート経営そのものの失敗によりデフォルトする問題だけに議論を限定する。 • ここでは,プロパティタイプとキャッシュフローの変動特性という二つの軸により,次の4つの事象に分類した。 • A . デフォルトした,C. デフォルトしない • B. ワンルーム・マンション,D. ファミリータイプ・マンション • 過去において,デフォルトした人を10000件抽出して,それぞれの事象に当てはめたものが,下表である。 ワンルームマンションでデフォルトした: P(A∩B)=500/10000=0.05 ワンルームマンションでデフォルトしない: P(A∩C)=4500/10000=0.45 ファミリータイプでデフォルトした: P(A∩B)=100/10000=0.01 ファミリータイプでデフォルトしない: P(A∩B)=4900/10000=0.49 (周辺確率) 無作為に選ばれた債権が,ワンルームであり,デフォルトするまたはしない確率,あるいはファミリータイプでデフォルトするまたはしない確率は,結合確率の周辺に現れ,周辺確率または条件なし確率と呼ばれる。
乗法定理(つづき):条件付き確率 • 条件付き確率 • 別の一つの事象が起きたときに,ある事象が起こる確率を「条件付き確率(conditional probability)」という。 • ワンルームマンション(B)であり,デフォルトする(A)確率 : P(A|B) =P(A∩B)/P(B)= 0.06 / 0.5=0.03 • 乗法定理 • P(A∩B)= P(A|B) P(B) • :事象をA,Bの二つとする。そのとき,A,B両方が起こる結合確率は,「Bが所与の時の条件付き確率にBの確率をかけたものに等しい。 • 無作為に選ばれた債権がファミリータイプで,デフォルトする確率を求める。 • P(A∩D) =P(A|D)P(D)=0.04*0.5=0.02 • P(A|D) = 0.04 • P(D)= 0.5 • *乗法定理は,より事象が増えていったときに,拡張することができるため,複雑な結合確率を求めることができる。 • ここに,n個の事象が存在しているとする(V1,V2,………,Vn)。 • P(V1∩V2∩,………∩Vn)=P(V1) ・ P( V2 |V1 ) ・ P( V3 |V1 ) ∩ V2) …………・P( Vn |V1 ∩V2 ∩ ,……, ∩Vn-1 ) • ノンリコースのアパートローンの自動審査システムで,25年ローンの審査が通る確率を考える。次の3つの条件を満たしている物件iの審査が通る確率は,次のように考える。 • 第1次審査.基本要件を満たしている(基本要件を,最寄り駅までの距離5分以内,構造はRC,SRC造)いる物件の通過確率 95/100 • 第2次審査.初期賃料の設定がヘドニック賃料のレンジ内に入っている物件の通過確率:90/100 • 第3次審査.地域がボラティリティの小さいエリア群である場合の通過確率:80/100 • この3つの条件を満たしている場合の通過確率は, 95/100×90/100 × 80/100 = 0.684 である。 • 統計的独立性 • P(A|B)=P(A) • P(A|B) =P(B) • 事象A,Bが統計的に独立であれば,一方の生起確率は他方の生起に影響されない。その場合, • P(A∩B)= P(A) P(B) • P(V1∩V2∩,………∩Vn)=P(V1) ・ P( V2 ) ・ P( V3 ) …………・P(Vn )
ベイズの定理1:単純なケース • 不動産市場分析を行っていく際に,分析者が,新しい情報を得ると事前に持っていた確率を修正することがしばしばある。分析にあたり,対象となるすべての事象に対して,事前確率を与える。その後,調査等を行うことで収集された新しい情報に基づいて,その事前確率を修正していく。その修正された新しい確率を事後確率という。このような事前確率を修正し,事後確率を求めていく手法をベイズ(Thomas Bayes)の定理と呼ばれるものである。 • 今,不動産投資を行う際に,欠陥建物に投資してしまうと,収益上,極めて甚大の被害を将来において被る可能性がある。そのため,性能評価を行うものの,その場合における評価精度もまた大きな問題である。性能上,欠陥が存在している事象をV1 ,そうでない事象をV2とする。投資市場に出回っている東京都区部における対ものの0.6%が,何らかの欠陥があるといわれているので,無作為に選定した物件が性能上,大きな瑕疵がある確率は,0.006である。そのため,P {V2}=1-0.006=0.994である。 • 性能評価を実施することで,投資対象としている物件が性能上,大きな瑕疵があるかないかは判定することができる。ここで,Eは,投資対象としている物件に性能上,何らかの瑕疵があるとする調査結果が出る確率とする。 • その事前確率は,次のように求められる。 性能評価によって,投資を実施する上で問題を抽出できる確率を0.999。P(E|V1)=0.999, P(E|V2)=0.001。P(V1)=0.006,P(v2)=0.994
ベイズの定理:事象が多いケース • ここで,都市公団の集合住宅の開発のケース(光が丘団地)を考えてみる。都市公団の集合住宅は,複数のデベロッパーによって建築が行われている。 • その市場シェアが,aデベ 50 %, bデベ30% ,cデベ 20%である。過去において,建築後,何らかの欠陥が発生したケースは, aデベ5 %, bデベ6% ,cデベ 7%である。 • 今,ある不動産購入希望者が,物件を購入した際に,欠陥住宅であった。それが,V1:aデベ , V2:bデベ ,V3:cデベである確率はどの程度か。 • P{V1}=0.5, P{V2}=0.3 , P{V3}=0.2 • 欠陥住宅である事象をEとする。 • P{E│V1}=0.05, P{E│V2}=0.06 , P{E│V3}=0.07 ここで求めたいのは,条件付き確率 P{V1│E} , P{V2│E} , P{V3│E} である。 P{a│E} = P{aE} / P{E} 同時確率 P{V3E} = 0.5 * 0.05 =0.025 P{E} = P{aE}+ P{bE}+ P{cE}=0.5*0.05 + 0.3*0.06 + 0.2* 0.07 =0.025+ 0.018+0.014=0.057 P{V1│E}=0.025 / 0.051 ≒0.439 P{V2│E}=0.018 / 0.051 ≒0.316 P{V3│E}=0.014 / 0.051 ≒0.245
確率変数と確率分布 確率変数(random variable)とは,確率的にその値が決定される変数であり,言い換えれば,実験よって値が決定される数量であり,その値は偶然によって決定される変数を意味する。また,確率分布とは,確率変数がとりうる値に対しての確率がどのように対応しているのかを表すものである。ここでは,簡単な代表的な例として,しばしば紹介される「サイコロの目の合計」について,紹介する。 サイコロの目の合計は,「サイコロを振る」という実験に基づくものであり,確率変数として扱われる。その標本空間は,下図のように36個の点で表すことができる。 また,確率変数は,0.5または1.14などといった中間値をとることがない「離散(discrete)確率変数」と,一定の範囲内でどのような値もとりうる「連続(continuous)確率変数」に大別される。 確率分布(probability distribution)は,全体として1の確率が,どのように配分されているのかを表すものである。離散確率変数に対応する代表的な確率分布としては,サイコロの目のでる確率のように,それぞれ1/6ずつ均等に確率が配分されている一様分布(uniform distribution),2つのサイコロの目の和のでる確率のように2から12までの間で三角形の形で確率が対応している三角分布(triangular distribution),コインを3枚投げて表のでる確率を求めるような場合の二項分布(binomial distribution),確率変数に対応する確率が幾何級数的に小さくなっていくような幾何分布(geometric distribution)などがある。 連続確率変数の場合には,変数のとりうる値に対して,一点ではなく,ある区間に対して,ある確率が対応することとなる。その場合,そのとりうる値のそれぞれに対しては,確率密度(probability density)が対応するという。 確率密度関数(f(x))とは,確率変数xの値に対して確率密度が対応する関係を表すものである。ここで,確率密度関数f(x)をもつ連続確率変数xがaとb(a<b)の間をとる確率P(a≦x≦b)は,f(x)を区間a,bで積分した値となる。
確率変数 • 確率変数(random variable)とは,標本空間の各標本点に対応して,その値が決まるような変数 • サイコロのケース:二つのサイコロを投げた時に出る目の和をxとする。 • 2.3.4.5.6.7.8.9.1.11.12のそれぞれの値が出る確率は,それぞれ何パーセントか? 計算が出来ることより,確率のものの考え方をきちんと理解しましょう!
演習1.トランプゲーム • 1.トランプから4枚のカードを抜く。その中のハートの数をxとすれば,ハートの数が0.1.2.3.4のそれぞれの確率を求めよ! • (ヒント.トランプの枚数は52枚。その中から,4枚のカードを引いたときの組み合わせの数を求める。さらに,ハートの数は13枚である。13枚の中からハートの数が0枚,1枚,2枚,3枚,4枚を引く組み合わせを計算する。例えば,ハートの数が3枚の場合は,13枚の中から3枚を引く組み合わせを計算し,さらに,残りの39枚の中から1枚を引く組み合わせを計算する。「組み合わせ(combination)」 nCr=nPr / r! =n!/(r!(n-r)!))