180 likes | 586 Views
最小二乗法. 正規分布( normal distribution ). その測定値が 出現する確率. 測定値の分布 測定値 x が得られる確率 P(x) 頻度分布 → 確率分布 この分布曲線を描くには無限個の測定値が必要 有限個の測定値から推定 中心極限定理 ( central limit theorem ) 互いに無関係かつランダムに生じる小さな値の総和は正規分布 ( ガウス分布 ) になる 平均値 m 、標準偏差 σ 区間 [m- σ ,m+ σ ] 内に入る確率が 0.683≒2/3. 測定値( σ で割ったもの). 仮定 どの測定値も同じ信頼度
E N D
最小二乗法 最小二乗法
正規分布(normal distribution) その測定値が 出現する確率 • 測定値の分布 • 測定値xが得られる確率P(x) • 頻度分布→確率分布 • この分布曲線を描くには無限個の測定値が必要 • 有限個の測定値から推定 • 中心極限定理(central limit theorem) • 互いに無関係かつランダムに生じる小さな値の総和は正規分布(ガウス分布)になる • 平均値 m、標準偏差σ • 区間[m-σ,m+σ]内に入る確率が0.683≒2/3 測定値(σで割ったもの) 最小二乗法
仮定 どの測定値も同じ信頼度 標本(sample) N個の測定値の集合 標本平均 (sample mean) 不偏分散 (adjusted variance) 分散が大きい→ばらつく N=1のとき0/0 測定精度の推定 不偏分散の平方根 σN 分散:測定の精度を推定する 最小二乗法
真値の信頼性測定値(平均値)からの推定 • 標本のとり方で異なる標本平均 • 非常に大きな N の場合には • 分布が決定し • 平均値が決定する • 「標本平均μN を真の値 mとする」ことの信頼性(=測定値の信頼性)は N に依存する 2/3の確率で言える m の範囲 (天下り) 95%の信頼区間→ x 1.96 最小二乗法
いかにして、もっともらしい直線をひくか? • 量(x,y)の間に y = a0 + a1x という関係がある • 測定により a0 と a1 を決める • 測定値 (x1,y1), (x2,y2),… • どの測定も互いに影響しあわない(独立) • 測定値のばらつきは正規分布(ランダム) 最小二乗法
確率の総和 =全面積=1 σが小さければ確率分布の幅が狭く。いつも同じ測定値が再現しやすい 測定値の組を得る確率 • 1個の観測値(xi,yi)を得る確率 • 正規分布 • N個の観測値の組{(xi,yi), i=1,…,N}を得る確率(独立事象の積) 変数xiに対して 真にあるべき y = a0 + a1xi 最小二乗法
最小二乗法のアイデアパラメータの決定法 • 測定結果は、起こるべくして起きた • 測定結果を与える確率が最大となっていた 残差の二乗に信頼度の重みをつけて 和をとり、これを最小にすることで、 最適なパラメータを得る方法が 最小二乗法である 最小二乗法
パラメータの決定:偏微分 • 極小をあたえるパラメータの条件 この連立方程式 (正規方程式という) を満たすパラメータ を求める 最小二乗法
どの測定値も等く信頼できるとき 最小二乗法
用語 最小二乗法
直線回帰の相関係数 R~1 R~0 R~-1 最小二乗法
非線形モデル MP次元のパラメータ空間内を 探索して最小値を見いだす MP個の非線形連立方程式を解く 最小二乗法