310 likes | 691 Views
Qualitative Response Model. 被説明変数がダミー変数の回帰. 例) MROZ.RAW 女性労働 inlf 女性が外で働いていれば 1 ,そうでなければ 0 inlf=f( 家計所得,教育年数,年齢,子育て費用) 推定方法 線型確率モデル (linear probability model) プロビットモデル probit model ロジットモデル logit model. 線型確率モデル. 非説明変数 y は 1 または 0 の 値をとるダミー変数 線型モデルをそのまま当てはめる. y. 1. 当てはめられた直線.
E N D
被説明変数がダミー変数の回帰 • 例)MROZ.RAW • 女性労働 • inlf 女性が外で働いていれば1,そうでなければ0 • inlf=f(家計所得,教育年数,年齢,子育て費用) • 推定方法 • 線型確率モデル(linear probability model) • プロビットモデル probit model • ロジットモデル logit model
線型確率モデル 非説明変数 y は1または0の値をとるダミー変数 線型モデルをそのまま当てはめる y 1 当てはめられた直線 yの予測値(当てはめられた直線)は,説明変数が特定の値をとるときに,yが1となる確率を表すと解釈することができる 係数bはxの増加がyが1となる確率をどのくらい増加させるかを表す 0 x
線型確率モデルの問題点 • yの予測値が0と1の間に収まらない • Pr(y=1|x)のもっと良い定式化は? • Pr(y=1|x)=F(b’x) • F( ) に確率分布関数を当てはめるとこの問題は回避できる • 分散不均一性の問題
probit model, logit model 次のようなモデルを想定 F( )は確率分布関数 Probit model 標準正規分布 Logit model logisitic分布 ただし,y*=b’x+u
係数の意味probit model, logit model f( )は確率密度関数, y*=b’x+u probit modelやlogit modelでの係数の解釈 yの期待値に与える影響を正確に求めるためには,f(y*)の計算が必要 x1,x2,..,xkの水準に依存 (他の説明変数がとる値によっても異なる)
Probit model, logit modelの考え方 ここでyは観察される変数であるが,y*は観察不可能な変数であるとする。また,誤差項はある確率分布にしたがう。 例) 女性の労働参加を決定するある観察不可能な変数がある(y*)。 観察不可能な変数y*は,説明変数xの線型関数+誤差項で決定される。 y*がある閾値(critical value)を超えると女性は労働に参加する(y=1)。 しかし,y*が閾値を越えなければ女性は労働に参加しない(y=0)
Probit model, logit modelの考え方(続き) 最後の等式は,確率密度関数がx=0に関して対称的な場合に成立 標準正規分布, ロジスティック分布では成立
probit, logitモデルの推定 menu から Quick Estimate equation を選択して,次の画面のEstimation settings で method にBINARY を選択する。 specificationに Binary estimation method というoptionが表れるので,Probitまたは Logitを選択する
probit model の推計結果 Dependent Variable: INLF Method: ML - Binary Probit (Quadratic hill climbing) Variable Coefficient Std. Error z-Statistic Prob. ------------------------------------------------------------------------ C 0.270077 0.508593 0.531027 0.5954 NWIFEINC -0.012024 0.004840 -2.484327 0.0130 EDUC 0.130905 0.025254 5.183485 0.0000 EXPER 0.123348 0.018716 6.590348 0.0000 EXPERSQ -0.001887 0.000600 -3.145205 0.0017 AGE -0.052853 0.008477 -6.234656 0.0000 KIDSLT6 -0.868329 0.118522 -7.326288 0.0000 KIDSGE6 0.036005 0.043477 0.828142 0.4076 ----------------------------------------------------------------------- McFadden R-squared 0.220581 Mean dependent var 0.568393 S.D. dependent var 0.495630 S.E. of regression 0.425945 Akaike info criterion 1.087124 Sum squared resid135.1646 Schwarz criterion 1.136251 Log likelihood -401.3022 Hannan-Quinn criter. 1.106050 Deviance 802.6044 Restr. deviance 1029.746 Restr. log likelihood -514.8732 LR statistic 227.1420 Avg. log likelihood -0.532938 Prob(LR statistic) 0.000000 Obs with Dep=0 325 Total obs 753 Obs with Dep=1 428
最尤法による推定 尤度関数 likelihood function probit model, logit model :F()を特定化し,最尤法でパラメータを決める
係数の意味 : marginal effectprobit model, logit model f( )は確率密度関数, y*=b’x+u logit modelの場合 probit modelの場合 f(y*)=f(y*) 標準正規分布の密度関数
係数の意味:marginal effect (2) probit model, logit model の係数の比は,marginal effect の相対的な比率を表す
marginal effectの求め方 probit分析の結果を開いたまま, View/ Representation とたどり, そこの結果を張り付けると便利 Eviewsのコマンドウィンドウで次のようにタイプ 説明 直前の回帰の係数@coefsをprob_bというベクトルに代入 説明変数が平均値をとる場合のy*を計算し,yhatというスカラー変数に代入 Yhatの値での標準正規分布の密度関数の値を計算し,それをdnorm_yというスカラー変数に代入 Marginal effectsの結果を代入するベクトルをdydxとする(要素数は8個) 各要素に,それぞれの説明変数の限界効果を代入 この例では,expersqというexperの平方の項があるため,dydx(4)の計算は他とは異なっている vector prob_b = @coefs scalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * ( @mean(exper ) )^2 + prob_b(6) * @mean(age) + prob_b(7) *@mean(kidslt6) + prob_b(8) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (8) dydx dydx(2) = dnorm_y * prob_b(2) dydx(3) = dnorm_y * prob_b(3) dydx(4) = dnorm_y * ( prob_b(4) + 2 * prob_b(5) * @mean(exper) ) dydx(6) = dnorm_y * prob_b(6) dydx(7) = dnorm_y * prob_b(7) dydx(8) = dnorm_y * prob_b(8)
marginal effect の求め方 Excelを用いた方法 説明変数の平均値をここにコピーする marginal effects 係数の値 この列はB列とC列の掛け算 上のセルの合計 関数を使ってy*における密度関数の値を得る
問題(1) • MROZ.RAWのデータを用い,女性の労働参加を,線型確率モデルとlogit model, probit model で推計し,係数を解釈せよ。 • 被説明変数: inlf 労働力であれば1 • 説明変数: nwifeinc( non wife income), educ(教育年数),exper(実際に働いた年数),expersq=exper^2, age(年齢),kidslt6(6歳未満の子供の数), kidsge6(6-18歳の子供の数)
Tobit model • 耐久財の購入量(y)の決定 • 購入しない人(y=0)が存在 • y>0 と y=0 のみが観察される • この場合も次のようなモデルを考える • y* 観察不可能な変数で,耐久財の購入量(y)を決定する潜在変数
Tobit model の当てはめ y OLSの当てはめ x y*とxの関係 Tobit model
Tobit modelの応用 • 女性の労働供給 • MROZ.RAW • 労働参加していない女性が一定割合存在 • 耐久財の購入 • 低賃金労働者の労働供給 • 生活保護の受給との関係で
Tobit model の解釈(2) ここで,z~N(0,1)のとき,次の式が成り立つことを用いている inverse Mills ratio y>0の条件付きの期待値は,xbよりも大きくなることが重要
Tobit modelの解釈 (3) yの unconditional expected value 説明変数xが与えられた場合のyの期待値 y>0の条件付き期待値は前頁
Tobitモデルの解釈(4) 結果だけまとめておく
Tobitの推定方法 誤差項の分布を選択(Tobitは正規分布) menuで Quick Estimate equation Estimation settingsのmethodで CENSORED - .. を選択する 打ち切りの位置を指定する。0以外の値も,右側の指定もできる。
E-ViewsでのTobit modelの推定 sの推計値
Tobit model とOLSの比較 E-Viewsでの出力 Tobitの場合,xjの1単位の増加yの期待値に与える影響をみるためには,x’b/s を計算し,標準正規分布関数からその涙液分布を計算する必要あり。単純に比較できない
問題(2) • MROZ.RAW • 女性の労働時間の回帰分析 • 40%強が労働時間0 • 被説明変数:hours • 説明変数:nwifeinc, educ, exper, exper^2, age, kidslt6,kidsge6 • OLSとTobit model で推計し,結果を解釈せよ