280 likes | 1.02k Views
回帰分析 重回帰 (1). 項目. 重回帰モデルの前提 最小二乗 推定量の性質 仮説 検定(単一の制約) 決定 係数 Eviews での 回帰分析の実際 非線形 効果 ダミー変数 定数項ダミー 傾き のダミー 3 つ以上のカテゴリー. 重回帰モデル multiple regression model. 説明変数が 2 個以上. 他の説明変数を一定に保っておいて, x i だけを 1 単位増加させたときに y が何単位増えるか 他の要因をコントロールした x i 固有の影響. 重回帰モデル 前提. 線型モデル(パラメータに関し)
E N D
項目 • 重回帰モデルの前提 • 最小二乗推定量の性質 • 仮説検定(単一の制約) • 決定係数 • Eviewsでの回帰分析の実際 • 非線形効果 • ダミー変数 • 定数項ダミー • 傾きのダミー • 3つ以上のカテゴリー
重回帰モデル multiple regression model • 説明変数が2個以上 他の説明変数を一定に保っておいて,xi だけを1単位増加させたときに y が何単位増えるか 他の要因をコントロールした xi 固有の影響
重回帰モデル前提 • 線型モデル(パラメータに関し) • 誤差項の期待値は0 • 誤差項は互いに独立 • 誤差項の分散は一定(分散均一性) • 誤差項は正規分布に従う • BLUEの成立のためにはこの条件は不要
最小二乗法 • 残差平方和を最小にするようにパラメータを決定 • a,b1,b2,..,bk : 未知パラメータ a,b1,b2,..bk の推定値 • ei: 残差
最小二乗推定量 Sxxj : 説明変数 xjの平方和(xjを他の説明変数に回帰したときの残差の平方和) 誤差項の分散の推定量 k+1は説明変数の個数(定数項とx) SER (standard error of the regression)
仮説の検定 H0:bj=bj0 k+1は説明変数の個数(定数項とx)
当てはまりの良さ • TSS=ESS+RSS 説明変数の数kを増やしていけば,R2は単調に増加する 決定係数 自由度修正済み決定係数 adjusted R2 説明変数の増加にペナルティーを課すように修正したR2
被説明変数をln(wage)にした場合 ここをクリックすると,Representation Estimation output Coefficient Diagnostics Residual Diagnostics などのメニューが表れる (この画面はEstimation Output) • Educが1年増加すると賃金は9.2%上昇 • Experが1年増加すると賃金は0.4%増加 • Tenureが1年増加すると賃金は2.2%増加
非線形効果 説明変数xの2次の項を説明変数として加える 係数の意味 xが1単位増加したときyに与える効果 xの水準に依存する • 係数の意味の直感的な把握の仕方 • b1,b2の値をもとにxが与えられた場合の ∂y/∂x の大きさを計算する(Excelの活用) • Eviewsの中では,例えば,xが平均値をとる場合の効果についてはコマンドラインで • scalar dydx = @coefs(i) + @coefs(i+1)* @mean(x) • とするとスカラー変数 dydxが作成される(@coefs(i) 直前の回帰のi番目の係数(xの係数:定数項は1番目とする),@coefs(i+1): x^2の係数,@mean(x) 変数xの平均値)
Eviewsでの回帰分析の統計量 • スカラー変数 @regobsオブザベーション数,@f F統計量,@ssr 残差平方和 その他 @aic, @coefs(i), @stderrs(i), @tstats(i), @dw, @r2, @rbar2 • ベクトル変数 @coefs 係数ベクトル @coefs(i) でi番目の説明変数の係数(定数項が1番目),@stderrs 係数の標準誤差,@tstatst値 コマンド行で scalar var1 = @ssr vectorvar2 = @coefs とタイプするとvar1やvar2@ssr, @coefsの中身が保存される
問題(1) • ln(wage)を被説明変数にし,educ, exper, tenure, tenureの2乗を説明変数にして回帰分析を行え。 • wage1.rawのデータを用いる • tenureの範囲を調べよ。 • tenureが1年増加したとき,wageは何%増加するか • tenure=0, 5, 10, 20, 30, 40のそれぞれの場合について • 上の回帰分析の係数の値を用い,tenureとwageの関係をグラフで表せ。 • educの2乗を説明変数に加えるとどうなるか。
ダミー変数 • 質を表す変数 • 女性ならば1,そうでなければ0 • 結婚していれば1.そうでなければ0 • 大学卒ならば1,そうでなければ0 • educ, wage, experはこれに対し連続変数 • 一般に,0または1をとるような変数をダミー変数と呼ぶ
ダミー変数(2) • 定数項ダミー • 傾きに関するダミー • 3つ以上のカテゴリーを持つ変数の場合 • 学歴 • 中卒または高校中退 • 高卒,大卒未満 • 大卒以上 • 職業 • 事務職 • 研究職 • 営業 • 現場
定数項ダミー ln(wage) female=0の場合 b2 female=1の場合 a b2 図はb1<0の場合 a+b1 educ
傾きのダミー ln(wage) female=0の場合 b2 female=1の場合 a b2+b3 a+b1 図はb1<0,b3>0の場合 educ
問題 (2) • femaleダミー変数を説明変数に加えた回帰を行え • 被説明変数 ln(wage) • 説明変数 educ, exper, tenure, female • 賃金の男女格差は存在するか • 学歴の効果に男女格差が存在するか • educとfemaleの交差項を作成する • exper, tenureの効果に男女格差が存在するか
問題 (3) • 次の回帰を行う • 被説明変数 ln(wage) • 説明変数 educ, tenure, exper, female, female*educ, female*tenure, female*exper • 男女別に回帰分析を行う • EViewsのメニューでsampleを選択 If condition..のボックスに条件式を記入 • female=0 とすれば男性のみ,female = 1 とすれば女性のみ; 戻すときはsample で条件式を消す • 説明変数を educ, tenure, experとして回帰 • ダミー変数を用いた回帰と結果を比較せよ。
3つ以上のカテゴリー • 属性が4つある場合 • 例)学歴 • 中卒 • 高卒 • 短大卒 • 大卒 • この場合,3つのダミー変数をつくる • 中卒をベースにして,それぞれの学歴の効果がD1からD3で捉えることができる • 4つ作るとどうなるか? (3つのダミー変数:定数項は中卒の切片)
問題(4) • 結婚ダミーが賃金に与える影響を調べよ • married(結婚していれば1) • 結婚が賃金に与える影響は男女間で異なるかもしれない • 結婚×男女 の組み合わせで4通り • married と female のそれぞれの組合せの観測度数を調べよ • 二つの変数(married と female)を選択して,グループとして開く • Menuから View/N way tabulation クロス集計票 • 被説明変数 ln(wage), 説明変数 female, married, female*married, + educ, exper, tenure として回帰 • female*married 適当な名前で新しい変数を作る • female, married, female*marriedの係数の意味は • 定数項の大きさは? • 男性既婚,男性独身,女性既婚,女性独身
問題(5) • 教育年数の影響は,連続変数で捉えるのではなく,学歴別に調べた方がよいかもしれない • 教育年数の分布を調べよ • 教育年数から次のような学歴ダミー変数を作れ • 高卒未満 ( educ < 12) • 高卒以上 大卒未満 (12 <= educ <16) • 大卒 以上 (16 <= educ) • 次の回帰分析を行え • 被説明変数:ln(wage),説明変数:学歴ダミー,その他の変数 (exper, tenure, female)
変数の作成方法 メニューの Genrボタンをクリック新変数を作成する画面で次のように記述 ED1 = (educ<16) and (educ>=12) ED2 = (educ>=16) ED1は高卒ダミー,ED2は大卒ダミー(中卒がベース) (educ<16)等は論理式 () の中が真なら1,偽なら0 and / or ED1は educが12年以上かつ16年未満の時に限り1,それ以外は0。 ED2はeducが16年以上の時に限り1,それ以外は0。