530 likes | 1.93k Views
Stata 教學. Regression and Correlation. 資料散佈圖 scatter diagram. 打開 Chinalife.dta 。 討論中國各省市的平均餘命( 2000 年)和其他地區變數( 2004 )的關係。 試畫出各省市每萬人病床數和平均餘命關係的 scatter diagram 。. Scatter Diagram. IV. DV. PRC 各省平均餘命與萬人病床數. Stata 畫迴歸線. 迴歸線從 0 畫到極大值( . ). 在散佈圖中畫出迴歸線. 教育投資有助於延長生命嗎?. 前圖怎麼畫出來的?. 迴歸線.
E N D
Stata教學 Regression and Correlation 社會統計
資料散佈圖scatter diagram • 打開Chinalife.dta。 • 討論中國各省市的平均餘命(2000年)和其他地區變數(2004)的關係。 • 試畫出各省市每萬人病床數和平均餘命關係的scatter diagram。 社會統計
Scatter Diagram IV DV 社會統計
PRC各省平均餘命與萬人病床數 社會統計
Stata畫迴歸線 迴歸線從0畫到極大值(.) 社會統計
在散佈圖中畫出迴歸線 社會統計
教育投資有助於延長生命嗎? 社會統計
前圖怎麼畫出來的? 迴歸線 • twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline(71.24387) text(71.24387 -60 "Y-bar", place(w)) Y軸標題 散佈圖 加一條平均餘命的平均值(值是用summary計算出來的 不要圖例 中小大小的圖邊 在(─60, 71.24387)的位置左方(W西方)加上Y-bar的字樣 社會統計
可否用下拉式選單完成上圖? • 部分可以,但非全部 社會統計
Overlaid twoway graph:散佈圖 DV IV 先選散佈圖 社會統計
Overlaid twoway graph:迴歸線 迴歸線從X=0起到最大值 社會統計
Overlaid twoway graph:Y軸標題 選擇中小型圖邊 社會統計
Overlaid twoway graph:產生圖表 圖表缺少了代表平均餘命平均值的線,也沒有相應的註記,這可能是下拉式選單的缺陷,也可能是我還沒找到正確的方法。所以要在command視窗裡加註。 社會統計
下拉式選單到指令視窗 • 把下拉式選單的指令在指令視窗裡叫回來。 在Review視窗裡有所有執行過的指令,點一下指令就會出現在指令視窗裡。在指令最後的地方加上yline和text的指令。 社會統計
自訂一條線並加上文字註記 • twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline(71.24387) text(71.24387 -60 "Y-bar", place(w)) -60是自己試驗出來的位置,因為如果設定為0的話,字會和軸線(不是在0上)重疊,看不清楚。 社會統計
迴歸分析 社會統計
迴歸分析 自變數 依變數 社會統計
迴歸分析:統計結果 社會統計
解讀Stata迴歸分析結果 Stata以ANOVA表和迴歸係數表以及其他重要統計量來呈現迴歸統計結果: ANOVA表 迴歸係數表 社會統計
迴歸分析:詮釋統計結果 迴歸方程式:lifeexp=69.178+0.003587(pcedu) 人均教育支出每增加人民幣一元,該省市的平均餘命增加0.003587歲。 R2=0.2965,即迴歸模型可以解釋29.65%的總變異,F=MSR/MSE=12.22(=t2),P值=0.0015,我們可以拒絕整個迴歸模型沒有解釋力的虛無假設,也就是R2不等於0。 迴歸係數與截距的顯著水準均在0.01以下 迴歸係數的95%信賴區間為(0.001489, 0.005685)。 社會統計
迴歸模型DV的預測值 社會統計
在data editor中檢視新增加的預測值 預測值加入原資料中 社會統計
母體期望值E(Y|X)或μy的95%信賴區間 • 無法在下拉式選單中點選,必須在指令欄裡下指令。 • 對某特定Xp值而言,所預測的母體期望值的估計變異數 • se2=MSE=7.4109, 社會統計
Stata中求對應特定Xp預測母體值的標準差 •在Stata裡用predict 新變數名稱, stdp這個指令來求對應數值。 •predict stderr, stdp 社會統計
母體期望值E(Y|X)或μy的95%信賴區間 • 先求出t值,要知道自由度在31-2=29下,α=0.05的t值。 • 在Stata中,用invttail(29, .05/2) • generate yhatll=yhat-stderr*invttail(29, .05/2)這是信賴下界 • generate yhatul=yhat+stderr*invttail(29, .05/2)這是信賴上界 社會統計
圖形 社會統計
圖形 社會統計
母體預測值的信賴區間 • 從實際觀察到的樣本來推測母體,除了可以求出對應特定X值的母體期望值的信賴區間之外,我們還可以求母體預測值的信賴區間。 • 對某特定Xp值而言,母體預測值的估計變異數 社會統計
Stata中求對應特定Xp預測母體值的標準差 •在Stata裡用predict 新變數名稱, stdf這個指令來求對應數值。這裡和前面略有不同。 •predict stderrf, stdf 社會統計
Stata中求對應特定Xp預測母體值的標準差 •predict stderrf, stdf •list 社會統計
母體期望值Y-hat的95%信賴區間 • 先求出t值,要知道自由度在31-2=29下,α=0.05的t值。 • 在Stata中,用invttail(29, .05/2) • generate yhatllf=yhat-stderrf*invttail(29, .05/2)這是信賴下界 • generate yhatulf=yhat+stderrf*invttail(29, .05/2)這是信賴上界 • list v1 lifeexp pcedu yhat stderrf yhatllf yhatulf 社會統計
母體期望值Y-hat的95%信賴區間 社會統計
圖示 社會統計
母體預測值95%信賴區間圖示 社會統計
Covariance and Correlation • 如果只是要知道兩變數之間的相關程度,可以計算共變數或相關係數。 社會統計
Correlation 社會統計
Correlation • . correlate lifeexp pcedu • (obs=31) • | lifeexp pcedu • -------------+------------------ • lifeexp | 1.0000 • pcedu | 0.5445 1.0000 社會統計
Covariance 社會統計
Covariance • . correlate lifeexp pcedu, covariance • (obs=31) • | lifeexp pcedu • -------------+------------------ • lifeexp | 10.1837 • pcedu | 841.87 234698 Cov Variance 社會統計
Hypothesis Testing 社會統計
相關係數的統計檢定 欲檢證的變數名稱,留白為全部變數成對的相關係數 社會統計
相關係數的統計檢定 • . pwcorr lifeexp pcedu, sig • | lifeexp pcedu • -------------+------------------ • lifeexp | 1.0000 • | • | • pcedu | 0.5445 1.0000 • | 0.0015 • | r 相關係數t檢定的p值 社會統計