841 likes | 1.39k Views
HỒI QUY ĐƠN BIẾN. CHƯƠNG 2. HỒI QUY ĐƠN BIẾN. Biết được phương pháp ước lượng bình phương nhỏ nhất để ước lượng hàm hồi quy tổng thể dựa trên số liệu mẫu Hiểu các cách kiểm định những giả thiết Sử dụng mô hình hồi quy để dự báo. MỤC TIÊU. NỘI DUNG. Mô hình. 1.
E N D
HỒI QUY ĐƠN BIẾN CHƯƠNG 2
HỒI QUY ĐƠN BIẾN • Biếtđượcphươngphápướclượngbìnhphươngnhỏnhấtđểướclượnghàmhồiquytổngthểdựatrênsốliệumẫu • Hiểucáccáchkiểmđịnhnhữnggiảthiết • Sửdụngmôhìnhhồiquyđểdựbáo MỤC TIÊU
NỘI DUNG Mô hình 1 Phương pháp bình phương nhỏ nhất (OLS) 2 3 Khoảng tin cậy 4 Kiểm định giả thiết Ví dụ 5
Ví dụ Cho sốliệuvềsốlượnggạobán (tấn) hàngthángcủa 6 cửahànggạo. Nếuanh A mởmộtcủahànggạothìdựbáolượnggạobánhàngtháng.
Ví dụ • Nếuanh A muốnbángạomứcgiá 6 ngàn đ/kg thìdựbáosốlượnggạobántrongtháng.
2.1 MÔ HÌNH Môhìnhhồiquytuyếntínhhaibiến (đơnbiến) PRF dạngxácđịnh • E(Y/Xi) = f(Xi)= β1 + β2Xi dạngngẫunhiên • Yi = E(Y/Xi) + Ui = β1 + β2Xi + Ui SRF dạngxácđịnh • dạngngẫunhiên
2.1 MÔ HÌNH Trongđó • : Ướclượngchob1. • : Ướclượngchob2. • : Ướclượngcho E(Y/Xi) • Sửdụngphươngphápbìnhphươngnhỏnhấtthôngthường (OLS) đểtìm ,
2.1 MÔ HÌNH Hình 2.1: Hệ số hồi quy trong hàm hồi quy PRF và SRF
2.2 PHƯƠNG PHÁP OLS Giả sử có n cặp quan sát (Xi, Yi). Tìm giá trị Ŷi sao cho Ŷi gần giá trị Yi nhất, tức ei= |Yi- Ŷi| càng nhỏ càng tốt. • Tuy nhiên, eithường rất nhỏ và thậm chí bằng 0 vì chúng triệt tiêu lẫn nhau. Để tránh tình trạng này, ta dùng phương pháp bình phương nhỏ nhất (Ordinary least squares OLS). • Với n cặp quan sát, muốn
2.2 PHƯƠNG PHÁP OLS Điều kiện (*) có nghĩa tổng bình phương các sai lệch giữa giá trị thực tế (Yi ) và giá trị tính theo hàm hồi quy mẫu là nhỏ nhất. • Bài toán thành tìm , sao cho f min Điều kiện để phương trình trên đạt cực trị là:
2.2 PHƯƠNG PHÁP OLS • Giải hệ ta được
2.2 PHƯƠNG PHÁP OLS • Với là trung bình mẫu (theo biến) gọi là độ lệch giá trị của biến so với giá trị trung bình mẫu
Đặc điểm của đường hồi quy mẫu Một khi thu được các ước lượng từ mẫu, ta có thể vẽ được đường hồi quy mẫu và đường này có những đặc tính sau:
Đặc điểm của đường hồi quy mẫu • Nó đi qua giá trị trung bình mẫu của X và Y, do Hình 2.2: Đường hồi quy mẫu qua giá trị trung bình
Đặc điểm của đường hồi quy mẫu 2. Giá trị ước lượng trung bình của Y bằng với giá trị trung bình của Y quan sát. 3. Giá trị trung bình của sai số ei bằng 0: ē = 0. 4. Sai số ei không có tương quan với giá trị dự báo của Yi. 5. Sai số ei không có tương quan với Xi.
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH TSS = RSS + ESS
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH • TSS (Total Sum of Squares - Tổng bình phương sai số tổng cộng) • ESS: (Explained Sum of Squares - Bình phương sai số được giải thích) • RSS: (Residual Sum of Squares - Tổng bình phương sai số)
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH Y ESS Tổng chênh lệch SRF TSS RSS Yi Xi X Hình 2.3: Ý nghĩa hình học của TSS, RSS và ESS
HỆ SỐ XÁC ĐỊNH R2 TSS = ESS + RSS → • Hàm SRF phùhợptốtvớicácsốliệuquansát (mẫu) khigần Yi . Khiđó ESS lớnhơn RSS. • Hệsốxácđịnh R2: mộtthướcđomứcđộphùhợpcủahàmhồiquymẫu.
HỆ SỐ XÁC ĐỊNH R2 Trong mô hình 2 biến, người ta chứng minh được rằng
TÍNH CHẤT CỦA HỆ SỐ XÁC ĐỊNH R2 0≤ R2≤1 Cho biết % sựbiếnđộngcủa Y đượcgiảithíchbởicácbiếnsố X trongmôhình. R2=1: đườnghồiquyphùhợphoànhảo R2=0: X và Y khôngcóquanhệ Nhượcđiểm: R2tăngkhisốbiến X đưavàomôhìnhtăng, dùbiếnđưavàokhôngcó ý nghĩa. =>Sửdụng R2điềuchỉnh (adjusted R2 -R2) đểquyếtđịnhđưathêmbiếnvàomôhình.
HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNHR2 • Khi k > 1, R2 < R2. Do vậy, khi số biến X tăng,R2 sẽ tăng ít hơn R2. • Khi đưa thêm biến vào mô hình mà làm choR2 tăng thì nên đưa biến vào và ngược lại.
HỆ SỐTƯƠNG QUAN r Hệ số tương quan r: đo lường mức độ chặt chẽ của quan hệ tuyến tính giữa 2 đại lượng X và Y.
TÍNH CHẤT HỆ SỐTƯƠNG QUAN r • r > 0: giữa X và Y có quan hệ đồng biến • r-> ± 1: X và Y có quan hệ tuyến tính chặt chẽ • r-> 0: X và Y có quan hệ tuyến tính không chặt chẽ • r < 0: X và Y có quan hệ nghịch biến • Hệ số tương quan có tính chất đối xứng: rXY = rYX • Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan giữa chúng bằng 0. • r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính, r không có ý nghĩa để mô tả quan hệ phi tuyến.
HỆ SỐTƯƠNG QUAN r Có thể chứng minh được và r cùng dấu với VD: Với R2 = 0,81 => r = ± 0,9 = 0,9
HIỆP TƯƠNG QUAN MẪU Đo lường mức độ quan hệ giữa X và Y
2.3 Các giả thiết của phương pháp OLS • Giả thiết 1: Các giá trị Xi được xác định trước và không phải là đại lượng ngẫu nhiên. VD: Mẫu 1 Mẫu 2
2.3 Các giả thiết của phương pháp OLS • Giả thiết 2: Kỳ vọng hoặc trung bình số học của các sai số là bằng 0 (zero conditional mean), nghĩa là E(U/Xi) = 0 • Giả thiết 3: Các sai số U có phương sai bằng nhau (homoscedasticity). Var(U/Xi) = σ2
2.3 Các giả thiết của phương pháp OLS Phương sai sai số đồng nhất: Var(U/Xi) = σ2
Phương sai sai số không đồng nhất: var(Ui|Xi) = i2 2.3 Các giả thiết của phương pháp OLS
2.3 Các giả thiết của phương pháp OLS • Giả thiết 4: Các sai số U không có sự tương quan, nghĩa là Cov(Ui, Ui’) = E(UiUi’) = 0, nếu i i’
2.3 Các giả thiết của phương pháp OLS • Giả thiết 5: Các sai số U độc lập với biến giải thích. Cov(Ui, Xi) = 0 • Giả thiết 6: Đại lượng sai số ngẫu nhiên có phân phối chuẩn Ui~ N(0, δ2 )
2.4 TÍNH CHẤT CÁC ƯỚC LƯỢNG , làướclượngđiểmcủa , tìmđượcbằngphươngpháp OLS cótínhchất: • , đượcxácđịnhmộtcáchduynhấtvới n cặpgiátrịquansát (Xi , Yi) • , làcácđạilượngngẫunhiên, vớicácmẫukhácnhau, giátrịcủachúngsẽkhácnhau • Ta đolườngđộchínhxáccácướclượngbằngsaisốchuẩn (standard error – se).
Saisố chuẩn của các ước lượng OLS var: phươngsai 2: phương sai nhiễu của tổng thể 2 = Var (Ui ) -> thực tế khó biết được giá trị 2 -> dùng ước lượng không chệch se: saisốchuẩn
Saisố chuẩn của các ước lượng OLS Sai số chuẩn của hồi quy: là độ lệch tiêu chuẩn các giá trị Y quanh đường hồi quy mẫu
Định lý Gauss-Markov • Định lý: Với những giả thiết (từ 1 đến 5) của mô hình hồi quy tuyến tính cổ điển, mô hình hồi quy tuyến tính theo phương pháp bình phương tối thiểu là ước lượng tuyến tính không chệch tốt nhất, tức là, chúng là BLUE.
Định lý Gauss-Markov • Một ước lượng được gọi là “ước lượng không chệch tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện: • Nó là tuyến tính, có nghĩa là một hàm tuyến tính của một biến ngẫu nhiên, • Nó không chệch, • Nó có phương sai nhỏ nhất, hay còn gọi là ước lượng hiệu quả (efficient estimator).
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY Xácsuấtcủakhoảng (i - i, i + i) chứagiátrịthựccủa ilà 1 - hay: P(i - i i i + i) = 1 - . với
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY • (i - i, i + i) : là khoảng tin cậy, • i : độ chính xác của ước lượng • 1 - : hệ số tin cậy, • với (0 < < 1): là mức ý nghĩa. • t (/2, n-2): giá trị tới hạn (tìm bằng cách tra bảng số t-student) • n: số quan sát • Ví dụ: nếu = 0,05 = 5%, ta đọc “xác suất để khoảng tin cậy chứa giá trị thực của 1 , 2 là 95%.
2.4 KHOẢNG TIN CẬY CỦA 2 , : giátrịcủađạilượngngẫunhiênphânphốitheoquyluậtvớibậctự do n-2 thỏađiềukiện hay
2.5 KIỂM ĐỊNH GIẢ THUYẾT • Do Uitheophânphốichuẩn, cácướclượng OLS của1và 2cũngtheophânphốichuẩnvìchúnglàcáchàmsốtuyếntínhcủaUi. • Chúngtacóthểápdụngcáckiểmđịnht, F, và 2đểkiểmđịnhcácgiảthuyếtvềcácướclượng OLS.
2.5 KIỂM ĐỊNH GIẢ THUYẾT 1. Kiểm định giả thuyết về hệ số hồi quy • Haiphía: • Phíaphải: • Phíatrái:
1. Kiểmđịnhgiảthuyếtvềhệsốhồiquy Cách 1: Phương pháp giá trị tới hạn Bước 1: Tính t Bước 2: Tra bảng t-student để có giá trị tới hạn Bước 3: Quy tắc quyết định Nếu bác bỏ H0. Nếu chấp nhận H0.
f(t) 1-a a/2 a/2 Miền chấp nhận Ho Miền bác bỏ Ho Miền bác bỏ Ho -t t a/2 a/2 -4 -3 -2 -1 0 1 2 3 4 t
1. Kiểmđịnhgiảthuyếtvềhệsốhồiquy Cách 2: Phương pháp khoảng tin cậy Khoảng tin cậy của i:với mức ý nghĩa trùng với mức ý nghĩa của H0 Quy tắc quyết định - Nếu chấp nhận H0 - Nếu bác bỏ H0
1. Kiểmđịnhgiảthuyếtvềhệsốhồiquy Cách 3: Phương pháp p-value Bước 1: Tính Bước 2: Tính Bước 3: Quy tắc quyết định - Nếu p ≤ : Bác bỏ H0 - Nếu p > : Chấp nhận H0