1 / 47

MÔ HÌNH HỒI QUY HAI BIẾN

MÔ HÌNH HỒI QUY HAI BIẾN. Thế nào là hồi quy? Thế nào là tuyến tính? Mô hình hồi quy tuyến tính là như thế nào?. Hồi quy được Francis Galton đưa ra lần đầu tiên và bài viết của Ông rất nổi tiến Xu hướng bố mẹ cao đẻ con cao Bố mẹ thấp đẻ con thấp

nieve
Download Presentation

MÔ HÌNH HỒI QUY HAI BIẾN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. MÔ HÌNH HỒI QUY HAI BIẾN • Thế nào là hồi quy? • Thế nào là tuyến tính? • Mô hình hồi quy tuyến tính là như thế nào?

  2. Hồi quy được Francis Galton đưa ra lần đầu tiên và bài viết của Ông rất nổi tiến • Xu hướng bố mẹ cao đẻ con cao • Bố mẹ thấp đẻ con thấp • Chiều cao trung bình của trẻ em do những ông bố bà mẹ cùng chiều cao sinh ra có xu hướng tiến tới hay “Hồi quy” ở chiều cao trung bình của dân số. • Theo cách nói của Galton, đó là “Hồi quy về trung bình” (regression to mediocrity)

  3. Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến, biến phụ thuộc, vào một hay nhiều biến khác, các biến giải thích; • Với ý tưởng ước lượng hay dự đoán giá trị bình quân hay trung bình (tổng thể) của biến phụ thuộc trên cơ sở các giá trị biết trước hay cố định (trong mẫu lặp lại) của các biến giải tích.

  4. Hồi quy tuyến tính • Tuyến tính theo các biến số • Tuyến tính theo các tham số • Hồi quy tuyến tính là một hồi quy theo các thông số (các thông số chỉ có lũy thừa bằng 1 mà thôi); nó có thể có tuyến tính hoặc có thể không tuyến tính theo các biế giải thích (các giá trị X)

  5. Phân tích hồi quy giải quyết các vấn đề • Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập. • Kiểm định giả thuyết cơ bản về bản chất của sự phụ thuộc. • Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập. • Kết hợp các vấn đề trên.

  6. MỐI QUAN HỆ CỦA HỒI QUY • QUAN HỆ THỐNG KÊ VÀ QUAN HỆ HÀM SỐ, QUAN HỆ TẤT ĐỊNH • HỒI QUY VỚI QUAN HỆ NHÂN QUẢ • HỒI QUY VỚI TƯƠNG QUAN • Phân tích tương quan là tính sức mạnh hay mức độ liên kết tuyến tính giữa hai biến • Nhưng trong phân tích tương quan không có sự phân biệt giữa các biến

  7. CÁC LOẠI SỐ LIỆU • Số liệu theo thời gian • Hàng ngày: giá vàng, USD trên thị trường • Hàng tuần: giá cà phê • Hàng tháng: Chỉ số giá Hàng quí: GDP • Hàng năm: GDP, ngân sách chính phủ • 5 năm: tổng điều tra ngành công nghiệp chế tạo • 10 năm: tổng điều tra dân số.

  8. CÁC LOẠI SỐ LIỆU • Số liệu chéo Là số liệu về một hoặc nhiều biến được thu thập tại cùng một thời điểm tại nhiều địa phương, đơn vị khác nhau • Số liệu tổng hợp Bao gồm cả số liệu chuỗi thời gian và số liệu chéo ví dụ: Số liệu về giá vàng, đôla hàng ngay ở Hà Nội, TPHCM

  9. NGUỒN SỐ LIỆU • Cơ quan nhà nước (Bộ TM, Bộ NN & PTNT) • Cơ quan Quốc tế (WR, IMF, UNDP…) • Công ty tư nhân • Cá nhân thu thập • ..............

  10. Tính chính xác của số liệu Mặc dù có nhiều số liệu phục vụ cho nghiên cứu kinh tế, chất lượng của số liệu thường không đủ tốt. Do những nguyên nhân gì? • Sai số trong quan sát, bỏ sót hay phạm sai lầm • Gần đúng hay làm tròn số • Thiên lệch về lựa chọn • Phương pháp chọn mẫu • Các số liệu kinh tế thường ở mức rất tổng hợp • Ngoài ra còn có những số liệu bảo mật

  11. MÔ HÌNH HỒI QUY TỔNG THỂ

  12. Xác suất có điều kiện P(Y|Xi) của dữ liệu

  13. BIỂU ĐỒ Chi tiêu gia đình hàng tuần ($) Thu nhập gia đình hàng tuần ($)

  14. ĐẶC TRƯNG NGẪU NHIÊN CỦA PRF ………………………………….

  15. KN biến phụ thuộc và biến giải thích Biến giải thích Biến phụ thuộc Biến độc lập Biến được giải thích Biến dự báo Biến được dự báo Biến được H.quy Biến hồi quy Biến tác nhân hay biến kiểm soát Phản ứng Nội sinh Ngoại sinh

  16. Biến phụ thuộc (Dependent Variable) Y; Biến giải thích (Explanatory Variable) Xs 1. Y = Son’s Height; X = Father’s Height 2. Y = Height of boys; X = Age of boys 3. Y = Personal Consumption Expenditure X = Personal Disposable Income 4. Y = Demand; X = Price 5. Y = Rate of Change of Wages X = Unemployment Rate 6. Y = Money/Income; X = Inflation Rate 7. Y = % Change in Demand; X = % Change in the advertising budget 8. Y = Crop yield; Xs = temperature, rainfall, sunshine, fertilizer

  17. A random sample from the population Y X ------------------ 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 ------------------ Another random sample from the population Y X ------------------- 55 80 88 100 90 120 80 140 118 160 120 180 145 200 135 220 145 240 175 260 -------------------- The Sample Regression Function (SRF)

  18. Weekly Consumption Expenditure (Y) SRF1 SRF2 Weekly Income (X)

  19. The Sample Regression Function (SRF) • SRF1 and SRF 2 • Y^i = α ^ + ^Xi • Y^i = estimator of E(YXi) • α^= estimator of α • ^= estimator of  • Estimate = A particular numerical value obtained by the estimator in an application • SRF in stochastic form: Yi= ^1 + ^2Xi + ε ^i or Yi= Y^i + ε^i

  20. Phương trình hồi quy tổng thể Trong đó: Yi : Biến phụ thuộc, biến ngẫu nhiên Xi: Biến độc lập, biến không ngẫu nhiên εi: Sai số α,β: Hệ số hồi quy

  21. Các giả thiết hồi quy • Mối quan hệ Y và X là tuyến tính • Các giá trị X là biến số không ngẫu nhiên, có giá trị cố định • a. Kỳ vọng sai số bằng không và phương sai là một hằng số b. Các biến số ngẫu nhiên εi độc lập về mặt thống kê c. Số hạng sai số có phân phối chuẩn

  22. ƯỚC LƯỢNG THAM SỐ HỒI QUY • Thông số thử nghiệm hàm SRF (Sample regression function). Total

  23. ƯỚC LƯỢNG THAM SỐ HỒI QUY • Best Linear unbiased Estimator (BLUE) • Ordinary Linear Square (OLS) • Đính lý Gauss-Markov: Với các giả định i, ii, iiia và iiib, các ước lượng α(hat) và β(hat) là những ước lượng không chệch tốt nhất của α và β(và hiệu quả nhất) có nghĩa là chúng có phương sai nhỏ nhất trong số tất cả các ước lượng tuyến tính không chệch.

  24. Ước lượng

  25. Với:

  26. Kiểm định và ước lượng khoảng Kiểm định t: Ước lượng khoảng:

  27. Decision Rule for t-test of significance

  28. VD: Giả sử bạn phụ trách cơ quan tiền tệ trung ương trong một quốc gia tưởng tượng. Bạn được cho số liệu quá khứ sau đây về lượng tiền và thu nhập quốc dân (tính theo triệu dollar)

  29. a. Hãy chấm những điểm này trên đồ thị. Sau đó ước lượng hồi quy thu nhập quốc dân Y trên lượng tiền tệ X và vẽ đường này trên đồ thị. b. Bạn giải thích như thế nào về tung độ gốc và độ dốc của đường hồi quy. c. Nếu bạn là người duy nhất kiểm soát sự cung ứng tiền tệ và mong đạt được mức thu nhập quốc dân là 12.0 trong năm 1991, thì bạn sẽ cung ứng tiền tệ ở mức nào. Giải thích

  30. Ví dụ: • Y: Bushels per acre of corn • X: Fertilizer • Hãy ước lượng các tham số hồi quy • Biểu diễn các cặp giá trị lên biểu đồ • Vẽ đường hồi quy lên biểu đồ

  31. Giải thích phương trình hồi quy?

  32. PHÂN TÍCH PHƯƠNG SAI

  33. Hệ số xác định: Hoặc

  34. Hệ số tương quan:

  35. Ví dụ: Y: Lượng cầu X: Giá của một loại hàng hóa Cặp số: 1 2 3 4 5 6 7 Y: 8 7 6 5 5 4 4 X: 2 3 3 4 5 6 8

  36. Yêu cầu: • Biểu diễn các cặp giá trị Y và X lên biểu đồ • Trước khi ước lượng hàm hồi quy, hãy dự đoán dấu của β (dương hay âm). Hãy giải thích ngắn gọn. • Ước lượng phương trình hồi quy • Cho biết ý nghĩa của độ dốc hồi quy • Kiểm định giả thuyết Ho: β1 = 0, β2 = 1 • Tính và giải thích hệ số xác định, hệ số tương quan của phương trình hồi quy. • Dự báo cầu của loại hàng hóa khi giá tăng lên tại X = 12.

  37. VD2: 1. Hãy hoàn chỉnh bảng phân tích phương sai hồi qui sau và cho biết ý nghĩa của kiểm định F. Xác định giá trị t để kiểm định ý nghĩa thống kê của độ dốc đường hồi qui: ANOVA

More Related