310 likes | 503 Views
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI. Chương 2 : (6ti ết). NỘI DUNG. 2.1. Phân tích tương quan 2.2. Phân tích hồi qui. PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI. Chương 2 : (6ti ết). MỞ ĐẦU
E N D
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) NỘI DUNG 2.1.Phân tích tương quan 2.2.Phân tích hồi qui
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) MỞ ĐẦU - Trong chương trước, chúng ta chỉ nghiên cứu các vấn đề liên quan đến mẫu ngẫu nhiên của một biến ngẫu nhiên X. - Trong chương này, chúng ta quan tâm đến mẫu ngẫu nhiên bao gồm các cặp giá trị của hai biến ngẫu nhiên X và Y. VD. Để nghiên cứu về chiều cao và cân nặng của các em học sinh trong một trường, chúng ta lấy mẫu ngẫu nhiên gồm n học sinh và thu thập các số liệu về chiều cao và cân nặng của n học sinh. Gọi X là biến ngẫu nhiên để đo chiều cao của học sinh và Y là biến ngẫu nhiên chỉ cân nặng của học sinh. Với n học sinh ta có n cặp giá trị (Yi , Xi).
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Mục tiêu của chương này là nghiên cứu sự liên hệ giữa biến Y và X bằng sự phân tích tương quan và hồi qui. - Trong phân tích tương quan, người ta đề cập đến cường độ của mối quan hệ giữa hai biến Y và X, đánh giá xem hai biến Y và X có quan hệ với nhau hay không. - Trong phân tích hồi qui, người ta lại xác định quan hệ giữa hai biến Y và X dưới dạng phương trình toán học, từ đó ta có thể dự đoán được biến Y (biến phụ thuộc, dependent variable) dựa vào biến X (biến độc lập, independent variable) => Trong chương này, chúng ta cũng giới hạn chỉ nghiên cứu tương quan và hồi qui đơn biến và tuyến tính, nghĩa là chỉ nghiên cứu trường hợp biến Y chỉ phụ thuộc vào 1 biến Xvà dạng phương trình hồi qui là phương trình đường thẳng (khác với các tương quan và hồiqui bội và phi tuyến).
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) 2.1. Phân tích tương quan * Xét 2 đại lượng ngẫu nhiên X , Y trong n cặp kết quả quan sát (x1,y1)…(xn,yn) ta có: Y = X + Ngẫu nhiên có điều kiện - Như vậy: Y = f(x) tạo mối quan hệ hàm số: Y = X + Ngẫu nhiên độc lập (không có điều kiện) * Nếu: Y = X + Ngẫu nhiên có điều kiện + Ngẫu nhiên độc lập tạo nên hệ thức giữa chúng. - Ước lượng dưới dạng tổng quát thống kê và lập hệ số tương quan. - Theo lý thuyết thống kê +X và Y có mối liên hệ mômen tương quan:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Từ đó ta có hệ số tương quan:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Lưu ý:-1 ≤ r ≤ 1 - r được dùng để ước lượng hướng và độ mạnh của mối quan hệ giữa X,Y. - /r/ > 0,8 tương quan mạnh. - /r/ = 0,4 - 0,8 tương quan trung bình. - /r/ < 0,4 tương quan yếu. - /r/ càng lớn thì tương quan giữa X và Y càng chặt.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) * Để kiểm tra độ tương thích 2 biến X,Y lập bảng tính và áp dụng công thức tính rX,Y:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) * Để kiểm tra độ tương thích 2 biến X,Y lập bảng tính và áp dụng công thức tính rX,Y:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Ví dụ:Tính hệ số tương quan giữa 2 biến X, Y cho bởi bảng tương quan sau: Giải:Số phần tử của mẫu n = 5
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) => R = - 0,1 ; KL: 2 biến X, Y tương quan yếu.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Bài tập:Lấy mẫu ngẫu nhiên 2 biến X và Y ta có các giá trị (xi, yi) cho bởi bảng sau: Tìm hệ số tương quan giữa 2 biến X, Y.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) 2.2. Phân tích hồi qui 2.2.1. Khái niệm cơ bản Khái niệm: Phân tích hồi qui nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc) với một hay nhiều biến khác (gọi là biến độc lập). - Sự phụ thuộc các đại lượng ngẫu nhiên được xác định bằng một hàm phân phối có điều kiện F(x,y). - Phân tích hồi qui là tính các thông số của mô hình trên cơ sở các số liệu thực nghiệm. - Mô hình mục tiêu nghiên cứu phải xác định rõ ràng, hàm mục tiêu được gọi là hàm đáp ứng. b. Phân biệt hồi qui và tương quan => khác nhau về mục đích và kỹ thuật.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) (1) Về mục đích: Phân tích tương quan là do mức độ kết hợp giữa 2 biến. VD: mức độ quan hệ giữa nghiện thuốc lá và ung thư phổi. Phân tích hồi qui lại ước lượng hoặc dự báo một biến trên cơ sở giá trị đã cho của các biến khác. (2) Về kỹ thuật: Phân tích hồi qui: các biến không có tính chất đối xứng, biến phụ thuộc là biến ngẫu nhiên, các giá trị biến độc lập của chúng đã được xác định. Phân tích tương quan: không có sự phân biệt giữu các biến, chúng có tính chất đối xứng.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) 2.2.2. Phương pháp bình phương nhỏ nhất. - Do nhà toán học Đức Carl Friedrich Gauss đưa ra. - Phương trình hồi qui gần đúng phụ thuộc vào phương pháp tính dùng để tính các hệ số hồi qui. - Phương pháp bình phương nhỏ nhất xác định hệ số phương trình hồi qui sao cho gần đúng với kỳ vọng toán học của thực nghiệm.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Bài toán xác định hệ số hồi qui là xác định cực tiểu của hàm nhiều biến bo, b1,... - Trong đó: Xi (i = 1,2,…..n): là yếu tố biến thiên độc lập. yi : giá trị thực nghiệm Ŷ = f (xo, bo, b1, …) giá trị tìm được theo phương trình hồi qui.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Nếu Ŷ = f (x0, bo, b1,…) là hàm khả vi thì điều kiện cực tiểu của là: - Hoặc khai triển ra: …………………………
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Sau khi biến đổi ta có hệ phương trình: …………………………………… - Hệ phương trình trên có bao nhiêu phương trình thì phương trình hồi qui có bấy nhiêu hệ số. - Bằng các phương pháp toán học ta xác định được các hệ số của phương trình chuẩn.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) 2.2.3. Một số dạng phương trình hồi qui - Tối ưu hóa phụ thuộc 1 biến số Ŷ = f(x) theo dạng hồi qui thực nghiệm. - Phương trình hồi qui tuyến tính: - Phương trình hồi qui Parabon:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Phương trình hồi qui biểu diễn qua đa thức: - Trong đó:Po (x), P1 (x), PK (x) là đa thức trực giao trên các tập điểm X1, …, Xn. - Phương trình hồi qui mũ và lũy thừa: => Các phương trình mũ và lũy thừa được tuyến tính hoá bằng lấy logarit.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) 2.2.4. Phân tích hồi qui tuyến tính bội k. - Nếu thông số tối ưu phụ thuộc vào k biến độc lập (x1, x2,… xk). - Mô hình được chọn là biểu thức tuyến tính. - Ta gọi là hồi qui tuyến tính bội k. Ví dụ: Giả sử có n thí nghiệm với k biến độc lập, (x1, x2, …, xK) không có thí nghiệm lặp lại. - Ta có bảng sau:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Giả thiết: 1. Mỗi kết hợp x1, …, xk đại lượng y có phân phối chuẩn. 2. Phương sai σy2 không đổi. 3. Sai số các phép đo biến độc lập không đáng kể so với sai số đo Y. 4. Các biến x1, …, xk độc lập tuyến tính. Ước lượng kết quả được tính bằng: x0: là biến giả (x0=1).
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) Bài toán đặt ra: Tìm các hệ số hồi quy theo số liệu thực nghiệm bằng phương pháp bình phương nhỏ nhất: - Đạo hàm biểu thức trên theo bo, b1…, bk ta nhận được hệ phương trình chuẩn và trình bày dưới dạng ma trận.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Biểu diễn sơ đồ thí nghiệm được trình bày dưới dạng ma trận của x thu được là:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) * Ma trận cột các giá trị Y: Ma trận của các hệ số hồi qui: =>Từ ma trận thí nghiệm (x) ma trận của hệ số (B) và kết quả của thí nghiệm (Y), ta có dạng ma trận hệ phương trình: B.X = Y
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Nhân hai vế của ma trận hệ phương trình trên với với ma trận nghịch đảo của ma trận X là ma trận XT. + Ma trận XT là ma trận chuyển vị của ma trận X: + Dạng ma trận hệ phương trình chuẩn ta có: XT. X. B = XT.Y
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Từ đó, ta suy ra: B = (XT.X)-1 XT.Y Với: (XT.X)-1 là ma trận nghịch đảo của XT.X - Từ đó ta tính được: Trong đó: Cjj: những phần tử của ma trận nghịch đảo.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Ước lượng của phương sai σbj2 ta xác định được biên của các khoảng tin cậy với mỗi hệ số hồi qui như sau: bj -Ước lượng của hệ số hồi quy βj t - Chuẩn số Student (được tra trong bảng chuẩn) sbj - Sai số trong việc xác định bj - Sau khi xác định được các hệ số của phương trình hồi qui cần tiến hành kiểm định: + Ý nghĩa của hệ số hồi qui + Sự tương tích của phương trình hồi qui
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) * Kiểm định của các hệ số hồi qui - Việc kiểm định ý nghĩa của các hệ số hồi qui được thực hiện theo tiêu chuẩn Student Trong đó: + bj : Hệ số thứ j trong phương trình hồi qui (βj). + sbj: sai số trong việc xác định hệ số thứ j (bj)
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Nếu tj > tp (f) ảnh hưởng của yếu tố thứ j có ý nghĩa với thông số tối ưu yi, hệ số bj được giữ lại. - Nếu tj < tp (f) hệ số bj bị loại khỏi phương trình hồi qui (p: mức ý nghĩa, f : bậc tự do tái hiện). => Khi loại hết các hệ số không có nghĩa ta được phương trình hồi quy.
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) * Kiểm định sự tương thích của phương trình hồi qui - Sự tương thích của phương trình hồi qui được kiểm định theo tiêu chuẩn Fisher: - Trong đó: Stt2 phương sai tương thích Sth2 phương sai tái hiện - Với:
PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Chương2:(6tiết) - Trong đó: Với: ftt = fdư – fth = n - l + n là: số thí nghiệm + l : số hệ số có nghĩa trong phương trình hồi qui. - Nếu F tính được < F1-p (f1, f2) tra bảng với mức ý nghĩa p, f1 = ftt, f2 = fth thì: phương trình tương thích với thực nghiệm. Và ngược lại.