1 / 59

บทที่ 7 การวิเคราะห์การถดถอย

บทที่ 7 การวิเคราะห์การถดถอย. การวิเคราะห์การถดถอยเป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตั้งแต่ 2 ตัวแปรขึ้นไป ว่ามีความสัมพันธ์ในรูปแบบใด. ตัวแปรในการวิเคราะห์การถดถอยแบ่งเป็น 2 ลักษณะคือ 1. ตัวแปรตาม (Dependent Random Variable) 2. ตัวแปรอิสระ (Independent Random Variable).

xanthe
Download Presentation

บทที่ 7 การวิเคราะห์การถดถอย

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. บทที่ 7 การวิเคราะห์การถดถอย การวิเคราะห์การถดถอยเป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตั้งแต่ 2 ตัวแปรขึ้นไป ว่ามีความสัมพันธ์ในรูปแบบใด ตัวแปรในการวิเคราะห์การถดถอยแบ่งเป็น 2 ลักษณะคือ 1. ตัวแปรตาม (Dependent Random Variable) 2. ตัวแปรอิสระ (Independent Random Variable)

  2. การวิเคราะห์การถดถอยอย่างง่าย : เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตาม และตัวแปรอิสระ 1ตัวแปรเท่านั้น การวิเคราะห์การถดถอยแบบพหุคูณ : เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตาม และตัวแปรอิสระมากกว่า 1 ตัวแปร ในเบื้องต้นเป็นการศึกษาความสัมพันธ์ในรูปแบบความสัมพันธ์เชิงเส้น

  3. การถดถอยอย่างง่าย เป็นการศึกษาว่าตัวแปรตาม และ ตัวแปรอิสระ 1 ตัว มีความสัมพันธ์เชิงเส้น โดยมีรูปแบบดังนี้ สมการนี้เรียกว่า regression line of Y on X และค่าสังเกต (xi , yi ) ใดๆคือ

  4. คือค่า intercept เป็นจุดตัดแกน Y คือความชันของเส้น คือค่าความคลาดเคลื่อนที่ yiเบี่ยงเบนออกจากค่าเฉลี่ยของ Y ณ แต่ละค่าของ X Assumption 1. มีการแจกแจงแบบปกติ 2. มีการแจกแจงแบบปกติ

  5. สมการที่แสดงความสัมพันธ์ระหว่างตัวแปรตาม (Y) กับตัวแปรอิสระ (X) คือเส้นที่ลากเชื่อมต่อจุด mean ณ ค่า X แต่ละค่าที่ทำการศึกษา โดยแต่ละค่าของ X จะมีค่าสังเกต (Y) มากมายและ Y มีการแจกแจงแบบปกติ และมีค่าความแปรปรวนของ Y ในแต่ละ X คงที่ (เท่ากัน)

  6. Y *(xi,yi) X

  7. เส้นสมการถดถอยที่แสดงนั้นจะสามารถหาได้ก็ต่อเมื่อต้องทราบค่าสังเกตของประชากรทั้งหมดจึงจะหาเส้นนี้ได้ ดังนั้นเส้นนี้จึงเป็นเส้นในอุดมคติ แต่จากการสุ่มตัวอย่างขนาด n ได้ค่าสังเกต (x1 , y1) , … , (xn , yn ) เราสามารถประมาณค่าพารามิเตอร์ของสมการถดถอยได้โดยอาศัยวิธีการ least square (ประมาณค่า intercept และ slope)

  8. Y X

  9. Y (xi , yi ) * X

  10. ค่าสังเกต (xi , yi ) ใดๆสามารถเขียนในรูปของสมการได้ดังนี้ เมื่อ eiคือส่วนเหลือ (residual) มีการแจกแจงโดยประมาณเป็นการแจกแจงแบบปกติ b0 คือค่าประมาณ intercept b1 คือค่าประมาณ slope

  11. การประมาณค่าพารามิเตอร์ทำได้โดยวิธี Least square

  12. ความคลาดเคลื่อนมาตรฐานของ b0และ b1คือ

  13. การทดสอบสมมติฐานเกี่ยวกับ b0และ b1 1. เป็นการทดสอบว่าสมการถดถอยผ่านจุดกำเนิดหรือไม่ H0 : H1 : 2. เป็นการทดสอบว่า X มีความสัมพันธ์กับ Y หรือไม่โดยพิจารณาจาก H0 : H1 :

  14. สถิติที่ใช้ในการทดสอบคือสถิติที่ใช้ในการทดสอบคือ ช่วงเชื่อมั่นสำหรับค่าพารามิเตอร์คือ

  15. Y (xi , yi ) * X SST = SSR + SSE

  16. ตารางการวิเคราะห์ความแปรปรวนตารางการวิเคราะห์ความแปรปรวน Sov df SS MS F Sig. Regression 1 SSR MSR MSR/MSE p Error n-2 SSE MSE Total n-1 SST สมมติฐานในการทดสอบคือ H0 : H1 :

  17. Menu Analyze > Regression > ผลจาการใช้ menu นี้สามารถวิเคราะห์ได้หลายแบบดังนี้ 1. Linear*** 2. Curve estimation 3. Logistic 4. Probit 5. Non-Linear 6. Weight estimation 7. 2-stage Least Square

  18. Linear หน้าจอจะปรากฏ box ทางขวามือ 1. Box ของ Dependent variable : ใส่ตัวแปรตามใน box นี้ 2. Box ของ Independent var. : ใส่ตัวแปรอิสระใน box นี้ [สามารถวิเคราะห์ได้หลายสมการสำหรับตัวแปรตามตัวเดียวกัน click ที่ next เหนือ box นี้] 3. Method : ระบุวิธีการเลือกตัวแปรอิสระ(ในกรณีที่มีตัวแปรอิสระหลายตัวแปร)

  19. 4. Selection var. : ใส่ตัวแปรที่ต้องการให้วิเคราะห์ภายใต้เงื่อนไขที่กำหนด(ไม่วิเคราะห์การถดถอยทั้งหมดวิเคราะห์เพียงบางส่วนเท่านั้น เช่นศึกษาความสัมพันธ์ระหว่างเงินเดือนปัจจุบัน (Y) กับเงินเดือนเริ่มต้น (X) ภายใต้เงื่อนไขเฉพาะประเภทของงานเช่นอาชีพเสมียน (clerical) เท่านั้น 5. Case Label : แสดง label ในรูปกราฟแทนที่จะเป็นกล่องสี่เหลี่ยมเล็กๆก็จะแทนด้วย Label ตัวแปรที่ใส่ใน box นี้

  20. OPTIONS สำหรับกลุ่มของ Stepping Method Criteria เป็นเกณฑ์ที่ใช้ในการพิจารณาตัวแปรอิสระ เข้าสมการถดถอยหรือพิจารณาตัดตัวแปรอิสระออกจากสมการ มี 2 ทางให้เลือกคือ 1. Use probability of F (default): ตัวแปรอิสระที่จะนำเข้าสมการต้องมีค่า sig. น้อยกว่า F-entry (0.05) และตัวแปรอิสระที่จะถูกตัดออกจากสมการต้องมีค่า sig. มากกว่า F-removal (0.10)

  21. 2. Use F-value : พิจารณาตัวแปรอิสระเข้าสมการหรือตัดตัวแปรอิสระออกจากสมการโดยค่า F ตัวแปรอิสระที่จะนำเข้าสมการต้องมีค่า F มากกว่า F-value entry (3.84) และตัวแปรอิสระที่จะถูกตัดออกจากสมการต้องมีค่า F น้อยกว่า F-value removal (2.71) ผลลัพธ์ของการเลือกใช้ 2 คำสั่งย่อยนี้อาจไม่เหมือนกัน กลุ่ม include constant in equation : เป็นทางเลือกให้คำนวณค่าคงที่ (intercept)ในสมการหรือไม่ ถ้าไม่ต้องการ ให้ click เครื่องหมายออกจากคำสั่งนี้

  22. กลุ่มของ missing values 1. Excluded cases listwise : (default) ตัด case ที่สูญหายออกจากการวิเคราะห์ทั้งหมด 2. Excluded cases pairwise : ใช้ case ทีมีค่าตัวแปรที่ทำการศึกษาครบ (ตัวแปรอื่นที่ไม่ได้ศึกษาอาจสูญหาย) 3. Replace with mean : แทนค่าที่สูญหายด้วยค่าเฉลี่ยของตัวแปรนั้น

  23. Statistics : กลุ่มของ Regression Coefficients 1. Estimate : (default) แสดงค่าสัมประสิทธิ์ถดถอย (bi (Bi)) ความคลาดเคลื่อนมาตรฐานของ (bi ) สัมประสิทธิ์มาตรฐาน Beta ค่าสถิติ t ของ Bi และค่า p-value 2. Confidence intervals : แสดงช่วงเชื่อมั่น 95 % ของ

  24. 3. Covariance Matrix : แสดงเมตริกซ์ความแปรปรวน-ความแปรปรวนร่วมของค่าประมาณสัมประสิทธิ์ถดถอย 3.1. แสดงเมตริกซ์ความแปรปรวนร่วมใต้เส้น ทแยงมุม 3.2. แสดงสหสัมพันธ์เหนือเส้นทแยงมุม 3.3. แสดงค่าความแปรปรวนบนเส้นทแยงมุม

  25. กลุ่มของ residual 1. Durbin-Watson : เป็นการทดสอบว่าค่าความคลาดเคลื่อนเป็นไปโดยสุ่ม หรือมีความสัมพันธ์กันหรือไม่ เพราะตามข้อสมมติแล้วความคลาดเคลื่อนต้องเป็นอิสระต่อกัน 2. Casewise diagnostics : เป็นการแสดงรายการตำแหน่ง ค่าตัวแปรตาม ค่าพยากรณ์ ค่าส่วนเหลือ 2.1. Outliers outside n std.deviations แสดงค่าสังเกตที่มีค่าสัมบูรณ์ของส่วนเหลือมาตรฐานมากกว่าค่าที่กำหนด โดยปกติมีค่าเท่ากับ 3 เท่าของส่วนเบี่ยงเบนมาตรฐาน แต่ถ้าต้องการค่าอื่นก็ใส่ค่าลงในช่องหน้า std.deviation 2.2. All cases : แสดงค่าทุกหน่วยสังเกต

  26. 1. Model-fit : (default) แสดงค่า R , R2 , adjust R2 ความคลาดเคลื่อนมาตรฐาน ตารางการวิเคราะห์ความแปร ปรวน 2. R-square change : แสดงค่า R Square change , F Change และ Sig. F change 3. Descriptive : แสดงค่าสถิติพื้นฐานของตัวแปร 4. Part and Partial correlations : แสดงค่าส่วนของสหสัมพันธ์ และสหสัมพันธ์บางส่วน 5. Collinearity diagnostics : แสดงค่า VIF , eigenvalues ของ cross products matrix , condition indicies , proportion variance decomposition , tolerance ของตัวแปรต่างๆ

  27. R2 (coefficient of determination) ความหมายของค่าสัมประสิทธิ์นี้คือ ความผันแปรของ Y ทั้งหมดอธิบายด้วยความผันแปรของตัวแปรอิสระเท่าใด เช่น R2 = 0.89 หมายความว่าตัวแปรอิสระอธิบายความผันแปรได้ร้อยละ 89 ถ้าตัวแปรอิสระมีมากกว่า 1 ตัว ค่าของ R2 จะเพิ่มขึ้นเกินจริง ต้องมีการปรับเพื่อความถูกต้องและใกล้เคียงความเป็นจริงมากยิ่งขึ้นโดย p คือจำนวนตัวแปรอิสระ

  28. เมื่อสร้างสมการประมาณสมการถดถอยได้แล้ว เราสามารถพยากรณ์ค่า Y เมื่อกำหนดค่าของตัวแปรอิสระ X จากสมการโดยการพยากรณ์ค่า มี 2 ลักษณะคือ 1. การพยากรณ์ค่าเฉลี่ย 2. การพยากรณ์ค่า Yiใดๆ(ค่าเดี่ยว) เมื่อกำหนด x = x0 ค่าประมาณของ Y จะเท่ากันทั้ง 2 ลักษณะแต่ค่าของความคลาดเคลื่อนมาตรฐานจะแตกต่างกัน

  29. ในกรณีการพยากรณ์ค่าเฉลี่ย Y ณ จุด x = x0 ค่าความคลาดเคลื่อนมาตรฐานของ ในกรณีการพยากรณ์ค่าเดี่ยวของ Y ณ จุด x = x0 ค่าความ คลาดเคลื่อนมาตรฐานของ Y จะเพิ่มมากขึ้นเป็น

  30. ช่วงเชื่อมั่นสำหรับค่าเฉลี่ยของ Y ณ จุด x=x0คือ ช่วงเชื่อมั่นสำหรับค่าเดี่ยว Y ณ จุด x=x0คือ

  31. ค่าสัมประสิทธิ์ Beta ในการแปลความของสมการถดถอยที่ประมาณได้จากตัวอย่าง ค่าสัมประสิทธิ์ของการถดถอยเป็นค่าที่บอกความสำคัญของตัวแปรอิสระนั้นๆต่อตัวแปรตามบางครั้งทำได้ค่อนข้างยากเนื่องจากหน่วยของตัวแปรตามและตัวแปรอิสระต่างกัน ถ้าตัวแปรทั้งหมดอยู่ในรูปของคะแนนมาตรฐาน ค่าสัมประสิทธิ์นี้จะสามารถบอกได้ถึงความสำคัญของตัวแปรอิสระแต่ละตัว

  32. การวิเคราะห์การถดถอยแบบพหุคูณการวิเคราะห์การถดถอยแบบพหุคูณ เป็นการศึกษาความสัมพันธ์ของตัวแปรตาม กับตัวแปร อิสระมากกว่า 1 ตัวแปร สมการแสดงความสัมพันธ์คือ ค่าสังเกต yiใดๆ

  33. Menu Analyze > Regression > Linear ... ใส่ตัวแปรตามใน box ของ independent var. ใส่ตัวแปรอิสระ มากกว่า 1 ตัวแปรลงใน box ของตัวแปรอิสระ ถ้าต้องการศึกษาความสัมพันธ์ของตัวแปรทั้งหมด วิธีการวิเคราะห์จะเป็น Enter แต่ถ้าต้องการคัดเลือกตัวแปรอิสระที่เหมาะสมเข้าไปในสมการถดถอยมีวิธีการเลือกดังนี้ 1. Stepwise 2. Remove 3. Backward 4. Forward

  34. วิธีการคัดเลือกตัวแปรอิสระ 1. Enter : เป็นวิธีการที่บังคับตัวแปรอิสระที่สนใจเข้าไปในสมการ ตัวแปรอิสระที่สนใจจะถูกนำมาใส่ไว้ใน box ของindependent var. 2. Forward Selection : เป็นวิธีการที่นำตัวแปรอิสระใน box independent var. มาทำการพิจารณาทีละตัว เพิ่มขึ้นทีละตัวแปรในแต่ละ step จะหยุดเมื่อไม่มีตัวแปรอิสระสามารถเข้าในสมการได้เกณฑ์ที่ใช้พิจารณาอาจเป็น Prob. F entry หรือ F-value entry

  35. 3. Backward Elimination : เป็นการตัดตัวแปรอิสระออกจากสมการทีละตัวในแต่ละ step โดยขั้นแรกใส่ตัวแปรอิสระทั้งหมดเข้าไปในสมการก่อน ขั้นต่อไปจึงพิจารณาตัดตัวแปรทีละตัว ทำเรื่อยไปจนกว่าไม่สามารถตัดตัวแปรอิสระตัวใดออกจากสมการได้เกณฑ์ที่ใช้พิจารณาอาจเป็น Prob. F removal หรือ F-value removal 4. Stepwise Regression : เป็นวิธีการผสมระหว่าง Forward Selection และ Backward Elimination เป็นวิธีการที่ดีที่สุดในการคัดเลือกตัวแปร

  36. Forward Selection : 1. พิจารณาตัวแปรตามกับตัวแปรอิสระแต่ละตัว Y - X1 , Y - X2 , Y - X3 , Y - X4 พิจารณาตัวแปรอิสระที่มีความสัมพันธ์กับ Y สูงที่สุด อาจพิจารณาจากสมการใดมีค่า R2 สูงที่สุดแสดงว่าตัวแปรอิสระตัวนั้นอธิบายความผันแปรของ Y ได้มากที่สุด หรือมีความสัมพันธ์กับ Y สูงที่สุด สมมติว่าเป็น X1 ทำการทดสอบ H0 : หรือไม่ ถ้ายอมรับแสดงว่าไม่มีตัวแปรอิสระใดเหมาะสม แต่ถ้าปฏิเสธ ก็ทำขั้นต่อไป

  37. 2. พิจารณาตัวแปรอิสระตัวต่อไปโดยพิจารณาความสัมพันธ์ระหว่างตัวแปรอิสระแต่ละตัวที่เหลือกับตัวแปรตามเมื่อตัวแปรอิสระ X1อยู่ในสมการเรียบร้อยแล้ว หรือพิจารณาจากค่า partial correlation ระหว่าง Y กับตัวแปรอิสระที่เหลือทีละตัวโดยคุม X1ไว้ในสมการแล้ว Y, X1 - X2 , Y, X1 - X3 , Y, X1 - X4 สมมติว่า X2 มีค่า partial correlation สูงที่สุด X2 จะเข้าสมการเป็นตัวแปรถัดไป ทำการทดสอบ หรือไม่ ถ้าปฏิเสธแสดงว่า X2 อยู่ในสมการทำขั้นต่อไปเรื่อยๆจนไม่มีตัวแปรสามารถเข้าไปในสมการได้อีก

  38. Backward Elimination : 1. นำตัวแปรอิสระทั้งหมดเข้าในสมการ Y - X1 , X2 , X3 , X4 หาค่า R2 พิจารณาว่าตัวแปรอิสระตัวใดใดมีความสัมพันธ์กับ Y น้อยที่สุดเมื่อตัวแปรอิสระตัวอื่นยังคงอยู่ในสมการ 1. Y, X1, X2 , X3 - X4 2. Y, X1, X2 , X4 - X3 3. Y, X1, X3 , X4 - X2 4. Y, X2, X3 , X4 - X1

  39. 1. Y, X1, X2 , X3 - X4 หาค่า R2 จากค่า SSReg SSR(B4| B1,B2,B3) = SSR(B1,B2,B3,B4) - SSR (B1,B2,B3) 2. Y, X1, X2 , X4 - X3 หาค่า R2 จากค่า SSReg SSR(B3 | B1,B2,B4) = SSR(B1,B2,B3,B4) - SSR (B1,B2,B4) 3. Y, X1, X3 , X4 - X2 หาค่า R2 จากค่า SSReg SSR(B2 | B1,B3,B4) = SSR(B1,B2,B3,B4) - SSR (B1,B3,B4) 4. Y, X2, X3 , X4 - X1 หาค่า R2 จากค่า SSReg SSR(B1 | B2,B3,B4) = SSR(B1,B2,B3,B4) - SSR (B2,B3,B4)

  40. หาค่า R2 ที่น้อยที่สุดมาทำการพิจารณา โดยตัวแปรอิสระที่มีค่า R2น้อยแสดงว่ามีความสัมพันธ์กับตัวแปรตามน้อยที่สุดสมมติว่าเป็นตัวแปรอิสระ X4 พิจารณาค่า F = MSR(B4 |B1,B2,B3)/MSE(full model) เทียบค่า sig.(p-value) กับ POUT ( prob of F removal) ว่าสามารถตัดตัวแปรนี้ทิ้งได้หรือไม่ถ้าค่า sig.(p-value) มีค่ามากกว่า แสดงว่ายอมรับสมมติฐานที่ว่า ค่า นั่นคือสามารถตัดตัวแปรนี้ออกจากสมการได้ ถ้าไม่สามารถตัดได้ก็หยุดทำเพราะค่าที่สัมพันธ์กับ Y น้อยที่สุดแล้วยังไม่สามารถตัดทิ้งจากสมการได้

  41. Stepwise regression เป็นวิธีการคัดเลือกตัวแปรที่ดีที่สุดเป็นการแก้ไขปัญหาที่เกิดขึ้นเนื่องจากวิธีการ Forward Selection และ Backward Elimination วิธีการ Forward Selection เป็นการคัดเลือกตัวแปรอิสระที่มีความสัมพันธ์กับ Y มากที่สุด แต่บางครั้งอาจมีตัวแปรอิสระที่มีความสัมพันธ์ซึ่งกันและกัน แต่อธิบายตัวแปรตามได้มากกว่า ตัวแปรอิสระตัวนี้อาจไม่เข้าไปในสมการเลย

  42. วิธีการ Backward Elimination ก็เช่นกันพิจารณาความสัมพันธ์ของตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามน้อยที่สุด แล้วพิจารณาว่าสามารถตัดออกจากสมการได้หรือไม่ ซึ่งบางครั้งตัวแปรอิสระอาจมีความสัมพันธ์กันเองสูงมากและถูกตัดออกจากสมการทั้งๆที่อธิบายตัวแปรตามได้ดีกว่า วิธีการ Stepwise Regression เป็นการนำ 2 วิธีมารวมกันในแต่ละขั้นจึงทำให้ตัวแปรที่ได้น่าเชื่อถือว่าเป็นตัวแปรอิสระที่มีสามารถอธิบาย Y ได้ดีจริงๆ

  43. ขั้นที่ 1 คัดเลือกตัวแปรอิสระเข้าสู่สมการเป็นตัวแรกโดยวิธีการ Forward Selection ขั้นที่ 2 คัดเลือกตัวแปรอิสระตัวที่สองด้วยวิธีการ Forward Selection เมื่อได้ตัวแปรอิสระตัวที่สองแล้วใช้วิธีการ Backward Elimination ตรวจสอบว่าตัวแปรอิสระที่อยู่ในสมการ 2 ตัวนั้น มีตัวใดสามารถตัดทิ้งได้หรือไม่ ขั้นต่อไปทำเช่นเดียวกันคือใช้ Forward Selection คัดเลือกตัวแปรอิสระเข้าไปในสมการ และใช้ Backward Elimination ตรวจสอบว่าสามารถตัดตัวแปรอิสระที่อยู่ในสมการแล้วได้หรือไม่ ทำเรื่อยไปจนไม่มีตัวแปรอิสระนำเข้าสมการหรือตัดตัวแปรอิสระออกจากสมการได้

  44. การวัด Collinearity ในกรณีที่ตัวแปรอิสระไม่เป็นอิสระต่อกัน นั่นคือมีความสัมพันธ์กัน เรียกว่าเกิด Collinearity หรือ multi-collinearity เมื่อตัวแปรอิสระมีความสัมพันธ์กันสูงทำให้การประมาณค่าพารามิเตอร์ไม่ดี ค่าที่ใช้วัด Collinearity คือ 1. Tolerance 2. Variance Inflation Factor (VIF)

  45. Tolerance Tolerance เป็นค่าที่ใช้วัดค่าของ Collinearity ของตัวแปรอิสระที่ i ว่ามีความสัมพันธ์เชิงเส้นกับตัวแปรอิสระตัวอื่นมากน้อยแค่ไหน สัดส่วนของค่าความแปรปรวนที่ไม่อธิบายด้วยตัวแปรอิสระตัวอื่นที่อยู่ในสมการ (Ri ) ค่า Toleranceคำนวณจาก 1 - Ri2ถ้า Tolerance ของตัวแปรอิสระตัวใดมีค่าเล็ก แสดงว่าตัวแปรนั้นเกือบเป็นผลรวมเชิงเส้นของตัวแปรอิสระตัวอื่นๆนั่นคือมีความสัมพันธ์กับตัวแปรอิสระตัวอื่นเป็นอย่างสูง ค่าของ Tolerance มีค่าอยู่ระหว่าง 0 กับ 1

  46. Variance Inflation Factor ค่า VIF เป็นตัวสถิติอีกตัวหนึ่งที่ใช้วัดความสัมพันธ์ระหว่างตัวแปรอิสระตัวที่ i กับตัวแปรอิสระตัวอื่นๆ ค่า VIF มีความสัมพันธ์กับค่าของ Tolerance โดย VIF = ค่าของ VIF ถูกใช้คำนวณค่าความแปรปรวนของ สปส.การถดถอยของตัวแปรอิสระตัวที่ ถ้าค่า VIF เพิ่มมากขึ้น ค่าความแปรปรวนของ สปส.การถดถอยจะเพิ่มขึ้นด้วย ค่า VIF ที่ใหญ่แสดงว่าเกิด Multi-Collinearity ระหว่างตัวแปรอิสระ

  47. ในการเลือกตัวแปรอิสระเข้าสู่สมการโดยวิธี Stepwise Regression ในการคัดเลือกตัวแปรแต่ละขั้นจะคำนึงถึงค่าของ Tolerance และ ค่าของ VIF ด้วยเพื่อเป็นการป้องกันการเกิด Multi-Collinearity ระหว่างตัวแปร ดังนั้นวิธีการ StepwiseRegression จึงเป็นวิธีการที่นิยมใช้มากที่สุด

  48. Eigen Values and Condition Indexes เป็นการดูว่าค่าสังเกตมีอิทธิพลต่อการเปลี่ยนแปลงรูปแบบของความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระ นั่นคือการที่มีค่าสูง/ต่ำผิดปกติอาจทำให้รูปแบบของความสัมพันธ์เปลี่ยนแปลงไป Condition index = ถ้าตัวแปรมีความสัมพันธ์กันสูง ค่าของ Condition indexes จะมีค่าสูง

  49. สัดส่วนของความแปรปรวนสัดส่วนของความแปรปรวน ความแปรปรวนของ สปส.ถดถอยแต่ละตัวรวมทั้งค่าคงที่ สามารถแตกออกเป็นผลบวกของส่วนประกอบที่เกี่ยวพันกับค่า eigenvalue แต่ละค่า ถ้าสัดส่วนของความแปรปรวนของ สปส. 2 ตัว หรือมากกว่า 2 ตัว เกี่ยวพันกับ eigenvalue ตัวเดียวกัน แสดงว่ามีความไม่เป็นอิสระกันเกิดขึ้น

  50. การตรวจสอบข้อสมมติ เมื่อได้ model หรือสมการประมาณสมการถดถอยแล้ว ต้องมีการตรวจสอบว่า model ที่ได้นั้นเหมาะสมหรือไม่ โดยทำการตรวจสอบจากการวิเคราะห์ส่วนเหลือ (residual) เพราะส่วนเหลือเป็นตัวประมาณของความคลาดเคลื่อน พิจารณาดังต่อไปนี้ 1. การแจกแจงของส่วนเหลือเป็นการแจกแจงแบบปกติที่มีค่าเฉลี่ยเท่ากับ 0 และค่าความแปรปรวนคงที่ 2. ส่วนเหลือไม่มีความสัมพันธ์กันเอง

More Related