830 likes | 2.44k Views
บทที่ 7 การวิเคราะห์การถดถอย. การวิเคราะห์การถดถอยเป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตั้งแต่ 2 ตัวแปรขึ้นไป ว่ามีความสัมพันธ์ในรูปแบบใด. ตัวแปรในการวิเคราะห์การถดถอยแบ่งเป็น 2 ลักษณะคือ 1. ตัวแปรตาม (Dependent Random Variable) 2. ตัวแปรอิสระ (Independent Random Variable).
E N D
บทที่ 7 การวิเคราะห์การถดถอย การวิเคราะห์การถดถอยเป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตั้งแต่ 2 ตัวแปรขึ้นไป ว่ามีความสัมพันธ์ในรูปแบบใด ตัวแปรในการวิเคราะห์การถดถอยแบ่งเป็น 2 ลักษณะคือ 1. ตัวแปรตาม (Dependent Random Variable) 2. ตัวแปรอิสระ (Independent Random Variable)
การวิเคราะห์การถดถอยอย่างง่าย : เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตาม และตัวแปรอิสระ 1ตัวแปรเท่านั้น การวิเคราะห์การถดถอยแบบพหุคูณ : เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรตาม และตัวแปรอิสระมากกว่า 1 ตัวแปร ในเบื้องต้นเป็นการศึกษาความสัมพันธ์ในรูปแบบความสัมพันธ์เชิงเส้น
การถดถอยอย่างง่าย เป็นการศึกษาว่าตัวแปรตาม และ ตัวแปรอิสระ 1 ตัว มีความสัมพันธ์เชิงเส้น โดยมีรูปแบบดังนี้ สมการนี้เรียกว่า regression line of Y on X และค่าสังเกต (xi , yi ) ใดๆคือ
คือค่า intercept เป็นจุดตัดแกน Y คือความชันของเส้น คือค่าความคลาดเคลื่อนที่ yiเบี่ยงเบนออกจากค่าเฉลี่ยของ Y ณ แต่ละค่าของ X Assumption 1. มีการแจกแจงแบบปกติ 2. มีการแจกแจงแบบปกติ
สมการที่แสดงความสัมพันธ์ระหว่างตัวแปรตาม (Y) กับตัวแปรอิสระ (X) คือเส้นที่ลากเชื่อมต่อจุด mean ณ ค่า X แต่ละค่าที่ทำการศึกษา โดยแต่ละค่าของ X จะมีค่าสังเกต (Y) มากมายและ Y มีการแจกแจงแบบปกติ และมีค่าความแปรปรวนของ Y ในแต่ละ X คงที่ (เท่ากัน)
Y *(xi,yi) X
เส้นสมการถดถอยที่แสดงนั้นจะสามารถหาได้ก็ต่อเมื่อต้องทราบค่าสังเกตของประชากรทั้งหมดจึงจะหาเส้นนี้ได้ ดังนั้นเส้นนี้จึงเป็นเส้นในอุดมคติ แต่จากการสุ่มตัวอย่างขนาด n ได้ค่าสังเกต (x1 , y1) , … , (xn , yn ) เราสามารถประมาณค่าพารามิเตอร์ของสมการถดถอยได้โดยอาศัยวิธีการ least square (ประมาณค่า intercept และ slope)
Y X
Y (xi , yi ) * X
ค่าสังเกต (xi , yi ) ใดๆสามารถเขียนในรูปของสมการได้ดังนี้ เมื่อ eiคือส่วนเหลือ (residual) มีการแจกแจงโดยประมาณเป็นการแจกแจงแบบปกติ b0 คือค่าประมาณ intercept b1 คือค่าประมาณ slope
การประมาณค่าพารามิเตอร์ทำได้โดยวิธี Least square
ความคลาดเคลื่อนมาตรฐานของ b0และ b1คือ
การทดสอบสมมติฐานเกี่ยวกับ b0และ b1 1. เป็นการทดสอบว่าสมการถดถอยผ่านจุดกำเนิดหรือไม่ H0 : H1 : 2. เป็นการทดสอบว่า X มีความสัมพันธ์กับ Y หรือไม่โดยพิจารณาจาก H0 : H1 :
สถิติที่ใช้ในการทดสอบคือสถิติที่ใช้ในการทดสอบคือ ช่วงเชื่อมั่นสำหรับค่าพารามิเตอร์คือ
Y (xi , yi ) * X SST = SSR + SSE
ตารางการวิเคราะห์ความแปรปรวนตารางการวิเคราะห์ความแปรปรวน Sov df SS MS F Sig. Regression 1 SSR MSR MSR/MSE p Error n-2 SSE MSE Total n-1 SST สมมติฐานในการทดสอบคือ H0 : H1 :
Menu Analyze > Regression > ผลจาการใช้ menu นี้สามารถวิเคราะห์ได้หลายแบบดังนี้ 1. Linear*** 2. Curve estimation 3. Logistic 4. Probit 5. Non-Linear 6. Weight estimation 7. 2-stage Least Square
Linear หน้าจอจะปรากฏ box ทางขวามือ 1. Box ของ Dependent variable : ใส่ตัวแปรตามใน box นี้ 2. Box ของ Independent var. : ใส่ตัวแปรอิสระใน box นี้ [สามารถวิเคราะห์ได้หลายสมการสำหรับตัวแปรตามตัวเดียวกัน click ที่ next เหนือ box นี้] 3. Method : ระบุวิธีการเลือกตัวแปรอิสระ(ในกรณีที่มีตัวแปรอิสระหลายตัวแปร)
4. Selection var. : ใส่ตัวแปรที่ต้องการให้วิเคราะห์ภายใต้เงื่อนไขที่กำหนด(ไม่วิเคราะห์การถดถอยทั้งหมดวิเคราะห์เพียงบางส่วนเท่านั้น เช่นศึกษาความสัมพันธ์ระหว่างเงินเดือนปัจจุบัน (Y) กับเงินเดือนเริ่มต้น (X) ภายใต้เงื่อนไขเฉพาะประเภทของงานเช่นอาชีพเสมียน (clerical) เท่านั้น 5. Case Label : แสดง label ในรูปกราฟแทนที่จะเป็นกล่องสี่เหลี่ยมเล็กๆก็จะแทนด้วย Label ตัวแปรที่ใส่ใน box นี้
OPTIONS สำหรับกลุ่มของ Stepping Method Criteria เป็นเกณฑ์ที่ใช้ในการพิจารณาตัวแปรอิสระ เข้าสมการถดถอยหรือพิจารณาตัดตัวแปรอิสระออกจากสมการ มี 2 ทางให้เลือกคือ 1. Use probability of F (default): ตัวแปรอิสระที่จะนำเข้าสมการต้องมีค่า sig. น้อยกว่า F-entry (0.05) และตัวแปรอิสระที่จะถูกตัดออกจากสมการต้องมีค่า sig. มากกว่า F-removal (0.10)
2. Use F-value : พิจารณาตัวแปรอิสระเข้าสมการหรือตัดตัวแปรอิสระออกจากสมการโดยค่า F ตัวแปรอิสระที่จะนำเข้าสมการต้องมีค่า F มากกว่า F-value entry (3.84) และตัวแปรอิสระที่จะถูกตัดออกจากสมการต้องมีค่า F น้อยกว่า F-value removal (2.71) ผลลัพธ์ของการเลือกใช้ 2 คำสั่งย่อยนี้อาจไม่เหมือนกัน กลุ่ม include constant in equation : เป็นทางเลือกให้คำนวณค่าคงที่ (intercept)ในสมการหรือไม่ ถ้าไม่ต้องการ ให้ click เครื่องหมายออกจากคำสั่งนี้
กลุ่มของ missing values 1. Excluded cases listwise : (default) ตัด case ที่สูญหายออกจากการวิเคราะห์ทั้งหมด 2. Excluded cases pairwise : ใช้ case ทีมีค่าตัวแปรที่ทำการศึกษาครบ (ตัวแปรอื่นที่ไม่ได้ศึกษาอาจสูญหาย) 3. Replace with mean : แทนค่าที่สูญหายด้วยค่าเฉลี่ยของตัวแปรนั้น
Statistics : กลุ่มของ Regression Coefficients 1. Estimate : (default) แสดงค่าสัมประสิทธิ์ถดถอย (bi (Bi)) ความคลาดเคลื่อนมาตรฐานของ (bi ) สัมประสิทธิ์มาตรฐาน Beta ค่าสถิติ t ของ Bi และค่า p-value 2. Confidence intervals : แสดงช่วงเชื่อมั่น 95 % ของ
3. Covariance Matrix : แสดงเมตริกซ์ความแปรปรวน-ความแปรปรวนร่วมของค่าประมาณสัมประสิทธิ์ถดถอย 3.1. แสดงเมตริกซ์ความแปรปรวนร่วมใต้เส้น ทแยงมุม 3.2. แสดงสหสัมพันธ์เหนือเส้นทแยงมุม 3.3. แสดงค่าความแปรปรวนบนเส้นทแยงมุม
กลุ่มของ residual 1. Durbin-Watson : เป็นการทดสอบว่าค่าความคลาดเคลื่อนเป็นไปโดยสุ่ม หรือมีความสัมพันธ์กันหรือไม่ เพราะตามข้อสมมติแล้วความคลาดเคลื่อนต้องเป็นอิสระต่อกัน 2. Casewise diagnostics : เป็นการแสดงรายการตำแหน่ง ค่าตัวแปรตาม ค่าพยากรณ์ ค่าส่วนเหลือ 2.1. Outliers outside n std.deviations แสดงค่าสังเกตที่มีค่าสัมบูรณ์ของส่วนเหลือมาตรฐานมากกว่าค่าที่กำหนด โดยปกติมีค่าเท่ากับ 3 เท่าของส่วนเบี่ยงเบนมาตรฐาน แต่ถ้าต้องการค่าอื่นก็ใส่ค่าลงในช่องหน้า std.deviation 2.2. All cases : แสดงค่าทุกหน่วยสังเกต
1. Model-fit : (default) แสดงค่า R , R2 , adjust R2 ความคลาดเคลื่อนมาตรฐาน ตารางการวิเคราะห์ความแปร ปรวน 2. R-square change : แสดงค่า R Square change , F Change และ Sig. F change 3. Descriptive : แสดงค่าสถิติพื้นฐานของตัวแปร 4. Part and Partial correlations : แสดงค่าส่วนของสหสัมพันธ์ และสหสัมพันธ์บางส่วน 5. Collinearity diagnostics : แสดงค่า VIF , eigenvalues ของ cross products matrix , condition indicies , proportion variance decomposition , tolerance ของตัวแปรต่างๆ
R2 (coefficient of determination) ความหมายของค่าสัมประสิทธิ์นี้คือ ความผันแปรของ Y ทั้งหมดอธิบายด้วยความผันแปรของตัวแปรอิสระเท่าใด เช่น R2 = 0.89 หมายความว่าตัวแปรอิสระอธิบายความผันแปรได้ร้อยละ 89 ถ้าตัวแปรอิสระมีมากกว่า 1 ตัว ค่าของ R2 จะเพิ่มขึ้นเกินจริง ต้องมีการปรับเพื่อความถูกต้องและใกล้เคียงความเป็นจริงมากยิ่งขึ้นโดย p คือจำนวนตัวแปรอิสระ
เมื่อสร้างสมการประมาณสมการถดถอยได้แล้ว เราสามารถพยากรณ์ค่า Y เมื่อกำหนดค่าของตัวแปรอิสระ X จากสมการโดยการพยากรณ์ค่า มี 2 ลักษณะคือ 1. การพยากรณ์ค่าเฉลี่ย 2. การพยากรณ์ค่า Yiใดๆ(ค่าเดี่ยว) เมื่อกำหนด x = x0 ค่าประมาณของ Y จะเท่ากันทั้ง 2 ลักษณะแต่ค่าของความคลาดเคลื่อนมาตรฐานจะแตกต่างกัน
ในกรณีการพยากรณ์ค่าเฉลี่ย Y ณ จุด x = x0 ค่าความคลาดเคลื่อนมาตรฐานของ ในกรณีการพยากรณ์ค่าเดี่ยวของ Y ณ จุด x = x0 ค่าความ คลาดเคลื่อนมาตรฐานของ Y จะเพิ่มมากขึ้นเป็น
ช่วงเชื่อมั่นสำหรับค่าเฉลี่ยของ Y ณ จุด x=x0คือ ช่วงเชื่อมั่นสำหรับค่าเดี่ยว Y ณ จุด x=x0คือ
ค่าสัมประสิทธิ์ Beta ในการแปลความของสมการถดถอยที่ประมาณได้จากตัวอย่าง ค่าสัมประสิทธิ์ของการถดถอยเป็นค่าที่บอกความสำคัญของตัวแปรอิสระนั้นๆต่อตัวแปรตามบางครั้งทำได้ค่อนข้างยากเนื่องจากหน่วยของตัวแปรตามและตัวแปรอิสระต่างกัน ถ้าตัวแปรทั้งหมดอยู่ในรูปของคะแนนมาตรฐาน ค่าสัมประสิทธิ์นี้จะสามารถบอกได้ถึงความสำคัญของตัวแปรอิสระแต่ละตัว
การวิเคราะห์การถดถอยแบบพหุคูณการวิเคราะห์การถดถอยแบบพหุคูณ เป็นการศึกษาความสัมพันธ์ของตัวแปรตาม กับตัวแปร อิสระมากกว่า 1 ตัวแปร สมการแสดงความสัมพันธ์คือ ค่าสังเกต yiใดๆ
Menu Analyze > Regression > Linear ... ใส่ตัวแปรตามใน box ของ independent var. ใส่ตัวแปรอิสระ มากกว่า 1 ตัวแปรลงใน box ของตัวแปรอิสระ ถ้าต้องการศึกษาความสัมพันธ์ของตัวแปรทั้งหมด วิธีการวิเคราะห์จะเป็น Enter แต่ถ้าต้องการคัดเลือกตัวแปรอิสระที่เหมาะสมเข้าไปในสมการถดถอยมีวิธีการเลือกดังนี้ 1. Stepwise 2. Remove 3. Backward 4. Forward
วิธีการคัดเลือกตัวแปรอิสระ 1. Enter : เป็นวิธีการที่บังคับตัวแปรอิสระที่สนใจเข้าไปในสมการ ตัวแปรอิสระที่สนใจจะถูกนำมาใส่ไว้ใน box ของindependent var. 2. Forward Selection : เป็นวิธีการที่นำตัวแปรอิสระใน box independent var. มาทำการพิจารณาทีละตัว เพิ่มขึ้นทีละตัวแปรในแต่ละ step จะหยุดเมื่อไม่มีตัวแปรอิสระสามารถเข้าในสมการได้เกณฑ์ที่ใช้พิจารณาอาจเป็น Prob. F entry หรือ F-value entry
3. Backward Elimination : เป็นการตัดตัวแปรอิสระออกจากสมการทีละตัวในแต่ละ step โดยขั้นแรกใส่ตัวแปรอิสระทั้งหมดเข้าไปในสมการก่อน ขั้นต่อไปจึงพิจารณาตัดตัวแปรทีละตัว ทำเรื่อยไปจนกว่าไม่สามารถตัดตัวแปรอิสระตัวใดออกจากสมการได้เกณฑ์ที่ใช้พิจารณาอาจเป็น Prob. F removal หรือ F-value removal 4. Stepwise Regression : เป็นวิธีการผสมระหว่าง Forward Selection และ Backward Elimination เป็นวิธีการที่ดีที่สุดในการคัดเลือกตัวแปร
Forward Selection : 1. พิจารณาตัวแปรตามกับตัวแปรอิสระแต่ละตัว Y - X1 , Y - X2 , Y - X3 , Y - X4 พิจารณาตัวแปรอิสระที่มีความสัมพันธ์กับ Y สูงที่สุด อาจพิจารณาจากสมการใดมีค่า R2 สูงที่สุดแสดงว่าตัวแปรอิสระตัวนั้นอธิบายความผันแปรของ Y ได้มากที่สุด หรือมีความสัมพันธ์กับ Y สูงที่สุด สมมติว่าเป็น X1 ทำการทดสอบ H0 : หรือไม่ ถ้ายอมรับแสดงว่าไม่มีตัวแปรอิสระใดเหมาะสม แต่ถ้าปฏิเสธ ก็ทำขั้นต่อไป
2. พิจารณาตัวแปรอิสระตัวต่อไปโดยพิจารณาความสัมพันธ์ระหว่างตัวแปรอิสระแต่ละตัวที่เหลือกับตัวแปรตามเมื่อตัวแปรอิสระ X1อยู่ในสมการเรียบร้อยแล้ว หรือพิจารณาจากค่า partial correlation ระหว่าง Y กับตัวแปรอิสระที่เหลือทีละตัวโดยคุม X1ไว้ในสมการแล้ว Y, X1 - X2 , Y, X1 - X3 , Y, X1 - X4 สมมติว่า X2 มีค่า partial correlation สูงที่สุด X2 จะเข้าสมการเป็นตัวแปรถัดไป ทำการทดสอบ หรือไม่ ถ้าปฏิเสธแสดงว่า X2 อยู่ในสมการทำขั้นต่อไปเรื่อยๆจนไม่มีตัวแปรสามารถเข้าไปในสมการได้อีก
Backward Elimination : 1. นำตัวแปรอิสระทั้งหมดเข้าในสมการ Y - X1 , X2 , X3 , X4 หาค่า R2 พิจารณาว่าตัวแปรอิสระตัวใดใดมีความสัมพันธ์กับ Y น้อยที่สุดเมื่อตัวแปรอิสระตัวอื่นยังคงอยู่ในสมการ 1. Y, X1, X2 , X3 - X4 2. Y, X1, X2 , X4 - X3 3. Y, X1, X3 , X4 - X2 4. Y, X2, X3 , X4 - X1
1. Y, X1, X2 , X3 - X4 หาค่า R2 จากค่า SSReg SSR(B4| B1,B2,B3) = SSR(B1,B2,B3,B4) - SSR (B1,B2,B3) 2. Y, X1, X2 , X4 - X3 หาค่า R2 จากค่า SSReg SSR(B3 | B1,B2,B4) = SSR(B1,B2,B3,B4) - SSR (B1,B2,B4) 3. Y, X1, X3 , X4 - X2 หาค่า R2 จากค่า SSReg SSR(B2 | B1,B3,B4) = SSR(B1,B2,B3,B4) - SSR (B1,B3,B4) 4. Y, X2, X3 , X4 - X1 หาค่า R2 จากค่า SSReg SSR(B1 | B2,B3,B4) = SSR(B1,B2,B3,B4) - SSR (B2,B3,B4)
หาค่า R2 ที่น้อยที่สุดมาทำการพิจารณา โดยตัวแปรอิสระที่มีค่า R2น้อยแสดงว่ามีความสัมพันธ์กับตัวแปรตามน้อยที่สุดสมมติว่าเป็นตัวแปรอิสระ X4 พิจารณาค่า F = MSR(B4 |B1,B2,B3)/MSE(full model) เทียบค่า sig.(p-value) กับ POUT ( prob of F removal) ว่าสามารถตัดตัวแปรนี้ทิ้งได้หรือไม่ถ้าค่า sig.(p-value) มีค่ามากกว่า แสดงว่ายอมรับสมมติฐานที่ว่า ค่า นั่นคือสามารถตัดตัวแปรนี้ออกจากสมการได้ ถ้าไม่สามารถตัดได้ก็หยุดทำเพราะค่าที่สัมพันธ์กับ Y น้อยที่สุดแล้วยังไม่สามารถตัดทิ้งจากสมการได้
Stepwise regression เป็นวิธีการคัดเลือกตัวแปรที่ดีที่สุดเป็นการแก้ไขปัญหาที่เกิดขึ้นเนื่องจากวิธีการ Forward Selection และ Backward Elimination วิธีการ Forward Selection เป็นการคัดเลือกตัวแปรอิสระที่มีความสัมพันธ์กับ Y มากที่สุด แต่บางครั้งอาจมีตัวแปรอิสระที่มีความสัมพันธ์ซึ่งกันและกัน แต่อธิบายตัวแปรตามได้มากกว่า ตัวแปรอิสระตัวนี้อาจไม่เข้าไปในสมการเลย
วิธีการ Backward Elimination ก็เช่นกันพิจารณาความสัมพันธ์ของตัวแปรอิสระที่มีความสัมพันธ์กับตัวแปรตามน้อยที่สุด แล้วพิจารณาว่าสามารถตัดออกจากสมการได้หรือไม่ ซึ่งบางครั้งตัวแปรอิสระอาจมีความสัมพันธ์กันเองสูงมากและถูกตัดออกจากสมการทั้งๆที่อธิบายตัวแปรตามได้ดีกว่า วิธีการ Stepwise Regression เป็นการนำ 2 วิธีมารวมกันในแต่ละขั้นจึงทำให้ตัวแปรที่ได้น่าเชื่อถือว่าเป็นตัวแปรอิสระที่มีสามารถอธิบาย Y ได้ดีจริงๆ
ขั้นที่ 1 คัดเลือกตัวแปรอิสระเข้าสู่สมการเป็นตัวแรกโดยวิธีการ Forward Selection ขั้นที่ 2 คัดเลือกตัวแปรอิสระตัวที่สองด้วยวิธีการ Forward Selection เมื่อได้ตัวแปรอิสระตัวที่สองแล้วใช้วิธีการ Backward Elimination ตรวจสอบว่าตัวแปรอิสระที่อยู่ในสมการ 2 ตัวนั้น มีตัวใดสามารถตัดทิ้งได้หรือไม่ ขั้นต่อไปทำเช่นเดียวกันคือใช้ Forward Selection คัดเลือกตัวแปรอิสระเข้าไปในสมการ และใช้ Backward Elimination ตรวจสอบว่าสามารถตัดตัวแปรอิสระที่อยู่ในสมการแล้วได้หรือไม่ ทำเรื่อยไปจนไม่มีตัวแปรอิสระนำเข้าสมการหรือตัดตัวแปรอิสระออกจากสมการได้
การวัด Collinearity ในกรณีที่ตัวแปรอิสระไม่เป็นอิสระต่อกัน นั่นคือมีความสัมพันธ์กัน เรียกว่าเกิด Collinearity หรือ multi-collinearity เมื่อตัวแปรอิสระมีความสัมพันธ์กันสูงทำให้การประมาณค่าพารามิเตอร์ไม่ดี ค่าที่ใช้วัด Collinearity คือ 1. Tolerance 2. Variance Inflation Factor (VIF)
Tolerance Tolerance เป็นค่าที่ใช้วัดค่าของ Collinearity ของตัวแปรอิสระที่ i ว่ามีความสัมพันธ์เชิงเส้นกับตัวแปรอิสระตัวอื่นมากน้อยแค่ไหน สัดส่วนของค่าความแปรปรวนที่ไม่อธิบายด้วยตัวแปรอิสระตัวอื่นที่อยู่ในสมการ (Ri ) ค่า Toleranceคำนวณจาก 1 - Ri2ถ้า Tolerance ของตัวแปรอิสระตัวใดมีค่าเล็ก แสดงว่าตัวแปรนั้นเกือบเป็นผลรวมเชิงเส้นของตัวแปรอิสระตัวอื่นๆนั่นคือมีความสัมพันธ์กับตัวแปรอิสระตัวอื่นเป็นอย่างสูง ค่าของ Tolerance มีค่าอยู่ระหว่าง 0 กับ 1
Variance Inflation Factor ค่า VIF เป็นตัวสถิติอีกตัวหนึ่งที่ใช้วัดความสัมพันธ์ระหว่างตัวแปรอิสระตัวที่ i กับตัวแปรอิสระตัวอื่นๆ ค่า VIF มีความสัมพันธ์กับค่าของ Tolerance โดย VIF = ค่าของ VIF ถูกใช้คำนวณค่าความแปรปรวนของ สปส.การถดถอยของตัวแปรอิสระตัวที่ ถ้าค่า VIF เพิ่มมากขึ้น ค่าความแปรปรวนของ สปส.การถดถอยจะเพิ่มขึ้นด้วย ค่า VIF ที่ใหญ่แสดงว่าเกิด Multi-Collinearity ระหว่างตัวแปรอิสระ
ในการเลือกตัวแปรอิสระเข้าสู่สมการโดยวิธี Stepwise Regression ในการคัดเลือกตัวแปรแต่ละขั้นจะคำนึงถึงค่าของ Tolerance และ ค่าของ VIF ด้วยเพื่อเป็นการป้องกันการเกิด Multi-Collinearity ระหว่างตัวแปร ดังนั้นวิธีการ StepwiseRegression จึงเป็นวิธีการที่นิยมใช้มากที่สุด
Eigen Values and Condition Indexes เป็นการดูว่าค่าสังเกตมีอิทธิพลต่อการเปลี่ยนแปลงรูปแบบของความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระ นั่นคือการที่มีค่าสูง/ต่ำผิดปกติอาจทำให้รูปแบบของความสัมพันธ์เปลี่ยนแปลงไป Condition index = ถ้าตัวแปรมีความสัมพันธ์กันสูง ค่าของ Condition indexes จะมีค่าสูง
สัดส่วนของความแปรปรวนสัดส่วนของความแปรปรวน ความแปรปรวนของ สปส.ถดถอยแต่ละตัวรวมทั้งค่าคงที่ สามารถแตกออกเป็นผลบวกของส่วนประกอบที่เกี่ยวพันกับค่า eigenvalue แต่ละค่า ถ้าสัดส่วนของความแปรปรวนของ สปส. 2 ตัว หรือมากกว่า 2 ตัว เกี่ยวพันกับ eigenvalue ตัวเดียวกัน แสดงว่ามีความไม่เป็นอิสระกันเกิดขึ้น
การตรวจสอบข้อสมมติ เมื่อได้ model หรือสมการประมาณสมการถดถอยแล้ว ต้องมีการตรวจสอบว่า model ที่ได้นั้นเหมาะสมหรือไม่ โดยทำการตรวจสอบจากการวิเคราะห์ส่วนเหลือ (residual) เพราะส่วนเหลือเป็นตัวประมาณของความคลาดเคลื่อน พิจารณาดังต่อไปนี้ 1. การแจกแจงของส่วนเหลือเป็นการแจกแจงแบบปกติที่มีค่าเฉลี่ยเท่ากับ 0 และค่าความแปรปรวนคงที่ 2. ส่วนเหลือไม่มีความสัมพันธ์กันเอง