1 / 34

Chapter 12

Chapter 12. Regression and Correlation Analysis. Definition. Regression Analysis Correlation Analysis Independent Variable (symbol  X) Dependent Variable (symbol  Y). Regression Analysis. Simple Regression Analysis 1 Dependent var. and 1 Independent var.

delora
Download Presentation

Chapter 12

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Chapter 12 Regression and Correlation Analysis

  2. Definition • Regression Analysis • Correlation Analysis • Independent Variable (symbol X) • Dependent Variable (symbol Y) BC428(Chapter 12) A.Bootsara Prakobtham

  3. Regression Analysis • Simple Regression Analysis • 1 Dependent var. and 1 Independent var. • relation of 2 Var : Simple linear regression or simple non-linear regression • Multiple Regressin Analysis • 1 Dependent var. and >1 Independent var. BC428(Chapter 12) A.Bootsara Prakobtham

  4. Scatter Diagram • Check Straight line? • uses plot graph : Y-axis is Dependent Var. X-axis is Independent Var. • get equation by : Straight line  Linear regression Equation Non-straight line  Non-Linear regression Equation BC428(Chapter 12) A.Bootsara Prakobtham

  5. Scatter Diagram BC428(Chapter 12) A.Bootsara Prakobtham

  6. เป็นการตรวจสอบลักษณะความสัมพันธ์กันก่อนที่จะคำนวณค่าทางสถิติเป็นการตรวจสอบลักษณะความสัมพันธ์กันก่อนที่จะคำนวณค่าทางสถิติ BC428(Chapter 12) A.Bootsara Prakobtham

  7. คำสั่ง Graphs  Scatter .. Output Ex12.1 1 part จากกราฟแสดงว่า ตัวแปรค่าใช้จ่ายในการวิจัย กับผลกำไรมีความสัมพันธ์กันในเชิงเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham

  8. Simple Regression Analysis • เป็นการศึกษาความสัมพันธ์ 2 ตัวแปร โดยที่ต้องทราบค่าของตัวแปรตัวหนึ่งล่วงหน้า • วัตถุประสงค์ • ศึกษาความสัมพันธ์ของตัวแปรว่ามีความสัมพันธ์กันมากน้อยเพียงใด • ใช้ความสัมพันธ์ที่วิเคราะห์ได้มาประมาณค่า Y (เมื่อมีการกำหนดค่า X) BC428(Chapter 12) A.Bootsara Prakobtham

  9. only simple linear regression analysis • equation ( population ) • Y = 0+1X+ • equation ( sample ) • Y = b0+b1X+e • predicted equation ( Y estimation ) ^ • Y = b0+b1X BC428(Chapter 12) A.Bootsara Prakobtham

  10. จากรูปแสดงค่า1เมื่อ X และ Y มีความสัมพันธ์เป็นรูปเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham

  11. ข้อตกลงเบื้องต้นของสมการY = b0+b1X+e • E(e) = 0 • Var(e) = ค่าคงที่ • e is normal distribution • each e are independent BC428(Chapter 12) A.Bootsara Prakobtham

  12. การหาค่าสัมประสิทธิ์การถดถอยของตัวอย่างการหาค่าสัมประสิทธิ์การถดถอยของตัวอย่าง • จะใช้วิธี กำลังสองน้อยที่สุด(Least square method) ซึ่งเป็นวิธีที่ใช้หาค่า b0และ b1เพื่อทำให้ผลบวกของค่าคลาดเคลื่อนยกกำลังสองมีค่าน้อยที่สุด • เป็นการคำนวณหาค่า b0และ b1จากสมการ • ค่า b0เป็นระยะที่เส้นถดถอยตัดแกน Y • ค่า b1เป็นค่าความชันของเส้นถดถอย โดยที่ b1> 0 เป็นค่า X และ Y เปลี่ยนแปลงในทิศทางเดียวกัน b1< 0 เป็นค่า X และ Y เปลี่ยนแปลงในทิศทางตรงกันข้าม b1= 0 เป็นค่า X ไม่มีผลต่อ Y BC428(Chapter 12) A.Bootsara Prakobtham

  13. ถ้า X เพิ่มขึ้น 1 หน่วย ค่า Y จะเพิ่มขึ้น b1 หน่วย ถ้า X เพิ่มขึ้น 1 หน่วย ค่า Y จะลดลง b1 หน่วย ไม่ว่า X จะเปลี่ยนไปเท่าไหร่ Y ก็จะมีค่าเท่าเดิม BC428(Chapter 12) A.Bootsara Prakobtham

  14. ความคลาดเคลื่อนมาตรฐานของการกะประมาณค่าความคลาดเคลื่อนมาตรฐานของการกะประมาณค่า • เป็นการวัดการกระจายของข้อมูลรอบเส้นถดถอย • สัญลักษณ์ที่ใช้คือ Sy.x Sy.x = 0 การประมาณค่า Y จากเส้นถดถอยมีความถูกต้อง 100% Sy.xเพิ่มมากขึ้น การประมาณค่า Y จากเส้นถดถอยไม่ได้ให้ความถูกต้องเท่าที่ควร BC428(Chapter 12) A.Bootsara Prakobtham

  15. การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิการถดถอยการทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิการถดถอย 1. ต้องทดสอบว่า 1= 0 ? • ถ้า 1≠0 จะใช้สมการถดถอยเชิงเส้นประมาณค่า Y จาก X ได้ • สมมติฐาน H0 : 1 = 0 H1 : 1 ≠ 0 • สถิติทดสอบ t หรือ F • df = n-2 2. ต้องทดสอบว่า 0= 0 ? BC428(Chapter 12) A.Bootsara Prakobtham

  16. สัมประสิทธิ์การกำหนด(Coefficient of Determination) • หมายถึงสัดส่วนที่ตัวแปร X สามารถอธิบายการเปลี่ยนแปลงของตัวแปร Y ได้ • สัญลักษณ์ที่ใช้คือ r2 (R square) • r2 = Explained Variation Total Variation • คุณสมบัติของค่า r2 1. 0≤r2≤1 2. ค่า r2 แสดงให้ทราบว่าความแปรผันที่เกิดขึ้นใน Y เป็นผลเนื่องมาจาก X ร้อยละเท่าไร 3. ยิ่งค่าr2 ยิ่งมากแสดงว่า Y และ X มีความสัมพันธ์กันมาก BC428(Chapter 12) A.Bootsara Prakobtham

  17. สัมประสิทธิ์สหสัมพันธ์อย่างง่าย(Correlation Coefficient) • ใช้วัดความสัมพันธ์ระหว่าง X และ Y ว่ามีความสัมพันธ์กันมากหรือน้อย • สัญลักษณ์ที่ใช้คือ r (ใช้  r) • -1≤r≤1 • สมมติฐาน H0 : =0 H1: ≠0 • สถิติทดสอบ t-test (n<30) หรือ Z-test (n≥30) BC428(Chapter 12) A.Bootsara Prakobtham

  18. ความหมายของ r สัมประสิทธ์สหสัมพันธ์ = BC428(Chapter 12) A.Bootsara Prakobtham

  19. การตรวจสอบข้อตกลงเบื้องต้นใน Simple Linear Regresion Analysis ใช้ตรวจสอบเงื่อนไขของการวิเคราะห์ความถดถอยเชิงเส้น • ค่าเฉลี่ยของความคลาดเดลื่อนเป็น 0 • ค่าความแปรปรวนของ eเป็นค่าคงที่ เมื่อ Y มีการเปลี่ยนแปลงไป • ค่า e มีการแจกแจงแบบปกติ • แต่ละค่าของ e เป็นอิสระต่อกัน BC428(Chapter 12) A.Bootsara Prakobtham

  20. 1. การตรวจสอบค่าเฉลี่ยของความคลาดเดลื่อน • การหาค่า b0และ b1โดยทำให้ผลบวกกำลังสองของความคลาดเคลื่อนมีค่าต่ำสุด จะทำให้ผลรวมของความคลาดเคลื่อนเป็น 0 • ดังนั้น ค่าเฉลี่ยของความคลาดเคลื่อน = 0 • เพราะฉะนั้นเงื่อนไขนี้เป็นจริงเสมอ BC428(Chapter 12) A.Bootsara Prakobtham

  21. 2. การตรวจสอบค่าความแปรปรวนของค่าคลาดเคลื่อน • ตรวจสอบว่า Var(e) = 2 • กรณีที่ Var(e) ไม่เท่ากันทุกค่าของ X จะเรียกว่าเกิดปัญหา ^ Heteroscedastic เพราะว่า Var(e) = Var(Y) • การตรวจสอบจะพิจารณาจากกราฟ โดยดูความสัมพันธ์ระหว่าง e กับ Y BC428(Chapter 12) A.Bootsara Prakobtham

  22. กราฟแสดงความสัมพันธ์ระหว่าง e กับ Y ในรูปแบบต่าง ๆ BC428(Chapter 12) A.Bootsara Prakobtham

  23. 3. การทดสอบค่าคลาดเคลื่อนมีการแจกแจงแบบปกติหรือไม่ • ใช้การตรวจสอบโดยใช้ Shaporo-Wilk หรือ Kolmogorov-Smirnov • หรืออาจจะดูจาก Histrogramของค่าคลาดเคลื่อน BC428(Chapter 12) A.Bootsara Prakobtham

  24. 4. ทดสอบแต่ละค่าของค่าความคลาดเคลื่อนต้องเป็นอิสระกัน • ใช้สถิติทดสอบของ Durbin-Watson พิจารณาจาก • หรือพิจารณาจากค่า sig ถ้า sig<  แสดงว่าค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ BC428(Chapter 12) A.Bootsara Prakobtham

  25. คำสั่งที่ใช้ในการทดสอบคำสั่งที่ใช้ในการทดสอบ • ทดสอบข้อ 1 ค่าเฉลี่ยของความคลาดเดลื่อนเป็น 0 และข้อ 4แต่ละค่าของ e เป็นอิสระต่อกัน คำสั่ง Analyze Regression Linear • ทดสอบข้อ 3 ค่า e มีการแจกแจงแบบปกติ คำสั่ง Analyze  Descriptive Statistics Explore • ทดสอบข้อ 2 ค่าความแปรปรวนของ eเป็นค่าคงที่ คำสั่ง Graph Scatter… BC428(Chapter 12) A.Bootsara Prakobtham

  26. แปลผลจากตัวอย่างที่ 12.1 ได้ output 5 ส่วน • ส่วนที่ 1 แสดงชื่อตัวแปรอิสระในการทดสอบ • ใช้ค่าใช้จ่ายในการวิจัย เป็นตัวแปรอิสระ • ใช้วิธีการทดสอบคือ Enter BC428(Chapter 12) A.Bootsara Prakobtham

  27. ส่วนที่ 2 แสดงค่าสถิติที่ใช้ในการพิจารณา • ผลกำไรมีความสัมพันธ์กับค่าใช้จ่ายอย่างมาก (แปลต่อ) • ความแปรผันที่เกิดขึ้นในผลกำไรเป็นผลต่อเนื่องมาจากค่าใช้จ่าย 97.7 % ที่เหลือมาจากสาเหตุอื่นอีก 2.3% • การประมาณผลกำไรจากค่าใช้จ่ายในการวิจัยจะมีค่าความคลาดเคลื่อนประมาณ 1.72 หมื่นบาท • ค่า Durbin-Watson มีค่าเข้าใกล้ 2 แสดงว่าความคลาดเคลื่อนเป็นอิสระต่อกัน BC428(Chapter 12) A.Bootsara Prakobtham

  28. ส่วนที่ 3 แสดงการทดสอบค่าสัมประสิทธิ์การถดถอย (1) • สมมติฐาน H0 : ค่าใช้จ่ายไม่มีความสัมพันธ์กับกำไรในเชิงเส้นตรง • H1 : ค่าใช้จ่ายมีความสัมพันธ์กับกำไรในเชิงเส้นตรง • สถิติทดสอบ F = 608.918 • ระดับนัยสำคัญ = 0.05 • Sig = 0.000 • 0.000<0.05 Reject H0 นั่นคือค่าใช้จ่ายมีความสัมพันธ์กับกำไรในเชิงเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham

  29. ส่วนที่ 4 แสดงการทดสอบ 0และ1 เพื่อสร้างสมการถอถอย • 1. การทดสอบ0 (ทดสอบเกี่ยวกับส่วนการตัดแกน Y) • สมมติฐาน H0 : 0 =0 • H1 : 0 ≠0 • สถิติทดสอบ t = 1.819 • ระดับนัยสำคัญ = 0.05 • Sig = 0.092 • 0.092>0.05 Accept H0 นั่นคือ0 =0 BC428(Chapter 12) A.Bootsara Prakobtham

  30. ส่วนที่ 4(ต่อ) แสดงการทดสอบ 1 (เหมือนการทดสอบส่วนที่ 3) 1. การทดสอบ 1 (ทดสอบเกี่ยวกับส่วนการตัดแกน Y) • สมมติฐาน H0 : 1 =0 H1 : 1 ≠0 • สถิติทดสอบ t = 24.676 • ระดับนัยสำคัญ = 0.05 • Sig = 0.000 • 0.000<0.05 Reject H0นั่นคือ1 ≠ 0 ดังนั้นจึงสรุปได้ว่าสมการความถดถอยซึ่งแสดงความสัมพันธ์ระหว่างค่าใช้จ่ายในการวิจัยและผลกำไรเป็น ^ จาก สมการ Y = b0+b1X จะได้ ว่า ^ Profit = 2.597+4.922Expend BC428(Chapter 12) A.Bootsara Prakobtham

  31. ส่วนที่ 5 แสดงค่าสถิติทดสอบความคลาดเคลื่อนของการประมาณค่ากำไร ด้วยกำไร • ค่าเฉลี่ยของกำไรโดยประมาณเป็น 36.07 หมื่นบาท • ค่าประมาณต่ำสุดของกำไรเป็น 17.36 หมื่นบาท • ค่าประมาณสูงสุดของกำไรเป็น 51.82 หมื่นบาท • ค่าประมาณส่วนเบี่ยงเบนมาตรฐานของกำไรเป็น 11.35 หมื่นบาท • จำนวนข้อมูลทั้งหมด 15 ค่า BC428(Chapter 12) A.Bootsara Prakobtham

  32. สรุปผลการทดสอบข้อ 3 ค่า e มีการแจกแจงแบบปกติ มี 4 ส่วน ส่วนที่ 1 แปลผลเอง ส่วนที่ 2 แปลผลเอง BC428(Chapter 12) A.Bootsara Prakobtham

  33. ส่วนที่ 3 แปลผลเอง ส่วนที่ 4 แปลผลเอง BC428(Chapter 12) A.Bootsara Prakobtham

  34. แปลผลทดสอบข้อ 2 ค่าความแปรปรวนของ eเป็นค่าคงที่ กราฟแสดงความสัมพันธ์ระหว่างค่าความคลาดเคลื่อนกับกำไร จุดต่าง ๆ มีการกระจายที่ไม่ได้เพิ่มขึ้นหรือลดลง แสดงว่าค่าความคลาดเคลื่อนมีการกระจายตัวคงที่ BC428(Chapter 12) A.Bootsara Prakobtham

More Related