1 / 75

การวิเคราะห์ความแปรปรวน

การวิเคราะห์ความแปรปรวน. 1. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test) 2. การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม (F-Test) 3 . การวิเคราะห์ความแปรปรวนทางเดียว ( One-Way ANOVA ) 4 . การวิเคราะห์ความแปรปรวนสองทาง ( Two-Way ANOVA ).

lumina
Download Presentation

การวิเคราะห์ความแปรปรวน

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การวิเคราะห์ความแปรปรวนการวิเคราะห์ความแปรปรวน 1. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test) 2. การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม (F-Test) 3. การวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA) 4. การวิเคราะห์ความแปรปรวนสองทาง(Two-Way ANOVA)

  2. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test)

  3. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียวการทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว • เมื่อ σ2 คือ ค่าของความแปรปรวนของประชากรที่มีการแจกแจงแบบปกติและ σ02 เป็นค่าคงที่ของความแปรปรวนประชากรที่ต้องการทดสอบหรือยืนยันกับพารามิเตอร์ • สมมติฐานที่จะทดสอบคือ • สถิติที่ใช้ทดสอบ คือ

  4. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียวการทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว • เกณฑ์การตัดสินใจที่ระดับนัยสำคัญ มีดังนี้

  5. ตัวอย่าง โรงงานผลิตหลอดภาพโทรทัศน์แห่งหนึ่งทราบว่า อายุการใช้งานของหลอดภาพมีการแจกแจงแบบปกติ มีความแปรปรวน 10,000 ช.ม.2 ในการตรวจสอบคุณภาพครั้งหนึ่ง โดยการสุ่มหลอดภาพมา 20 หลอด พบว่าความแปรปรวนของอายุการใช้งานของหลอดภาพเท่ากับ 12,000 ช.ม.2 ที่ระดับนัยสำคัญ 0.05 จะกล่าวได้หรือไม่ว่า ความแปรปรวนของอายุการใช้งานของหลอดภาพไม่เท่ากับ 10,000 ช.ม.2

  6. คำตอบ • ให้ 2คือความแปรปรวนของอายุการใช้งานของหลอดภาพที่ผลิตโดยโรงงานแห่งนี้ หน่วย : ช.ม.2 • ขั้นที่ 1 H0 : 2 = 10,000 H1 : 2 10,000 • ขั้นที่ 2 กำหนด  = 0.05 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวนณค่า • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ 2 8.91 หรือ 2 32.85 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่าความแปรปรวนของอายุการใช้งานของหลอดภาพเท่ากับ 10,000 ช.ม.2

  7. ตารางไคสแควร์

  8. ตัวอย่าง บริษัทแห่งหนึ่งรับประกันว่า อุณหภูมิที่วัดโดยเทอร์โมมิเตอร์ที่ผลิตได้มีส่วนเบี่ยงเบนมาตรฐานไม่เกิน 0.5 0C เพื่อตรวจสอบการรับประกันดังกล่าว ได้สุ่มเทอร์โมมิเตอร์มาจำนวน 16 อัน วัดอุณหภูมิ ณ สถานที่แห่งเดียวกัน เวลาเดียวกัน พบว่าอุณหภูมิที่วัดได้มีส่วนเบี่ยงเบนมาตรฐาน 0.7 0C ที่ระดับนัยสำคัญ 0.01 การรับประกันของบริษัทข้างต้นเชื่อถือได้หรือไม่

  9. คำตอบ • ให้ 2คือความแปรปรวนของเทอร์โมมิเตอร์ที่ผลิต • ขั้นที่ 1 H0 : 2<0.25 H1 : 2 > 0.25 • ขั้นที่ 2 กำหนด  = 0.01 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวนณค่า • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ 2 30.58 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่า ความแปรปรวนของอุณหภูมิที่วัดโดยเทอร์โมมิเตอร์นี้ เท่ากับ 0.25 หรือกล่าวได้ว่าค่าเบี่ยงเบนมาตรฐานของอุณหภูมิที่วัดโดยเทอร์โมมิเตอร์นี้ไม่เกิน 0.5 0C อย่างมีนัยสำคัญที่ระดับ 0.01ดังนั้น การรับประกันของบริษัทข้างต้นเชื่อถือได้

  10. ตารางไคสแควร์

  11. การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม (F-Test)

  12. F-Test or F-Distribution • Sir Ronald Aylmer Fisher ได้พบว่า ถ้า • s12 และs22 เป็นค่าความแปรปรวนของกลุ่มตัวอย่างที่ 1 ที่มีจำนวนตัวอย่าง n1และตัวอย่างกลุ่มที่ 2 ที่มีจำนวนตัวอย่าง n2ตามลำดับ  และตัวอย่างทั้งหมดได้มาจากการสุ่มมาจากประชากร 2 ประชากรที่มีการกระจายแบบ Normal Distribution; และมี • S12 และS22 เป็นค่าความแปรปรวนของประชากรกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ  • ลักษณะของกราฟจะเปลี่ยนแปลงระดับความเบ้ ตามขนาด Degree of Freedom (df) ซึ่งเท่ากับ n1-1 และ n2-1 และต่อมารูปแบบการกระจายนี้ได้ถูกเรียกว่า Fisher Distribution หรือ F-Distribution

  13. ข้อกำหนดเบื้องต้นของ F-Test 1. สิ่งตัวอย่างที่จะเทียบกันทั้งสองกลุ่ม ถูกสุ่มมาจากประชากรแม่อย่างถูกต้อง (Randomly)  2. ประชากรที่ทำการสุ่มตัวอย่างมานั้นจะต้องมีการกระจายแบบ Normal Distribution 

  14. การประยุกต์ใช้และข้อจำกัดของ F-Test การประยุกต์ใช้ F-test • ในบรรดาเครื่องมือทาง สถิติที่ มีการพิสูจน์โมเดลทางคณิตศาสตร์ (Model Fit) เช่น Analysis of Variance และ Linear Regression Analysis จึงต้องมี F-Test เป็นตัวทดสอบทางสถิติเพื่อหาว่า Error จาก Model มากกว่า ค่าจริงหรือไม่ ซึ่ง Error หรือ Sum Square ก็ค่า Variance นั่นเอง นี่เองคือเหตุที่พบ F-Statistics ในการวิเคราะห์ Analysis of Variance และ Linear Regression Analysis  ข้อจำกัดของ F-Test  • ใช้ได้กับ 2 ประชากรเท่านั้น • จะให้ผลการทดสอบผิดพลาดมาก หากข้อมูลไม่เป็น Normal Distribution อย่างแท้จริง

  15. df1 = n1-1 และ df2 = n2-1

  16. F-Test • หรือ สมมติฐานที่จะทดสอบอยู่ในลักษณะ ดังนี้

  17. ตัวอย่าง ข้อมูลแสดงจำนวนรถจักรยานยนต์ที่ขายได้ในหนึ่งสัปดาห์ของตัวแทนจำหน่ายสองร้าน ร้าน ก 65 46 57 43 58 ร้าน ข 52 41 43 47 32 49 57 ถ้าสมมติว่าจำนวนรถจักรยานยนต์ที่ขายได้ในหนึ่งสัปดาห์มีการแจกแจงปกติโดยประมาณ จงใช้ระดับนัยสำคัญ 0.02 ตรวจสอบดูว่าความแปรปรวนของจำนวนรถที่ขายได้ในหนึ่งสัปดาห์ของร้าน ก และ ข แตกต่างกันหรือไม่

  18. ขั้นที่ 1 กำหนดสมมติฐาน ขั้นที่ 2 กำหนด = 0.02ขั้นที่ 3 เลือกและคำนวณค่าสถิติ

  19. ตัวอย่าง เพื่อศึกษาเปรียบเทียบระยะเวลาที่ใช้ในการประกอบสินค้าแต่ละชิ้น ระหว่างพนักงานชายและพนักงานหญิงจากประสบการณ์ที่ผ่านมาทราบว่า เวลาดังกล่าวมีการแจกแจงแบบปกติโดยประมาณ และความแปรปรวนของเวลาสำหรับพนักงานหญิงน้อยกว่าสำหรับพนักงานชาย เพื่อความกระจ่างจึงได้สุ่มตัวอย่างคนงานชายมา 11 คน หาค่าเบี่ยงเบนมาตรฐานของระยะเวลาที่ใช้ประกอบสินค้าได้ 6.1 วินาที และได้สุ่มตัวอย่างคนงานหญิงมา 14 คน หาค่าเบี่ยงเบนมาตรฐานของระยะเวลาที่ใช้ประกอบสินค้าได้ 5.3 วินาที จงใช้ระดับนัยสำคัญ 0.01 ตรวจสอบดูว่าความแปรปรวนที่แท้จริงของเวลาที่ใช้สำหรับพนักงานชายมากกว่าสำหรับพนักงานหญิงหรือไม่

  20. คำตอบ • ให้ 12 คือความแปรปรวนของเวลาที่ใช้ประกอบสินค้าของพนักงานชาย 22 คือความแปรปรวนของเวลาที่ใช้ประกอบสินค้าของพนักงานหญิง • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด  = 0.01 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวณค่า

  21. คำตอบ • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ F0.01(10,13)4.10 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่าความแปรปรวนของเวลาที่ใช้ในการประกอบสินค้าแต่ละชิ้นของพนักงานชายและพนักงานหญิงไม่แตกต่างกัน ที่ระดับนัยสำคัญ 0.01 ดังนั้น ความแปรปรวนที่แท้จริงของเวลาที่ใช้สำหรับพนักงานชายไม่มากกว่าสำหรับพนักงานหญิง

  22. การวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA)

  23. Analysis of Variance (ANOVA) เป็นวิธีการทดสอบสมมติฐานทางสถิติ เพื่อทดสอบความแตกต่างของค่าเฉลี่ยของประชากรที่มีตั้งแต่ 3 กลุ่มขึ้นไป One-Way ANOVA ANOVA Two-Way ANOVA

  24. ข้อเด่นของ ANOVA • สามารถวิเคราะห์ความแตกต่างของประชากรได้พร้อมกันมากกว่า 2 ประชากร ซึ่ง ถ้าเราใช้ t-test จะทำได้มากที่สุดแค่ 2 ประชากรเท่านั้น • สามารถวิเคราะห์ได้มากกว่า 1 ปัจจัย (Factor) ซึ่ง t-test จะทำได้เพียงปัจจัยเดียวเท่านั้น เช่น อุณหภูมิ  (Temperature) ความเร็ว (Speed) ความกด (Pressure) • สามารถใช้วิเคราะห์เพื่อให้เห็นผลกระทบซึ่งกันและกันของปัจจัยต่างๆ (Interaction) ได้ด้วย

  25. การวิเคราะห์ความแปรปรวนทางเดียว(One-Way ANOVA) • เป็นการวิเคราะห์ความแปรปรวนทางเดียวหรือการวิเคราะห์องค์ประกอบเดียว เป็นการทดสอบความแตกต่างระหว่างค่าเฉลี่ยของตัวแปรอิสระเพียงตัวเดียวหรือมีปัจจัยเดียว แต่จำแนกเป็น 2 ระดับหรือ 2 กลุ่มขึ้นไป โดยถือว่าหน่วยที่ได้รับปัจจัยระดับเดียวกันมาจากประชากรเดียวกัน เช่น อาชีพ  ทหาร  อาจารย์  วิศวกร ค่าใช้จ่าย …………………………. บาท/เดือน

  26. ข้อตกลงเบื้องต้นของ One-Way ANOVA • กลุ่มตัวอย่างที่ใช้ทดสอบในแต่ละกลุ่มจะต้องมีการแจกแจงแบบปกติ • กลุ่มตัวอย่างที่ใช้ทดสอบจะต้องมีความแปรปรวนเท่ากัน • กลุ่มตัวอย่างที่ใช้แต่ละกลุ่มจะต้องเป็นอิสระกัน • ตัวแปรอิสระมีเพียงตัวเดียว แต่จำแนกระดับได้ตั้งแต่ 2 ระดับขึ้นไป เช่น บุคลากรทางการศึกษามี 3 ประเภท คือ ผู้บริหาร ครู และพนักงาน • ตัวแปรตามมีเพียงตัวแปรเดียว โดยผลที่วัดได้จากตัวแปรตามนี้อยู่ในมาตรวัด Interval and Ratio

  27. หลักการของ One-Way ANOVA • ความแปรปรวนรวม = ความแปรปรวนระหว่างกลุ่ม + ความแปรปรวนภายในกลุ่ม (Total Variance = Between-Group Variance + Within-Group Variance) • ความแปรปรวนระหว่างกลุ่มเป็นค่าที่แสดงให้เห็นถึงขนาดของความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มต่างๆ ซึ่งเป็นผลสำคัญของตัวแปรอิสระที่ศึกษา • ความแปรปรวนภายในกลุ่ม เป็นค่าที่แสดงให้เห็นถึงคะแนนแต่ละตัวที่รวบรวมได้ภายในกลุ่ม ซึ่งเป็นผลของตัวแปรอื่นๆ ที่ทำให้คลาดเคลื่อนไป ค่าที่คำนวนได้นี้เรียกว่า ค่าความคลาดเคลื่อน

  28. ตาราง ANOVA

  29. ความหมายของสัญลักษณ์ Ti= ผลรวมของคะแนน n ค่าในแต่ละกลุ่ม T= ผลรวมของคะแนนทั้งหมด nj= จำนวนข้อมูลในแต่ละกลุ่ม k= จำนวนกลุ่ม xij= ข้อมูลตัวที่ i (แถว) ในกลุ่ม j (คอลัมน์) = ค่าเฉลี่ยของกลุ่ม j = ค่าเฉลี่ยรวม

  30. สมมติฐาน ANOVA H0 : 1 = 2 = … = k H1 : 1 ≠ 2 ≠ … ≠ kหรือมี iอย่างน้อย 1 คู่ที่ แตกต่างกัน

  31. ตัวอย่าง จากการสำรวจเจตคติของผู้บริหารโรงเรียน 3 ขนาด คือขนาดเล็ก กลาง และใหญ่ ที่มีต่อวิชาชีพการบริหารการศึกษา ปรากฏผลดังตาราง จงทำการทดสอบว่าเจตคติของผู้บริหารโรงเรียนทั้ง 3 ขนาดแตกต่างกันหรือไม่ กำหนด = 0.05

  32. คำตอบ • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด = 0.05 • ขั้นที่ 3 เลือกและคำนวณค่าสถิติ Ho : 1 = 2 = 3 H1 : 1 ≠ 2 ≠ 3 = 90 / (3-1) = 45 = (7-6)2 + (7-6)2 + (5-6)2 + (4-6)2 + (7-6)2 + (4-6)2 + (4-6)2 + (2-6)2 + (2-6)2 + (3-6)2 + (10-6)2 + (10-6)2 + (9-6)2 + (6-6)2 + (10-6)2 = 114 = 5(6-6)2 + 5(3-6)2 + 5(9-6)2 = 0+45+45 = 90 = 24 / (15-3) = 2 SSW = SST – SSB = 114-90 = 24 = 45 /2 = 22.5

  33. คำตอบ • ขั้นที่ 4 หาค่าวิกฤต ได้ dfB=3-1=2, dfW=15-3=12, F0.05(2,12)= 3.89 • ขั้นที่ 5 Fคำนวณ(=22.5) > Fวิกฤต(=3.89) จึง ปฏิเสธ H0ยอมรับ H1 • ขั้นที่ 6 สรุปได้ว่า ผู้บริหารโรงเรียนขนาดต่างกันมีเจตคติต่อวิชาชีพการบริหารการศึกษาแตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05

  34. การทดสอบภายหลังการวิเคราะห์ความแปรปรวนการทดสอบภายหลังการวิเคราะห์ความแปรปรวน • การทดสอบภายหลังการวิเคราะห์ความแปรปรวน หรือการเปรียบเทียบพหุคูณ (Multiple Comparisons) จะทำภายหลังทดสอบ F-Test แล้วพบว่ามีนัยสำคัญ หรือผลการทดสอบมีค่าเฉลี่ยอย่างน้อย 1 คู่ที่แตกต่างกัน เมื่อต้องการทราบว่าคู่ใดแตกต่างกันบ้าง ต้องทำการเปรียบเทียบพหุคูณ

  35. Multiple Comparisons/ A Post Hoc Test • วิธีการเปรียบเทียบเชิงซ้อนที่มีเงื่อนไขว่า ค่าแปรปรวนของข้อมูลทุกชุดต้องเท่ากัน ประกอบด้วย 1. Least-Significant Different(LSD) 2.Waller – Duncan 3.S-N-K(Student-Newman-Keuls) 4.Dunnett’s C 5. Bonferroni 6.Sidak7.Scheffe 8.R-E-G-WF 9.Tukey’s HSD 10.R-E-G-WQ 11.Tukey’s–b 12.Duncan 13.Hochberg’s GT2 14.Gabriel • วิธีการเปรียบเทียบเชิงซ้อนที่ไม่มีเงื่อนไขเกี่ยวกับการเท่ากันของค่าแปรปรวน 1. Tamhane’s T22.Dunnett’s T3 3.Games-Howell4.Dunnett’s C

  36. Least-Significant Different(LSD) • LSD หรือ Fisher’s Least-Significant Difference เป็นเทคนิคที่ R.A. Fisher ได้พัฒนาขึ้นเพื่อเปรียบเทียบค่าเฉลี่ยประชากรได้ครั้งละหลายคู่ โดยมีขั้นตอนดังนี้ 1.คำนวณค่า LSD โดยที่ ถ้า ni = njจะทำให้ 2. นำ เปรียบเทียบกับค่า LSD ถ้า > LSD แสดงว่าi ≠ j ถ้า LSD แสดงว่า i = j

  37. จากตัวอย่างข้างต้น 1.คำนวณ=0.05, n-k=15-3=12, t = 2.18 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05

  38. Tukey’s Honesty Significant Difference (HSD) • เป็นวิธีการเปรียบเทียบค่าเฉลี่ยประชากร โดยตัวอย่างแต่ละชุดมีขนาดเท่ากัน โดยที่ k = จำนวนกลุ่ม, dfw = n-k, ค่า q เปิดได้จากตาราง ขั้นตอนมีดังนี้ 1.คำนวณ HSD 2. คำนวณค่า 3. เปรียบเทียบค่า กับ HSD ถ้า > HSD แสดงว่า i ≠ j ถ้า HSD จะสรุปว่า i = j

  39. จากตัวอย่างข้างต้น • 1.คำนวณ=0.05, k=3, dfW=12, q = 3.77 • 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05

  40. Scheffe • หรือเรียกอีกอย่างว่า S-Method จะใช้ในกรณีที่ตัวอย่างแต่ละชุดมีขนาดเท่ากันหรือไม่เท่ากันก็ได้ มีสูตรดังนี้ โดยที่ k = จำนวนกลุ่ม, dfB= k-1, dfw = n-k, ค่า F เปิดได้จากตาราง, MSW = ค่าความคลาดเคลื่อนของความแปรปรวนภายในกลุ่ม , n1= จำนวนกลุ่มตัวอย่างที่ 1 , n2 = จำนวนกลุ่มตัวอย่างที่ 2ขั้นตอนการคำนวณมีดังนี้ 1.คำนวณ S 2. คำนวณค่า 3. เปรียบเทียบค่ากับ S ถ้า > S แสดงว่า i ≠ j ถ้า S จะสรุปว่า i = j

  41. จากตัวอย่างข้างต้น 1.คำนวณ=0.05, k=3, dfb=2, dfW=12, F = 3.88

  42. จากตัวอย่างข้างต้น 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05

  43. ตัวอย่าง ในการทดลองสอน 4 วิธี กับนักเรียน 4 กลุ่ม จงทดสอบว่าเมื่อสอนจนจบเนื้อหาตามที่ต้องการทดลองสอนทั้ง 4 วิธีให้ผลแตกต่างกันหรือไม่ กำหนด (=0.01) โดยผลการสอบได้คะแนนแต่ละกลุ่มดังแสดงในตาราง

  44. คำตอบ • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด = 0.01 • ขั้นที่ 3 เลือกและคำนวณค่าสถิติ H0 : 1 = 2 = 3 = 4 H1 : 1 ≠ 2 ≠ 3 ≠ 4

  45. ตาราง ANOVA

More Related