2.03k likes | 8.42k Views
การวิเคราะห์ความแปรปรวน. 1. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test) 2. การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม (F-Test) 3 . การวิเคราะห์ความแปรปรวนทางเดียว ( One-Way ANOVA ) 4 . การวิเคราะห์ความแปรปรวนสองทาง ( Two-Way ANOVA ).
E N D
การวิเคราะห์ความแปรปรวนการวิเคราะห์ความแปรปรวน 1. การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test) 2. การเปรียบเทียบความแปรปรวนของประชากรสองกลุ่ม (F-Test) 3. การวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA) 4. การวิเคราะห์ความแปรปรวนสองทาง(Two-Way ANOVA)
การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว (Chi-Square Test)
การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียวการทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว • เมื่อ σ2 คือ ค่าของความแปรปรวนของประชากรที่มีการแจกแจงแบบปกติและ σ02 เป็นค่าคงที่ของความแปรปรวนประชากรที่ต้องการทดสอบหรือยืนยันกับพารามิเตอร์ • สมมติฐานที่จะทดสอบคือ • สถิติที่ใช้ทดสอบ คือ
การทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียวการทดสอบสมมติฐานเกี่ยวกับค่าความแปรปรวนของประชากรกลุ่มเดียว • เกณฑ์การตัดสินใจที่ระดับนัยสำคัญ มีดังนี้
ตัวอย่าง โรงงานผลิตหลอดภาพโทรทัศน์แห่งหนึ่งทราบว่า อายุการใช้งานของหลอดภาพมีการแจกแจงแบบปกติ มีความแปรปรวน 10,000 ช.ม.2 ในการตรวจสอบคุณภาพครั้งหนึ่ง โดยการสุ่มหลอดภาพมา 20 หลอด พบว่าความแปรปรวนของอายุการใช้งานของหลอดภาพเท่ากับ 12,000 ช.ม.2 ที่ระดับนัยสำคัญ 0.05 จะกล่าวได้หรือไม่ว่า ความแปรปรวนของอายุการใช้งานของหลอดภาพไม่เท่ากับ 10,000 ช.ม.2
คำตอบ • ให้ 2คือความแปรปรวนของอายุการใช้งานของหลอดภาพที่ผลิตโดยโรงงานแห่งนี้ หน่วย : ช.ม.2 • ขั้นที่ 1 H0 : 2 = 10,000 H1 : 2 10,000 • ขั้นที่ 2 กำหนด = 0.05 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวนณค่า • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ 2 8.91 หรือ 2 32.85 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่าความแปรปรวนของอายุการใช้งานของหลอดภาพเท่ากับ 10,000 ช.ม.2
ตัวอย่าง บริษัทแห่งหนึ่งรับประกันว่า อุณหภูมิที่วัดโดยเทอร์โมมิเตอร์ที่ผลิตได้มีส่วนเบี่ยงเบนมาตรฐานไม่เกิน 0.5 0C เพื่อตรวจสอบการรับประกันดังกล่าว ได้สุ่มเทอร์โมมิเตอร์มาจำนวน 16 อัน วัดอุณหภูมิ ณ สถานที่แห่งเดียวกัน เวลาเดียวกัน พบว่าอุณหภูมิที่วัดได้มีส่วนเบี่ยงเบนมาตรฐาน 0.7 0C ที่ระดับนัยสำคัญ 0.01 การรับประกันของบริษัทข้างต้นเชื่อถือได้หรือไม่
คำตอบ • ให้ 2คือความแปรปรวนของเทอร์โมมิเตอร์ที่ผลิต • ขั้นที่ 1 H0 : 2<0.25 H1 : 2 > 0.25 • ขั้นที่ 2 กำหนด = 0.01 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวนณค่า • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ 2 30.58 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่า ความแปรปรวนของอุณหภูมิที่วัดโดยเทอร์โมมิเตอร์นี้ เท่ากับ 0.25 หรือกล่าวได้ว่าค่าเบี่ยงเบนมาตรฐานของอุณหภูมิที่วัดโดยเทอร์โมมิเตอร์นี้ไม่เกิน 0.5 0C อย่างมีนัยสำคัญที่ระดับ 0.01ดังนั้น การรับประกันของบริษัทข้างต้นเชื่อถือได้
F-Test or F-Distribution • Sir Ronald Aylmer Fisher ได้พบว่า ถ้า • s12 และs22 เป็นค่าความแปรปรวนของกลุ่มตัวอย่างที่ 1 ที่มีจำนวนตัวอย่าง n1และตัวอย่างกลุ่มที่ 2 ที่มีจำนวนตัวอย่าง n2ตามลำดับ และตัวอย่างทั้งหมดได้มาจากการสุ่มมาจากประชากร 2 ประชากรที่มีการกระจายแบบ Normal Distribution; และมี • S12 และS22 เป็นค่าความแปรปรวนของประชากรกลุ่มที่ 1 และกลุ่มที่ 2 ตามลำดับ • ลักษณะของกราฟจะเปลี่ยนแปลงระดับความเบ้ ตามขนาด Degree of Freedom (df) ซึ่งเท่ากับ n1-1 และ n2-1 และต่อมารูปแบบการกระจายนี้ได้ถูกเรียกว่า Fisher Distribution หรือ F-Distribution
ข้อกำหนดเบื้องต้นของ F-Test 1. สิ่งตัวอย่างที่จะเทียบกันทั้งสองกลุ่ม ถูกสุ่มมาจากประชากรแม่อย่างถูกต้อง (Randomly) 2. ประชากรที่ทำการสุ่มตัวอย่างมานั้นจะต้องมีการกระจายแบบ Normal Distribution
การประยุกต์ใช้และข้อจำกัดของ F-Test การประยุกต์ใช้ F-test • ในบรรดาเครื่องมือทาง สถิติที่ มีการพิสูจน์โมเดลทางคณิตศาสตร์ (Model Fit) เช่น Analysis of Variance และ Linear Regression Analysis จึงต้องมี F-Test เป็นตัวทดสอบทางสถิติเพื่อหาว่า Error จาก Model มากกว่า ค่าจริงหรือไม่ ซึ่ง Error หรือ Sum Square ก็ค่า Variance นั่นเอง นี่เองคือเหตุที่พบ F-Statistics ในการวิเคราะห์ Analysis of Variance และ Linear Regression Analysis ข้อจำกัดของ F-Test • ใช้ได้กับ 2 ประชากรเท่านั้น • จะให้ผลการทดสอบผิดพลาดมาก หากข้อมูลไม่เป็น Normal Distribution อย่างแท้จริง
F-Test • หรือ สมมติฐานที่จะทดสอบอยู่ในลักษณะ ดังนี้
ตัวอย่าง ข้อมูลแสดงจำนวนรถจักรยานยนต์ที่ขายได้ในหนึ่งสัปดาห์ของตัวแทนจำหน่ายสองร้าน ร้าน ก 65 46 57 43 58 ร้าน ข 52 41 43 47 32 49 57 ถ้าสมมติว่าจำนวนรถจักรยานยนต์ที่ขายได้ในหนึ่งสัปดาห์มีการแจกแจงปกติโดยประมาณ จงใช้ระดับนัยสำคัญ 0.02 ตรวจสอบดูว่าความแปรปรวนของจำนวนรถที่ขายได้ในหนึ่งสัปดาห์ของร้าน ก และ ข แตกต่างกันหรือไม่
ขั้นที่ 1 กำหนดสมมติฐาน ขั้นที่ 2 กำหนด = 0.02ขั้นที่ 3 เลือกและคำนวณค่าสถิติ
ตัวอย่าง เพื่อศึกษาเปรียบเทียบระยะเวลาที่ใช้ในการประกอบสินค้าแต่ละชิ้น ระหว่างพนักงานชายและพนักงานหญิงจากประสบการณ์ที่ผ่านมาทราบว่า เวลาดังกล่าวมีการแจกแจงแบบปกติโดยประมาณ และความแปรปรวนของเวลาสำหรับพนักงานหญิงน้อยกว่าสำหรับพนักงานชาย เพื่อความกระจ่างจึงได้สุ่มตัวอย่างคนงานชายมา 11 คน หาค่าเบี่ยงเบนมาตรฐานของระยะเวลาที่ใช้ประกอบสินค้าได้ 6.1 วินาที และได้สุ่มตัวอย่างคนงานหญิงมา 14 คน หาค่าเบี่ยงเบนมาตรฐานของระยะเวลาที่ใช้ประกอบสินค้าได้ 5.3 วินาที จงใช้ระดับนัยสำคัญ 0.01 ตรวจสอบดูว่าความแปรปรวนที่แท้จริงของเวลาที่ใช้สำหรับพนักงานชายมากกว่าสำหรับพนักงานหญิงหรือไม่
คำตอบ • ให้ 12 คือความแปรปรวนของเวลาที่ใช้ประกอบสินค้าของพนักงานชาย 22 คือความแปรปรวนของเวลาที่ใช้ประกอบสินค้าของพนักงานหญิง • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด = 0.01 • ขั้นที่ 3 กำหนดตัวสถิติและคำนวณค่า
คำตอบ • ขั้นที่ 4 บริเวณปฏิเสธ H0คือ F0.01(10,13)4.10 • ขั้นที่ 5 ยอมรับ H0ปฏิเสธ H1 • ขั้นที่ 6 สรุปได้ว่าความแปรปรวนของเวลาที่ใช้ในการประกอบสินค้าแต่ละชิ้นของพนักงานชายและพนักงานหญิงไม่แตกต่างกัน ที่ระดับนัยสำคัญ 0.01 ดังนั้น ความแปรปรวนที่แท้จริงของเวลาที่ใช้สำหรับพนักงานชายไม่มากกว่าสำหรับพนักงานหญิง
การวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA)
Analysis of Variance (ANOVA) เป็นวิธีการทดสอบสมมติฐานทางสถิติ เพื่อทดสอบความแตกต่างของค่าเฉลี่ยของประชากรที่มีตั้งแต่ 3 กลุ่มขึ้นไป One-Way ANOVA ANOVA Two-Way ANOVA
ข้อเด่นของ ANOVA • สามารถวิเคราะห์ความแตกต่างของประชากรได้พร้อมกันมากกว่า 2 ประชากร ซึ่ง ถ้าเราใช้ t-test จะทำได้มากที่สุดแค่ 2 ประชากรเท่านั้น • สามารถวิเคราะห์ได้มากกว่า 1 ปัจจัย (Factor) ซึ่ง t-test จะทำได้เพียงปัจจัยเดียวเท่านั้น เช่น อุณหภูมิ (Temperature) ความเร็ว (Speed) ความกด (Pressure) • สามารถใช้วิเคราะห์เพื่อให้เห็นผลกระทบซึ่งกันและกันของปัจจัยต่างๆ (Interaction) ได้ด้วย
การวิเคราะห์ความแปรปรวนทางเดียว(One-Way ANOVA) • เป็นการวิเคราะห์ความแปรปรวนทางเดียวหรือการวิเคราะห์องค์ประกอบเดียว เป็นการทดสอบความแตกต่างระหว่างค่าเฉลี่ยของตัวแปรอิสระเพียงตัวเดียวหรือมีปัจจัยเดียว แต่จำแนกเป็น 2 ระดับหรือ 2 กลุ่มขึ้นไป โดยถือว่าหน่วยที่ได้รับปัจจัยระดับเดียวกันมาจากประชากรเดียวกัน เช่น อาชีพ ทหาร อาจารย์ วิศวกร ค่าใช้จ่าย …………………………. บาท/เดือน
ข้อตกลงเบื้องต้นของ One-Way ANOVA • กลุ่มตัวอย่างที่ใช้ทดสอบในแต่ละกลุ่มจะต้องมีการแจกแจงแบบปกติ • กลุ่มตัวอย่างที่ใช้ทดสอบจะต้องมีความแปรปรวนเท่ากัน • กลุ่มตัวอย่างที่ใช้แต่ละกลุ่มจะต้องเป็นอิสระกัน • ตัวแปรอิสระมีเพียงตัวเดียว แต่จำแนกระดับได้ตั้งแต่ 2 ระดับขึ้นไป เช่น บุคลากรทางการศึกษามี 3 ประเภท คือ ผู้บริหาร ครู และพนักงาน • ตัวแปรตามมีเพียงตัวแปรเดียว โดยผลที่วัดได้จากตัวแปรตามนี้อยู่ในมาตรวัด Interval and Ratio
หลักการของ One-Way ANOVA • ความแปรปรวนรวม = ความแปรปรวนระหว่างกลุ่ม + ความแปรปรวนภายในกลุ่ม (Total Variance = Between-Group Variance + Within-Group Variance) • ความแปรปรวนระหว่างกลุ่มเป็นค่าที่แสดงให้เห็นถึงขนาดของความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มต่างๆ ซึ่งเป็นผลสำคัญของตัวแปรอิสระที่ศึกษา • ความแปรปรวนภายในกลุ่ม เป็นค่าที่แสดงให้เห็นถึงคะแนนแต่ละตัวที่รวบรวมได้ภายในกลุ่ม ซึ่งเป็นผลของตัวแปรอื่นๆ ที่ทำให้คลาดเคลื่อนไป ค่าที่คำนวนได้นี้เรียกว่า ค่าความคลาดเคลื่อน
ความหมายของสัญลักษณ์ Ti= ผลรวมของคะแนน n ค่าในแต่ละกลุ่ม T= ผลรวมของคะแนนทั้งหมด nj= จำนวนข้อมูลในแต่ละกลุ่ม k= จำนวนกลุ่ม xij= ข้อมูลตัวที่ i (แถว) ในกลุ่ม j (คอลัมน์) = ค่าเฉลี่ยของกลุ่ม j = ค่าเฉลี่ยรวม
สมมติฐาน ANOVA H0 : 1 = 2 = … = k H1 : 1 ≠ 2 ≠ … ≠ kหรือมี iอย่างน้อย 1 คู่ที่ แตกต่างกัน
ตัวอย่าง จากการสำรวจเจตคติของผู้บริหารโรงเรียน 3 ขนาด คือขนาดเล็ก กลาง และใหญ่ ที่มีต่อวิชาชีพการบริหารการศึกษา ปรากฏผลดังตาราง จงทำการทดสอบว่าเจตคติของผู้บริหารโรงเรียนทั้ง 3 ขนาดแตกต่างกันหรือไม่ กำหนด = 0.05
คำตอบ • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด = 0.05 • ขั้นที่ 3 เลือกและคำนวณค่าสถิติ Ho : 1 = 2 = 3 H1 : 1 ≠ 2 ≠ 3 = 90 / (3-1) = 45 = (7-6)2 + (7-6)2 + (5-6)2 + (4-6)2 + (7-6)2 + (4-6)2 + (4-6)2 + (2-6)2 + (2-6)2 + (3-6)2 + (10-6)2 + (10-6)2 + (9-6)2 + (6-6)2 + (10-6)2 = 114 = 5(6-6)2 + 5(3-6)2 + 5(9-6)2 = 0+45+45 = 90 = 24 / (15-3) = 2 SSW = SST – SSB = 114-90 = 24 = 45 /2 = 22.5
คำตอบ • ขั้นที่ 4 หาค่าวิกฤต ได้ dfB=3-1=2, dfW=15-3=12, F0.05(2,12)= 3.89 • ขั้นที่ 5 Fคำนวณ(=22.5) > Fวิกฤต(=3.89) จึง ปฏิเสธ H0ยอมรับ H1 • ขั้นที่ 6 สรุปได้ว่า ผู้บริหารโรงเรียนขนาดต่างกันมีเจตคติต่อวิชาชีพการบริหารการศึกษาแตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
การทดสอบภายหลังการวิเคราะห์ความแปรปรวนการทดสอบภายหลังการวิเคราะห์ความแปรปรวน • การทดสอบภายหลังการวิเคราะห์ความแปรปรวน หรือการเปรียบเทียบพหุคูณ (Multiple Comparisons) จะทำภายหลังทดสอบ F-Test แล้วพบว่ามีนัยสำคัญ หรือผลการทดสอบมีค่าเฉลี่ยอย่างน้อย 1 คู่ที่แตกต่างกัน เมื่อต้องการทราบว่าคู่ใดแตกต่างกันบ้าง ต้องทำการเปรียบเทียบพหุคูณ
Multiple Comparisons/ A Post Hoc Test • วิธีการเปรียบเทียบเชิงซ้อนที่มีเงื่อนไขว่า ค่าแปรปรวนของข้อมูลทุกชุดต้องเท่ากัน ประกอบด้วย 1. Least-Significant Different(LSD) 2.Waller – Duncan 3.S-N-K(Student-Newman-Keuls) 4.Dunnett’s C 5. Bonferroni 6.Sidak7.Scheffe 8.R-E-G-WF 9.Tukey’s HSD 10.R-E-G-WQ 11.Tukey’s–b 12.Duncan 13.Hochberg’s GT2 14.Gabriel • วิธีการเปรียบเทียบเชิงซ้อนที่ไม่มีเงื่อนไขเกี่ยวกับการเท่ากันของค่าแปรปรวน 1. Tamhane’s T22.Dunnett’s T3 3.Games-Howell4.Dunnett’s C
Least-Significant Different(LSD) • LSD หรือ Fisher’s Least-Significant Difference เป็นเทคนิคที่ R.A. Fisher ได้พัฒนาขึ้นเพื่อเปรียบเทียบค่าเฉลี่ยประชากรได้ครั้งละหลายคู่ โดยมีขั้นตอนดังนี้ 1.คำนวณค่า LSD โดยที่ ถ้า ni = njจะทำให้ 2. นำ เปรียบเทียบกับค่า LSD ถ้า > LSD แสดงว่าi ≠ j ถ้า LSD แสดงว่า i = j
จากตัวอย่างข้างต้น 1.คำนวณ=0.05, n-k=15-3=12, t = 2.18 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05
Tukey’s Honesty Significant Difference (HSD) • เป็นวิธีการเปรียบเทียบค่าเฉลี่ยประชากร โดยตัวอย่างแต่ละชุดมีขนาดเท่ากัน โดยที่ k = จำนวนกลุ่ม, dfw = n-k, ค่า q เปิดได้จากตาราง ขั้นตอนมีดังนี้ 1.คำนวณ HSD 2. คำนวณค่า 3. เปรียบเทียบค่า กับ HSD ถ้า > HSD แสดงว่า i ≠ j ถ้า HSD จะสรุปว่า i = j
จากตัวอย่างข้างต้น • 1.คำนวณ=0.05, k=3, dfW=12, q = 3.77 • 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05
Scheffe • หรือเรียกอีกอย่างว่า S-Method จะใช้ในกรณีที่ตัวอย่างแต่ละชุดมีขนาดเท่ากันหรือไม่เท่ากันก็ได้ มีสูตรดังนี้ โดยที่ k = จำนวนกลุ่ม, dfB= k-1, dfw = n-k, ค่า F เปิดได้จากตาราง, MSW = ค่าความคลาดเคลื่อนของความแปรปรวนภายในกลุ่ม , n1= จำนวนกลุ่มตัวอย่างที่ 1 , n2 = จำนวนกลุ่มตัวอย่างที่ 2ขั้นตอนการคำนวณมีดังนี้ 1.คำนวณ S 2. คำนวณค่า 3. เปรียบเทียบค่ากับ S ถ้า > S แสดงว่า i ≠ j ถ้า S จะสรุปว่า i = j
จากตัวอย่างข้างต้น 1.คำนวณ=0.05, k=3, dfb=2, dfW=12, F = 3.88
จากตัวอย่างข้างต้น 2. คำนวณค่า และ 3. เปรียบเทียบผล • สรุปผลได้ว่า ผู้บริหารโรงเรียนขนาดเล็กมีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดกลาง ส่วนโรงเรียนขนาดใหญ่มีเจตคติต่อวิชาชีพการบริหารการศึกษาสูงกว่าโรงเรียนขนาดเล็กและขนาดกลาง อย่างมีนับสำคัญที่ระดับ 0.05
ตัวอย่าง ในการทดลองสอน 4 วิธี กับนักเรียน 4 กลุ่ม จงทดสอบว่าเมื่อสอนจนจบเนื้อหาตามที่ต้องการทดลองสอนทั้ง 4 วิธีให้ผลแตกต่างกันหรือไม่ กำหนด (=0.01) โดยผลการสอบได้คะแนนแต่ละกลุ่มดังแสดงในตาราง
คำตอบ • ขั้นที่ 1 กำหนดสมมติฐาน • ขั้นที่ 2 กำหนด = 0.01 • ขั้นที่ 3 เลือกและคำนวณค่าสถิติ H0 : 1 = 2 = 3 = 4 H1 : 1 ≠ 2 ≠ 3 ≠ 4