440 likes | 676 Views
การวิเคราะห์ความแปรปรวน. การวิเคราะห์ความแปรปรวนสามารถนำมาใช้ประโยชน์ในการหาคำตอบเกี่ยวกับเรื่องต่างๆ ที่ทำการวิเคราะห์โดยวิธีอื่นไม่สามารถทำได้ดังนี้.
E N D
การวิเคราะห์ความแปรปรวนการวิเคราะห์ความแปรปรวน
การวิเคราะห์ความแปรปรวนสามารถนำมาใช้ประโยชน์ในการหาคำตอบเกี่ยวกับเรื่องต่างๆ ที่ทำการวิเคราะห์โดยวิธีอื่นไม่สามารถทำได้ดังนี้ 1. ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรพร้อมๆ กันตั้งแต่ 3 ประชากรขึ้นไป โดยที่ตัวแปรหรือลักษณะที่สนใจศึกษาในประชากรมี 1 ตัว หรือ 1 ลักษณะได้ การวิเคราะห์ความแปรปรวนโดยที่ตัวแปรหรือลักษณะที่สนใจศึกษาในประชากรมี 1ตัว หรือ 1 ลักษณะ นี้เรียกว่า การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One - way analysis of variance)
2. ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรพร้อมๆ กันตั้งแต่ 2 ประชากรขึ้นไป โดยที่ตัวแปรหรือลักษณะที่สนใจในประชากรที่มากกว่า 1 ตัว หรือ 1ลักษณะ โดยใช้ การวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง (Two - way analysis of variance)
3. ใช้แยกปัจจัยของหน่วยทดลอง (experimental unit) หรือสิ่งแวดล้อมอื่นๆ ที่มีผลต่อการเปลี่ยนแปลงของลักษณะที่ต้องการทดสอบความแตกต่างระหว่างประชากร เพื่อให้ผลการทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรตั้งแต่ 2 ประชากรขึ้นไปมีความถูกต้องเชื่อถือได้มากขึ้น
ข้อตกลงเบื้องต้นสำหรับการวิเคราะห์ความแปรปรวนข้อตกลงเบื้องต้นสำหรับการวิเคราะห์ความแปรปรวน ข้อมูลจากแต่ละประชากรที่นำมาใช้ทดสอบจะต้องมี คุณสมบัติที่สำคัญต่อไปนี้ 1. เป็นข้อมูลที่ได้จากตัวอย่างที่เลือกมาจากแต่ละประชากรที่นำมาทดสอบ ข้อมูลที่นำมาใช้สำหรับการวิเคราะห์จะต้องเป็นข้อมูลที่เก็บรวบรวมได้ จากตัวอย่างที่เลือก มาเป็นตัวแทนของประชากร เท่านั้น จะใช้ข้อมูลทั้งหมดที่เก็บจากทุกๆ หน่วย ของประชากรไม่ได้
2. เป็นข้อมูลที่มีการแจกแจงแบบปกติในแต่ละประชากร ข้อมูลของลักษณะที่สนใจศึกษาในแต่ละประชากรซึ่งนำมาทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรตั้งแต่ 2 ประชากรขึ้นไป จะต้องมีการแจกแจงปกติ 3. ข้อมูลของแต่ละประชากรจะต้องมีความแปรปรวน เท่ากัน
วิธีวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียววิธีวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว ความหมายของสัญลักษณะที่ใช้สำหรับเรื่องนี้ เพื่อ ความสะดวกในการคำนวณและการวิเคราะห์ มีดังนี้ สัญลักษณ์ k คือ จำนวนประชากรที่นำมาทดสอบ คือ ค่าเฉลี่ยประชากรที่ i, i = 1, 2, 3, …, k ni คือ จำนวนตัวอย่างที่เลือกจากประชากรที่ i nคือ จำนวนตัวอย่างทั้งหมดที่เลือกมาจากทุกประชากร
xij คือ ค่าสังเกตที่ได้จากตัวอย่างที่ j ที่เลือกมาจาก ประชากรที่ i , j = 1, 2, 3, …, ni T1 คือ ผลรวมของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรที่ i คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรที่ i T คือ ยอดรวมของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรทุกประชากร คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่เลือกมาจาก ประชากรทุกประชากร
T คือ ยอดรวมของค่าสังเกตจากตัวอย่าง ที่เลือกมาจากประชากรทุกประชากร คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างที่ เลือกมาจากประชากรทุกประชากร
ผลรวมกำลังสองเฉลี่ยทั้งหมด (total mean square) เขียนแทนด้วยสัญลักษณะMS (T) โดยที่ SS(T) คือ ผลรวมกำลังสองทั้งหมด (Total sum of square) df(T) คือ องศาแห่งความเป็นอิสระของทั้งหมด (total deree of freedom)
ผลรวมกำลังสองเฉลี่ยระหว่างประชากรผลรวมกำลังสองเฉลี่ยระหว่างประชากร (between mean square) เขียนแทนด้วยสัญลักษณ์MS(B) โดยที่ SS(B) คือ ผลรวมกำลังสองระหว่างประชากร (between sum of square) df(T) คือ องศาแห่งความเป็นอิสระระหว่างประชากร (between degree of freedom) = k-1
ผลรวมกำลังสองเฉลี่ยภายในประชากรผลรวมกำลังสองเฉลี่ยภายในประชากร (within mean square) เขียนแทนด้วยสัญลักษณะMS(W) โดยที่ SS(W) คือ ผลรวมกำลังสองภายในประชากร (within sum of square) df(W) คือ องศาแห่งความเป็นอิสระของภายในประชากร (within degree of freedom) = n-k
ถ้าประชาทั้ง k ประชากรมีการแจกแจงปกติ ที่มีความแปรปรวนเท่ากันแล้ว อัตราส่วน มีการแจกแจงแบบF (F-distribution) ที่มีองศาความเป็นอิสระk-1 และ n-k การแจกแจงแบบ F มีลักษณะเป็นโค้งไม่สมมาตร (asymmetrical shape) ขอบเขตของการปฏิเสธ สมมุติฐานว่างอยู่ทางขวาของโค้ง
ถ้าต้องการทดสอบสมมุติฐานว่างที่ว่าค่าเฉลี่ยของ ประชากรทั้ง k ประชากรไม่มีความแตกต่างกัน หรือ ที่ระดับนัยสำคัญ จะปฏิเสธ Ho ถ้าอัตราส่วน มีค่ามากกว่าค่า F ที่อ่านได้จากตารางที่องศาแห่งความเป็นอิสระของระหว่างประชากร และภายในประชากร
การปฏิเสธ Ho หรือยอมรับ H1 นี้ หมายความว่ามีค่าเฉลี่ยของประชากรอย่างน้อยหนึ่งประชากรที่แตกต่างจากค่าเฉลี่ยของประชากรอื่นๆ ที่เหลือ โดยทั่วๆ ไป การทดสอบสมมุติฐานโดยวิธีความแปรปรวน นิยมเขียนอยู่ในรูปตารางวิเคราะห์ความแปรปรวน ดังนี้
ตารางวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียวตารางวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว สาเหตุของความ แปรปรวน องศาแห่ง ความ เป็นอิสระ (df) ผลรวมกำลังสอง (SS) ผลรวมกำลังสองเฉลี่ย (MS) อัตราส่วน F k-1 ระหว่างประชากร ภายในประชากร n-k รวม n-1
ตัวอย่างที่ 1 ข้อมูลต่อไปนี้แสดงปริมาณผงซักฟอกชนิดหนึ่ง ที่แม่บ้านแต่ละคนใช้ซึ่งเลือกมาเป็นตัวอย่างจากจังหวัดภูเก็ต ลำปาง สุรินทร์ และอยุธยา โดยใช้พนักงาน 4 คน สำรวจในช่วง 3 เดือน จงทดสอบว่ามีความแตกต่างระหว่างปริมาณการใช้ผงซักฟอกโดยเฉลี่ยของแม่บ้านในจังหวัดต่างๆ ในรอบ 3 เดือน ที่ผ่านมาหรือไม่ ที่ระดับนัยสำคัญ 0.05
ปริมาณผงซักฟอก (กล่อง) แม่บ้าน ภูเก็ต 5 8 8 5 4 อยุธยา 11 8 12 19 ลำปาง 2 7 8 10 11 12 สุรินทร์ 7 9 10 9 10
วิธีทำ สมมุติฐาน Ho : แม่บ้านในจังหวัดภูเก็ต ลำปาง สุรินทร์ และอยุธยา ใช้ผงซักฟอกโดยเฉลี่ยเท่ากัน H1 : แม่บ้านในจังหวัด ภูเก็ต ลำปาง สุรินทร์ และอยุธยา ใช้ผงซักฟอกโดยเฉลี่ยไม่เท่ากัน หรือ อย่างน้อยหนึ่งคู่ที่ i j
ปริมาณผงซักฟอก ตัวอย่างที่ 1 2 3 4 5 6 5 8 8 5 4 2 7 8 10 11 12 4 49 64 100 121 144 7 9 10 9 10 49 81 100 81 100 11 8 12 19 121 64 144 361 25 64 64 25 16 Ti 30 50 45 50
สรุปตารางวิเคราะห์ความแปรปรวนสรุปตารางวิเคราะห์ความแปรปรวน สาเหตุของความแปรปรวน MS d.f. SS อัตราส่วน f SS(B)=1,626.67-1531.25 95.42/3 31.81/9.4 ระหว่างจังหวัด 3 = 95.42 =31.81 =3.38 SS(W)=1,777-1,626.67 150.33/16 16 ภายในจังหวัด =150.33 =9.4 SS(T)=1,777-1,531.25 รวม 19 =245.75 จากตารางแจกแจงความถี่ F ของค่า F ที่ระดับนัยสำคัญ 0.05 และ d.f. (3,16) เท่ากับ 3.24
อัตราส่วน F ที่คำนวณได้ 3.38 > 3.24 ดังนั้น ปฏิเสธ Ho ยอมรับ H1 สรุปได้ว่า ปริมาณผงซักฟอกที่แม่บ้านทั้ง 4 จังหวัดใช้มีความแตกต่างกัน หรือมีแม่บ้านอย่างน้อยหนึ่งจังหวัดที่ใช้ผงซักฟอกในปริมาณไม่เท่ากับแม่บ้านในจังหวัดอื่นๆ อีก 3 จังหวัด ที่ระดับนัยสำคัญ 0.05
หมายเหตุ ถ้าต้องการทราบว่าค่าเฉลี่ยของประชากรใดบ้างแตกต่างกัน ต้องทดสอบหาความแตกต่างระหว่างค่าเฉลี่ยของสองประชากรใดๆ ภายหลังการวิเคราะห์ความแปรปรวน โดยใช้วิธีของ Tukey หรือ LSD หรือ Scheffe หรือ Student-Newman
การวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง (two-way analysis of variance) ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากร ตั้งแต่สองชุดขึ้นไป โดยที่ประชากรมีความแตกต่างกัน เนื่องจากสองลักษณะ -ยอดจำหน่ายสินค้าแตกต่างกันเนื่องจากพนักงานขาย และวันในแต่ละสัปดาห์หรือไม่ -อัตราค่าจ้างของคนงานในโรงงานอุตสาหกรรมแตกต่าง เนื่องจากประเภทโรงงาน/เพศของคนงานหรือไม่
ขั้นตอนการวิเคราะห์ ความแปรปรวนแบบจำแนกสองทาง ความหมายของสัญลักษณ์ที่จะใช้สำหรับการวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง เมื่อข้อมูลประกอบด้วยค่าสังเกตของค่าเดียว มีดังนี้ r คือ จำนวนแถว c คือ จำนวนสดมภ์ n คือ ค่าตัวอย่างทั้งหมด
Xij คือ ค่าสังเกตที่ได้จากแถวที่ i สดมภ์ที่ j คือ ค่าเฉลี่ยของค่าสังเกตจากสดมภ์ที่ j ทุกๆ แถว คือ ค่าเฉลี่ยของค่าสังเกตจากแถวที่ i ทุกๆ สดมภ์ คือ ค่าเฉลี่ยของค่าสังเกตจากตัวอย่างทั้งหมด คือ ผลรวมของค่าสังเกตจากแถวที่ i ทุกๆ สดมภ์ คือ ผลรวมของค่าสังเกตจากสดมภ์ที่ j ทุกๆ แถว T คือ ผลรวมของค่าสังเกตจากตัวอย่างทั้งหมด
ตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางเมื่อข้อมูลประกอบด้วยค่าสังเกตเพียงค่าเดียวตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางเมื่อข้อมูลประกอบด้วยค่าสังเกตเพียงค่าเดียว สาเหตของความแปรวปรวน d.f. SS MS F r-1 ระหว่างแถว ระหว่างสดมภ์ c-1 ภายในแถวและสดมภ์ (r-1)(c-1) รวม rc-1
ในการทดลองปลูกมะเขือเทศในห้องทดลองที่อุณหภูมิต่างกัน 4 ระดับ และมีวิธีให้อาหารที่ต่างกัน 3 วิธี ได้ตาราง ANOVA มีค่าต่างๆ ดังนี้ สาเหตุของ ความแปรปรวน df SS MS F 10.53 237 79 ระหว่างอุณหภูมิ 3 (237/3) (79/7.5) (302-20-45) 1.33 10 2 ระหว่างอาหาร 20 (20/2) (10/7.5) ภายในอุณหภูมิ และอาหาร 7.5 45 6 [(6)(7.5)] รวม 11 302
สมมุติฐาน ก) H0: มะเขือเทศที่ปลูกในอุณหภูมิต่างกัน 4 ระดับ ให้ผลผลิตโดยเฉลี่ยเท่ากัน H1: มะเขือเทศที่ปลูกในอุณหภูมิต่างกัน 4 ระดับ ให้ผลผลิตโดยเฉลี่ยไม่เท่ากัน ข) H0: มะเขือเทศที่ปลูกโดยให้อาหารต่างกัน 3 อย่าง ให้ผลผลิตโดยเฉลี่ยเท่ากัน H1: มะเขือเทศที่ปลูกโดยให้อาหารต่างกัน 3 อย่าง ให้ผลผลิตโดยเฉลี่ยไม่เท่ากัน
ก) ค่าวิกฤต F0.5,3,6 = 4.76 5.14 ข) ค่าวิกฤต F0.5,2,6 = ก) เพราะว่าอัตราส่วน F ในการทดสอบเรื่องอุณหภูมิ เท่ากับ 10.53 > 4.76 ดังนั้น ปฏิเสธ H0ยอมรับ H1 ข) เพราะว่าอัตราส่วน F ในการทดสอบเรื่องอาหาร เท่ากับ 1.33 < 5.14 ดังนั้น ยอมรับ H0ปฏิเสธ H1 สรุปได้ว่าการปลูกมะเขือเทศในอุณหภูมิที่ต่างกันจะให้ ผลผลิตโดยเฉลี่ยต่างกัน แต่การให้อาหารต่างกันไม่ทำ ให้ผลผลิตโดยเฉลี่ยต่างกันนั่นคืออาหารไม่มีผลต่อผลผลิต
ตัวอย่างที่ 2 บริษัทผลิตกระดาษเช็ดหน้า ทำกล่องบรรจุกระดาษเช็ดหน้าต่างกัน 3 แบบ ถ้าจำนวนกล่องของกระดาษเช็ดหน้าแต่ละแบบที่ขายได้ในห้างสรรพสินค้าขนาด ใหญ่ 4 ห้าง ดังนี้
ห้างสรรพสินค้า แบบของกล่องบรรจุ รวม C R L M ลีลา ฟ้าสวย นวยนาด รวม 17 34 23 74 15 26 21 62 1 23 8 32 6 22 16 44 39 105 68 212 กระดาษเช็ดหน้าที่บรรจุกล่องทั้งสามแบบขายได้ต่างกันหรือไม่ และห้างสรรพสินค้าทั้งสี่ห้างขายกระดาษเช็ดหน้าได้ต่างกันหรือไม่ ที่ระดับนัยสำคัญ 0.05
วิธีทำ สมมุติฐาน ก. Ho: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขาย ได้ทั้ง 3 แบบ ไม่แตกต่างกัน H1: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขาย ได้ทั้ง 3 แบบแตกต่างกัน ข. Ho: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้าง ทั้ง 4 ขายได้ไม่แตกต่างกัน H1: จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้าง ทั้ง 4 ขายได้แตกต่างกัน
ห้าง Ti. แบบ C X2 R L X2 M X2 X2 ลีลา ฟ้าสวย นวยนาด 15 26 21 289 1,156 529 225 676 441 1 23 8 1 529 64 6 22 16 36 484 256 39 105 68 17 34 23 = 4,292.5 62 74 32 T.j 44 =4,093.32 T = 212 = 3,745.33
สรุปตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทางสรุปตารางวิเคราะห์ความแปรปรวนแบบจำแนกสองทาง สาเหตุของความแปรปรวน SS MS F d.f. SS(R)=4,292.5-3,745.33 ระหว่างแบบ 2 =547.17 =273.585 =36.07(ก) SS(C)=4,093.32-3,745.33 ระหว่างห้าง 3 =347.99 =115.99 =15.29(ข) ภายในแบบและห้าง SS(W)=940.67-547.17-347.99 6 =45.51 =7.585 SS(T)=4,686-3,745.33 รวม 11 =940.67
ทดสอบที่ระดับนัยสำคัญ 0.05 ดังนั้น ค่าวิกฤติ F(0.05,3,6) = 5.14 และ F(0.05,3,6) = 4.76 นั่นคือ อัตราส่วน F ของการทดสอบ Ho ที่ว่าจำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขายได้ทั้ง 3 แบบไม่แตกต่างกันซึ่งเท่ากับ 36.07 มากกว่า 5.14 และ อัตราส่วน F ของการทดสอบ Ho จำนวนกล่อง โดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้างทั้ง 4 ขายได้ ไม่แตกต่างกันซึ่งเท่ากับ 15.29 มากกว่า 4.76
ดังนั้น จึงปฏิเสธ Ho ของการทดสอบสมมุติฐานทั้งสองสมมุติฐาน นั้นคือ จำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ขายได้ทั้ง 3 แบบแตกต่างกัน และจำนวนกล่องโดยเฉลี่ยของกระดาษเช็ดหน้าที่ห้างทั้ง 4 ห้างขายได้แตกต่างกัน
จบหน่วยที่ 4 การวิเคราะห์ ความ แปรปรวน