2.07k likes | 6.62k Views
การ วิเคราะห์ข้อมูลเบื้องต้น. การวัดแนวโน้มเข้าสู่ส่วนกลาง. มัธยฐาน (Median). ฐานนิยม (Mode). ค่าเฉลี่ย (Mean). ค่าเฉลี่ยเลขคณิต (Arithmetic Mean). ค่าเฉลี่ยเรขาคณิต (Geometric Mean). ค่าเฉลี่ยฮาร์โมนิค (Harmonic Mean). 2.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง
E N D
การวิเคราะห์ข้อมูลเบื้องต้นการวิเคราะห์ข้อมูลเบื้องต้น
การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง มัธยฐาน (Median) ฐานนิยม (Mode) ค่าเฉลี่ย(Mean) ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเฉลี่ยเรขาคณิต (Geometric Mean) ค่าเฉลี่ยฮาร์โมนิค (Harmonic Mean) 2.1 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measure of Central Tendency)
2.1.1 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) กรณีข้อมูลไม่ได้แจกแจงความถี่ ค่าเฉลี่ยเลขคณิตของประชากร ค่าเฉลี่ยเลขคณิตของตัวอย่าง
ตัวอย่าง 2.1 ในการวัดระดับความสามารถทางสติปัญญา (I.Q.) ของนักเรียนห้องหนึ่ง สุ่มตัวอย่างนักเรียนมา 10 คน วัดระดับ I.Q. บันทึกผลได้ดังตาราง
กรณีข้อมูลแจกแจงความถี่กรณีข้อมูลแจกแจงความถี่ โดยที่ หมายถึง จุดกี่งกลางชั้น n หมายถึง จำนวนตัวอย่าง fi คือ ความถี่ในแต่ละอันตรภาคชั้น
ตัวอย่างที่ 2.2 ในการสำรวจเป็ดของครัวเรือนในหมู่บ้านชนบทแห่งหนึ่ง บันทึกจำนวนเป็ดต่อครัวเรือน ได้ข้อมูลดังตาราง จงหาจำนวนเป็ดเฉลี่ยต่อครัวเรือน
ดังนั้น แต่ละครัวเรือนจะเลี้ยงเป็ดเฉลี่ย 15.625 ตัวต่อครัวเรือน
2.1.2 มัธยฐาน (Median) = กรณีข้อมูลไม่ได้แจกแจงความถี่ 1) เรียงลำดับข้อมูลจากน้อยไปหามาก หรือมากไปหาน้อย 2) หาตำแหน่งของมัธยฐาน ถ้าข้อมูลมี n ตัว ตำแหน่งมัธยฐาน 3) ค่ามัธยฐานคือค่าสังเกตที่อยู่ในตำแหน่งที่หาได้ในข้อ (2) หมายเหตุ ถ้าชุดข้อมูลมี n ตัว ซึ่ง n เป็นจำนวนคู่ ตำแหน่งที่ได้จะอยู่ระหว่างค่าสังเกต 2 จำนวน การหาค่ามัธยฐานให้นำค่าสังเกตทั้ง 2 ที่อยู่ระหว่างตำแหน่งที่หาได้มาหาค่าเฉลี่ย
ตัวอย่าง 2.3 จงหาค่ามัธยฐานของข้อมูลต่อไปนี้ 1) 12 9 14 10 18 20 17 • เรียงลำดับข้อมูลจากน้อยไปหามาก • 9 10 12 14 17 18 20 • หาตำแหน่งมัธยฐาน • ตำแหน่งมัธยฐาน • หาค่ามัธยฐาน • มัธยฐานคือค่าสังเกตในตำแหน่งที่ 4 • ดังนั้น มัธยฐาน = 14
2) 22 29 17 27 39 35 25 28 • เรียงลำดับข้อมูลจากน้อยไปหามาก • 17 22 25 27 28 29 35 39 • หาตำแหน่งมัธยฐาน • ตำแหน่งมัธยฐาน • หาค่ามัธยฐาน • มัธยฐานคือค่าสังเกตในตำแหน่งที่ 4.5 ซึ่งอยู่ระหว่างค่าสังเกตในตำแหน่งที่ 4 และ 5 • ดังนั้น มัธยฐาน
กรณีข้อมูลแจกแจงความถี่กรณีข้อมูลแจกแจงความถี่ 1) หาตำแหน่งมัธยฐานจากสูตร ตำแหน่งมัธยฐาน 2) คำนวณหาค่ามัธยฐานจากสูตร โดยที่ L คือ ขอบเขตล่างของชั้นมัธยฐาน I คือ ความกว้างของอันตรภาคชั้น n คือ จำนวนข้อมูล F คือ ความถี่สะสมของชั้นก่อนมัธยฐาน f คือ ความถี่ในชั้นมัธยฐาน
ตัวอย่าง 2.4 ตารางแจกแจงความถี่แสดงปริมาณเครื่องคอมพิวเตอร์ที่สั่งมาขายของบริษัทแห่งหนึ่งในแต่ละสาขาจำนวน 40 สาขา มีข้อมูลดังนี้
วิธีทำ มัธยฐานคือตำแหน่ง ที่ 20 ซึ่งอยู่ในชั้นนี้ ตำแหน่งมัธยฐาน L = 30.5 I = 10 n = 40 F = 13 f = 12
หาค่ามัธยฐานจากสูตร L = 30.5 I = 10 n = 40 F = 13 f = 12 ดังนั้น มัธยฐานของปริมาณการสั่งซื้อเครื่องคอมพิวเตอร์คือ 36.33 เครื่อง
2.1.3 ฐานนิยม (Mode) กรณีข้อมูลไม่ได้แจกแจงความถี่ ฐานนิยม คือข้อมูลที่มีความถี่มากที่สุด สามารถหาฐานนิยมได้ทั้งข้อมูลเชิงปริมาณ และข้อมูลเชิงคุณภาพ
ตัวอย่าง 2.5 จงหาฐานนิยมของข้อมูลต่อไปนี้ 1) 2 5 7 9 7 3 1 9 7 4 3 5 10 7 ข้อมูลที่มีความถี่มากที่สุดคือ 7 ดังนั้นฐานนิยม คือ 7 2) 73 11 14 16 17 18 20 24 26 37 ข้อมูลชุดนี้ไม่มีค่าไหนที่ซ้ำกันเลย ดังนั้นข้อมูลชุดนี้จึงไม่มีฐานนิยม 3) 10 11 9 7 10 15 9 4 7 10 9 6 5 ข้อมูลที่มีความถี่มากที่สุดคือ 9 และ 10 ดังนั้น ข้อมูลชุดนี้ไม่มีฐานนิยม
ตัวอย่าง 2.6 ในการสำรวจคนที่ใช้รถยนต์จำนวน 20 คน ว่าใช้รถยี่ห้ออะไร ได้ผลสำรวจดังนี้ HONDA TOYOTA TOYOTA MAZDA SUZUKI VOLVO MITSUBISHI LEXUS FORD NISSAN TOYOTA SUZUKI MAZDA FORD HONDA BENZ BMW TOYOTA NISSAN KIA พบว่า TOYOTA มีความถี่มากที่สุด ดังนั้น ฐานนิยมคือ TOYOTA
กรณีข้อมูลแจกแจงความถี่กรณีข้อมูลแจกแจงความถี่ 1) เลือกชั้นที่มีความถี่มากที่สุดเป็นชั้นฐานนิยม 2) คำนวณหาค่าฐานนิยมจากสูตร โดยที่ L คือ ขอบเขตล่างของชั้นมัธยฐาน I คือ ความกว้างของอันตรภาคชั้น d1 คือ ความถี่ชั้นฐานนิยม – ความถี่ชั้นก่อนมฐานนิยม d2 คือ ความถี่ชั้นฐานนิยม – ความถี่ชั้นหลังฐานนิยม
ตัวอย่าง 2.7 จากตัวอย่าง 2.4 จงหาฐานนิยมของปริมาณคอมพิวเตอร์ที่สั่งมาขาย
วิธีทำ d1=12 – 6 = 6 d2=12 – 5 = 7
อันตรภาคชั้น 31 – 40 มีความถี่สูงสุด คือ 12 จึงให้ชั้นนี้เป็นชั้นฐานนิยม จะได้ L = 30.5 d1 = 6 d2 = 7 แทนค่าในสูตร ดังนั้นฐานนิยมของปริมาณการสั่งซื้อเครื่องคอมพิวเตอร์คือ 35.12 เครื่อง
2.3 การวัดการกระจาย (Measurement of Dispersion) ในการวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นค่ากลางที่ใช้เป็นลักษณะของตัวแทนข้อมูลชุดนั้น แต่ถ้าเราทราบแต่ค่ากลางเพียงค่าเดียว ทำให้เราไม่สามารถมองเห็นภาพรวมของข้อมูลในชุดนั้นๆ ได้ ชุดที่ 1 8 8 8 8 8 ชุดที่ 2 4 6 8 10 12 ชุดที่ 3 6 1 15 11 7
2.3.1 พิสัย (Range) พิสัย = Xmax – Xmin เมื่อ Xmaxคือ ค่ามากที่สุดในชุดข้อมูล Xmin คือ ค่าน้อยที่สุดในชุดข้อมูล
2.3.2 ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ส่วนเบี่ยงเบนมาตรฐานของประชากร ( ) กรณีข้อมูลไม่ได้แจกแจงความถี่ กรณีข้อมูลแจกแจงความถี่
2.3.3 ความแปรปรวน (Variance) ความแปรปรวนของประชากร ( ) กรณีข้อมูลไม่ได้แจกแจงความถี่ กรณีข้อมูลแจกแจงความถี่
ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (S.D หรือ S) - กรณีข้อมูลไม่ได้แจกแจงความถี่ หรือ
ความแปรปรวนของตัวอย่าง (S.D หรือ S) - กรณีข้อมูลไม่ได้แจกแจงความถี่ หรือ
ตัวอย่าง 2.8 สุ่มตัวอย่างนักศึกษาคณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏเชียงใหม่ จำนวน 11 คน สอบถามถึงจำนวนครั้งที่ใช้โทรศัพท์ในการโทรออกในแต่ละวัน ได้ข้อมูลดังนี้ • 2 11 7 5 • 3 10 6 5 4 5 จงหา พิสัย ส่วนเบี่ยงเบนมาตรฐาน และความแปรปรวนของข้อมูลชุดนี้
วิธีทำ 1) พิสัย = Xmax – Xmin = 10 – 2 = 8 ดังนั้นพิสัยมีค่าเท่ากับ 9 2) ส่วนเบี่ยงเบนมาตรฐาน - หาค่าเฉลี่ย
การหาส่วนเบี่ยงเบนมาตรฐานของตัวอย่างมี 2 สูตร ดังนั้นจะแสดงทั้ง 2 สูตร สูตรที่ 1
สูตรที่ 2 ดังนั้นส่วนเบี่ยงเบนมาตรฐานมีค่าเท่ากับ 3.114 ครั้ง
3) ความแปรปรวน จากสูตรจะเห็นว่า ความแปรปรวน = (ส่วนเบี่ยงเบนมาตรฐาน)2 ดังนั้นความแปรปรวน S2= (3.114)2 = 9.697 ครั้ง2
ส่วนเบี่ยงเบนมาตรฐานของตัวอย่าง (S.D หรือ S) - กรณีข้อมูลแจกแจงความถี่ หรือ
ความแปรปรวนของตัวอย่าง (S.D หรือ S) - กรณีข้อมูลแจกแจงความถี่ หรือ
ตัวอย่าง 2.9 จากการสอบถามถึงเงินออมในแต่ละวันของนักศึกษาสาขาวิชาสถิติ ได้ข้อมูลดังนี้ จงหาส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้
ต้องหา ก่อน จากสูตร จะได้
สัมประสิทธิ์การแปรผัน(Coefficient of Variation: C.V.) ใช้ในการเปรียบเทียบการกระจายของข้อมูล 2 ชุดขึ้นไป
ตัวอย่าง 2.10 ในการสอบกลางภาคเรียน วิชา การคิดและการตัดสินใจ หลักสถิติ แคลคูลัส และสถิติธุรกิจ ปรากฏผลดังนี้ จงพิจารณาว่าคะแนนสอบวิชาใดมีการกระจายมากกว่ากัน
วิธีทำ วิชาการคิดและการตัดสินใจ วิชาหลักสถิติ วิชาแคลคูลัส วิชาสถิติธุรกิจ ดังนั้น วิชาที่มีการกระจายมากที่สุดคือ แคลคูลัส รองลงมาได้แก่ วิชาสถิติธุรกิจ การคิดและการตัดสินใจ และ หลักสถิติ ตามลำดับ
2.4 ค่ามาตรฐาน (Standard Score) เป็นค่าที่บอกความแตกต่างระหว่างค่าที่ได้จากการสังเกตนั้นกับค่าเฉลี่ยคิดเป็นกี่เท่าของส่วนเบี่ยงเบนมาตรฐานของข้อมูลโดยคำนวณได้จากสูตร
ตัวอย่าง 2.11 จากข้อมูลในตัวอย่าง 2.10 ถ้านายเพลิงสอบวิชาการคิดและการตัดสินใจ หลักสถิติ แคลคูลัส และสถิติธุรกิจ ได้คะแนน 30, 33, 24 และ 25 คะแนน ตามลำดับ อยากทราบว่านายเพลิงเรียนวิชาไหนได้ดีที่สุด
หาค่ามาตรฐานของทั้ง 4 วิชา จากสูตร วิชาการคิดและการตัดสินใจ วิชาหลักสถิติ วิชาแคลคูลัส วิชาสถิติธุรกิจ ดังนั้นวิชาที่นายเพลิงเรียนดีที่สุดคือ วิชาการคิดและการตัดสินใจ รองลงมาคือวิชาแคลคูลัส หลักสถิติ และสถิติธุรกิจ ตามลำดับ