780 likes | 1.81k Views
สต. 300 สถิติทั่วไป. อาจารย์รัชนีวรรณ กุมภคาม สาขาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยแม่โจ้. คำอธิบายรายวิชา. มาตรวัดต่างๆ สถิติพรรณนาและการประยุกต์ใช้ แนวคิดเกี่ยวกับประชากร กลุ่มตัวอย่างและการสุ่มตัวอย่าง การประมาณค่าและการทดสอบสมมติฐาน. 1. 2. 3. บทที่ 1 บทนำ. บทที่ 2 การนำเสนอข้อมูล.
E N D
สต. 300 สถิติทั่วไป อาจารย์รัชนีวรรณ กุมภคาม สาขาสถิติ คณะวิทยาศาสตร์ มหาวิทยาลัยแม่โจ้
คำอธิบายรายวิชา มาตรวัดต่างๆ สถิติพรรณนาและการประยุกต์ใช้ แนวคิดเกี่ยวกับประชากร กลุ่มตัวอย่างและการสุ่มตัวอย่าง การประมาณค่าและการทดสอบสมมติฐาน
1 2 3 บทที่ 1 บทนำ บทที่ 2 การนำเสนอข้อมูล บทที่ 3 การวิเคราะห์ข้อมูลเบื้องต้น รายละเอียดของเนื้อหาวิชา 4 4 บทที่ 4 การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปร 5 บทที่ 5 การทดสอบสมมติฐานเกี่ยวกับค่าเฉลี่ย 6 บทที่ 6 การทดสอบข้อมูลที่อยู่ในรูปของความถี่
บทที่ 3 การวิเคราะห์ข้อมูลเบื้องต้น
การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง • ค่าเฉลี่ย (Mean) ข้อมูลไม่มีการการแจกแจงความถี่ ข้อมูลที่มีการแจกแจงความถี่
ตัวอย่างที่ 1 จงหาค่าเฉลี่ยจากข้อมูลต่อไปนี้ 11 34 50 24 75 23 วิธีทำ
ตัวอย่างที่ 2 จงหาค่าเฉลี่ยจากข้อมูลต่อไปนี้
ตัวอย่างที่ 3 จงหาค่าเฉลี่ยจากข้อมูลต่อไปนี้
ค่าเฉลี่ยแบบถ่วงน้ำหนัก เมื่อข้อมูลมีความสำคัญไม่เท่ากัน เช่น การคิดเกรดเฉลี่ยของนักศึกษาจะพบว่าแต่ละวิชาที่ลงทะเบียนอาจมีจำนวนหน่วยกิตของแต่ละวิชาไม่เท่ากัน เป็นต้น แทน ดังนี้ เมื่อ Wi คือ น้ำหนักที่ใช้ถ่วง Xi คือ ข้อมูล N คือ จำนวนข้อมูล
ตัวอย่างที่ 4 กนกพร ได้รับผลการเรียนจากการลงทะเบียนทั้งหมด 15 หน่วยกิต จำนวน 5 วิชา ดังนี้ จงหาเกรดเฉลี่ยของกนกพร
ตัวอย่างที่ 4 (ต่อ) วิธีทำ
ค่าเฉลี่ยรวม เมื่อต้องการหาค่าเฉลี่ยของข้อมูลหลายกลุ่ม เมื่อ Ni คือ จำนวนข้อมูลในกลุ่มที่ I iคือ ค่าเฉลี่ยของกลุ่มที่ i
การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง • มัธยฐาน (Median) มัธยฐาน (Median)คือ ค่ากลางของข้อมูล เมื่อมีการเรียงลำดับข้อมูลแล้ว จากน้อยไปมากหรือจากมากไปน้อยก็ได้ มีวิธีการคำนวณอยู่ 2 วิธี นั่นคือ ข้อมูลที่ไม่ได้แจงแจงความถี่ ข้อมูลที่มีการแจกแจงความถี่
ตัวอย่างที่ 5 จงหาค่ามัธยฐานจากข้อมูลต่อไปนี้ 5 5 8 1 2 7 9 4 3 4 วิธีทำ เรียงลำดับ 1 2 3 4 4 5 5 7 8 9 ตำแหน่งของมัธยฐาน = = = 5.5 มัธยฐาน = = 4.5
ตัวอย่างที่ 6จงหาค่ามัธยฐานจากข้อมูลต่อไปนี้
ตัวอย่างที่ 7จากข้อมูลส่วนสูง (ซ.ม.) ของนักเรียนมัธยมศึกษาจำนวน 40 คน จงหาค่ามัธยฐานของส่วนสูง
การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง • ฐานนิยม (Mode) ฐานนิยม (Mode)คือ ข้อมูลที่มีจำนวนความถี่มากที่สุด ซึ่งฐานนิยมอาจจะมีมากกว่าหนึ่งค่า หรืออาจจะไม่มีเลยก็ได้ ฐานนิยมมีวิธีการคำนวณอยู่ 2 วิธี ดังนี้ ข้อมูลที่ไม่ได้แจงแจงความถี่ สามารถหาค่าฐานนิยมได้จาก การสังเกตจากข้อมูลที่มีจำนวนความถี่สูงที่สุดในกลุ่มข้อมูลนั้นๆ ข้อมูลที่มีการแจกแจงความถี่ สามารถหาค่าฐานนิยมได้จากสูตรดังต่อไปนี้
ข้อมูลที่ไม่ได้แจงแจงความถี่ข้อมูลที่ไม่ได้แจงแจงความถี่ • สามารถหาค่าฐานนิยมได้จาก การสังเกตจากข้อมูลที่มีจำนวนความถี่สูงที่สุดในกลุ่มข้อมูลนั้นๆ 3 , 5 , 6 , 2 , 5 , 3 , 5 ฐานนิยมคือ 5 3 , 5 , 6 , 2 , 5 , 3 , 5 , 3 ฐานนิยมคือ 3 และ 5 3 , 5 , 6 , 2 , 5 , 3 , 2 , 1 ฐานนิยมคือ 2 , 3 และ 5 ชุดของข้อมูลบางชุดอาจจะไม่มีฐานนิยมเช่น 1 , 3 , 2 , 5 , 6 , 9 , 8
ข้อมูลที่มีการแจงแจงความถี่ข้อมูลที่มีการแจงแจงความถี่ • สามารถหาค่าฐานนิยมได้จากสูตรดังต่อไปนี้ กำหนดให้ Mo = ฐานนิยม L = ขีดจำกัดล่างที่แท้จริงของอันตรภาคชั้นที่มีความถี่สูงสุด C = ความกว้างของชั้นที่มีฐานนิยมอยู่ 1 = ผลต่างความถี่ระหว่างชั้น ฐานนิยม กับก่อนชั้น ฐานนิยม 2 = ผลต่างความถี่ระหว่างชั้น ฐานนิยม กับชั้นถัดจากชั้น ฐานนิยม
ตัวอย่างที่ 8 จงหาฐานนิยมของข้อมูลต่อไปนี้ 3 6 9 6 1 4 6 7 ฐานนิยม คือ 6 12 34 67 12 14 34 18 ฐานนิยม คือ 12 และ 34 0 4 1 2 8 5 7 ฐานนิยม ไม่มี
ตัวอย่างที่ 9 จงหาฐานนิยมของข้อมูลต่อไปนี้
ตัวอย่างที่ 10 จากข้อมูลค่าใช้จ่ายต่อวัน (บาท/วัน) ของนักศึกษา 7 คน เป็นดังนี้ 40 35 20 40 25 40 จงหาค่าเฉลี่ย มัธยฐาน ฐานนิยม วิธีทำ เรียงลำดับข้อมูลได้ดังนี้ 20 25 30 35 40 40 40 ตำแหน่งของมัธยฐาน = มัธยฐาน มีค่าเท่ากับ 35 ฐานนิยม คือ ข้อมูลที่มีจำนวนซ้ำกันมากที่สุด ได้แก่ 40
การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง • ความสัมพันธ์ของค่าเฉลี่ย มัธยฐาน และฐานนิยม ในกรณีที่การแจกแจงของข้อมูลไม่สมมาตรกัน สามารถประมาณความสัมพันธ์ของ Mean , Median , Mode ได้เป็นสมการ คือ Mean – Mode = 3(Mean – Median) หรือ Mode = 3Median – 2Mean
ตัวอย่างที่ 11 จากข้อมูลเกรดเฉลี่ยของนักศึกษา 65 คน คำนวณค่าเฉลี่ยและมัธยฐานได้ 2.38 และ 2.50 ตามลำดับ จงหาฐานนิยมของเกรดเฉลี่ยของนักศึกษา 65 คน Mode = 3 Median – 2 Mean = 3(2.50) – 2 (2.38) = 7.50 – 4.76 = 2.74
การวัดตำแหน่งของข้อมูลการวัดตำแหน่งของข้อมูล • ควอไทล์ (Quartiles)คือ ค่าของข้อมูลที่เกิดจากการแบ่งข้อมูลออกเป็น 4 ส่วนเท่าๆกัน เพราะฉะนั้นค่าควอไทล์จะมี 3 ค่า คือ Q1 , Q2 , Q3 • เดไซล์ (Deciles)คือ ค่าของข้อมูลที่เกิดจากการแบ่งข้อมูลออกเป็น 10 ส่วนเท่าๆกัน เพราะฉะนั้นค่าเดไซล์ จะมี 9 ค่า คือ D1 , D2 , D3 , ……., D9 • เปอร์เซนต์ไทล์ (Percentiles)คือ ค่าของข้อมูลที่เกิดจากการแบ่งข้อมูลออกเป็น 100 เท่าๆกัน เพราะฉะนั้นค่าเปอร์เซนต์ไทล์จะมี 99 ค่า คือ P1 , P2 , P3 , ……., P9
ข้อมูลที่ไม่ได้แจกแจงความถี่ข้อมูลที่ไม่ได้แจกแจงความถี่ • การจัดเรียงลำดับข้อมูล • หาตำแหน่ง Qr = หาตำแหน่ง Dr = หาตำแหน่ง Pr = • นำตำแหน่งที่ได้ไปตรวจว่าตรงกับข้อมูลที่เรียงลำดับไว้ตัวใด ค่านั้นก็คือค่าที่ต้องการ หากตำแหน่งที่ต้องการอยู่ระหว่างข้อมูลสองตัว จะทำการเทียบบัญญัติไตรยางศ์เพื่อหาค่าที่ต้องการ
ตัวอย่างที่ 12 จงหา Q1 , D6 , P70 ของข้อมูลต่อไปนี้ 15 78 63 54 27 34 46 83 92 69 วิธีทำ จัดเรียงลำดับข้อมูลจากน้อยไปหามาก ได้ดังนี้ 15 27 34 46 54 63 69 78 83 92 ตำแหน่ง Q1 = =
ข้อมูลที่มีการแจกแจงความถี่ข้อมูลที่มีการแจกแจงความถี่ ตำแหน่ง Qr = ตำแหน่ง Dr = ตำแหน่ง Pr = N เป็นจำนวนข้อมูลทั้งหมด fi เป็นความถี่ของชั้นที่มี Qr , Dr , Pr L เป็นขีดจำกัดล่างที่แท้จริงของชั้นที่มี Qr , Dr , Pr เป็นความถี่สะสมของชั้นต่ำกว่าชั้นที่มี Qr , Dr , Pr 1 ชั้น c เป็นอันตรภาคชั้น
ตัวอย่างที่ 13 จากตารางแจกแจงความถี่คะแนนสอบวิชาคอมพิวเตอร์เบื้องต้นของนักศึกษา 120 คนที่กำหนดให้ จงคำนวณหา • ควอไทล์ที่ 2 • เดไซล์ที่ 7 • คะแนนสูงสุดของกลุ่มผู้ได้คะแนนต่ำสุดซึ่งมี 20 เปอร์เซนต์ของนักศึกษาทั้งหมด
การวัดการกระจาย(Measures of Dispersion) • พิสัย (Range ; R) ก. ข้อมูลที่ไม่ได้แจกแจงความถี่ พิสัย = ค่าสูงสุดของข้อมูล – ค่าต่ำสุดของข้อมูล ข. ข้อมูลที่มีการแจกแจงความถี่ พิสัย = ขอบเขตชั้นบนของชั้นสูงสุด – ขอบเขตชั้นล่างของชั้นต่ำสุด * แต่กรณีที่ตารางแจกแจงความถี่เป็นลักษณะเป็นแบบอันตรภาคชั้นเปิด จะไม่สามารถหาค่าพิสัยได้
ตัวอย่างที่ 14 จงหาพิสัยของข้อมูลต่อไปนี้ 70 , 62 , 34 , 82 , 61 , 89 วิธีทำ ข้อมูลสูงสุด = 89 ข้อมูลต่ำสุด = 34 พิสัย = 89 – 34 = 55
ตัวอย่างที่ 15 จงวัดการกระจายของข้อมูลจากตารางแจกแจงความถี่ต่อไปนี้โดยใช้พิสัย วิธีทำขีดจำกัดบนที่แท้จริงของชั้นสูงสุด = 79.5 ขีดจำกัดล่างที่แท้จริงของชั้นต่ำสุด = 39.5 พิสัย = 79.5 – 39.5 = 40.0
การวัดการกระจาย(Measures of Dispersion) • ส่วนเบี่ยงเบนควอไทล์ (Quartile Deviation : QD)
ตัวอย่างที่ 16 จงหาส่วนเบี่ยงเบนควอไทล์ของข้อมูลต่อไปนี้ 10 12 15 18 23 29 42 50 59 60 62 70 76 85 90 วิธีทำตำแหน่ง Q1 = Q1 = 18 ตำแหน่ง Q3 = Q3 = 18
ตัวอย่างที่ 17 จากตารางแจกแจงความถี่ข้อมูล น้ำหนักของนักศึกษา 100 คน จงวัดการกระจายของข้อมูลโดยวิธีส่วนเบี่ยงเบนควอไทล์
การวัดการกระจาย(Measures of Dispersion) • ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation ; MD) ก. ข้อมูลที่ไม่ได้แจกแจงความถี่ ถ้า Xiแทนข้อมูลแต่ละค่า จำนวน n ตัว ค่า เรียกว่าค่าสัมบูรณ์ (absolute value) ของความแตกต่างของข้อมูลตัวที่ i กับตัวกลางเลขคณิต
ตัวอย่างที่ 18 (ข้อมูลที่ไม่ได้แจกแจงความถี่) จงหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูลต่อไปนี้ 9 3 8 8 9 8 9 18 วิธีทำ
การวัดการกระจาย(Measures of Dispersion) • ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation ; MD) ข. ข้อมูลที่ได้มีการแจกแจงความถี่ จากตารางแจกแจงความถี่ข้อมูล จำนวน k ชั้น X1 , X2 , X3 , ……..,Xkแทนค่ากลางของข้อมูลในแต่ละ f 1 , f2 , f3 , ……..,fkแทนความถี่ของข้อมูลในแต่ละชั้น ตามลำดับ
ตัวอย่างที่ 19 (ข้อมูลที่ได้มีการแจกแจงความถี่) จากตารางแจกแจงความถี่ จงหาส่วนเบี่ยงเบนเฉลี่ยของข้อมูล f
ตัวอย่างที่ 19 (ต่อ) วิธีทำ
การวัดการกระจาย (Measures of Dispersion) • ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ก. ข้อมูลที่ไม่ได้แจกแจงความถี่ ถ้า Xiแทนข้อมูลแต่ละค่า จำนวน n ตัว ส่วนเบี่ยงเบนมาตรฐาน
การวัดการกระจาย (Measures of Dispersion) • ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ข. ข้อมูลที่ได้มีการแจกแจงความถี่ จากตารางแจกแจงความถี่ข้อมูล จำนวน k ชั้น X1 , X2 , X3 , ……..,Xkแทนค่ากลางของข้อมูลในแต่ละ f 1 , f2 , f3 , ……..,fkแทนความถี่ของข้อมูลในแต่ละชั้น ตามลำดับ ส่วนเบี่ยงเบนมาตรฐาน
ตัวอย่างที่ 20 จากข้อมูลต่อไปนี้ จงหาส่วนเบี่ยงเบนมาตรฐาน 9 3 8 8 9 8 9 18 วิธีทำ
ตัวอย่างที่ 21 จากตารางแจกแจงความถี่ จงคำนวณค่าความแปรปรวนของข้อมูล
การเปรียบเทียบการกระจายของข้อมูลการเปรียบเทียบการกระจายของข้อมูล • สัมประสิทธิ์ของพิสัย เมื่อ แทนคะแนนสูงสุดในข้อมูลชุดนั้น แทนคะแนนต่ำสุดในข้อมูลชุดนั้น สัมประสิทธิ์ของพิสัย =
การเปรียบเทียบการกระจายของข้อมูลการเปรียบเทียบการกระจายของข้อมูล • สัมประสิทธิ์ของส่วนเบี่ยงเบนควอไทล์ เมื่อ คือควอไทล์ที่ 1 และ 3 ตามลำดับ สัมประสิทธิ์ของส่วนเบี่ยงเบนควอไทล์ =
การเปรียบเทียบการกระจายของข้อมูลการเปรียบเทียบการกระจายของข้อมูล • สัมประสิทธิ์ของส่วนเบี่ยงเบนเฉลี่ย เมื่อ M.D. แทน ส่วนเบี่ยงเบนเฉลี่ยของข้อมูล แทน ค่าเฉลี่ยเลขคณิตของข้อมูล สัมประสิทธิ์ของส่วนเบี่ยงเบนเฉลี่ย =
การเปรียบเทียบการกระจายของข้อมูลการเปรียบเทียบการกระจายของข้อมูล • สัมประสิทธิ์ของการแปรผัน หรือ สัมประสิทธิ์ของส่วนเบี่ยงเบนมาตรฐาน เมื่อ แทน ส่วนเบี่ยงเบนมาตรฐานของข้อมูล แทน ค่าเฉลี่ยเลขคณิตของข้อมูล สัมประสิทธิ์ของการแปรผัน =
ตัวอย่างที่ 22 จากข้อมูลต่อไปนี้ 10 12 15 18 23 29 42 50 59 60 62 70 76 85 90 จงคำนวณสัมประสิทธิ์ของการกระจาย โดย ก. พิสัย ข. ส่วนเบี่ยงเบนควอไทล์