1 / 121

การวิเคราะห์ข้อมูล (Data Analysis)

การวิเคราะห์ข้อมูล (Data Analysis). การวิเคราะห์ข้อมูลเชิงปริมาณ : 1. การเตรียมข้อมูล (Data Preparation) 2. การนำเสนอข้อมูล (Data Presentation) 3. การวิเคราะห์ข้อมูล (Data Analysis). สถิติเชิงบรรยายหรือเชิงพรรณนา ( Descriptive Statistics).

eliot
Download Presentation

การวิเคราะห์ข้อมูล (Data Analysis)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การวิเคราะห์ข้อมูล (Data Analysis) การวิเคราะห์ข้อมูลเชิงปริมาณ: 1. การเตรียมข้อมูล (Data Preparation) 2. การนำเสนอข้อมูล (Data Presentation) 3. การวิเคราะห์ข้อมูล (Data Analysis)

  2. สถิติเชิงบรรยายหรือเชิงพรรณนา (Descriptive Statistics) เป็นการอธิบายหรือบรรยายลักษณะของข้อมูลที่เก็บรวบรวม แต่จะไม่สามารถอ้างอิงถึงลักษณะประชากรได้ เช่น 1. การแจกแจงความถี่ 2. การวัดแนวโน้มเข้าสู่ส่วนกลาง 3. การจัดตำแหน่งเปรียบเทียบ 4. การวัดการกระจาย 5. การวัดลักษณะของเส้นโค้งความถี่ของข้อมูล 6. การวัดความสัมพันธ์ 7. การวัดการถดถอย

  3. การแจกแจงความถี่ (Frequency Distribution) • เป็นการจัดกลุ่มของข้อมูลที่เก็บรวบรวมมาได้ให้อยู่เป็นชุดเดียวกันตามค่าของตัวแปร เพื่อให้เห็นภาพรวมของข้อมูลทั้งชุด เป็นการจัดเพื่อให้เกิดเป็นสารสนเทศที่เป็นประโยชน์ต่อการตัดสินใจ • การแจกแจงความถี่จะทำคู่กับร้อยละ เป็นการเปรียบเทียบตัวเลขจำนวนหนึ่งกับตัวเลขอีกจำนวนหนึ่งที่เทียบส่วนเป็น100 ดังนั้นในการคำนวณหาค่าร้อยละจึงใช้ตัวเลขที่เราต้องการเปรียบเทียบหารด้วยจำนวนเต็มของสิ่งนั้น แล้วคูณด้วย 100

  4. การแจกแจงความถี่ (Frequency Distribution) เพื่อจัดระเบียบข้อมูลใหม่ โดยหาความถี่ที่ข้อมูลซ้ำๆ กันจำแนกเป็น 1. แบบเรียงคะแนนแต่ละจำนวน (ไม่จัดกลุ่ม) โดยการเรียงคะแนนจากน้อย-มาก หรือมาก-น้อย โดยการทำรอยขีด (Tally) แล้วแจกแจงความถี่ วิธีนี้เหมาะสำหรับคะแนนสูง-ต่ำ ที่ไม่ห่างกันมาก 2. แบบเรียงคะแนนเป็นกลุ่ม (จัดกลุ่ม) เหมาะสำหรับคะแนนสูง-ต่ำที่ห่างกันมาก โดยต้องหาพิสัย (Range) ก่อน หลังจากนั้นจึงหาความกว้างแต่ละชั้น (Interval) แล้วจึงแจกแจงความถี่ กรณีโจทย์ไม่ระบุจำนวนชั้น ให้หาจำนวนชั้นจากสูตร k=1+3.3logN โดย N คือจำนวนตัวอย่าง

  5. การแจกแจงความถี่ (Frequency Distribution)

  6. การแจกแจงความถี่ (Frequency Distribution)

  7. ตัวอย่างที่ 1 • จากการเก็บค่าน้ำหนักตัวของผู้ที่เข้ามารับการรักษาตัวที่โรงพยาบาลจิตเวช สงขลา เดือนเมษายน พ.ศ. 2551 มีดังต่อไปนี้ 70 57 66 46 45 58 66 55 56 49 46 64 78 52 69 48 79 55 44 52 73 54 64 49 71 46 48 56 66 65 65 58 43 57 63 76 53 48 82 64 75 78 62 55 61 57 44 53 59 64 จงแจกแจงความถี่แบบไม่จัดเป็นกลุ่ม 1. พิจารณาจากค่าคะแนนสูงสุดและคะแนนต่ำสุด คะแนนสูงสุดคือ 82 คะแนนต่ำสุดคือ 43 2. สร้างตารางบรรจุค่าสูงสุดไปหาค่าต่ำสุด แล้วหาความถี่

  8. ตัวอย่างที่ 2 • จากการเก็บค่าอายุของผู้ที่เข้ามารับการรักษาตัวที่โรงพยาบาลจิตเวช สงขลาประจำปี พ .ศ. 2551 มีดังต่อไปนี้ 20 17 36 16 45 18 26 15 56 19 46 14 18 32 19 18 21 25 42 32 12 24 14 19 71 21 28 56 26 15 65 18 43 17 13 71 23 40 18 34 25 18 22 55 21 17 43 33 19 14 จงสร้างตารางแจกแจงความถี่และหาค่าของพิสัย จำนวนชั้น ความกว้างชั้น ขีดจำกัดชั้น ขอบเขตชั้น จุดกึ่งกลางชั้น ความถี่สะสม ความถี่สัมพัทธ์ และความถี่สะสมสัมพัทธ์

  9. วิธีทำ 1. พิสัย = ค่าสูงสุด – ค่าต่ำสุด = 71-12 = 59 2. จำนวนชั้น = k = 1 + 3.3logN = 1+3.3log50 = 1+ 3.3(1.69897) = 1+ 5.606601 = 6.606601 ~7 3. ความกว้างของชั้น = พิสัย/จำนวนชั้น = 59/7 ~9

  10. การนำเสนอผลการแจกแจงความถี่การนำเสนอผลการแจกแจงความถี่ • การนำเสนอด้วยคำบรรยาย เช่น ข้อมูลทั่วไปของประชาชนที่อยู่ในกทม. เป็นเพศหญิงร้อยละ 75 เพศชายร้อยละ 25 มีระดับการศึกษาปริญญาตรี ร้อยละ 75 ปริญญาโทร้อยละ 25 • การนำเสนอด้วยตารางแจกแจงความถี่ • ตารางแจกแจงความถี่ทางเดียว - เป็นการแจกแจงความถี่ของข้อมูลในตัวแปร 1 ตัว นิยมนำเสนอคู่กับร้อยละ • ตารางแจกแจงความถี่สองทาง - เป็นการแจกแจงความถี่ของข้อมูลจากตัวแปร 2 ตัวในคราวเดียวกัน เพื่อทำให้เห็นความแตกต่างระหว่างกลุ่มชัดเจนขึ้น และยังสามารถพิจารณาความสัมพันธ์ในเบื้องต้นระหว่างตัวแปรทั้งสอง • ตารางแจกแจงความถี่สามทาง - เป็นการแจกแจงความถี่ของข้อมูลจากตัวแปร 3 ตัวในคราวเดียวกัน

  11. ตัวอย่างตารางแจกแจงความถี่ทางเดียวตัวอย่างตารางแจกแจงความถี่ทางเดียว

  12. ตัวอย่างตารางแจกแจงความถี่สองทาง (2 ตัวแปร)

  13. ตัวอย่างตารางแจกแจงความถี่สามทาง (3 ตัวแปร)

  14. การนำเสนอผลการแจกแจงความถี่การนำเสนอผลการแจกแจงความถี่ • การนำเสนอด้วยฮิตโตแกรม • การนำเสนอด้วยรูปหลายเหลี่ยมความถี่ • การนำเสนอด้วยโค้งความถี่

  15. การนำเสนอด้วยฮิตโตแกรมการนำเสนอด้วยฮิตโตแกรม

  16. การนำเสนอด้วยรูปหลายเหลี่ยมความถี่การนำเสนอด้วยรูปหลายเหลี่ยมความถี่

  17. การนำเสนอด้วยโค้งแห่งความถี่การนำเสนอด้วยโค้งแห่งความถี่

  18. สถิติเชิงบรรยายหรือเชิงพรรณนา (Descriptive Statistics) เป็นการอธิบายหรือบรรยายลักษณะของข้อมูลที่เก็บรวบรวม แต่จะไม่สามารถอ้างอิงถึงลักษณะประชากรได้ เช่น 1. การแจกแจงความถี่ 2. การวัดแนวโน้มเข้าสู่ส่วนกลาง 3. การจัดตำแหน่งเปรียบเทียบ 4. การวัดการกระจาย 5. การวัดลักษณะของเส้นโค้งความถี่ของข้อมูล 6. การวัดความสัมพันธ์ 7. การวัดการถดถอย

  19. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง 1. ตัวกลางเลขคณิตหรือค่าเฉลี่ย (Arithmetic Mean) 2. มัธยฐาน (Median) 3. ฐานนิยม (Mode)

  20. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง 1. ตัวกลางเลขคณิตหรือค่าเฉลี่ย (Arithmetic Mean) • เป็นค่าแนวโน้มเข้าสู่ส่วนกลางซึ่งถือว่าดีที่สุด เพราะเป็นค่าที่คำนวณได้จากการรวมคะแนนทั้งหมดของข้อมูลที่สนใจเข้าไว้ด้วยกัน แล้วจึงหารด้วยจำนวนข้อมูล โดยปกติมักนิยมเรียกว่า ค่าเฉลี่ย

  21. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง 1. ตัวกลางเลขคณิตหรือค่าเฉลี่ย (Arithmetic Mean) • คุณสมบัติของตัวกลางเลขคณิต • การเปลี่ยนแปลงของคะแนนค่าใดค่าหนึ่ง ย่อมมีผลทำให้ค่าเฉลี่ยเปลี่ยนแปลงตามไปด้วย • ถ้านำค่าคงที่บวกหรือลบกับทุก ๆ ค่าของข้อมูลแต่ละตัว ค่าเฉลี่ยจะเพิ่มขึ้นหรือลดลงเท่ากับค่าคงที่นั้น • ถ้านำค่าคงที่ไปคูณหรือหารกับทุก ๆ ค่าของข้อมูล ค่าเฉลี่ยก็จะเพิ่มขึ้นหรือลดลงเท่ากับจำนวนค่าคงที่ที่นำไปคูณหรือหารนั้น • ผลบวกของผลต่างที่แต่ละข้อมูลต่างไปจากค่าเฉลี่ย จะมีค่าเป็น 0 เสมอ

  22. ตัวอย่าง

  23. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง 2. มัธยฐาน (Median) • คือ ค่าของข้อมูลที่อยู่ ณ ตำแหน่งกึ่งกลางของข้อมูลชุดหนึ่ง ซึ่งได้มีการจัดเรียงลำดับข้อมูลแล้ว นั้นคือค่ามัธยฐานจะแบ่งข้อมูลออกเป็น 2 ส่วนเท่า ๆ กัน • ถ้าชุดข้อมูลมีข้อมูลที่มีความแตกต่างกันมาก เช่น 5, 9, 7, 12, 89 การใช้มัธยฐานเป็นตัวแทนของข้อมูลจะดีกว่าการใช้ค่าเฉลี่ย

  24. ตัวอย่าง • กรณีไม่จัดกลุ่ม เลขคี่ = (N+1) / 2 21 25 20 22 24 • กรณีไม่จัดกลุ่ม เลขคู่ = N/2 และ (N/2) +1 21 252022 2425

  25. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง 3. ฐานนิยม (Mode) • คือ ค่ากลางที่คำนึงถึงการเกิดขึ้นของข้อมูลบ่อยที่สุด • ฐานนิยม มีคุณสมบัติพิเศษที่ตัวกลางแบบอื่น ๆ ไม่มีคือ สามารถหาค่ากลางได้ในกรณีข้อมูลเป็นข้อมูลเชิงคุณภาพ • 22 21 22 23 20 25 • 22 20 9 22 21 20 21 24 25 21 22 5

  26. การวัดแนวโน้มเข้าสู่ส่วนกลางการวัดแนวโน้มเข้าสู่ส่วนกลาง การพิจารณาเลือกใช้ค่าเฉลี่ย มัธยฐาน ฐานนิยม • ค่าเฉลี่ย เหมาะสำหรับการคำนวณขั้นสูงต่อไป • ถ้าข้อมูลมีบางค่าที่มีค่าสูงหรือต่ำกว่าคะแนนอื่น ๆ มาก ๆ การหาค่ามัธยฐาน หรือ ฐานนิยมจะเหมาะสมกว่าค่าเฉลี่ย • ลักษณะของข้อมูลเชิงคุณภาพ (มาตรวัด Nominal or Ordinal Scale) ควรใช้ฐานนิยมเป็นค่ากลางของข้อมูล

  27. สถิติเชิงบรรยายหรือเชิงพรรณนา (Descriptive Statistics) เป็นการอธิบายหรือบรรยายลักษณะของข้อมูลที่เก็บรวบรวม แต่จะไม่สามารถอ้างอิงถึงลักษณะประชากรได้ เช่น 1. การแจกแจงความถี่ 2. การวัดแนวโน้มเข้าสู่ส่วนกลาง 3. การจัดตำแหน่งเปรียบเทียบ 4. การวัดการกระจาย 5. การวัดลักษณะของเส้นโค้งความถี่ของข้อมูล 6. การวัดความสัมพันธ์ 7. การวัดการถดถอย

  28. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 1. เปอร์เซ็นต์ไทล์ (Percentile) 2. ควอไทล์ (Quartile) 3. เดไซล์ (Decile)

  29. Quartile vs. Decile vs. Percentile

  30. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 1. เปอร์เซ็นต์ไทล์ (Percentile) • ค่าเปอร์เซ็นต์ไทล์ (P)หมายถึง ค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า อยู่ P% และมีจำนวนข้อมูลที่มีค่ามากกว่าอยู่ (100-P) % • ตำแหน่งเปอร์เซ็นต์ไทล์ (P)หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ P ส่วนในร้อยส่วนที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง P • การหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม มีขั้นตอน ดังนี้ 1. เรียงลำดับข้อมูล n ค่าจากน้อยไปมาก 2. คำนวณหาตำแหน่ง P(n + 1)/100ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดเป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด

  31. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 1. เปอร์เซ็นต์ไทล์ (Percentile) • ตัวอย่าง จงหาเปอร์เซ็นต์ไทล์ที่ 68 ของข้อมูลต่อไปนี้ 6.3 6.6 7.6 3.0 9.5 5.9 6.1 5.0 3.6 เรียงลำดับข้อมูล 9 ค่าจากน้อยไปมาก ดังนี้ 3.0 3.6 5.0 5.9 6.1 6.3 6.6 7.6 9.5 คำนวณหาตำแหน่ง 68(9 + 1)/100 = 6.8  7 ค่าเปอร์เซ็นต์ไทล์ที่ 68 ของข้อมูล = 6.6 ค่ามัธยฐาน ที่ตำแหน่ง? มีค่า?

  32. ตัวอย่างเปอร์เซ็นต์ไทล์ตัวอย่างเปอร์เซ็นต์ไทล์

  33. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 1. เปอร์เซ็นต์ไทล์ (Percentile) การหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่แจกแจงความถี่ มีสูตรในการคำนวณ ดังนี้ เมื่อ L= ขีดจำกัดล่างของอันตรภาคชั้นที่มี Pr อยู่ I= ความกว้างของอันตรภาคชั้น r= ตำแหน่งเปอร์เซ็นต์ไทล์ที่ต้องการหา n = จำนวนข้อมูลทั้งหมด fi = ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L fr = ความถี่ของชั้น L • ก่อนที่จำนำสูตรนี้ไปหาจะต้องทราบก่อนว่า Pr ควรจะอยู่อันตรภาคชั้นใด โดยเปรียบเทียบค่า (n x r)/100 กับความถี่สะสม

  34. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 1. เปอร์เซ็นต์ไทล์ (Percentile) ตัวอย่าง การคำนวณหาเปอร์เซ็นต์ไทล์สำหรับข้อมูลที่แจกแจงความถี่จงหาเปอร์เซ็นต์ไทล์ที่ 20และ 80ของข้อมูลความสูงของนักเรียนที่กำหนดไว้ในตารางแจกแจงความถี่ ดังนี้ • จากความถี่สะสมชั้นที่ 2 มี f = 23 ดังนั้น เปอร์เซ็นต์ไทล์ที่ 20 จะอยู่ในชั้นที่ 2  • เปอร์เซ็นต์ไทล์ที่ 20 ได้ L = 144.5 I = 10 r = 20 n = 100 fi = 5 fr = 18  P20 = 152.83

  35. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 2. ควอไทล์ (Quartile) • ควอไทล์เป็นการแบ่งข้อมูลออกเป็น 4 ส่วนเท่า ๆ กัน ส่วนละ 25% โดยเรียงลำดับข้อมูลจากน้อยไปมาก ดังนั้น • ค่าควอไทล์1(Q1) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q1อยู่ 25% • ค่าควอไทล์2(Q2) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q2อยู่ 50% และมีจำนวนข้อมูลที่มีค่ามากกว่า Q2อยู่ 50% • ค่าควอไทล์3(Q3) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่าต่ำกว่า Q3อยู่ 75 % และมีจำนวนข้อมูลที่มีค่ามากกว่า Q3อยู่ 25% • ค่าควอไทล์ 4 (Q4) หมายถึงค่าของข้อมูลที่มีจำนวนข้อมูลที่มีค่ามากกว่า Q3 อยู่ 25% • ตำแหน่งควอไทล์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ X ส่วนในสี่ส่วนที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง X

  36. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 2. ควอไทล์ (Quartile) • การคำนวณหาควอไทล์สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม 1. เรียงลำดับข้อมูล nค่า จากน้อยไปหามาก 2. สำหรับการคำนวณหาค่า Q1 ให้คำนวณ (n+1)/4 ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดให้เป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด ส่วนการหาค่า Q3ให้คำนวณหา 3 (n+1)/4 และปัดให้เป็นเลขจำนวนเต็มที่ใกล้เคียงมากที่สุด 3. สูตร Q(n+1)/4

  37. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 2. ควอไทล์ (Quartile) สำหรับการหาควอไทล์ สำหรับข้อมูลที่แจกแจงความถี่ มีสูตรในการคำนวณ ดังนี้ เมื่อ L= ขีดจำกัดล่างของอันตรภาคชั้นที่มี QK อยู่ I= ความกว้างของอันตรภาคชั้น k= ตำแหน่งควอไทล์ที่ต้องการหา n = จำนวนข้อมูลทั้งหมด fi = ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L fk = ความถี่ของชั้น L พิสัยควอไทล์ คือความแตกต่างระหว่างควอไทล์บน (Q3)และควอไทล์ล่าง (Q1)

  38. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 2. ควอไทล์ (Quartile) ตัวอย่าง จงหาควอไทล์บน (Q3) ค่ามัธยฐาน และควอไทล์ล่าง (Q1) ของคะแนนเฉลี่ยวิชาภาษาไทยของนักเรียน 22 คน ดังนี้ 45 50 65 23 55 48 78 89 96 85 74 42 45 75 78 41 56 66 77 88 95 78 เนื่องจาก n = 22 คน เรียงข้อมูลจากน้อยไปมากได้ดังนี้ 23 41 42 45 45 48 50 55 56 65 66 74 75 77 78 78 78 85 88 89 95 96 การหาQ3 คำนวณหาค่า 3 (n+1)/4 = 17.25 ปัดเป็น 17 ดังนั้นค่าควอไทล์บนจะเป็นค่าของข้อมูลตัวที่ 17 ที่เรียงลำดับไว้แล้ว คือ 78

  39. ตัวอย่างควอไทล์

  40. ตัวอย่างควอไทล์

  41. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 3. เดไซล์(Decile) • เป็นการแบ่งข้อมูลอออกเป็น 10 ส่วนเท่าๆกัน มีจำนวน 9 ค่า คือ D, D2, …, D9 โดยที่ k = 1 ,2, 3, … 9 • ตำแหน่งเดไซล์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่ X ส่วนในสิบส่วนที่มีค่าของข้อมูลต่ำกว่าค่าของข้อมูล ณ ตำแหน่ง X • การคำนวณหาเดไซล์ สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม 1. เรียงลำดับข้อมูล n ค่า จากน้อยไปหามาก 2. สำหรับการคำนวณหาค่า Dk ให้คำนวณ k(n+1)/10 ถ้าผลลัพธ์เป็นเลขไม่ลงตัวให้ปัดให้เป็นเลขจำนวนเต็มที่มีค่าใกล้เคียงมากที่สุด

  42. การจัดตำแหน่งเปรียบเทียบการจัดตำแหน่งเปรียบเทียบ 3. เดไซล์(Decile) ส่วนการหา Dkสำหรับข้อมูลที่แจกแจงความถี่ มีสูตรในการคำนวณ ดังนี้ เมื่อ L = ขีดจำกัดล่างของอันตรภาคชั้นที่มี Dkอยู่ I = ความกว้างของอันตรภาคชั้น k = ตำแหน่งเดไทล์ที่ต้องการหา n = จำนวนข้อมูลทั้งหมด fi = ความถี่สะสมของอันตรภาคชั้นที่ต่ำกว่า L fk = ความถี่ของชั้น L

  43. ตัวอย่างเดไซล์

  44. ตัวอย่างเดไซล์

  45. สถิติเชิงบรรยายหรือเชิงพรรณนา (Descriptive Statistics) เป็นการอธิบายหรือบรรยายลักษณะของข้อมูลที่เก็บรวบรวม แต่จะไม่สามารถอ้างอิงถึงลักษณะประชากรได้ เช่น 1. การแจกแจงความถี่ 2. การวัดแนวโน้มเข้าสู่ส่วนกลาง 3. การจัดตำแหน่งเปรียบเทียบ 4. การวัดการกระจาย 5. การวัดลักษณะของเส้นโค้งความถี่ของข้อมูล 6. การวัดความสัมพันธ์ 7. การวัดการถดถอย

  46. การวัดการกระจาย • การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการคำนวณหาตัวแทนของชุดข้อมูล แต่ไม่ได้พิจารณาถึงลักษณะของการเกิดขึ้นของข้อมูลว่าข้อมูลที่เกิดขึ้นนั้นมีการกระจัดกระจายมากน้อยเพียงใด หรือว่าข้อมูลที่เกิดขึ้นมีค่าใกล้เคียงไล่เลี่ยกันหรือเกาะกลุ่มมากน้อยเพียงใด

  47. การวัดการกระจาย • เช่น ลองพิจารณาข้อมูล 2 ชุดนี้ • ชุดที่ 1 160, 55, 80, 355, 200, 170 มีค่าเฉลี่ยเลขคณิต = 170 • ชุดที่ 2 157, 151, 170, 175, 170, 197 มีค่าเฉลี่ยเลขคณิต = 170 • จะเห็นได้ว่าข้อมูลทั้ง 2 ชุด มีค่าเฉลี่ยเลขคณิตเท่ากัน คือ 170 แต่การเกิดขึ้นของข้อมูลแต่ละชุดแตกต่างกัน กล่าวคือ ข้อมูลชุดที่ 1 มีค่าของข้อมูลกระจัดกระจายแตกต่างกันมาก แต่ข้อมูลชุดที่ 2 การเกิดขึ้นของข้อมูลมีค่าใกล้เคียงหรือเกาะกลุ่มกัน

  48. การวัดการกระจาย 1. พิสัย (Range) 2. พิสัยระหว่างควอไทล์ (Interquartile Range) 3. ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) 4. ค่าแปรปรวน (Variance)

  49. การวัดการกระจาย 1. พิสัย (Range) • การวัดการกระจายโดยหาค่าพิสัยคำนวณได้จากผลต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุด วิธีการวัดการกระจายโดยใช้พิสัย เป็นวิธีคำนวณได้ง่ายและรวดเร็วที่สุด

More Related