1 / 120

การวิเคราะห์ข้อมูลโดยใช้ สถิติอ้างอิง

การวิเคราะห์ข้อมูลโดยใช้ สถิติอ้างอิง. รศ.อดิศักดิ์ พงษ์พูลผลศักดิ์ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี. การประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน. การประมาณค่าจากการสุ่มอย่างง่าย (Simple Random Sampling) การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ (Systematic Sampling)

Download Presentation

การวิเคราะห์ข้อมูลโดยใช้ สถิติอ้างอิง

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การวิเคราะห์ข้อมูลโดยใช้สถิติอ้างอิงการวิเคราะห์ข้อมูลโดยใช้สถิติอ้างอิง รศ.อดิศักดิ์ พงษ์พูลผลศักดิ์ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี

  2. การประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐานการประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน • การประมาณค่าจากการสุ่มอย่างง่าย (Simple Random Sampling) • การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ(Systematic Sampling) • การประมาณค่าจากการเลือกตัวอย่างสุ่มแบบแบ่งพวก (Stratified Random Sampling) • การประมาณค่าจากการเลือกตัวอย่างแบบกลุ่ม

  3. การประมาณค่าจากการสุ่มอย่างง่ายการประมาณค่าจากการสุ่มอย่างง่าย • จากประชากรขนาด N ที่มีลักษณะคล้ายคลึงกันหรือเหมือนกัน ถ้าเลือกสุ่มตัวอย่างขนาด n โดยวิธีสุ่มตัวอย่างอย่างง่าย เราจะได้ชุดตัวอย่างที่เป็นทั้งหมด ชุด และในการใช้ ชุดตัวอย่างจะเลือกใช้เพียงชุดเดียว ทำให้ได้โอกาสที่จะเลือกใช้แต่ละชุด จะมีโอกาสเป็น • การเลือกตัวอย่างโดยวิธีนี้ประเด็นสำคัญคือลักษณะประชากรจะต้องมีความคล้ายคลึงกันหรือเหมือนกันมากที่สุด จึงจะประมาณค่าประชากรได้ถูกต้องแม่นยำ ทั้งนี้ในการประมาณค่าพารามิเตอร์จะคำนวณค่าประมาณต่างๆมาจากการให้โอกาสของการถูกเลือกของหน่วยตัวอย่างมาด้วยโอกาสเท่าๆกัน และก่อนที่จะกล่าวถึงค่าประมาณต่างๆ ในขั้นต้นจะกล่าวถึงสัญลักษณ์ของค่าพารามิเตอร์และค่าประมาณพารามิเตอร์ที่ได้จากการสุ่มตัวอย่าง ดังนี้

  4. การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) ตารางที่ 5.1แสดง ความหมายสัญลักษณ์ของค่าพารามิเตอร์และค่าประมาณพารามิเตอร์ที่ได้จากการสุ่มตัวอย่าง

  5. การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) • ในการเลือกตัวอย่างสุ่มอย่าง่าย(SRS) ขนาด n จากประชากรขนาด N ค่าประชากรที่เราสนใจอาจเป็นค่ารวม ค่าเฉลี่ย อัตราส่วน หรือสัดส่วน ตัวประมาณค่าพารามิเตอร์ ในตารางที่ 5.2 จะมี คุณสมบัติของตัวประมาณค่าดังนี้ • ต้องเป็นตัวประมาณค่าที่ไม่เอนเอียง • เป็นตัวประมาณที่คงเส้นคงวาในลักษณะที่ว่าถ้าขนาดตัวอย่างn มีขนาดใหญ่เข้าใกล้ประชากรขนาดจะทำให้ตัวประมาณมีค่าเข้าใกล้ค่าพารามิเตอร์ • ตัวประมาณจะมีความแปรปรวนดังตารางที่ 5.2

  6. ตารางที่ 5.2 แสดงค่าเฉลี่ย (Mean) ยอดรวม (Total) และสัดส่วน (Proportion) และความแปรปรวนของค่าเฉลี่ย ความแปรปรวนของยอดรวมความแปรปรวนของค่าสัดส่วน ของประชากรและค่าประมาณพารามิเตอร์

  7. ตารางที่ 5.2 แสดงค่าเฉลี่ย (Mean) ยอดรวม (Total) และสัดส่วน (Proportion) และความแปรปรวนของค่าเฉลี่ย ความแปรปรวนของยอดรวมความแปรปรวนของค่าสัดส่วน ของประชากรและค่าประมาณพารามิเตอร์

  8. การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ) • จากที่กล่าวมาแล้วเป็นการประมาณค่าเฉลี่ยของประชากร แบบจุดจากการสุ่มตัวอย่างอย่างง่ายสำหรับการประมาณแบบช่วงของค่าเฉลี่ยของการสุ่มตัวอย่างอย่างง่ายจะกำหนดดังนี้

  9. การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)

  10. การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)การประมาณค่าจากการสุ่มอย่างง่าย(ต่อ)

  11. ตัวอย่างที่ 5.1 หมู่บ้านแห่งหนึ่งมีครัวเรือนทั้งหมด 4,000 ครัวเรือนสุ่มตัวอย่างอย่างง่ายจากครัวเรือนทั้งหมดมาจำนวน 40 ครัวเรือนสอบถามจำนวนสมาชิกในครัวเรือนที่ไม่มีงานทำได้ผลดังนี้ 3 , 2 , 0 , 1 , 2 2 , 4 , 0 , 0 , 1 3 , 2 , 1 , 1 , 1 2 , 3 , 4 , 0 , 2 2 , 5 , 0 , 1 , 3 0 , 2 , 1 , 2 , 0 0 , 2 , 1 , 1 , 2 1 , 1 , 1 , 2 , 0 ก. จงประมาณค่าเฉลี่ยและความแปรปรวนของจำนวนสมาชิกในครัวเรือนที่ไม่มีงานทำต่อครัวเรือน ข. จงใช้ช่วงความเชื่อมั่น 95% เพื่อกะประมาณค่าเฉลี่ยที่แท้จริง

  12. ตัวอย่างที่ 5.2 สุ่มตัวอย่างบางครัวเรือนมา 30 ครัวเรือน จากในพื้นที่แห่งหนึ่งซึ่งประกอบไปด้วยครัวเรือน 14,848 ครัวเรือน ปรากฏจำนวนบุคคลต่อครัวเรือนเป็นดังนี้ 5 6 3 3 2 2 2 2 4 4 3 2 7 4 3 5 4 4 3 3 4 3 3 1 2 4 3 4 2 4 ตามลำดับจงกะประมาณจำนวนประชากรทั้งหมดในพื้นที่ดังกล่าวและค่าประมาณจะคลาดเคลื่อนไปจากค่าจริงไม่เกิน

  13. นั่นคือคาดว่าจำนวนประชากรจะอยู่ระหว่าง 44200 ถึง 55777 คน ทั้งนี้ การกะประมาณกำหนดให้มีระดับความเชื่อมั่น 90%

  14. ตัวอย่างที่ 5.3 ก.ให้หาค่าประมาณอัตราส่วน(ratio) ของจำนวนนักเรียนต่อจำนวนครูสำหรับโรงเรียนแต่ละประเภทในประชากร ข. หาStandard error ของตัวประมาณในข้อ ก.

  15. ตัวอย่างที่ 5.4 ตัวอย่าง 5.4ในการสำรวจภาวะเศรษฐกิจและสังคมของประชากรในเขตกรุงเทพฯ ซึ่งมุ่งที่จะกะประมาณสัดส่วนของประชากรที่มีอยู่อาศัยเป็นของตนเองจากการสำรวจด้วยตัวอย่างขนาดครัวเรือนพบว่ามีอยู่ 360 ครัวเรือนเท่านั้นที่มีที่อยู่อาศัยเป็นของตัวเอง จงหาค่าประมาณสัดส่วน (หรือ ร้อยละ) ของประชากรในเขตกรุงเทพ ฯที่มีที่อยู่อาศัยเป็นของตัวเอง พร้อมทั้งหาช่วงความเชื่อมั่น 99%

  16. ตัวอย่างที่ 5.5 ในการศึกษาระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3432 โรงงาน ผู้วิจัยได้ทำการสุ่มตัวอย่างโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A มาอย่างง่าย (SRS) จำนวน 338 คน และเก็บรวบรวมข้อมูลตัวอย่างโดยการสัมภาษณ์เจ้าของโรงงานเพื่อสอบถามระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ได้ผลแสดงในแฟ้มข้อมูล SPSS ดังนี้

  17. จงประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐาน พร้อมทั้งแปลผลจากข้อมูลดังกล่าว

  18. วิธีทำ

  19. เนื่องจากเป็นการสุ่มตัวอย่างอย่างง่าย และต้องการสรุปไปถึงประชากรทั้งหมด3,432 โรงงาน ในการประมาณค่าเฉลี่ยและค่าคลาดเคลื่อนมาตรฐานจะใช้ และ ถ้า Nมีขนดโตมากๆและ n มีขนาดน้อย ซึ่งSPSSจะคำนวณด้วย คำสั่ง Mean และ S.E.mean

  20. นำผลที่ได้มาปรับแต่งเพื่อนำเสนอเป็นรายงานวิจัยต่อไป และแปลผลค่าเฉลี่ยให้เป็นระดับความสามารถดังนี้ การกำหนดความหมายของค่าเฉลี่ยความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3,432 โรงงาน 4.50-5.00 หมายถึงระดับความสามารถมากที่สุด 3.50-4.49 หมายถึงระดับความสามารถมาก 2.50-3.49 หมายถึงระดับความสามารถปานกลาง 1.50-2.49 หมายถึงระดับความสามารถน้อย 1.00-1.49 หมายถึงระดับความสามารถน้อยที่สุด

  21. จากการศึกษาความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3432 โรงงานตามความคิดเห็นของหัวหน้างาน พบว่าเฉลี่ยโดยรวม ความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือมีความสามารถอยู่ใน ระดับมาก

  22. เมื่อพิจารณาเป็นรายข้อจะพบว่า • ความสามารถอ่านแบบ เขียนแบบเทคนิคและเลือกใช้วัสดุอุตสาหกรรม เชื่อมโลหะและประกอบขึ้นรูปผลิตภัณฑ์โลหะแผ่นเบื้องต้น ถอด ตรวจสอบและประกอบชิ้นส่วนเครื่องยนต์ ปรับ แปรรูปและขึ้นรูปงานด้วยเครื่องมือกล บำรุงรักษาเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ ถอดประกอบเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ ถอดประกอบคลัตช ์ เกียร์และเพลาขับตามคู่มือ บำรุงรักษาระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือ หัวหน้างานของนักศึกษามีความคิดเห็นว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถอยู่ในระดับมาก และสำหรับความสามารถประกอบ ทดสอบวงจรและ อุปกรณ์ไฟฟ้า อิเล็กทรอนิกส์เบื้องต้น บำรุงรักษาคลัตช์ เกียร์และเพลาขับตามคู่มือ ถอดประกอบระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือ บำรุงรักษา แบตเตอรี่ ระบบสตาร์ท ระบบประจุไฟฟ้า ระบบแสงสว่าง ระบบไฟเตือนและสัญญาณตามคู่มือ ซ่อมเครื่องยนต์แก๊สโซลีนตามคู่มือ ซ่อมเครื่องยนต์ดีเซลตามคู่มือ ซ่อมเครื่องยนต์ดีเซลตามคู่มือ หัวหน้างานของนักศึกษามีความคิดเห็นว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถอยู่ในระดับปานกลาง

  23. ในการแปลผลเนื่องจากเป็นการทำนายโดยการกำหนดเป็นช่วงแล้วนำค่าเฉลี่ยที่คำนวณได้มาพิจารณาว่าตกอยู่ในช่วงใด แล้วแปลผลเป็นระดับ มากที่สุด มาก ปานกลาง น้อย น้อยที่สุด ตามช่วงที่กำหนด มักจะมีคำถามเสมอว่าควรจะกำกับ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย หรือไม่ • คำตอบคือ จะกำกับไว้ก็ได้ก็ไม่ผิดอะไร หรือจะไม่กำกับไว้ความหมายก็ไม่เสียไป แต่เมื่อพิจารณาแล้วจะเขียนได้ความหมายและอ่านแล้วได้ความหมายกว่า การกำกับ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐาน • และในอีกประเด็นหนึ่งที่เป็นคำถามเสมอว่า ทำไมใช้ ค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย ทำไมไม่ใช้ ค่าเฉลี่ย และ ค่าส่วนเบี่ยงเบนมาตรฐาน คำตอบคือ กรณีนี้เป็นการสุ่มตัวอย่างและสรุปผลไปถึงประชากรทั้งหมด จึงใช้การหาค่าเฉลี่ย และ ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นการอ้างอิงถึงประชากร แต่ถ้าสุ่มตัวอย่างเพื่อสรุปถึงตัวอย่างก็จะใช้ ค่าเฉลี่ย และ ค่าส่วนเบี่ยงเบนมาตรฐาน ดังที่แสดงไว้ในบทที่ 4 ซึ่งเป็นสถิติเชิงพรรณนา • และประเด็นสุดท้ายที่เป็นคำถามในการสรุปผลคือ จะถามว่าจะสรุปผลเป็นอย่างอื่นได้หรือไม่ คำตอบคือ ได้เช่นต้องการพิจารณาลำดับความสำคัญก็ควรจะใช้ ค่าสัมประสิทธิ์ความผันแปรในการสรุป ทั้งนี้เนื่องจาก ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยแตกต่างกัน มีค่าไม่เท่ากัน ดังนั้นก่อนการจัดอันดับควรที่จะเปลี่ยนหน่วยให้เป็นหน่วยเดียวกันจึงค่อยจัดอันดับก็จะทำให้ผลถูกต้องขึ้น ดังตารางตัวอย่างข้างล่างนี้

  24. ในการศึกษาลำดับความสามารถระดับคุณภาพฝีมือแรงงานของนักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ ซึ่งมีจำนวนโรงงานอุตสาหกรรมประกอบผลิตภัณฑ์ A ทั้งหมดจำนวน 3,432 โรงงาน ตามความคิดเห็นของหัวหน้างานพบว่านักศึกษาระดับอาชีวะศึกษาในเขตภาคตะวันออกเฉียงเหนือ มีความสามารถปรับ แปรรูปและขึ้นรูปงานด้วยเครื่องมือกล เป็นอันดับแรก รองลงมาอันดับสองคือ มีความสามารถเชื่อมโลหะและประกอบขึ้นรูปผลิตภัณฑ์โลหะแผ่นเบื้องต้น อันดับสามมีความสามารถบำรุงรักษาเครื่องยนต์แก๊สโซลีนและดีเซลตามคู่มือ และความสามารถในสามอันดับสุดท้ายคือ มีความสามารถถอดประกอบระบบรองรับ บังคับเลี้ยวและเบรกตามคู่มือในอันดับ 13 มีความสามารถบำรุงรักษา แบตเตอรี่ ระบบสตาร์ท ระบบประจุไฟฟ้า ระบบแสงสว่าง ระบบไฟเตือนและสัญญาณตามคู่มือในอันดับ 14 และ มีความสามารถอ่านแบบในอันดับ 15 • จากการแปลผลข้างต้นจะพบว่าการแปลผลใน 2 วิธีจะให้ผลทางความหมายแตกต่างกันดังนั้นในการแปลผลจะขึ้นอยู่กับว่าผู้ใช้ผลในการแปลผลให้สอดคล้องกับวัตถุประสงค์อย่างไร ถ้าต้องการแปลผลระดับความคิดเห็นก็จะใช้ช่วงระดับความคิดเห็น แต่ถ้าผู้วิจัยสนใจลำดับก็ควรปรับหน่วยของค่าเฉลี่ยให้เป็นร้อยละด้วยค่าสัมประสิทธิ์ความผันแปรแล้วจึงจัดลำดับ

  25. ตัวอย่างที่ 5.6 • ในการศึกษาโครงการสำรวจทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา ในอาคารห้างสรรพสินค้าทั่วประเทศ ซึ่งมีจำนวนอาคาร ทั้งหมดจำนวน 639 อาคาร • ผู้วิจัยได้ทำการสุ่มตัวอย่างอย่างง่าย(SRS)จำนวน 284 อาคาร และเก็บรวบรวมข้อมูลตัวอย่างโดยการสังเกตอาคารห้างสรรพสินค้าตัวอย่างที่สุ่มมาได้ เพื่อสังเกตทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา โดยใช้แบบสังเกตและสังเกตอาคารเหล่านั้นว่ามี หรือ ไม่มี ทางลาดสำหรับผู้พิการ ทุพลภาพและคนชรา ได้ผลแสดงในแฟ้มข้อมูล SPSS ดังนี้

  26. จงประมวลผลข้อมูลจากแฟ้มข้อมูลดังกล่าวพร้อมทั้งสรุปผลข้อมูล ในแฟ้มข้อมูลข้อ 2.1-2.9

  27. จากการศึกษาสิ่งอำนวยความสะดวกทางลาดสำหรับผู้พิการ ทุพลภาพและคนชราในอาคารห้างสรรพสินค้าทั่วประเทศ ซึ่งมีจำนวนอาคาร ทั้งหมดจำนวน 639 อาคาร พบว่า • ส่วนมากห้างสรรพสินค้าทั่วประเทศ จะสร้างทางลาดที่มีความกว้างของทางลาดไม่น้อยกว่า 90 เซนติเมตรร้อยละ 70.85 รองลงมาพื้นผิวทางลาดผิวไม่ลื่นร้อยละ 68.75 พื้นที่มีความต่างระดับมีทางลาดที่ผู้ใช้รถเข็นสามารถเข้าถึงได้ ร้อยละ 67.99 มีพื้นที่หน้าทางลาดเป็นที่ว่างยาวไม่น้อยกว่า 1.50 เมตร ร้อยละ 54.61 ทางลาดที่มีความยาวรวม 6 เมตรขึ้นไปมีความกว้างไม่น้อยกว่า 1.50 เมตร ร้อยละ 51.66 ทางลาดมีความชันไม่เกิน 1: 12 ร้อยละ 48.16 ทางลาดแต่ละช่วงยาวไม่เกิน 6.00 เมตรร้อยละ 45.19 ทางลาดที่มีความยาว 2.50 เมตรขึ้นไปมีราวจับทั้ง 2 ด้านร้อยละ 30.40 และมีป้ายแสดงทิศทางหรือตำแหน่งของทางลาดให้ผู้ใช้รถเข็นและคนชราทราบ ร้อยละ 6.00

  28. การประมาณค่าจากการเลือกตัวอย่างแบบมีระบบการประมาณค่าจากการเลือกตัวอย่างแบบมีระบบ • สำหรับกรณีที่หน่วยต่างๆในประชากรอยู่เรียงกันอย่างสุ่ม เราหาค่าประมาณความแปรปรวนอย่างคร่าว ๆ ได้โดยคิดเหมือนกับเป็น SRS ขนาด n จาก N ได้จากวิธีต่าง ๆ เช่น

More Related