590 likes | 984 Views
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology. นายแพทย์ชนินันท์ สนธิไชย พบ., FETP , สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา กองควบคุมโรคติดต่อ สำนักอนามัย. สถิติ. เก็บรวบรวมข้อมูล เรียบเรียง การวิเคราะห์ การแปลผล การนำเสนอ. การอธิบายลักษณะข้อมูล.
E N D
สถิติเบื้องต้นสำหรับงานระบาดวิทยาStatisticsfor Epidemiology นายแพทย์ชนินันท์ สนธิไชย พบ., FETP,สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา กองควบคุมโรคติดต่อ สำนักอนามัย
สถิติ • เก็บรวบรวมข้อมูล • เรียบเรียง • การวิเคราะห์ • การแปลผล • การนำเสนอ
การอธิบายลักษณะข้อมูลการอธิบายลักษณะข้อมูล • อัตราส่วน (Ratio) • สัดส่วน (Proportion) • อัตรา (Rate)
อัตราส่วน (Ratio) • ค่าเปรียบเทียบระหว่างตัวเลข 2 จำนวน • เศษไม่ได้เป็นส่วนหนึ่งของส่วน • X:Y • อัตราส่วนของชายต่อหญิง คือ 2:3
สัดส่วน (Proportion) • การเปรียบเทียบจำนวนย่อยกับจำนวนรวม • เศษเป็นส่วนหนึ่งของส่วน • ผลรวมของสัดส่วน เป็น 1 หรือร้อยละ 100 เสมอ • X/Y หรือ X/Y x 100 • สัดส่วนของประชากรชาย คือ 0.4 หรือร้อยละ 40
อัตรา (Rate) • การวัดโอกาสของการเกิดเหตุการณ์หรือจำนวนความถี่ในกลุ่มประชากรที่ศึกษา • มีเวลาเข้ามาเกี่ยวข้อง • อัตราเกิด อัตราตาย
ลักษณะของตัวแปร • แบ่งตามลักษณะของตัวแปร • เชิงคุณภาพ • เชิงปริมาณ • แบ่งตามมาตรการวัดตัวแปร • Nominal • Ordinal • Interval • Ratio
ลักษณะของตัวแปร ตัวแปรเชิงคุณภาพ (Qualitative Variable) • มีคุณสมบัติแตกต่างกันในแง่ของชนิดหรือประเภทหรือคุณลักษณะ • เช่น เพศ อาชีพ ภูมิลำเนา ตัวแปรเชิงปริมาณ (Quantitative Variable) • มีความแตกต่างกันตามความถี่ จำนวน หรือปริมาณมากน้อย • สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อยกว่าอีกนามหนึ่ง • เช่น อายุ น้ำหนักส่วนสูง คะแนนสอบ
มาตรการวัดตัวแปร มาตรนามบัญญัติ (Nominal Scale) • เป็นการจำแนกข้อมูลโดยใช้นามเป็นเกณฑ์ • ไม่สามารถเปรียบเทียบได้ว่านามหนึ่งดีกว่านามหนึ่ง • เช่น เพศ อาชีพ มาตรอันดับ (Ordinal Scale) • เป็นการจำแนกข้อมูลโดยใช้นามเป็นเกณฑ์ • สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อยกว่าอีกนามหนึ่ง • เช่น ระดับการศึกษา ระดับความนิยม มาตรอันตรภาค (Interval Scale) • เป็นการจำแนกข้อมูลโดยใช้นามและลำดับ • สามารถวัดปริมาณความแตกต่างของนามได้ • ไม่มี “0” ที่แท้จริง • เช่น อุณหภูมิ ไอคิว มาตรอัตราส่วน (Ratio Scale) • สามารถเปรียบเทียบอัตราส่วนระหว่างปริมาณได้ • มี “0” ที่แท้จริง • เช่น รายได้ อายุ น้ำหนัก
ประเภทของสถิติในงานระบาดวิทยาประเภทของสถิติในงานระบาดวิทยา ชีวสถิติ Biostatistics สถิติเชิงพรรณนา Descriptive Statistics สถิติเชิงอนุมาน Inferential Statistics การคาดประมาณ Parameter Estimation การทดสอบสมมติฐาน Hypothesis Testing การคาดประมาณเฉพาะค่า Point Estimation การคาดประมาณเป็นช่วง Interval Estimation
องค์ประกอบของสถิติ พารามิเตอร์ (Parameter) ประชากร Population ค่าเฉลี่ยเลขคณิต μ ค่าเบี่ยงเบนมาตรฐาน δ ค่าสัดส่วน π สถิติ (Statistics) กลุ่มตัวอย่าง Sample ค่าเฉลี่ยเลขคณิต x ค่าเบี่ยงเบนมาตรฐาน s ค่าสัดส่วน p
ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย ประชากรประเทศไทย 63,525,062 คน พารามิเตอร์ น้ำหนักตัวเฉลี่ย (μ) = ?? kg สถิติเชิงอนุมาน กลุ่มตัวอย่าง 1,000 คน สถิติ น้ำหนักตัวเฉลี่ย (x) = 50 kg
สถิติเชิงพรรณนา (Descriptive Statistics) • ใช้เพื่ออธิบายลักษณะของข้อมูลที่เก็บรวบรวมมาได้ • สัดส่วน อัตรา อัตราส่วน (Proportion, Rate, Ratio) • ค่ากลาง (Mean, Median, Mode) • ค่าการกระจาย (Variance, SD, Range, Interquartile Range)
การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจาย(Measures of Central Location and Dispersion)
การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measure of Central Location) • เพื่อหาค่าที่เป็นตัวแทนที่ดีที่สุดของกลุ่มประชากร • การวัดการกระจาย (Measure of dispersion) • เพื่อดูว่าประชากรแต่ละคนมีความแตกต่างกันมากน้อยเพียงใด • เพื่อดูความแตกต่างของประชากรแต่ละคนจากค่ากลาง
การวัดแนวโน้มเข้าสู่ส่วนกลาง Measure of Central Location • Mean (Arithmetic Mean) ค่าเฉลี่ยเลขคณิต • Median มัธยฐาน • Mode ฐานนิยม 16
ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) • ค่าเฉลี่ย (Mean หรือ Average) • ผลรวมของข้อมูลหารด้วยจำนวนข้อมูล • สัญลักษณ์
24+28+17+32+27+25+22+19+31 9 225 9 ค่าเฉลี่ย คือ 25 kg ตัวอย่าง จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน 2428 17 32 27 25 22 19 31 = = = 25 kg
ตัวอย่าง 24+28+17+32+27+25+22+19+90 9 284 9 จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน 2428 17 32 27 25 22 19 90 = = = 31.6 kg ค่าเฉลี่ย คือ 31.6 kg
คุณสมบัติของค่าเฉลี่ยคุณสมบัติของค่าเฉลี่ย • คำนวณโดยอาศัยข้อมูลทุกค่า • มีความไวในกรณีที่มีข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ • หากข้อมูลมีลักษณะเบ้ ค่าเฉลี่ยจะไม่สามารถเป็นตัวแทนของกลุ่มข้อมูลที่ดีได้
มัธยฐาน (Median) • ค่าข้อมูลที่อยู่ตำแหน่งตรงกลางของชุดข้อมูลที่เรียงลำดับ • จำนวนข้อมูลที่มีค่ามากกว่ามัธยฐาน เท่ากับจำนวนข้อมูลที่มีค่าน้อยกว่ามัธยฐาน • วิธีการหาค่ามัธยฐาน • จัดเรียงลำดับข้อมูลจากน้อยไปหามาก • หาข้อมูลที่อยู่ในตำแหน่งตรงกลางจากสูตร • กรณีจำนวนข้อมูลเป็นเลขคี่ ค่ามัธยฐานคือข้อมูลตำแหน่งกลาง • กรณีจำนวนข้อมูลเป็นเลขคู่ ค่ามัธยฐานจะอยู่ระหว่างข้อมูล 2 ตำแหน่งกลาง และเท่ากับค่าเฉลี่ยของข้อมูล 2 ตำแหน่งนั้น
ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน 2428 17 32 27 25 22 19 31 จัดลำดับข้อมูลจากน้อยไปหามาก 171922 24252728 31 32 ค่ามัธยฐาน คือ 25 kg
ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน 2428 17 32 27 25 22 19 90 จัดลำดับข้อมูลจากน้อยไปหามาก 171922 24252728 32 90 ค่ามัธยฐาน คือ 25 kg
ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 10 คน 2428 17 32 27 25 22 19 31 38 จัดลำดับข้อมูลจากน้อยไปหามาก 171922 24252728 31 32 38 ค่ามัธยฐาน คือ = 26 kg
คุณสมบัติของค่ามัธยฐานคุณสมบัติของค่ามัธยฐาน • ข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ ไม่มีผลต่อค่ามัธยฐาน • นิยมใช้ในกรณีที่ข้อมูลมีลักษณะเบ้
ฐานนิยม (Mode) • ค่าที่มีความถี่สูงที่สุด หรือค่าที่ซ้ำกันมากที่สุด • มักใช้กับตัวแปรเชิงคุณภาพ
ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน 171922 24252727 27 90 ค่าฐานนิยม คือ 27 kg
ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน 172222 24252727 29 40 ค่าฐานนิยม คือ 22 และ 27 kg
การวัดการกระจาย Measure of Dispersion • Variance (ความแปรปรวน) • Standard Deviation: SD (ค่าเบี่ยงเบนมาตรฐาน) • Range(พิสัย) • Percentile(เปอร์เซ็นไทล์) • Quartile (ควอไทล์) • Interquartile (อินเตอร์ควอไทล์) 29
ตัวอย่าง จงคำนวณค่าเฉลี่ยคะแนนสอบของนักเรียน 5คน ในแต่ละห้องเรียน Mean = 80 คะแนน 78 79 80 81 82 Mean = 80 คะแนน 70 75 80 85 90 Mean = 80 คะแนน 60 70 80 90 100
ตัวอย่าง จงคำนวณค่ามัธยฐานคะแนนสอบของนักเรียน 5คน ในแต่ละห้องเรียน Median = 80 คะแนน 78 79 80 81 82 Median = 80 คะแนน 70 75 80 85 90 Median = 80 คะแนน 60 70 80 90 100
ความแปรปรวน (Variance) และค่าเบี่ยงเบนมาตรฐาน (SD) • Variance = s2= = • SD = s = = • ใช้ประกอบกับค่าเฉลี่ย
ค่าเฉลี่ย คือ 25 kg Degree of freedom ประชากร 9 คน 2428 17 32 27 25 22 19 31 สุ่มตัวอย่าง กลุ่มตัวอย่าง 3 คน 28 19 ??? Degree of freedom = n-1
การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Mean และ Standard Deviation
การกระจายแบบเบ้ขวา (Skew to the right หรือ Positive skew)
การกระจายแบบเบ้ซ้าย (Skew to the left หรือ Negative skew)
การกระจายแบบเบ้ซ้าย การกระจายแบบเบ้ขวา
พิสัย (Range) • ความแตกต่างระหว่างค่าน้อยที่สุดกับค่ามากที่สุดในชุดข้อมูล • ค่ามากที่สุด - ค่าน้อยที่สุด • ทางสถิติ พิสัย... • ทางระบาดวิทยา ตั้งแต่... ถึง... • ใช้ประกอบกับค่ามัธยฐาน
ตัวอย่าง ค่ามัธยฐานและพิสัยของคะแนนสอบของนักเรียน 5คน ในแต่ละห้องเรียน Median = 80 คะแนน Range 78-82 คะแนน 78 79 80 81 82 Median = 80 คะแนน Range 70-90 คะแนน 70 75 80 85 90 Median = 80 คะแนน Range 60-100 คะแนน 60 70 80 90 100
Percentiles • เกิดจากการแบ่งข้อมูลเป็น 100 ส่วนเท่าๆ กัน เมื่อข้อมูลถูกเรียงจากน้อยไปหามาก • มีค่าอยู่ระหว่าง 0-100 • Percentiles ที่ P หมายถึง ค่าที่มีจำนวนข้อมูลน้อยกว่าร้อยละ P ของชุดข้อมูลทั้งหมด 10% 90% 10th Percentile 67% 33% 33rd Percentile
Quartiles • เกิดจากการแบ่งข้อมูลเป็น 4 ส่วนเท่าๆ กัน เมื่อข้อมูลถูกเรียงจากน้อยไปหามาก • แบ่งเป็น Quartile ที่ 1, 2, 3 และ 4 Q1 คือ ค่า ณ ตำแหน่งที่ Q3คือ ค่า ณ ตำแหน่งที่ 1st Quartile 2nd Quartile 3rd Quartile 4th Quartile 50th Percentile 75th Percentile 100th Percentile 25th Percentile Median
Interquartile Range • เป็นการวัดการกระจายที่นิยมใช้ประกอบกับค่ามัธยฐาน • เป็นตัวแทนของข้อมูลครึ่งหนึ่งที่อยู่ในช่วงกลางของชุดข้อมูลระหว่าง P25-P75 1st Quartile 2nd Quartile 3rd Quartile 4th Quartile 50th Percentile 75th Percentile 100th Percentile 25th Percentile Interquartile Range
การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Median, Percentile, Quartile และ Interquartile Range
การเลือกวิธีการวัดแนวโน้มเข้าสู่ส่วนกลางและวิธีการวัดการกระจายการเลือกวิธีการวัดแนวโน้มเข้าสู่ส่วนกลางและวิธีการวัดการกระจาย การกระจายแบบปกติ การกระจายแบบเบ้ • ขึ้นอยู่กับรูปแบบการกระจายของข้อมูล • ข้อมูลมีการกระจายแบบปกติ (Normal Distribution) ควรใช้ Mean และ SD • ข้อมูลมีการกระจายแบบเบ้ (Skew Distribution) ควรใช้ Median และ Range หรือ Interquartile Range
สรุปแนวทางการเลือกใช้วิธีการวัดแนวโน้มเข้าสู่ส่วนกลางและวิธีการวัดการกระจายสรุปแนวทางการเลือกใช้วิธีการวัดแนวโน้มเข้าสู่ส่วนกลางและวิธีการวัดการกระจาย
ตัวอย่างการใช้สถิติเชิงพรรณนาตัวอย่างการใช้สถิติเชิงพรรณนา 46 ค่ามัธยฐานของอายุผู้ป่วยเท่ากับ 29 ปี (พิสัย 15-56 ปี) ระยะฟักตัวของโรคเฉลี่ยเท่ากับ 15 วัน (SD 3.6 วัน) อัตราส่วนผู้ป่วยเพศชายต่อเพศหญิงคือ 3:2 อัตราป่วยโรคไข้เลือดออกในเดือนมกราคม 47 รายต่อประชากรแสนคน อัตราป่วยรายร้อยละ 3 ผู้ป่วยส่วนใหญ่เป็นนักเรียน/นักศึกษาร้อยละ 67
สถิติเชิงอนุมาน (Inferential Statistics) • ใช้เพื่อนำผลสรุปของข้อมูลที่คำนวณได้จากข้อมูลตัวอย่างไปอ้างอิงถึงค่าพารามิเตอร์ • การประมาณค่าพารามิเตอร์ (Parameter Estimation) • การทดสอบสมมติฐาน (Hypothesis Testing)
ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย ประชากรประเทศไทย 63,525,062 คน μ = 50 kg / 48 kg / 55 kg กลุ่มตัวอย่าง 1,000 คน (x) = 50 kg (x) = 48 kg (x) = 55 kg
42 kg 58 kg 48 kg 50 kg 55 kg 95% CI = 42-58 kg
ช่วงความเชื่อมั่น (Confidence Interval) หากทำการศึกษาแบบเดียวกัน 100 ครั้ง จะได้ช่วงความเชื่อมั่น 100 ช่วง ซึ่งจะมี 95 ช่วง ที่ครอบคลุมค่าพารามิเตอร์ที่ต้องการหา ค่าที่บ่งบอกว่าผลการศึกษาครั้งนี้ คาดว่าจะมีค่าผิดพลาดไม่เกินช่วงที่กำหนด 90%CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 10% 95%CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 5% 99%CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 1% 50