1 / 48

ชีวสถิติเบื้องต้น

ชีวสถิติเบื้องต้น. พ.ท. ผศ. ราม รังสินธุ์ พ.บ. ส.ม. DrPH ภาควิชาเวชศาสตร์ทหารและชุมชน วิทยาลัยแพทยศาสตร์พระมงกุฎเกล้า. สัญลักษณ์ ที่ใช้บ่อย. Population. Population Target Population Study Units. ค่าความดันลูกตาของประชากรประเทศไทย. ชนิดของข้อมูล. อายุ เพศ การศึกษา. ชนิดของข้อมูล.

Download Presentation

ชีวสถิติเบื้องต้น

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ชีวสถิติเบื้องต้น พ.ท. ผศ. ราม รังสินธุ์ พ.บ. ส.ม. DrPH ภาควิชาเวชศาสตร์ทหารและชุมชน วิทยาลัยแพทยศาสตร์พระมงกุฎเกล้า

  2. สัญลักษณ์ ที่ใช้บ่อย

  3. Population • Population • Target Population • Study Units ค่าความดันลูกตาของประชากรประเทศไทย

  4. ชนิดของข้อมูล อายุ เพศ การศึกษา

  5. ชนิดของข้อมูล Categorical (จำแนกชนิด / เชิงปริมาณ) • สองระดับ • ชาย / หญิง • Pregnant / Not pregnant • Smoker / Non-smoker • เป็นโรค / ไม่เป็นโรค • มากกว่า 2 ระดับ • โสด / คู่ / หม้าย / หย่า กลุ่ม ชาย หญิง 1 215 387 2 335 456 ได้จากการ “ นับ ”

  6. ชนิดของข้อมูล • Numerical • Continuous (ต่อเนื่อง) • ความดันเลือด Systolic Blood Pressure: 120, 122, 196 • อุณหภูมิร่างกาย: 38.7, 36.5 • น้ำหนัก 0 1 2 7 ได้จากการ “ วัด ”

  7. ชนิดของข้อมูล • ชนิดอื่น ๆ • Order Categorical • Stage of breast cancer: I II II IV • Discrete numerical • Number of children: 0 1 2 3 4 5+

  8. ชนิดของข้อมูล • ระดับชั้น Ranks • ร้อยละ Percentages • อัตรา อัตราส่วน Rates and ratios • ระดับคะแนน Scores

  9. การหาค่าเฉลี่ยของข้อมูลการหาค่าเฉลี่ยของข้อมูล

  10. การกระจายแบบ Normal

  11. การกระจายแบบ Normal

  12. การกระจายแบบ Normal • การกระจายของข้อมูลที่เกิดขึ้นบ่อยที่สุดในธรรมชาติ • ขนาดข้อมูลจำนวนมาก จะมีการกระจายแบบ Normal 1 SD = 68% 2 SD = 95%

  13. M and M and M • ฐานนิยม (Mode) : • มัธยฐาน (Median) : • ค่าเฉลี่ยเลขคณิต (Mean) :

  14. การหาค่าเฉลี่ยของข้อมูลการหาค่าเฉลี่ยของข้อมูล • ค่าเฉลี่ยเลขคณิต Arithmetic Mean (Mean) • ผลรวมของจำนวนข้อมูลทั้งหมด หารด้วย จำนวนข้อมูลทั้งหมด • ใช้บ่อยที่สุด Population Sample

  15. Mean : ตัวอย่าง • Data : {1,3,6,7,2,3,5} • จำนวนข้อมูล : 7 • ผลรวมค่าข้อมูลทั้งหมด : 27 • ค่าเฉลี่ยเลขคณิต : 3.9

  16. ค่ามัธยฐาน Median Definition : ค่าที่อยู่ตรงกลาง หลังจากการเรียงจากน้อยไปหามาก n เป็นจำนวนเลขคี่ :  the median score 5, 8, 9, 10, 28 median = 9 n เป็นจำนวนเลขคู่ :  ค่าของลำดับที่ 6, 17, 19, 20, 21, 27 median = 19.5

  17. มัธยฐาน Mode • ค่าของข้อมูล ที่พบจำนวนข้อมูล ได้มากที่สุด

  18. Mode: ตัวอย่าง • Data {1,3,7,3,2,3,6,7} • Mode : 3 • Data {1,3,7,3,2,3,6,7,1,1} • Mode : 1,3 • Data {1,3,7,0,2,-3, 6,5,-1} • Mode : none

  19. ตัวอย่าง สมมติว่าอายุของอาสาสมัครในการวิจัย 10 คนแรกเป็นไปดังนี้ : 34, 24, 56, 52, 21, 44, 64, 34, 42, 46  Mean = 41.7 years เพื่อหา Median, เราต้องเรียงข้อมูลจากน้อยไปหามากก่อน : 21, 24, 34, 34, 42, 44, 46, 52, 56, 64 ค่า Median อยู่ตำแหน่งที่   = 38 years Mode = 34 years.

  20. หากอาสาสมัครคนที่ 11 เข้ามาในการศึกษา อายุ 97 ปี ?  Mean = ? Mode = ? Median = ? 

  21. Mean VS Median • 16 + 20 + 18 + 7 + 30 = 18.2 Mean 5 • 7 16 18 20 30 = 18 Median • ขนาดตัวอย่างจำนวนมาก / Normal distribution Mean = Median • ขนาดตัวอย่างจำนวนน้อย / อาจไม่กระจายแบบ normal ให้รายงาน == Median

  22. การอธิบายการกระจายของข้อมูลการอธิบายการกระจายของข้อมูล • Min-max : บอกค่าสูงสุดต่ำสุด • Variance : ค่าเฉลี่ยของระยะห่างจากค่าข้อมูล แต่ละค่าไปจากค่าเฉลี่ยเลขคณิตยกกำลังสอง The average value of the squared deviations of each value from the mean ; (s2)

  23. การอธิบายการกระจายของข้อมูลการอธิบายการกระจายของข้อมูล • Range : บอกค่าความแตกต่างของค่าสูสุดกับต่ำสุด • Standard Deviation : ค่าเฉลี่ยของระยะห่างจาก ค่าข้อมูล แต่ละค่าไปจากค่าเฉลี่ยเลขคณิต The square root of the variance ; (s)

  24. การกระจายแบบ Normal • การกระจายของข้อมูลที่เกิดขึ้นบ่อยที่สุดในธรรมชาติ • ขนาดข้อมูลจำนวนมาก จะมีการกระจายแบบ Normal 1 SD = 68% 2 SD = 95%

  25. The Normal Distribution • Mean = median = mode • 68% ของข้อมูลอยู่ในขอบเขตของ 1 SD • 95% ของข้อมูลอยู่ในขอบเขตของ 2 SDs . Mean, Median, Mode 2 1

  26. ข้อมูลที่ได้จากการวัดContinuous DataStudent t test

  27. ตัวอย่างที่ 1

  28. การได้รับพลังงาน (kJ) ของหญิงสุขภาพแข็งแรง 11 คน

  29. การได้รับพลังงาน (kJ) ของหญิงสุขภาพแข็งแรง 11 คน

  30. จำนวนพลังงานที่ได้รับต่อวันแตกต่างจากค่ามาตรฐานที่กำหนด ไว้ที่ 7725 kJ ต่อวัน หรือไม่

  31. แนวคิด • เรากำลังจะพิสูจน์ว่า ค่าเฉลี่ยที่เราไปเก็บข้อมูลมา แตกต่างจากค่าใดค่าหนึ่งที่เคยมีไว้ไหม • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิง 11 คน = 6753.6 kJ • ค่าที่ต้องการเปรียบเทียบ = 7725 kJ t = ค่าเฉลี่ยจากการเก็บข้อมูล – ค่าที่ต้องการเทียบ ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล • ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล = Standard Deviation (SD)  n

  32. แนวคิด t = ค่าเฉลี่ยจากการเก็บข้อมูล – ค่าที่ต้องการเทียบ ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล • ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล = Standard Deviation (SD)  n • t = - 6753.6 7752 = - 2.821 11 1142.1 ÷

  33. แนวคิด • t = - 2.821 • นำไปเปิดตาราง t ที่ 10 degree of freedom : n - 1 • P < 0.02 • โอกาสความเป็นไปที่ค่าเฉลี่ยที่ได้มาจากการเก็บข้อมูลจะเท่ากับค่า 7725 kJ มีน้อยกว่า 2 % • ค่าที่ได้มาจากการเก็บตัวอย่างน้อยกว่าค่าที่กำหนดไว้อย่างมีนัยสำคัญทางสถิติ

  34. ตัวอย่างที่ 2

  35. การใช้พลังงานของผู้หญิง 2 กลุ่ม ผอม : อ้วน

  36. การใช้พลังงานของผู้หญิง 2 กลุ่ม ผอม : อ้วน

  37. การใช้พลังงานของกลุ่มหญิงอ้วนกับผอมนั้นต่างกันหรือไม่การใช้พลังงานของกลุ่มหญิงอ้วนกับผอมนั้นต่างกันหรือไม่

  38. แนวคิด • เรากำลังจะพิสูจน์ว่า ค่าเฉลี่ยที่เราไปเก็บข้อมูล มาจากประชากร 2 กลุ่ม (หญิงผอม : หญิงอ้วน) แตกต่างกันหรือไม่ • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงผอม 13 คน = 8.066 MJ/day • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงอ้วน 9 คน = 10.298 MJ/day

  39. แนวคิด t = ค่าเฉลี่ยของข้อมูลชุดที่ 1– ค่าเฉลี่ยของข้อมูลชุดที่ 2 ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด • ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด = pooled standard deviation x 1/n1 + 1/n2 • pooled variance = s2 = (n1- 1) s12 + (n2- 1) s22 n1 + n2 - 2

  40. แนวคิด • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงผอม 13 คน = 8.066 MJ/day • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงอ้วน 9 คน = 10.298 MJ/day t= ค่าเฉลี่ยของข้อมูลชุดที่ 1– ค่าเฉลี่ยของข้อมูลชุดที่ 2 ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด • t = 8.066 – 10.298 1.3044 x 1/13 + 1/9 = 3.95 on 20 degree of freedom • P < 0.001

  41. แนวคิด • t = 3.95 • นำไปเปิดตาราง t ที่ 20 degree of freedom : (n1-1) + (n2-1) • P < 0.001 • โอกาสความเป็นไปที่ค่าเฉลี่ยทั้ง 2 กลุ่มเท่ากัน มีน้อยกว่า 1% • ค่าที่ได้มาจากกลุ่มหญิงอ้วนและกลุ่มหญิงผอม มีความแตกต่างกัน อย่างมีนัยสำคัญทางสถิติ

  42. ข้อมูลที่ได้จากการนับ เข้ากลุ่ม Categorical Data Chi-Square test

  43. ตัวอย่าง ผู้ที่ได้รับการรักษาด้วยวิธี A มีอาการดีขึ้นกว่ากลุ่ม Placebo หรือไม่

  44. แนวคิด • กลุ่ม treatment A มีอัตราของอาการดีขึ้น = 9/12 = 75% • กลุ่ม ยาหลอก มีอัตราของอาการดีขึ้น = 4/13 = 30.8% • จากการศึกษาในคน 25 คนทั้ง 2 กลุ่มนี้ • 75% VS 30.8% ต่างกันแบบมีนัยสำคัญหรือไม่

  45. แนวคิด • ถ้า Treatment A ไม่สัมพันธ์กับอาการที่ดีขึ้น Cell A จะมีค่า= 13 x 12 / 25 = 6.24

  46. ถ้า Treatment A ไม่สัมพันธ์กับอาการที่ดีขึ้น Cell A จะมีค่า = 13 x 12 / 25 = 6.24 Cell B จะมีค่า = 13 x 13 / 25 = 6.76 Cell C จะมีค่า = 12 x 12 / 25 = 5.76 Cell D จะมีค่า = 12 x 13 / 25 = 6.24

  47. ค่าที่น่าจะเป็นหากการรักษา ไม่สัมพันธ์กับอาการที่ดีขึ้น Expected ค่าที่ได้จาการศึกษา Observed A Placebo รวม A Placebo รวม อาการดีขึ้น A 6.24 B 6.76 13 อาการดีขึ้น 9 4 13 อาการไม่ดีขึ้น C 5.24 D 6.24 12 อาการไม่ดีขึ้น 3 9 12 รวม 12 13 25 รวม 12 13 25 Chi-square = Σ(Observe – Expected)2 Expected =(9-6.24)2 + (4-6.76)2 + (3-5.24)2 + (9-6.24)2 6.24 6.76 5.24 6.24 = 1.22 + 1.13 + 0.96 + 1.22 = 4.53 at 1 degree of freedom

  48. Chi-square = Σ(Observe – Expected)2 Expected =(9-6.24)2 + (4-6.76)2 + (3-5.24)2 + (9-6.24)2 6.24 6.76 5.24 6.24 • = 1.22 + 1.12 + 0.96 + 1.22 = 4.5 at 1 degree of freedom • = 4.53 P value < 0.05 • ค่าที่ได้จากการศึกษามีความแตกต่าง..จากการคาดประมาณในกรณีที่... • “ไม่มีความสำพันธ์กันระหว่าง Treatment A และ อาการที่ดีขึ้น” • ฉะนั้นการรักษา A จึงมีความสัมพันธ์กับอาการที่ดีขึ้น • เมื่อเทียบกับยาหลอกอย่างมีนัยสำคัญทางสถิติ

More Related