1.17k likes | 2.43k Views
ชีวสถิติเบื้องต้น. พ.ท. ผศ. ราม รังสินธุ์ พ.บ. ส.ม. DrPH ภาควิชาเวชศาสตร์ทหารและชุมชน วิทยาลัยแพทยศาสตร์พระมงกุฎเกล้า. สัญลักษณ์ ที่ใช้บ่อย. Population. Population Target Population Study Units. ค่าความดันลูกตาของประชากรประเทศไทย. ชนิดของข้อมูล. อายุ เพศ การศึกษา. ชนิดของข้อมูล.
E N D
ชีวสถิติเบื้องต้น พ.ท. ผศ. ราม รังสินธุ์ พ.บ. ส.ม. DrPH ภาควิชาเวชศาสตร์ทหารและชุมชน วิทยาลัยแพทยศาสตร์พระมงกุฎเกล้า
Population • Population • Target Population • Study Units ค่าความดันลูกตาของประชากรประเทศไทย
ชนิดของข้อมูล อายุ เพศ การศึกษา
ชนิดของข้อมูล Categorical (จำแนกชนิด / เชิงปริมาณ) • สองระดับ • ชาย / หญิง • Pregnant / Not pregnant • Smoker / Non-smoker • เป็นโรค / ไม่เป็นโรค • มากกว่า 2 ระดับ • โสด / คู่ / หม้าย / หย่า กลุ่ม ชาย หญิง 1 215 387 2 335 456 ได้จากการ “ นับ ”
ชนิดของข้อมูล • Numerical • Continuous (ต่อเนื่อง) • ความดันเลือด Systolic Blood Pressure: 120, 122, 196 • อุณหภูมิร่างกาย: 38.7, 36.5 • น้ำหนัก 0 1 2 7 ได้จากการ “ วัด ”
ชนิดของข้อมูล • ชนิดอื่น ๆ • Order Categorical • Stage of breast cancer: I II II IV • Discrete numerical • Number of children: 0 1 2 3 4 5+
ชนิดของข้อมูล • ระดับชั้น Ranks • ร้อยละ Percentages • อัตรา อัตราส่วน Rates and ratios • ระดับคะแนน Scores
การหาค่าเฉลี่ยของข้อมูลการหาค่าเฉลี่ยของข้อมูล
การกระจายแบบ Normal • การกระจายของข้อมูลที่เกิดขึ้นบ่อยที่สุดในธรรมชาติ • ขนาดข้อมูลจำนวนมาก จะมีการกระจายแบบ Normal 1 SD = 68% 2 SD = 95%
M and M and M • ฐานนิยม (Mode) : • มัธยฐาน (Median) : • ค่าเฉลี่ยเลขคณิต (Mean) :
การหาค่าเฉลี่ยของข้อมูลการหาค่าเฉลี่ยของข้อมูล • ค่าเฉลี่ยเลขคณิต Arithmetic Mean (Mean) • ผลรวมของจำนวนข้อมูลทั้งหมด หารด้วย จำนวนข้อมูลทั้งหมด • ใช้บ่อยที่สุด Population Sample
Mean : ตัวอย่าง • Data : {1,3,6,7,2,3,5} • จำนวนข้อมูล : 7 • ผลรวมค่าข้อมูลทั้งหมด : 27 • ค่าเฉลี่ยเลขคณิต : 3.9
ค่ามัธยฐาน Median Definition : ค่าที่อยู่ตรงกลาง หลังจากการเรียงจากน้อยไปหามาก n เป็นจำนวนเลขคี่ : the median score 5, 8, 9, 10, 28 median = 9 n เป็นจำนวนเลขคู่ : ค่าของลำดับที่ 6, 17, 19, 20, 21, 27 median = 19.5
มัธยฐาน Mode • ค่าของข้อมูล ที่พบจำนวนข้อมูล ได้มากที่สุด
Mode: ตัวอย่าง • Data {1,3,7,3,2,3,6,7} • Mode : 3 • Data {1,3,7,3,2,3,6,7,1,1} • Mode : 1,3 • Data {1,3,7,0,2,-3, 6,5,-1} • Mode : none
ตัวอย่าง สมมติว่าอายุของอาสาสมัครในการวิจัย 10 คนแรกเป็นไปดังนี้ : 34, 24, 56, 52, 21, 44, 64, 34, 42, 46 Mean = 41.7 years เพื่อหา Median, เราต้องเรียงข้อมูลจากน้อยไปหามากก่อน : 21, 24, 34, 34, 42, 44, 46, 52, 56, 64 ค่า Median อยู่ตำแหน่งที่ = 38 years Mode = 34 years.
หากอาสาสมัครคนที่ 11 เข้ามาในการศึกษา อายุ 97 ปี ? Mean = ? Mode = ? Median = ?
Mean VS Median • 16 + 20 + 18 + 7 + 30 = 18.2 Mean 5 • 7 16 18 20 30 = 18 Median • ขนาดตัวอย่างจำนวนมาก / Normal distribution Mean = Median • ขนาดตัวอย่างจำนวนน้อย / อาจไม่กระจายแบบ normal ให้รายงาน == Median
การอธิบายการกระจายของข้อมูลการอธิบายการกระจายของข้อมูล • Min-max : บอกค่าสูงสุดต่ำสุด • Variance : ค่าเฉลี่ยของระยะห่างจากค่าข้อมูล แต่ละค่าไปจากค่าเฉลี่ยเลขคณิตยกกำลังสอง The average value of the squared deviations of each value from the mean ; (s2)
การอธิบายการกระจายของข้อมูลการอธิบายการกระจายของข้อมูล • Range : บอกค่าความแตกต่างของค่าสูสุดกับต่ำสุด • Standard Deviation : ค่าเฉลี่ยของระยะห่างจาก ค่าข้อมูล แต่ละค่าไปจากค่าเฉลี่ยเลขคณิต The square root of the variance ; (s)
การกระจายแบบ Normal • การกระจายของข้อมูลที่เกิดขึ้นบ่อยที่สุดในธรรมชาติ • ขนาดข้อมูลจำนวนมาก จะมีการกระจายแบบ Normal 1 SD = 68% 2 SD = 95%
The Normal Distribution • Mean = median = mode • 68% ของข้อมูลอยู่ในขอบเขตของ 1 SD • 95% ของข้อมูลอยู่ในขอบเขตของ 2 SDs . Mean, Median, Mode 2 1
ข้อมูลที่ได้จากการวัดContinuous DataStudent t test
การได้รับพลังงาน (kJ) ของหญิงสุขภาพแข็งแรง 11 คน
การได้รับพลังงาน (kJ) ของหญิงสุขภาพแข็งแรง 11 คน
จำนวนพลังงานที่ได้รับต่อวันแตกต่างจากค่ามาตรฐานที่กำหนด ไว้ที่ 7725 kJ ต่อวัน หรือไม่
แนวคิด • เรากำลังจะพิสูจน์ว่า ค่าเฉลี่ยที่เราไปเก็บข้อมูลมา แตกต่างจากค่าใดค่าหนึ่งที่เคยมีไว้ไหม • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิง 11 คน = 6753.6 kJ • ค่าที่ต้องการเปรียบเทียบ = 7725 kJ t = ค่าเฉลี่ยจากการเก็บข้อมูล – ค่าที่ต้องการเทียบ ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล • ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล = Standard Deviation (SD) n
แนวคิด t = ค่าเฉลี่ยจากการเก็บข้อมูล – ค่าที่ต้องการเทียบ ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล • ค่า standard error ของ ค่าเฉลี่ยจากการเก็บข้อมูล = Standard Deviation (SD) n • t = - 6753.6 7752 = - 2.821 11 1142.1 ÷
แนวคิด • t = - 2.821 • นำไปเปิดตาราง t ที่ 10 degree of freedom : n - 1 • P < 0.02 • โอกาสความเป็นไปที่ค่าเฉลี่ยที่ได้มาจากการเก็บข้อมูลจะเท่ากับค่า 7725 kJ มีน้อยกว่า 2 % • ค่าที่ได้มาจากการเก็บตัวอย่างน้อยกว่าค่าที่กำหนดไว้อย่างมีนัยสำคัญทางสถิติ
การใช้พลังงานของผู้หญิง 2 กลุ่ม ผอม : อ้วน
การใช้พลังงานของผู้หญิง 2 กลุ่ม ผอม : อ้วน
การใช้พลังงานของกลุ่มหญิงอ้วนกับผอมนั้นต่างกันหรือไม่การใช้พลังงานของกลุ่มหญิงอ้วนกับผอมนั้นต่างกันหรือไม่
แนวคิด • เรากำลังจะพิสูจน์ว่า ค่าเฉลี่ยที่เราไปเก็บข้อมูล มาจากประชากร 2 กลุ่ม (หญิงผอม : หญิงอ้วน) แตกต่างกันหรือไม่ • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงผอม 13 คน = 8.066 MJ/day • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงอ้วน 9 คน = 10.298 MJ/day
แนวคิด t = ค่าเฉลี่ยของข้อมูลชุดที่ 1– ค่าเฉลี่ยของข้อมูลชุดที่ 2 ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด • ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด = pooled standard deviation x 1/n1 + 1/n2 • pooled variance = s2 = (n1- 1) s12 + (n2- 1) s22 n1 + n2 - 2
แนวคิด • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงผอม 13 คน = 8.066 MJ/day • ค่าเฉลี่ยที่ไปเก็บข้อมูลมาจากผู้หญิงอ้วน 9 คน = 10.298 MJ/day t= ค่าเฉลี่ยของข้อมูลชุดที่ 1– ค่าเฉลี่ยของข้อมูลชุดที่ 2 ค่า standard error ของ ผลต่างของค่าเฉลี่ยของข้อมูลทั้ง 2 ชุด • t = 8.066 – 10.298 1.3044 x 1/13 + 1/9 = 3.95 on 20 degree of freedom • P < 0.001
แนวคิด • t = 3.95 • นำไปเปิดตาราง t ที่ 20 degree of freedom : (n1-1) + (n2-1) • P < 0.001 • โอกาสความเป็นไปที่ค่าเฉลี่ยทั้ง 2 กลุ่มเท่ากัน มีน้อยกว่า 1% • ค่าที่ได้มาจากกลุ่มหญิงอ้วนและกลุ่มหญิงผอม มีความแตกต่างกัน อย่างมีนัยสำคัญทางสถิติ
ข้อมูลที่ได้จากการนับ เข้ากลุ่ม Categorical Data Chi-Square test
ตัวอย่าง ผู้ที่ได้รับการรักษาด้วยวิธี A มีอาการดีขึ้นกว่ากลุ่ม Placebo หรือไม่
แนวคิด • กลุ่ม treatment A มีอัตราของอาการดีขึ้น = 9/12 = 75% • กลุ่ม ยาหลอก มีอัตราของอาการดีขึ้น = 4/13 = 30.8% • จากการศึกษาในคน 25 คนทั้ง 2 กลุ่มนี้ • 75% VS 30.8% ต่างกันแบบมีนัยสำคัญหรือไม่
แนวคิด • ถ้า Treatment A ไม่สัมพันธ์กับอาการที่ดีขึ้น Cell A จะมีค่า= 13 x 12 / 25 = 6.24
ถ้า Treatment A ไม่สัมพันธ์กับอาการที่ดีขึ้น Cell A จะมีค่า = 13 x 12 / 25 = 6.24 Cell B จะมีค่า = 13 x 13 / 25 = 6.76 Cell C จะมีค่า = 12 x 12 / 25 = 5.76 Cell D จะมีค่า = 12 x 13 / 25 = 6.24
ค่าที่น่าจะเป็นหากการรักษา ไม่สัมพันธ์กับอาการที่ดีขึ้น Expected ค่าที่ได้จาการศึกษา Observed A Placebo รวม A Placebo รวม อาการดีขึ้น A 6.24 B 6.76 13 อาการดีขึ้น 9 4 13 อาการไม่ดีขึ้น C 5.24 D 6.24 12 อาการไม่ดีขึ้น 3 9 12 รวม 12 13 25 รวม 12 13 25 Chi-square = Σ(Observe – Expected)2 Expected =(9-6.24)2 + (4-6.76)2 + (3-5.24)2 + (9-6.24)2 6.24 6.76 5.24 6.24 = 1.22 + 1.13 + 0.96 + 1.22 = 4.53 at 1 degree of freedom
Chi-square = Σ(Observe – Expected)2 Expected =(9-6.24)2 + (4-6.76)2 + (3-5.24)2 + (9-6.24)2 6.24 6.76 5.24 6.24 • = 1.22 + 1.12 + 0.96 + 1.22 = 4.5 at 1 degree of freedom • = 4.53 P value < 0.05 • ค่าที่ได้จากการศึกษามีความแตกต่าง..จากการคาดประมาณในกรณีที่... • “ไม่มีความสำพันธ์กันระหว่าง Treatment A และ อาการที่ดีขึ้น” • ฉะนั้นการรักษา A จึงมีความสัมพันธ์กับอาการที่ดีขึ้น • เมื่อเทียบกับยาหลอกอย่างมีนัยสำคัญทางสถิติ