สถิติสำหรับการวิจัย

สถิติสำหรับการวิจัย รศ.ดร.โยธิน แสวงดี สถาบันวิจัยประชากรและสังคม มหาวิทยาลัยมหิดล

สถิติสำหรับการวิจัย • สถิติมีความสำคัญคือ เป็นข้อมูล แสดงลักษณะการดำรงคงอยู่ของสถานะของข้อมูล ปรากกฏการณ์ สถานะภาพ ฯลฯ • สถิติเชิงพรรณา ใช้พรรณา เช่น แสดงปรากฎการณ์ สถานะการณ์ สถานะภาพ ที่เป็นอยู่ หรือ ที่ผ่านมาในอดีต เช่น สำนักงานสถิติแห่งชาตินำเสนอข้อมูลสถานะการณ์ สถานะภาพ ปรากฎการณ์ ต่างๆ ทางด้านจำนวนประชากร โครงสร้างประชากรตามอายุ และเพศ โครงสร้างครอบครัว ครอบครัวเดี่ยว ครอบครัวขยาย บริษัท ห้างหุ้นส่วนๆ ต่างๆ แสดงผลประกอบการ จำนวนงบลงทุน จำนวนวัสดุ อุปกรณ์ ความสูญเสียฯลฯ • สถิติเชิงพรรณา ได้แก่ Mean Mode Median S.D. เป็นต้น

สถิติสำหรับการทดสอบสมมุติฐานทางสถิติสถิติสำหรับการทดสอบสมมุติฐานทางสถิติ • ใช้มากสำหรับการวิจัยเชิงทดลอง • การวิจัยเพื่อการวัดและประเมินผล • การวิจัยดำเนินงาน • สาเหตุที่ต้องทำการพิสูจน์สมมุติฐานเพราะต้องการข้อค้นพบไปชี้นำนโยบาย เนื่องจากสามารถยืนยันได้อย่างแท้จริงว่าผ่านการทดลอง (ที่มีการควบคุม หรือ การขจัดปัจจัยอื่นๆที่เกี่ยวข้องออกๆปแล้ว)

สมมุติฐาน • Ho หรือ Null Hypothesis จะนิยมตั้งว่า ไม่แตกต่าง • ใช้สัญลักษณ์ = • Ha หรือ Alternative Hypothesis หรือ สมมุติฐานที่ต้องการพิสูจน์ • ใช้สัญลักษณ์ว่า แตกต่าง เช่น ไม่เท่ากับ > หรือ < เป็นต้น • ส่วนใหญ่จะไม่นิยมเขียน จะทราบกันโดยนัยะว่าจะพิสูจน์อะไร แต่งานวิจัยเชิงทดลองทั้งสายวิทยาศาสตร์ และสายสังคมศาสตร์จะต้องเขียนใว้ • สิ่งสำคัญคือ ตั้ง Ha ใว้อย่างไร ต้องพิสูจน์ ให้ได้เป็นจริงตามนั้น เพราะเป็นไปตามหลักปฏิฐานนิยม ไม่งั้นจะถือว่างานวิจัจล้มเหลว (เพราะไม่เป็นไปตามที่ตั้งใว้ในวัตถุประลงค์ที่ต้องการพิสูจน์)

t-test • ใช้สำหรับทดสอบสมมุติฐาน เปรียบเทียบกันสองกลุ่ม เท่านั้น • หน่วยวัดของสิ่งที่จะเปรียบเทียบต้องเป็นคะแนนพฤติกรรม ฤทธิ์ ส่วนสูง น้ำหนัก ฯลฯ เพราะเน้นที่การเปรียบเทียบค่าเฉลี่ยมัชฌิมเลขคณิต • หลักเบื้องต้น จำนวนตัวอย่าง อย่างน้อย 30 ตัวอย่างขึ้นไป • แบ่งกลุ่มเปรียบออกเป็นสองกลุ่ม เช่น กลุ่มทดลอง กับกลุ่มเปรียบ • กลุ่ม เพศหญิง กับ กลุ่มเพศชาย • กลุ่มเมือง กับ กลุ่ม ชนบท • กลุ่มเข้าเรียน กับ กลุ่มไม่เข้าเรียน ฯลฯ • ประเด็นที่จะวัด (พฤติกรรม ฤทธิ์ ส่วนสูง น้ำหนัก ค่าใช้จ่าย ฯลฯ) ต้องมีระดับการวัดเป็นอัตราส่วน หรือ เป็นช่วง

ประเภทของ t-test • One sample t-test ใช้สำหรับทดสอบสมมุติฐานเมื่อเปรียบเทียบกับค่ามาตรฐาน เช่น คะแนนภาษาอังกฤษ ของคนไทย เปรียเทียบกับ TOEFL ทดสอบกับค่าต่างๆ ที่มาตรฐานทางสังคมศาสตร์ หรือ วิทยาศาสตร์ ฯลฯ • Independent-Samples t-test ใช้สำหรับทดสอบความแตกต่างของค่าเฉลี่ยมัชฌิมเลขคณิต ของสองกลุ่มเปรียบเทียบ เช่น ชาย หญิง เมืองชนบท ทดลอง ควบคุม ฯลฯ • Paired-samples t-test ใช้เปรียบสัมฤทธิ์ผลการทดลองที่เป็นกิจกรรมดำเนินงาน ก่อนและหลัง ที่ติดตามคู่ นั้นๆ ตลอด สามารถพิสูจน์ว่ากิจกรรมทดลองส่งผลตรงต่อการเปลี่ยนแปลง ตามที่ตั้งใว้ในสมมุติฐาน

F-test (One-Way Analysis of Variance) • ใช้ทดสอบความแตกต่างของค่าเฉลี่ยมัชฌิมเลขคณิต ตั้งแต่ 3 กลุ่มขึ้นไป • เป็นกลุ่มทดลอง 3 treatment หรือ ทดลอง 2 treatment กับ กลุ่ม ควบคุม 1 กลุ่มก็ได้ • หรือ ในทางสังคมศาสตร์และทางวิทยาศาสตร์ จะใช้เปรียบเทียบความแตกต่างของค่าเฉลี่ย ตั้งแต่ 3 กลุ่มขึ้นไปก็ได้ • ข้อดีคือค้นหาความแตกต่าง ในแต่ละกลุ่ม • พฤติกรรมที่จะวัด ต้องเป็นคะแนน หรือมีระดับการวัดแบบอัตรส่วน หรือ แบบช่วง ทั้งสายวิทย์ และสายศิลป์ • ข้อดี คือ Post-Hoc test ที่ใช้ทดสอบความแตกต่างรายคู่เปรียบเทียบได้

Multivariate Analysis: (1) ANCOVA • หลัการเดียวกับ ANOVA แต่ใช้ Univariate เพราะใช้ตัวแปรตามตัวเดียว • แต่เปิดโอกาสให้มีการขจัดปัจจัยอื่นๆที่คาดว่ามีผลต่อพฤติกรรม หรือ ฤทธิ์ หรือ การสิ่งที่ศึกษานั้นๆ • CO ย่อมาจาก Covariance • ตัวแปรควบคุม Covariate Variable มักนิยมวัดด้วยปัจจัยที่มีระดับการวัดแบบอัตราส่วน แบบช่วง หากเป็นกลุ่มต้องจัดเป็นตัวแปร dummy variable (1,0 ตัวอย่างเช่น ในสายสังคมศาสตร์ เมือง = 1 ชนบท = 0 เป็นต้น แต่สายวิทยาศาสตร์ จะนิยมใช้อัตราส่วน)

(2) MANOVA • หลักการเดียวกันกับ ANOVA แต่ใช้ Multivariate • เพราะมีตัวแปรตามได้หลายตัว แต่ละตัวต้องมีระดับการวัดแบบอัตราส่วน หรือ แบบช่วง เพราะต้องการวัดความแตกต่างที่ค่าเฉลี่ยมัชฌิมเลขคณิต • M ย่อมาจาก Multivariate ที่หมายถึงมีตัวแปรตามมากกว่า 1 ตัว • หลักคิดคือ ในแต่ละกลุ่มเปรียบเทียบ สามารถเปรียบเทียบความแตกต่างใน พฤติกรรม ฤทธิ์ ฯลฯ ได้หลายตัวพร้อมกัน เช่น ในสายบริหารธุรกิจ มีการขนส่ง 3 แบบ และผลที่ต้องการวัดคือ มีความแตกต่างทั้ง ยอดขาย ยอดสึกหรอ เป็นต้น

(3) MANCOVA • เหมือน MANOVA • แต่เปิดโอกาสให้มีการขจัดปัจจัยอื่นๆที่มีผลต่อพฤติกรรมที่ต้องการวัด • ข้อดีคือได้ทราบผลการทดลองที่แน่ชัด หรือวัดได้แน่ชัดว่า ไม่เพียงมีผลต่อเพียงหนึ่งพฤกรรม แต่ยังวัดได้จากพฤติกรรมอื่นๆ อีก (ฤทธิ์ อื่นๆอีก) • มีการควบคุม ที่เป็นการขจัดปัจจัยอื่นๆได้ด้วย ระดับการวัดของปัจจัยควบคุม หรือ ตัวขจัดออกเหมือน ANCOVA

Chi-squared Test • ทดสอบสมมุติฐานเมื่อเปรียบเทียบตัวแปรอิสระที่เป็นกลุ่ม กับตัวแปรตามที่เป็นกลุ่ม • จุดอ่อนคือจำนวนตัวอย่าง • จำนวมกลุ่มในตัวแปรตามและตัวแปรอิสระไม่ควรมากเกิน 5 กลุ่ม • ควรเป็นกลุ่มที่เกิดขึ้นตามธรรมชาติ หรือ ตามเกณฑ์ที่มีการกำหนดเป็นมาตรใว้ และมีการอ้างอิงใว้ • จำนวน n ใน cell ควรมากว่า 5 • วัดความแตกต่างว่า ในตัวแปรอิสระที่มีระดับการวัดเป็นกลุ่มที่แตกต่างกัน จะมีความแตกต่างกันในตัวแปรตามที่เป็นกลุ่มแตกต่างกัน • หากจะทดสอบถึงความสัมพันธ์ (Association) ต้องวัดที่ค่า Contingency Coefficient: C)

Pearson Correlation • ใช้ทดสอบสหสัมพันธ์ของตัวแปรสองตัว • มีระดับการวัดแบบอัตราส่วนและแบบช่วง • มีค่าระหว่าง -1 ถึง 1 • จะวัดออกมาเป็นร้อยละก็ได้ • มีการตรวจสอบด้วยว่ามีสหสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติหรือไม่ โดยใช้ค่า t เป็นตัวยืนยัน • ใช้ทดสอบเมื่อต้องการขจัดปัจจัยอื่นๆออกไปด้วยก็ได้โดยใช้ Partial correlation • ประโยชน์ที่สำคัญคือใช้ตรวจสอบ Collinearity และ Multicollinearity ก่อนเข้า Multiple Regression • จุดตัด (Cut point 0.5 0.65 0.75)

สถิติสำหรับการพยากรณ์สถิติสำหรับการพยากรณ์ • สถิติสำหรับการจัดกลุ่ม • Factors Analysis, Discriminant Analysis • Inferential Statistics • ใช้สำหรับการพยากรณ์ การประมาณค่า • เน้นการใช้สมการถดถอยรูปแบบต่างๆ • การพิจารณาเส้นทางความสัมพันธ์เพื่อเปรียบเทียบผลทางตรงกับผลทางอ้อม ผ่านตัวแปรแทรกกลาง PATH ANALYSIS • สมการโครงสร้าง (SEM)

Simple Regression Analysis • การทดถอยเชิงเดี่ยว • ทดสอบ Causal Relationships ต้องมีหลักการทางเชิงทฤษดีมาก่อน -Positivism • Cause----- Consequence • Cause--- Effect • ต้นเหตุ- ผลที่เกิดขึ้น • ความสัมพันธ์เชิงเหตุและผล ที่ทดสอบด้วยสมการเศรษฐมิติ (Basic Econometrics) • ทดสอบอิทธิพล หนึ่งตัวแปรอิสระ กับหนึ่งตัวแปรตาม

จำนวน n ขั้นต่ำ คือ 30 • ไม่เน้นการควบคุม หรือ ขจัดอิทธิพลของปัจจัยอื่นๆ แต่ต้องการตรวจาสอบ • True Direct Real Effect • ระดับการวัดของข้อมูล อัตราส่วน ช่วง ทั้งตัวแปรต้นเหตุ และตัวแปรตาม แต่ ต้นเหตุสามารถเป็น dummy variable ได้ • ภาวะสมการสมรูป F, R-squared ยิ่งเข้าใกล้ 1 ยิ่งดี

Multiple Regression Analysis: MRA • ข้อดีใช้ในการค้นหาปัจจัยตามกฏ Causal Relationships • บนฐานคิดของสมการเศรษฐมิติ • สามารถพิสูจน์และวิเคราะห์หลายตัวแปรอิสระได้พร้อมกัน บนฐานคิดที่ว่า when everything being equals หรือเมื่อทุกสิ่งทุกอย่างเท่าเทียมกัน • ระดับการวัดของข้อมูล ตัวแปรตามต้องเป็นอัตราส่วน ช่วง • ตัวแปรอิสระ หรือตัวต้นเหตุ ควรเป็นอัตราส่วน หรือ ช่วง dummy variable ได้ • ต้องปฏิบัติตาม Basic assumption อย่างเคร่งครัด (เรียนรู้ตอนใช้ห้อง คอมพิวเตอร์) • PRF และ SRF • จำนวนตัวอย่างขั้นต่ำ 1 ต่อ 30 • ภาวะสมการสมรูป • Constrained Model และ Unconstrained Model (F-Ratio test) • R-squared Change

MRA: Method • Enter • Forward • Backward • Remove • Stepwise • เพื่ออะไร เมื่อใดใช้? • การสร้างตารางเพื่ออ่านและตีความหมายผลการวิเคราะห์ข้อมูล

Logistic Regression Analysis • วิเคราะห์โอกาสความน่าจะเป็นสูงสุด • Causal Relationship • ตัวแปรตามคือ การเกิดขึ้น การทำ การชื้อ การระบาด การใช้ การตัดสินใจ ฯลฯ ต้องเป็นตามกฏธรรมชาติ หรือ ตามเกณฑ์มาตรฐานสากล • 1= เกิด 0= ไม่เกิด • Binomial คือ Bi = สอง nominal คือ กลุ่ม • Dichotomous outcome variable

ตัวแปรต้นเหตุ ต้องตามข้อตกลงเบื้องต้น • Non-linear probability model • Linear probability model • Chi-squared test, Model Chi-squared • Restricted Model และ Unrestricted Model • Log likelihood Ratio test: LR test • Adjusted Proportional Probabilities • สอนในห้อง computer การอ่านและการแปรผล การเขียนรายงาน

สถิติสำหรับการวิจัย

สถิติสำหรับการวิจัย

Presentation Transcript