910 likes | 1.61k Views
การวิเคราะห์ข้อมูล. ดร . สังวรณ์ งัดกระโทก 26 มีนาคม 2553. แนวทางการวิเคราะห์ข้อมูล. การวิเคราะห์ข้อมูลเพื่อบรรยายสภาพ -- สถิติเชิงพรรณา การวิคราะห์ข้อมูลเพื่อศึกษาความสัมพันธ์ของตัวแปร ---correlation การวิเคราะห์ข้อมูลเพื่อเปรียบเทียบ ---t-test, z test, ANOVA, ANCOVA, MANOVA, MANCOVA
E N D
การวิเคราะห์ข้อมูล ดร. สังวรณ์ งัดกระโทก 26 มีนาคม 2553
แนวทางการวิเคราะห์ข้อมูลแนวทางการวิเคราะห์ข้อมูล • การวิเคราะห์ข้อมูลเพื่อบรรยายสภาพ--สถิติเชิงพรรณา • การวิคราะห์ข้อมูลเพื่อศึกษาความสัมพันธ์ของตัวแปร---correlation • การวิเคราะห์ข้อมูลเพื่อเปรียบเทียบ ---t-test, z test, ANOVA, ANCOVA, MANOVA, MANCOVA • การวิเคราะห์ข้อมูลทำนาย ---regression, forecasting • การวิเคราะห์ข้อมูลเพื่อตรวจสอบโมเดล—SEM • การวิเคราะห์ข้อมูลลดจำนวนตัวแปร---Factor Analysis
Factor Analysis SEM
การวิเคราะห์ความสัมพันธ์ของตัวแปรการวิเคราะห์ความสัมพันธ์ของตัวแปร • Pearson Correlation สำหรับตัวแปรต่อเนื่อง • Spearman Rank Correlation ตัวแปรจัดอันดับ • Chi-square ตัวแปรนามบัญญัติ
สัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient, Rxy) • ระดับของความผันแปรร่วมกันของตัวแปร X และ Y เช่น ความสัมพันธ์ของจำนวนนักศึกษากับจำนวนอาจารย์ • จำนวนนักศึกษากับจำนวนอาจารย์อาจมีความสัมพันธ์กัน แต่ไม่บอกว่าอะไรเป็นเหตุ อะไรเป็นผล • ความสัมพันธ์มีค่าตั้งแต่ -1 ถึง +1 <.20 ความสัมพันธ์น้อยมาก .20-.40 ความสัมพันธ์น้อย .40-.70 ความสัมพันธ์ปานกลาง .70-.90 ความสัมพันธ์สูง > .90 ความสัมพันธ์สูงมาก
การคำนวณสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันการคำนวณสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน X=เงินเดือน Y= ประสบการณ์การทำงาน t วิกฤติ =2.31
Simple and Multiple Regression
การวิเคราะห์การถดถอยอย่างง่าย (simple regression) 1. การวิเคราะห์การถดถอยอย่างง่าย (simple regression) : มีตัวแปรตามและตัวแปรอิสระอย่างละ 1 ตัว Y = a + bX + e
=๐ Ho : b=๐ H1: b=๐
ใช้ทดสอบนัยสำคัญของHo : b=๐
Multiple regression analysis คือ เทคนิค เชิงสถิติที่ใช้วิเคราะห์ความสัมพันธ์ระหว่าง ตัวแปรตาม 1 ตัวกับตัวแปรทำนายหลายตัว Y = a + b1X1 +b2X2 + … + bnXn + e
ข้อตกลงของการวิเคราะห์การถดถอยพหุคูณข้อตกลงของการวิเคราะห์การถดถอยพหุคูณ Linearity of the phenomenon measured Constant variance of the error terms Independence of the error terms Normality of the error term distribution
+ + 0 0 - - + + 0 0 - -
สัมประสิทธิ์ของการทำนาย (R2) R2คือ ปริมาณความแปรปรวนของตัวแปรตาม ที่อธิบายได้ด้วยตัวแปรต้น JOBQUA = 0.928 + 0.189(GROWTH) + 0.427(JOBSAT) + 0.141(COMMIT) + 0.442 (16.68) (8.130)(15.335)(5.323) R2 = 0.558
Multicollinearity : เกิดจากตัวแปรทำนายมีความสัมพันธ์กันเองสูง ทำให้ 1. สัมประสิทธิ์การถดถอยต่ำ หรือเปลี่ยนทิศทางจากลบเป็นบวก, บวกเป็นลบ 2. สัมประสิทธิ์การถดถอยไม่คงที่ 3. ตีความยากและไม่สามารถสรุปอ้างอิงได้ ๔.ค่า R2สูง แต่สัมประสิทธิ์การถดถอยไม่มีนัยสำคัญทางสถิติ แก้ไขได้โดยรวมตัวแปร หรือเลือกตัวแปรเพียงตัวเดียว
การวิเคราะห์การถดถอยเมื่อตัวทำนายการวิเคราะห์การถดถอยเมื่อตัวทำนาย เป็นตัวแปรนามบัญญัติ เช่น ใช้วุฒิการศึกษาทำนายคะแนนสอบ เมื่อวุฒิการศึกษา คือ ปริญญาตรี โท และเอก เปลี่ยนตัวแปรทำนายเป็นตัวแปรดัมมี่ (dummy variables)
ตัวแปรวุฒิการศึกษามี 3 ค่า จะสร้างเป็นตัวแปรดัมมี่ได้ 3 - 1 = 2 ตัวแปร ระดับปริญญาตรี (bachelor) กำหนดให้มีค่า เป็น 00 ระดับปริญญาโท (master) กำหนดให้ค่าเป็น 01 ระดับปริญญาเอก (doctor) กำหนดให้มีค่าเป็น 11 Score = a + b1(master) + b2 (doctor) + e
Score = a +b1(master)+b2 (doctor) + error Score = 50 + 10(master)+ 20(doctor) + error แปลผลอย่างไร ???
แนวทางการใช้ t-test • Independent t-test: ใช้เปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างสองกลุ่มที่เป็นอิสระต่อกัน เช่น ค่าเฉลี่ยของรายได้ระหว่างชายและหญิง • Dependent t-test: ใช้เปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างสองกลุ่มที่ไม่เป็นอิสระต่อกัน เช่น ค่าเฉลี่ยคะแนนก่อนเรียน และหลังเรียน ค่าเฉลี่ยความคิดเห็นของสามี-ภรรยา
เปรียบเทียบค่าเฉลี่ยของคะแนนระหว่างโรงเรียนของรัฐ vs. โรงเรียนเอกชน
Independent t-test • เปรียบเทียบค่าเฉลี่ยของคะแนนระหว่างโรงเรียนของรัฐ vs. โรงเรียนเอกชน
การคำนวณ: ความแปรปรวนของสองกลุ่มเท่ากัน
การคำนวณ: ความแปรปรวนของสองกลุ่มเท่ากัน
ข้อตกลงเบื้องต้น • กลุ่มตัวอย่างเป็นอิสระต่อกัน (independence) • ความแปรปรวนของสองกลุ่มเท่ากัน (Homogeneity of variance)
ผลการวิเคราะห์ t-test ด้วย SPSS
เปรียบเทียบค่าเฉลี่ยของคะแนนระหว่างโรงเรียนของรัฐ vs. โรงเรียนเอกชน
การเปรียบเทียบความนิยมต่อรัฐบาลระหว่างเดือนมกราคมและมีนาคมการเปรียบเทียบความนิยมต่อรัฐบาลระหว่างเดือนมกราคมและมีนาคม
การวิเคราะห์ความแปรปรวน (Analysis of Variance: ANOVA)
ANOVA • ใช้เปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่สามกลุ่มขึ้นไป • ถ้ามีกลุ่ม A BC ถ้าใช้ t-test ต้องเปรียบเทียบ AB, AC, BC ซึ่งแต่ละครั้งมีความคลาดเคลื่อน 0.05 ดังนั้นมีความคลาดเคลื่อนรวม 3(.05)=0.15
ANOVA • One-way ANOVA: มีตัวแปรต้น 1 ตัว (3 ระดับขึ้นไป)เช่น ภูมิภาค (ก.ท.ม. เหนือ กลาง ใต้ อีสาน) • Two-way ANOVA: มีมีตัวแปรต้น 2 ตัว (2 ระดับขึ้นไป) เช่น เพศ และ สถานภาพสมรส • Fixed variable : ศึกษาทุกระดับ • Random variable: ศึกษาบางระดับ
การตั้งสมมติฐาน: One-way ANOVA • ถ้ามี k กลุ่ม