1 / 31

Preparing data for analysis

Preparing data for analysis . Kanit Lohakad . Outline: . 1. ขั้นตอนการวิเคราะห์ข้อมูล ขั้นตอนที่ 1 การเก็บรวบรวมข้อมูล ขั้นตอนที่ 2 การเตรียมข้อมูลสำหรับการวิเคราะห์ การลงรหัส ( Coding) การบรรณาธิกร ( Editing) การแปรสภาพข้อมูล ( Transforming)

yule
Download Presentation

Preparing data for analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Preparing data for analysis Kanit Lohakad

  2. Outline: 1. ขั้นตอนการวิเคราะห์ข้อมูล ขั้นตอนที่ 1 การเก็บรวบรวมข้อมูล ขั้นตอนที่ 2 การเตรียมข้อมูลสำหรับการวิเคราะห์ การลงรหัส (Coding) การบรรณาธิกร (Editing) การแปรสภาพข้อมูล (Transforming) ขั้นตอนที่ 3 การวิเคราะห์ข้อมูล การวิเคราะห์ข้อมูลขั้นต้น การวิเคราะห์ข้อมูลด้วยสถิตทดสอบ ขั้นตอนที่ 4 การสรุปและนำเสนอข้อมูล

  3. Outline: 2. การกำหนดรหัสสำหรับข้อมูล 2.1 การกำหนดรหัสสำหรับคำถามปลายปิด 2.1.1 คำถามที่ให้เลือก 1 คำตอบ 2.1.2 คำถามที่ให้เลือกหลายคำตอบ (ตอบได้มากกว่า 1 ข้อ) 2.2 การกำหนดรหัสสำหรับคำถามปลายเปิด

  4. 1. ขั้นตอนการวิเคราะห์ข้อมูล ขั้นตอนที่ 1 การเก็บรวบรวมข้อมูล ขั้นตอนที่ 2 การเตรียมข้อมูลสำหรับการวิเคราะห์ 1) การลงรหัส (Coding) “อาชีพ” ให้รหัส “1” แทน ข้าราชการ “2” แทน พนักงานเอกชน “3” แทน กิจการส่วนตัว 2) การบรรณาธิกร (Editing) ความถูกต้องของข้อมูล ความสมบูรณ์ ครบถ้วนของข้อมูล การขาดหายของข้อมูล 3) การแปรสภาพข้อมูล (Transforming) เปลี่ยนรูปแบบของข้อมูลให้สะดวกกับการประมวลผล เป็นการบันทึกข้อมูลลงในสื่ออิเลคทรอนิคส์

  5. 1. ขั้นตอนการวิเคราะห์ข้อมูล ขั้นตอนที่ 3 การวิเคราะห์ข้อมูล 1. การวิเคราะห์ข้อมูลขั้นต้น: mean SD mode median การตรวจสอบข้อมูลขาดหาย (Missing data) การตรวจสอบข้อตกลงเบื้องต้นของสถิตวิเคราะห์ (Assumption) การตรวจสอบค่าสุดโต่ง (Extremes or Outliners) การตรวจสอบการกระจายของข้อมูล 2. การวิเคราะห์ข้อมูลด้วยสถิติทดสอบ : ทดสอบสมมุตฐาน ขั้นตอนที่ 4 การสรุปและนำเสนอข้อมูล

  6. 2. การกำหนดรหัสสำหรับข้อมูล ตอนที่ 1 ข้อมูลทั่วไปของผู้ตอบแบบสอบถาม 1. เพศ … หญิง …ชาย SEX …(1=หญิง, 2=ชาย) 2. ระดับชั้นปี………….level … 3. คณะ.................... faculty …(1=…, 2=…,3=…) 4. รายได้ต่อเดือน …………. บาท income … 5. ใช้อินเตอร์เน็ต…… ชั่วโมงต่อสัปดาห์ internet … 6. มีคอมพิวเตอร์เป็นของตนเองหรือไม่ … มี ...ไม่มี computer …(1=ม , 2=ไม่มี)

  7. 2.1 การกำหนดรหัสสำหรับคำถามปลายปิด 2.1.1 คำถามที่ให้เลือก 1 คำตอบ เพศ () ชาย () หญิง Sex ‘1’=ชาย ‘2’=หญิง รายได้() ไม่มีรายได้ () ต่ำกว่า 5,000 บ. ()5,001-10,000 บาท ( )10,001-20,000 บ.()20,001-50,000 บ. ()มากกว่า 50,000 บ. Income ‘1’=ไม่มีรายได้ ‘2’=ต่ำกว่า 5,000 ‘3’=5,001-10,000 ‘4’=10,001-20,000 ‘5’=20,001-50,000 ‘6’=มากกว่า 50,000 ระดับการศึกษา ()มัธยมตน ()มัธยมปลาย ()อนุปริญญา ( )ปริญญาตรี ()อื่นๆ(ระบุ)... Edu 1=ม.ต้น2=ม.ปลาย3=อนุปริญญา 4=ปริญญาตรี 5=อื่นๆ

  8. คำถามที่ให้แสดงระดับความมากน้อย (scale question) 5=มากที่สุด 4=มาก 3=ปานกลาง 2=น้อย 1=น้อยที่สุด

  9. 2.1.2 คำถามที่ให้เลือกหลายคำตอบ (ตอบได้มากกว่า 1 ข้อ) ในช่วง 6 เดือนที่ผ่านมา ท่านเดินทางไปต่างจังหวัดด้วยยานพาหนะใดบ้าง () รถยนต์ส่วนบุคคล ( ) รถรับจาง () รถประจาทางปรับอากาศ ( ) รถประจาทางไม่ปรับอากาศ () รถไฟ ( ) เครื่องบินโดยสาร แต่ละทางเลือก=1 ตัวแปร: ค่าของแต่ละทางเลือก ‘1’=เลือก,‘0’=ไมเลือก รถยนต์ส่วนบุคคล (VEH1) 1 = ผู้ตอบเลือกรถยนต์ส่วนบุคคล, 0=ผู้ตอบไมเลือกรถยนต์ส่วนบุคคล รถรับจาง (VEH2) 1 = ผู้ตอบเลือกรถรับจาง, 0=ผู้ตอบไม่เลือกรถรับจาง

  10. 2.2 การกำหนดรหัสสำหรับคำถามปลายเปิด -SPSS สามารถพิมพ์ข้อความได้ยาวไมเกิน 255 ตัวอักษร -วิธีการให้รหัส : พิจารณาคำตอบ : จัดกลุ่มคำตอบที่คล้าย/เหมือนกันให้เป็นรหัสเดียวกัน

  11. ประเภทของข้อมูล Terminology สถิตเชิงพรรณนา (descriptive statistics) การแสดงค่ากลางของข้อมูล (central tendency) การแสดงการแจกแจงข้อมูล/การกระจายของข้อมูล (dispersion) การประมวลผลสถิติเชิงพรรณาใน SPSS กรณีข้อมูล nominal และ ordinal กรณีข้อมูล interval และ ratio วิธีการตรวจสอบการแจกแจงของข้อมูล ตาราง กราฟ สถิติทดสอบการแจกแจงข้อมูล

  12. ประเภทของข้อมูล จำแนกตามระดับการวัด 1. Nominal Scale 2. Ordinal 3. Interval 4. Ratio มาตรานามบัญญัต (nominal scale) เป็นการวัดขั้นพื้นฐานที่ใช้สำหรับจัดประเภท เป็นการกำหนดชื่อให้กับวัตถุสิ่งของต่าง ๆ ที่แบ่งกันด้วย ลักษณะ/คุณภาพ ตัวอย่าง การนับถือศาสนา พุทธ =1 คริสต์ = 2 อิสลาม = 3 สถิตที่ใช้ ความถี่ ร้อยละ ฐานนิยม การทดสอบไคสแควร์

  13. มาตราเรียงอันดับ (ordinal scale) เป็นการวัดที่แสดงความเกี่ยวพันของสิ่งต่าง ๆ ที่คำนึงถึงการจัดประเภท จัดลำดับหรือตำแหน่งของสิ่งต่าง ๆ การจัดลำดับบอกทิศทางของความมากกว่าน้อยกว่าแต่ไม่สามารถบอกความละเอียดของการแตกต่างกันได้อย่างแท้จริง ตัวอย่าง อันดับเพลงยอดนิยมประจำสัปดาห์ การจัดอันดับการประกวดนางงาม สถิตที่ใช้ ความถี่ ร้อยละ ฐานนิยม มัธยฐาน เปอร์เซ็นต์ไทล์ การทดสอบไคสแควร์

  14. มาตราอันตรภาค (interval scale) เป็นมาตราการวัดที่มีคุณสมบัติเชิงตัวเลขที่มีระยะห่างของหน่วยที่ใช้ใน การวัดเท่ากัน ค่าที่ได้สามารถนำมาบวก ลบกันได้ ไม่มีศูนย์ (0) แท้ จึงนามาเปรียบเทียบเชิงสัดส่วนไม่ได้ ตัวอย่าง อุณหภูมิ คะแนนจากการสอบ ระดับความพงพอใจ สถิตที่ใช้ คาเฉลยเลขคณิต ส่วนเบี่ยงเบนมาตรฐาน วิเคราะห์ความแปรปรวน สหสมพันธ์

  15. มาตราอัตราส่วน (ratio scale) เป็นมาตรการวัดที่มีคุณสมบัติเหมือนมาตราอันตรภาค และมี จุดเริ่มต้นที่ศูนย์แท้ ซึ่งหมายความว่าที่จุดศูนย์นั้นไม่มีค่าของสิ่ง นั้น ๆ อยู่เลย สามารถเปรียบเทียบเชิงสัดส่วนได้ ตัวอย่าง น้ำหนัก ส่วนสูง ระยะทาง ความเร่ง ความเร็ว สถิติที่ใช้ สถิติบรรยาย สถิติเชิงอ้างอิง

  16. Nominal Ordinal Ratio ระดับการวัดค่าเป็นดังต่อไปนี้ Ordinal Nominal

  17. สถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อยสถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อย มาจากคำสั่งต่อไปนี้ สถิติพื้นฐาน Frequencies, Percents Mean, Median, Mode Variance, Standard Deviation ภาพChart, Histogram Stem-and-Leaf Plot, Box Plot คำสั่ง 1. FREQUENCIES 2. CROSSTABS 3. DESCRIPTIVES 4. EXPLORE

  18. การเริ่มต้นโปรแกรม SPSS 1. คลิกซ้อนที่สัญรูป (icon) ของ SPSS บนพื้นจอเดสก์ทอป หรือ 2. จากจอเดสก์ทอปคลิก Start > Programs >SPSS ดังนี้ คลิก Programs คลิก ครั้งที่ 3 คลิก Start

  19. What would you like to do? เลือกที่นี่ แล้วคลิก OK จะปรากฏหน้าต่าง SPSS Data Editor สำหรับป้อนข้อมูล หรือ คลิกซ้อนที่ชื่อแฟ้มข้อมูล ถ้าข้อมูลเคยป้อนไว้แล้ว สำหรับversion 11.0 จะมีหน้าต่างแบบนี้ 2 บาน

  20. แถบชื่อ ชื่อเริ่มต้นคือUntitled ซึ่งสามารถเปลี่ยนแปลงได้ทีหลัง หน้าต่าง SPSS Data Editor รายการเลือก หรือ เมนู (Menus) ในที่นี้มี 10 รายการ 2 มุมมอง(คลิกสลับไปสลับมาได้)

  21. หน้าต่าง SPSS Data Editorในมุมมอง Data View แถวนอน (row)ในมุมมอง Data View คือ รายการข้อมูล (cases) ในที่นี้แสดง 3 รายการ สดมภ์ (column)ในมุมมอง Data View คือ ตัวแปร (variables) ในที่นี้มี 10 ตัว คือ id, i1, i2, i3, …, edu

  22. หน้าต่าง SPSS Data Editorในมุมมอง Variable View แถวนอน (row)ในมุมมอง Variable View คือ ตัวแปร (variables) ในที่นี้แสดง 4 ตัวคือ id, i1, i2, i3 สดมภ์ (column)ในมุมมอง Variable Viewคือ ลักษณะต่างๆของตัวแปร เช่น Name, Type, Width, Decimals เป็นต้น

  23. การเตรียมแฟ้มข้อมูล สิ่งที่จะเตรียมคือ • การตั้งชื่อตัวแปร (Naming a variable) • ฉลากตัวแปร (Variable labels) • ค่าฉลาก (Value labels) • ค่าสูญหาย (Missing values) • ชนิดตัวแปร (Variable type) • รูปแบบสดมภ์ (Column format) • ระดับการวัด (Measurement level)

  24. การแทรก(Insert) และ ลบ(Delete)รายการข้อมูล/ตัวแปร Data>Insert Case ทำได้ดังนี้ # การแทรกรายการ (case) ใหม่ # การแทรกตัวแปร (variable) ใหม่ # การลบรายการ (case) # การลบตัวแปร (variable) # การบันทึก (Saving)แฟ้มข้อมูล # การเปิด(Opening)แฟ้มข้อมูลที่มีอยู่แล้ว # การออกจากโปรแกรม SPSS Data>Insert Variable Edit>Clear หรือ ใช้คำสั่ง Delete Edit>Clear หรือ ใช้คำสั่ง Delete File >Save As… File >Open> Data… File>Exit

  25. ข้อมูลส่วนบุคคล 1. เพศ 1 [ ] ชาย 2 [ ] หญิง 2. วุฒิการศึกษา 1 [ ] ปริญญาตรี 2 [ ] ปริญญาโท 3 [ ] ปริญญาเอก ความพึงพอใจ 1. การดำเนินงานจัดการอบรม 1 [ ] น้อยที่สุด 2 [ ] น้อย 3 [ ] ปานกลาง 4 [ ] มาก 5 [ ] มากที่สุด ---------------- 7. การให้บริการด้านอาหาร ตัวอย่างแบบสอบถามสำหรับการสาธิต

  26. การสร้างแฟ้มข้อมูล id แทนหมายเลขแบบสอบถาม i1 ถึง i7 แทนประเด็นการประเมินข้อ 1 ถึงข้อ 7โดยใช้ค่าฉลาก (Value labels) ดังนี้ 0=น้อยที่สุด,1=น้อย,2=ปานกลาง, 3=มาก, 4=มากที่สุด (9=missing value) sex แทนเพศ โดย 1=male, 2=female, 9=missing edu แทน วุฒิการศึกษา โดย 1=bachelor, 2=master, 3=doctor, 9=missing

  27. ลำดับการสร้างแฟ้มข้อมูลลำดับการสร้างแฟ้มข้อมูล คลิกที่ Variable View และบรรทัดแรกพิมพ์ชื่อตัวแปรใต้ Name คือ id บรรทัดที่สอง พิมพ์ i1 (ไม่มีในภาพนี้) ใต้ Values คลิกบริเวณที่แรเงา และช่อง Value: ป้อน 0 ช่อง Value Label: ป้อน leastแล้วคลิก Add ทำซ้ำจนถึง 4 = mostแล้วคลิก OK ดังจอภาพต่อไปนี้

  28. การกำหนดค่าของตัวแปร: จอภาพ Value Labels ต่อไปก็ คลิก Add และคลิก OK ตามลำดับ

  29. การกำหนดค่าสูญหาย:จอภาพ Missing Values ต่อไปก็คลิก OK เมื่อหมดตัวแปรแล้ว ก็บันทึกข้อมูล ในที่นี้ให้ชื่อแฟ้มว่า satis (โปรแกรมจะเติม .sav เป็น satis.sav ให้โดยอัตโนมัติ) กำลังกำหนดค่า 9

  30. การป้อนข้อมูล ตัวแปรมี 10 ตัวคือ ID I1 I2 I3 I4 I5 I6 I7 SEX EDU รายการแรกที่ป้อน คือ1 3 4 4 3 3 4 3 1 2 ป้อนค่า 3 ซึ่งมีค่าฉลากเท่ากับ much ป้อนค่า 1 ของตัวแปร id แล้วเลื่อนลูกศรไปทางขวา เพื่อป้อนค่าถัดไป ป้อนค่า 3 ของตัวแปร i1 แล้วเลื่อนลูกศรไปทางขวา เพื่อป้อนค่าถัดไป ทำซ้ำจนครบทุกรายการ แล้วบันทึกข้อมูล โดยคลิกดังนี้ File > Save

  31. การเปลี่ยนรูปแบบ (Transformation) ข้อมูล ในที่นี้ต้องการคำนวณ satistf = i1 + i2 + i3 + i4 + i5 + i6 + i7. ช่องตัวแปร ต่อไปอาจเลือกคลิก OKหรือ Pasteอย่างใดอย่างหนึ่ง เลือกรายการ Transformและคลิกคำสั่ง Compute… ที่ Target Variable: ป้อน satistfและ เลือกตัวแปร i1 จาก ช่องตัวแปร ต่อไปคลิกลูกศร และคลิก +ทำเช่นนี้จนถึง i7

More Related