1 / 24

R For Statistical Analysis

R For Statistical Analysis. ปราณี นิลกรณ์. การใช้ R เพื่อการวิเคราะห์ทางสถิติ. สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander

glenna-hunt
Download Presentation

R For Statistical Analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. R For Statistical Analysis ปราณี นิลกรณ์

  2. การใช้ R เพื่อการวิเคราะห์ทางสถิติ • สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander • ในการบรรยายนี้ จะเน้น การวิเคราะห์ข้อมูลโดยใช้ RCommander โดยเรียงลำดับขั้นตอนการวิเคราะห์ตั้งแต่ • การอ่านข้อมูลเข้า • การคำนวณสถิติพรรณนา • การสร้างกราฟ • การใช้สถิติอนุมาน เช่น การทดสอบสมมติฐาน การวิเคราะห์การถดถอย

  3. R commander • การใช้ R commander เหมือนกับการใช้โปรแกรมสำเร็จรูปทางสถิติอื่นๆ (เช่น SPSS) คือมีเมนูและ dialog box ให้คลิ้กเลือกในการอ่านข้อมูลเข้า จัดการข้อมูลและวิเคราะห์ข้อมูล • รายละเอียดเกี่ยวกับ R commander และวิธีใช้ อ่านได้จาก Getting Started With the R Commander โดย John Fox (10 July 2010) (อยู่ใน Help ของ R Commander)

  4. R Commander หน้าต่าง R commander แบ่งเป็น 3 ส่วน คือ • ส่วนบนสุด เป็น script window สำหรับเก็บคำสั่ง R ที่เกิดจากการใช้เมนูต่างๆหรือผู้ใช้อาจพิมพ์คำสั่ง R ลงไปเองโดยตรง • ส่วนกลางเป็น output window • ส่วนล่าง เป็น message window ที่ระบบใช้แสดงข้อผิดพลาด คำเตือน หรือ ข้อมูลอื่นๆให้ผู้ใช้ทราบ • ถ้าผู้ใช้สร้างกราฟ จะมีหน้าต่างกราฟต่างหาก

  5. เมนู ของ R Commander • File จัดการเกี่ยวกับไฟล์ • Edit แก้ไขเนื้อหาใน script และ output windows • Data สำหรับอ่านและจัดการเกี่ยวกับข้อมูล • Statistics สำหรับคำนวณสถิติต่างๆ • Graphs สำหรับสร้างกราฟพื้นฐานทางสถิติ • Models สำหรับคำนวณสถิติที่เกี่ยวข้องกับตัวแบบทางสถิติ เช่น การถดถอยฯลฯ • Distribution คำนวณความน่าจะเป็นภายใต้การแจกแจงต่างๆ • Tools สำหรับ load packages และ plug-in ต่างๆ • Help

  6. Toolbar ของ R Commander • ใต้แถบเมนู จะมี toolbar ดังนี้ Tool Bar

  7. Toolbar ของ R Commander • ปุ่มซ้ายสุด แสดงชุดข้อมูลที่กำลังใช้งานอยู่(active data set) เริ่มต้น จะยังไม่มี active data set ถ้าคลิ้กปุ่มนี้ จะสามารถเลือกชุดข้อมูลที่มีอยู่ในหน่วยความจำมาใช้ได้ • ตรงกลางเป็นปุ่ม Edit data set และ View data set ใช้สำหรับเรียก active data set มาแก้ไข หรือดูข้อมูล • ปุ่มขวาสุด แสดง ตัวแบบสถิติที่ใช้อยู่ เริ่มต้น จะยังไม่มี active model

  8. Data Input การนำข้อมูลเข้ามาใน R Commander ทำได้หลายวิธี • Key ข้อมูลเข้าโดยตรง โดยใช้ Data -> New data set … • import ข้อมูลจาก text file, SPSS, Minitab, Stata, Excel, Access, dBase • อ่าน data set จากที่มีอยู่ใน R package

  9. การ Key ข้อมูลเข้าโดยตรง • ให้เลือก Data-> New data set .. จาก R Commander menu จะปรากฏหน้าต่างดังนี้

  10. การ Key ข้อมูลเข้าโดยตรง • ให้พิมพ์ชื่อ ชุดข้อมูลลงไปตามที่ต้องการตั้ง(ถ้าไม่ตั้ง โดยอัตโนมัติจะมีชื่อเป็น “Dataset”) • ชื่อ data set อาจเริ่มต้นด้วย ตัวอักษรเล็ก /ตัวอักษรใหญ่ แล้วตามด้วย ตัวอักษรทั้งหมด /periods/ underscores/ตัวเลข แต่ห้ามมี Blank มิฉะนั้นจะถือว่ามีหลายชุดข้อมูล • แล้ว Click OK จะปรากฏ Data Editor Window ดังภาพต่อไป • ชื่อ data set ที่ตั้งไว้นี้ จะใช้เป็นชื่ออ้างอิงข้อมูลที่อ่านเข้ามาต่อไป

  11. การ Key ข้อมูลเข้าโดยตรง • ใส่ข้อมูล แต่ละตัวแปรตามต้องการ • ตั้งชื่อตัวแปรโดยการคลิ้กที่ var1 , var2 ฯลฯ จะทำให้ปรากฏ Variable editor dialog box ดังนี้ • ให้พิมพ์ชื่อตัวแปรตามที่ต้องการลงไปแทน var1 var2 ฯลฯ • เลือกเมนู File -> Close from the Data Editor หรือ คลิ้ก  ที่มุมขวาบนเพื่อปิด Data editor ข้อมูลที่พิมพ์เข้าไปจะเป็น active data set

  12. การอ่านข้อมูลจาก Text File • ในการเก็บข้อมูลใน Text File แถวแรกควรเป็นชื่อตัวแปร • แถวต่อๆไป เป็นค่าของตัวแปร โดย 1 แถวเป็นข้อมูลของ 1 case(คน) หรือ 1 หน่วยสังเกต • ข้อมูลของแต่ละตัวแปรควรแยกจากกันด้วย อย่างน้อย 1 ช่องว่าง หรือ มี comma คั่น หรือ ใช้ tab คั่น • ข้อมูลสูญหาย ให้ใช้ NA แทน • ตัวแปรที่มีค่าข้อมูลเป็น string R จะถือว่าตัวแปรนั้นเป็น factor • ใช้คำสั่ง Data -> Import data from text file

  13. ตัวอย่างข้อมูลใน Text file Id VitaminC Placebo 1 145 417 2 185 279 3 387 678 4 593 636 5 248 170 6 245 699 7 349 372 8 902 582 9 159 363 10 122 258 11 264 288 12 1052 526 13 218 180 14 117 172 15 185 278

  14. การอ่านข้อมูลจาก Text File • R Commander จะขึ้นหน้าต่างดังนี้ให้

  15. การอ่านข้อมูลจาก Text File • ให้ตั้งชื่อ data set ตามที่ต้องการ แล้ว Click OK • Read Text Data dialog จะเปิด Open file dialog ให้ ให้ไปที่ไฟล์ที่ต้องการอ่าน แล้วคลิ้ก Open จะทำให้ไฟล์ถูกอ่านเข้ามาใน R และชุดข้อมูลนี้จะเป็น active data set • ถ้าต้องการดูข้อมูล ให้ click View data set • การอ่านข้อมูลจาก SPSS, Excel ฯลฯทำได้ทำนองเดียวกัน

  16. การจัดการข้อมูล การ recode • เลือก Data->Manage variables in active data set->Recode Variables การคำนวณตัวแปรใหม่ • เลือก Data->Manage variables in active data set ->Compute New Variables

  17. การคำนวณสถิติพรรณนา • เมื่อมี active data set แล้ว สามารถคำนวณสถิติต่างๆได้ด้วย menu ของ R commander • การคำนวณสถิติพรรณนา เลือกเมนู Statistics -> Summaries->Numerical summaries จะปรากฏ dialog box ดังนี้ • เฉพาะตัวแปร numeric เท่านั้นที่ปรากฏใน dialog box • เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK

  18. การสร้างกราฟ • เลือกเมนู Graphs->Histogram….. จะปรากฏ Histogram dialog box ให้เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK • กราฟอื่น เลือกได้ทำนองเดียวกัน

  19. การทดสอบสมมติฐาน – เปรียบเทียบค่าเฉลี่ย 2 ประชากร ข้อมูลจับคู่ • เลือกเมนู Statistics->Means-> Paired t test ข้อมูลอิสระ • เลือกเมนู Statistics->Means-> Independent samples t test

  20. การทดสอบการเท่ากันของความแปรปรวนของ 2 ประชากร • เลือกเมนู Statistics->Variances-> Levene’s test • ตัวอย่าง output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 12.508 0.0006091 *** 103 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ‘ 1

  21. การหาความเชื่อมั่นของแบบสอบถามการหาความเชื่อมั่นของแบบสอบถาม • เลือกเมนู Statistics->Dimensional Analysis-> scale reliability

  22. Practiceดูเอกสารแบบฝึกหัด

More Related