R For Statistical Analysis ปราณี นิลกรณ์
การใช้ R เพื่อการวิเคราะห์ทางสถิติ สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander ในการบรรยายนี้ จะเน้น การวิเคราะห์ข้อมูลโดยใช้ R Commander โดยเรียงลำดับขั้นตอนการวิเคราะห์ตั้งแต่ การอ่านข้อมูลเข้า การคำนวณสถิติพรรณนา การสร้างกราฟ การใช้สถิติอนุมาน เช่น การทดสอบสมมติฐาน การวิเคราะห์ การถดถอย
R commander การใช้ R commander เหมือนกับการใช้โปรแกรม สำเร็จรูปทางสถิติอื่นๆ (เช่น SPSS) คือมีเมนูและ dialog box ให้คลิ้กเลือกในการอ่านข้อมูลเข้า จัดการ ข้อมูลและวิเคราะห์ข้อมูล รายละเอียดเกี่ยวกับ R commander และวิธีใช้ อ่านได้ จาก Getting Started With the R Commander โดย John Fox (10 July 2010) (อยู่ใน Help ของ R Commander)
R Commander หน้าต่าง R commander แบ่งเป็น 3 ส่วน คือ ส่วนบนสุด เป็น script window สำหรับเก็บคำสั่ง R ที่ เกิดจากการใช้เมนูต่างๆ หรือผู้ใช้อาจพิมพ์คำสั่ง R ลง ไปเองโดยตรง ส่วนกลางเป็น output window ส่วนล่าง เป็น message window ที่ระบบใช้แสดง ข้อผิดพลาด คำเตือน หรือ ข้อมูลอื่นๆให้ผู้ใช้ทราบ ถ้าผู้ใช้สร้างกราฟ จะมีหน้าต่างกราฟต่างหาก
เมนู ของ R Commander File จัดการเกี่ยวกับไฟล์ Edit แก้ไขเนื้อหาใน script และ output windows Data สำหรับอ่านและจัดการเกี่ยวกับข้อมูล Statistics สำหรับคำนวณสถิติต่างๆ Graphs สำหรับสร้างกราฟพื้นฐานทางสถิติ Models สำหรับคำนวณสถิติที่เกี่ยวข้องกับตัวแบบทางสถิติ เช่น การถดถอยฯลฯ Distribution คำนวณความน่าจะเป็นภายใต้การแจกแจงต่างๆ Tools สำหรับ load packages และ plug-in ต่างๆ Help
Toolbar ของ R Commander
Toolbar ของ R Commander ปุ่มซ้ายสุด แสดงชุดข้อมูลที่กำลังใช้งานอยู่(active data set) เริ่มต้น จะยังไม่มี active data set ถ้าคลิ้ก ปุ่มนี้ จะสามารถเลือกชุดข้อมูลที่มีอยู่ในหน่วยความจำมา ใช้ได้ ตรงกลางเป็นปุ่ม Edit data set และ View data set ใช้ สำหรับเรียก active data set มาแก้ไข หรือดูข้อมูล ปุ่มขวาสุด แสดง ตัวแบบสถิติที่ใช้อยู่ เริ่มต้น จะยังไม่มี active model
Data Input การนำข้อมูลเข้ามาใน R Commander ทำได้หลายวิธี Key ข้อมูลเข้าโดยตรง โดยใช้ Data -> New data set … import ข้อมูลจาก text file, SPSS, Minitab, Stata, Excel, Access, dBase อ่าน data set จากที่มีอยู่ใน R package
การ Key ข้อมูลเข้าโดยตรง ให้เลือก Data-> New data set .. จาก R Commander menu จะปรากฏหน้าต่างดังนี้
การ Key ข้อมูลเข้าโดยตรง ให้พิมพ์ชื่อ ชุดข้อมูลลงไปตามที่ต้องการตั้ง(ถ้าไม่ ตั้ง โดยอัตโนมัติจะมีชื่อเป็น “Dataset”) ชื่อ data set อาจเริ่มต้นด้วย ตัวอักษรเล็ก / ตัวอักษรใหญ่ แล้วตามด้วย ตัวอักษรทั้งหมด /periods/ underscores/ตัวเลข แต่ห้ามมี Blank มิฉะนั้นจะถือว่ามีหลายชุดข้อมูล แล้ว Click OK จะปรากฏ Data Editor Window ดังภาพต่อไป ชื่อ data set ที่ตั้งไว้นี้ จะใช้เป็นชื่ออ้างอิงข้อมูลที่ อ่านเข้ามาต่อไป
การ Key ข้อมูลเข้าโดยตรง ใส่ข้อมูล แต่ละตัวแปรตามต้องการ ตั้งชื่อตัวแปรโดยการคลิ้กที่ var1 , var2 ฯลฯ จะทำ ให้ปรากฏ Variable editor dialog box ดังนี้ ให้พิมพ์ชื่อตัวแปรตามที่ต้องการลงไปแทน var1 var2 ฯลฯ เลือกเมนู File -> Close from the Data Editor หรือ คลิ้ก ที่มุมขวาบนเพื่อปิด Data editor ข้อมูลที่พิมพ์ เข้าไปจะเป็น active data set
การอ่านข้อมูลจาก Text File แถวต่อๆไป เป็นค่าของตัวแปร โดย 1 แถวเป็นข้อมูล ของ 1 case(คน) หรือ 1 หน่วยสังเกต ข้อมูลของแต่ละตัวแปรควรแยกจากกันด้วย อย่างน้อย 1 ช่องว่าง หรือ มี comma คั่น หรือ ใช้ tab คั่น ข้อมูลสูญหาย ให้ใช้ NA แทน ตัวแปรที่มีค่าข้อมูลเป็น string R จะถือว่าตัวแปรนั้น เป็น factor ใช้คำสั่ง Data -> Import data from text file
ตัวอย่างข้อมูลใน Text file Id VitaminC Placebo 1 145 417 2 185 279 3 387 678 4 593 636 5 248 170 6 245 699 7 349 372 8 902 582 9 159 363 10 122 258 11 264 288 12 1052 526 13 218 180 14 117 172 15 185 278
การอ่านข้อมูลจาก Text File R Commander จะขึ้นหน้าต่างดังนี้ให้
การอ่านข้อมูลจาก Text File ให้ตั้งชื่อ data set ตามที่ต้องการ แล้ว Click OK Read Text Data dialog จะเปิด Open file dialog ให้ ให้ไปที่ไฟล์ที่ต้องการอ่าน แล้วคลิ้ก Open จะทำให้ไฟล์ ถูกอ่านเข้ามาใน R และชุดข้อมูลนี้จะเป็น active data set ถ้าต้องการดูข้อมูล ให้ click View data set การอ่านข้อมูลจาก SPSS, Excel ฯลฯ ทำได้ ทำนองเดียวกัน
การจัดการข้อมูล การ recode 03/04/60 การจัดการข้อมูล การ recode เลือก Data->Manage variables in active data set- >Recode Variables การคำนวณตัวแปรใหม่ เลือก Data->Manage variables in active data set ->Compute New Variables ปราณี นิลกรร์
การคำนวณสถิติพรรณนา เมื่อมี active data set แล้ว สามารถคำนวณสถิติต่างๆ ได้ด้วย menu ของ R commander การคำนวณสถิติพรรณนา เลือกเมนู Statistics -> Summaries->Numerical summaries จะปรากฏ dialog box ดังนี้ เฉพาะตัวแปร numeric เท่านั้นที่ปรากฏใน dialog box เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK
การสร้างกราฟ เลือกเมนู Graphs->Histogram….. จะปรากฏ Histogram dialog box ให้เลือกตัวแปรที่ต้องการ แล้ว คลิ้ก OK กราฟอื่น เลือกได้ทำนองเดียวกัน
การทดสอบสมมติฐาน – เปรียบเทียบค่าเฉลี่ย 2 ประชากร ข้อมูลจับคู่ เลือกเมนู Statistics->Means-> Paired t test ข้อมูลอิสระ เลือกเมนู Statistics->Means-> Independent samples t test
การทดสอบการเท่ากันของความแปรปรวนของ 2 ประชากร เลือกเมนู Statistics->Variances-> Levene’s test ตัวอย่าง output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 12.508 0.0006091 *** 103 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ‘ 1
การหาความเชื่อมั่นของแบบสอบถาม เลือกเมนู Statistics->Dimensional Analysis-> scale reliability
Practice ดูเอกสารแบบฝึกหัด 03/04/60 Practice ดูเอกสารแบบฝึกหัด ปราณี นิลกรร์