R For Statistical Analysis

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
Analyze → Compare Means → Paired-Sample T test…
Advertisements

ไม่อิงพารามิเตอร์เบื้องต้น
สถิติ และ การวิเคราะห์ข้อมูล
BC322 ครั้งที่ 6 Text file BC322 : computer Programming (Week6)
สถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อย
การทดสอบที (t) หัวข้อที่จะศึกษามีดังนี้
HTML Language ภาษา HTML คืออะไร ? HTML (Hyper Text Markup Language) เป็นภาษาที่ใช้ในการพัฒนา web page เพื่อให้โปรแกรม web brower ต่างๆ (Internet Explorer,
การสร้างจดหมายเวียน (Mail Merge ).
การใช้งานโปรแกรม Excel เบื้องต้น
MS Excel Excel เป็นโปรแกรมประเภท สเปรยชีต (Speadsheet) หรือโปรแกรมตาราง งาน ซึ่งจะเก็บข้อมูลต่าง ๆ ลงบน แผ่นตารางงาน คล้ายกับการเขียน ข้อมูลลงไปในสมุดที่มีการตีช่องตาราง.
Microsoft Excel 2007.
Week 6 ประกาศค่าตัวแปร.
บทที่ 3 พื้นฐานการเขียนโปรแกรม Visual Basic
PHP LANGUAGE.
การใช้โปรแกรมคอมพิวเตอร์ช่วยในการวิเคราะห์ข้อมูล
Microsoft Word Part I Government Savings Bank Computer Trainging Í
ปฏิบัติการที่ 3 : การสร้างโฮมเพจอย่างง่าย
ระบบอัตโนมัติและการพิมพ์
โปรแกรมสำเร็จรูปทางสถิติ
การฝึกอบรมการใช้งาน โปรแกรม Microsoft Office Xp.
การติดตั้ง R และ R Commander
SCC : Suthida Chaichomchuen
Dr. Tipsuda Janjamlha 30 AUG. 08
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
การใช้งานโปรแกรม Microsoft Word
การใช้งานโปรแกรม EViews เบื้องต้น
โปรแกรม Microsoft Access
การสร้างสื่อนำเสนอด้วย PowerPoint
เริ่มต้น Photoshop CS5.
ชั้นมัธยมศึกษาตอนต้น
Menu Analyze > Correlate
การใช้งาน Microsoft Windows XP
การติดตั้ง จัดการแฟ้มเสียง บันทึกเสียง และ effect
Chapter 4 การสร้าง Application
การเปลี่ยนแปลงเกี่ยวกับตัวแปร
โปรแกรม DeskTopAuthor
รายงาน เรื่อง -ส่วนประกอบที่สำคัญของ microsoft excel -การพิมพ์ข้อมูลและการสร้างสูตรเบื้องต้น จัดทำโดย.
Microsoft Excel เป็นโปรแกรมประเภท สเปรดชีต (spreadsheet) หรือตารางคำนวณอิเล็กทรอนิกส์ที่ใช้เก็บบันทึกข้อมูลในลักษณะต่างๆ ซึ่งส่วนใหญ่มักเก็บข้อมูลประเภทการคำนวณ.
รายงาน เรื่อง พื้นฐาน Microsoft Excel จัดทำโดย
พื้นฐานของ Microsoft Office Excel โดย
การประยุกต์ใช้ ง การเขียนโปรแกรมบนระบบไร้ สาย.
การแปลงข้อมูลใน Excel เป็นฐานข้อมูลใน Access
การ Generate ตารางข้อมูลให้เป็นแผนที่โดยใช้ ArcView
การทดสอบความแปรปรวน ANOVA
วิธีตรวจสอบข้อมูล 21 แฟ้ม ก่อนอัพโหลด ด้วยโปรแกรม สปสช. OPPP NHSO 2556.
การใช้ Word เพื่อการคำนวณ
ตัวแปรกับชนิดของข้อมูล
วิชาคอมพิวเตอร์กราฟิก
รู้จักกับTimeline, Layer และ Scene รู้จักกับTimeline, Layer และ Scene
การใช้งานโปรแกรม Microsoft Power Point
Week 2 Variables.
บทที่ 4 Power Point ขั้นตอนการทำสไลด์ รายละเอียดหน้าจอของ Power Point
บทที่ 3 การทำงานกับฟอร์ม (Form)
โปรแกรม Microsoft Access
บทที่ 3 การทำงานกับฟอร์ม (Form)
บทที่ 4 การทำงานกับรายงาน (Report)
บทที่ 3 การสร้าง Appication แบบ Windows Form
หลักการเขียนโปรแกรม ( )
บทที่ 9 การใช้งานฟอร์มและคอนโทรลต่าง ๆ
เริ่มต้น Photoshop CS5.
การแสดงผลและการรับข้อมูล (Data Output and Input)
ภาพนี้ชื่อว่าอะไร ? ก. แถบเมนูบาร์
Nero Burning Rom น. ส. ธัชรินทร์ เลิศกิจจา คณะศิลปกรศาสตร์ เอก ออกแบบทัศนศิลป์ - ศิลปเครื่องประดับ รหัสประจำตัวนิสิต section B05.
1 Functions กนกวรรธน์ เซี่ยงเจ็น สำนักวิชาเทคโนโลยีสารสนเทศ และการสื่อสาร มหาวิทยาลัยนเรศวร พะเยา.
ง30219 ระบบสนับสนุนการตัดสินใจ
เริ่มใช้งาน Microsoft Office
1 Introduction to SQL กนกวรรธน์ เซี่ยงเจ็น สำนักวิชาเทคโนโลยีสารสนเทศ และการสื่อสาร มหาวิทยาลัยนเรศวร วิทยาเขต สารสนเทศพะเยา.
การเตรียมข้อมูล (Data preparation)
การใช้งานโปรแกรม Excel เบื้องต้น
หลักการทั่วไปเกี่ยวกับการเขียนโปรแกรม
ใบสำเนางานนำเสนอ:

R For Statistical Analysis ปราณี นิลกรณ์

การใช้ R เพื่อการวิเคราะห์ทางสถิติ สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander ในการบรรยายนี้ จะเน้น การวิเคราะห์ข้อมูลโดยใช้ R Commander โดยเรียงลำดับขั้นตอนการวิเคราะห์ตั้งแต่ การอ่านข้อมูลเข้า การคำนวณสถิติพรรณนา การสร้างกราฟ การใช้สถิติอนุมาน เช่น การทดสอบสมมติฐาน การวิเคราะห์ การถดถอย

R commander การใช้ R commander เหมือนกับการใช้โปรแกรม สำเร็จรูปทางสถิติอื่นๆ (เช่น SPSS) คือมีเมนูและ dialog box ให้คลิ้กเลือกในการอ่านข้อมูลเข้า จัดการ ข้อมูลและวิเคราะห์ข้อมูล รายละเอียดเกี่ยวกับ R commander และวิธีใช้ อ่านได้ จาก Getting Started With the R Commander โดย John Fox (10 July 2010) (อยู่ใน Help ของ R Commander)

R Commander หน้าต่าง R commander แบ่งเป็น 3 ส่วน คือ ส่วนบนสุด เป็น script window สำหรับเก็บคำสั่ง R ที่ เกิดจากการใช้เมนูต่างๆ หรือผู้ใช้อาจพิมพ์คำสั่ง R ลง ไปเองโดยตรง ส่วนกลางเป็น output window ส่วนล่าง เป็น message window ที่ระบบใช้แสดง ข้อผิดพลาด คำเตือน หรือ ข้อมูลอื่นๆให้ผู้ใช้ทราบ ถ้าผู้ใช้สร้างกราฟ จะมีหน้าต่างกราฟต่างหาก

เมนู ของ R Commander File จัดการเกี่ยวกับไฟล์ Edit แก้ไขเนื้อหาใน script และ output windows Data สำหรับอ่านและจัดการเกี่ยวกับข้อมูล Statistics สำหรับคำนวณสถิติต่างๆ Graphs สำหรับสร้างกราฟพื้นฐานทางสถิติ Models สำหรับคำนวณสถิติที่เกี่ยวข้องกับตัวแบบทางสถิติ เช่น การถดถอยฯลฯ Distribution คำนวณความน่าจะเป็นภายใต้การแจกแจงต่างๆ Tools สำหรับ load packages และ plug-in ต่างๆ Help

Toolbar ของ R Commander

Toolbar ของ R Commander ปุ่มซ้ายสุด แสดงชุดข้อมูลที่กำลังใช้งานอยู่(active data set) เริ่มต้น จะยังไม่มี active data set ถ้าคลิ้ก ปุ่มนี้ จะสามารถเลือกชุดข้อมูลที่มีอยู่ในหน่วยความจำมา ใช้ได้ ตรงกลางเป็นปุ่ม Edit data set และ View data set ใช้ สำหรับเรียก active data set มาแก้ไข หรือดูข้อมูล ปุ่มขวาสุด แสดง ตัวแบบสถิติที่ใช้อยู่ เริ่มต้น จะยังไม่มี active model

Data Input การนำข้อมูลเข้ามาใน R Commander ทำได้หลายวิธี Key ข้อมูลเข้าโดยตรง โดยใช้ Data -> New data set … import ข้อมูลจาก text file, SPSS, Minitab, Stata, Excel, Access, dBase อ่าน data set จากที่มีอยู่ใน R package

การ Key ข้อมูลเข้าโดยตรง ให้เลือก Data-> New data set .. จาก R Commander menu จะปรากฏหน้าต่างดังนี้

การ Key ข้อมูลเข้าโดยตรง ให้พิมพ์ชื่อ ชุดข้อมูลลงไปตามที่ต้องการตั้ง(ถ้าไม่ ตั้ง โดยอัตโนมัติจะมีชื่อเป็น “Dataset”) ชื่อ data set อาจเริ่มต้นด้วย ตัวอักษรเล็ก / ตัวอักษรใหญ่ แล้วตามด้วย ตัวอักษรทั้งหมด /periods/ underscores/ตัวเลข แต่ห้ามมี Blank มิฉะนั้นจะถือว่ามีหลายชุดข้อมูล แล้ว Click OK จะปรากฏ Data Editor Window ดังภาพต่อไป ชื่อ data set ที่ตั้งไว้นี้ จะใช้เป็นชื่ออ้างอิงข้อมูลที่ อ่านเข้ามาต่อไป

การ Key ข้อมูลเข้าโดยตรง ใส่ข้อมูล แต่ละตัวแปรตามต้องการ ตั้งชื่อตัวแปรโดยการคลิ้กที่ var1 , var2 ฯลฯ จะทำ ให้ปรากฏ Variable editor dialog box ดังนี้ ให้พิมพ์ชื่อตัวแปรตามที่ต้องการลงไปแทน var1 var2 ฯลฯ เลือกเมนู File -> Close from the Data Editor หรือ คลิ้ก  ที่มุมขวาบนเพื่อปิด Data editor ข้อมูลที่พิมพ์ เข้าไปจะเป็น active data set

การอ่านข้อมูลจาก Text File แถวต่อๆไป เป็นค่าของตัวแปร โดย 1 แถวเป็นข้อมูล ของ 1 case(คน) หรือ 1 หน่วยสังเกต ข้อมูลของแต่ละตัวแปรควรแยกจากกันด้วย อย่างน้อย 1 ช่องว่าง หรือ มี comma คั่น หรือ ใช้ tab คั่น ข้อมูลสูญหาย ให้ใช้ NA แทน ตัวแปรที่มีค่าข้อมูลเป็น string R จะถือว่าตัวแปรนั้น เป็น factor ใช้คำสั่ง Data -> Import data from text file

ตัวอย่างข้อมูลใน Text file Id VitaminC Placebo 1 145 417 2 185 279 3 387 678 4 593 636 5 248 170 6 245 699 7 349 372 8 902 582 9 159 363 10 122 258 11 264 288 12 1052 526 13 218 180 14 117 172 15 185 278

การอ่านข้อมูลจาก Text File R Commander จะขึ้นหน้าต่างดังนี้ให้

การอ่านข้อมูลจาก Text File ให้ตั้งชื่อ data set ตามที่ต้องการ แล้ว Click OK Read Text Data dialog จะเปิด Open file dialog ให้ ให้ไปที่ไฟล์ที่ต้องการอ่าน แล้วคลิ้ก Open จะทำให้ไฟล์ ถูกอ่านเข้ามาใน R และชุดข้อมูลนี้จะเป็น active data set ถ้าต้องการดูข้อมูล ให้ click View data set การอ่านข้อมูลจาก SPSS, Excel ฯลฯ ทำได้ ทำนองเดียวกัน

การจัดการข้อมูล การ recode 03/04/60 การจัดการข้อมูล การ recode เลือก Data->Manage variables in active data set- >Recode Variables การคำนวณตัวแปรใหม่ เลือก Data->Manage variables in active data set ->Compute New Variables ปราณี นิลกรร์

การคำนวณสถิติพรรณนา เมื่อมี active data set แล้ว สามารถคำนวณสถิติต่างๆ ได้ด้วย menu ของ R commander การคำนวณสถิติพรรณนา เลือกเมนู Statistics -> Summaries->Numerical summaries จะปรากฏ dialog box ดังนี้ เฉพาะตัวแปร numeric เท่านั้นที่ปรากฏใน dialog box เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK

การสร้างกราฟ เลือกเมนู Graphs->Histogram….. จะปรากฏ Histogram dialog box ให้เลือกตัวแปรที่ต้องการ แล้ว คลิ้ก OK กราฟอื่น เลือกได้ทำนองเดียวกัน

การทดสอบสมมติฐาน – เปรียบเทียบค่าเฉลี่ย 2 ประชากร ข้อมูลจับคู่ เลือกเมนู Statistics->Means-> Paired t test ข้อมูลอิสระ เลือกเมนู Statistics->Means-> Independent samples t test

การทดสอบการเท่ากันของความแปรปรวนของ 2 ประชากร เลือกเมนู Statistics->Variances-> Levene’s test ตัวอย่าง output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 12.508 0.0006091 *** 103 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ‘ 1

การหาความเชื่อมั่นของแบบสอบถาม เลือกเมนู Statistics->Dimensional Analysis-> scale reliability

Practice ดูเอกสารแบบฝึกหัด 03/04/60 Practice ดูเอกสารแบบฝึกหัด ปราณี นิลกรร์