งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

ปราณี นิลกรณ์.  R เป็นภาษาและโปรแกรมสำเร็จรูปสำหรับการ คำนวณทางสถิติและสร้างกราฟประเภทให้เปล่า ( free open source package ) ที่พัฒนาขึ้นมาจาก ภาษา S.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "ปราณี นิลกรณ์.  R เป็นภาษาและโปรแกรมสำเร็จรูปสำหรับการ คำนวณทางสถิติและสร้างกราฟประเภทให้เปล่า ( free open source package ) ที่พัฒนาขึ้นมาจาก ภาษา S."— ใบสำเนางานนำเสนอ:

1 ปราณี นิลกรณ์

2  R เป็นภาษาและโปรแกรมสำเร็จรูปสำหรับการ คำนวณทางสถิติและสร้างกราฟประเภทให้เปล่า ( free open source package ) ที่พัฒนาขึ้นมาจาก ภาษา S ( S language, Bell Labs) โดย Robert Gentleman และ Ross Ihaka แห่ง University of Auckland, New Zealand เมื่อปี 2538  เหมาะทั้งสำหรับการเขียนโปรแกรมเอง และใช้แบบ โปรแกรมสำเร็จรูป  มีฟังก์ชันทางสถิติให้เรียกใช้มากมาย และมีผู้พัฒนา เพิ่มอย่างต่อเนื่อง 2

3  ข้อมูลทุกอย่างเกี่ยวกับ R หาอ่านได้จาก  R system ประกอบด้วย 2 ส่วนหลัก คือ 1.Base system – ประกอบด้วย R language software และส่วนเพิ่มเติมอื่นๆที่มีความ จำเป็นต้องใช้บ่อยๆ 2. User contributed add-on packages 3

4  จะหาโปรแกรม R ได้จากไหน?  ไป download ได้ที่ หรือที่www.r-project.org  โดยเลือกลงโปรแกรมพื้นฐาน ( Base Package)  ถ้าต้องการใช้แบบเมนู จะต้องติดตั้ง โปรแกรม Rcmdr เพิ่มเติม 4

5  การจัดการข้อมูลและหน่วยความจำ  การคำนวณในรูป Array และ Matrix  การวิเคราะห์ข้อมูลทางสถิติ  การสร้างกราฟ  การเขียนโปรแกรม 5

6 RGui ( Gui – Graphical user interface) ประกอบด้วย  วินโดวส์ R Console สำหรับเขียนคำสั่งและแสดงผล ลัพธ์  วินโดวส์ R Graph สำหรับแสดงกราฟ  Script Windows สำหรับเขียน แก้ไขคำสั่ง โปรแกรม 6

7 7

8 8

9 9

10 R และ สถิติ  R มี Packages ทีมีผู้สร้างสำหรับการคำนวณและการวิเคราะห์ ข้อมูลทางสถิติ ซึ่งเราสามารถ ดาวน์โหลดมาใช้ได้อย่างสะดวก และรวดเร็ว  มีผู้พัฒนา packages สำหรับเทคนิคการวิเคราะห์ใหม่ๆนอกจาก วิธีทางสถิติแบบเดิม เช่น data/text mining  นักสถิติที่วิจัยและพัฒนาวิธีการทางสถิติใหม่ๆ นิยมเขียนวิธีการ เป็น R packages 10

11 การทำงานของ R โดยทั่วไป การทำงานของ R โดยทั่วไป  การทำงานกับ R โดยทั่วไปคือ  พิมพ์คำสั่ง R ตามที่ต้องการ ใน command line interface หรือ  โหลดไฟล์ที่มีคำสั่ง R อยู่แล้ว(Script file) มา run  ช้า แต่มีข้อดี คือ  เป็นการบันทึกขั้นตอนการวิเคราะห์ข้อมูล เก็บไว้เป็นไฟล์ สำหรับงานแต่ละงานได้  เวลาพบความผิดพลาด ทราบได้ว่าผิดพลาดขั้นตอนไหน  ถ้าการวิเคราะห์ต้องทำหลายขั้นตอน สามารถนำคำสั่งมา run ซ้ำใหม่ได้โดยไม่ต้อง click ใหม่ซ้ำ ๆ 11

12 Getting help >? t.test or >help(t.test) 12

13  Not user start - steep learning curve, minimal GUI.  No commercial support; figuring out correct methods or how to use a function on your own can be frustrating.  Easy to make mistakes and not know.  Working with large datasets is limited by RAM  Data prep & cleaning can be messier & more mistake prone in R vs. SPSS or SAS  Some users complain about hostility on the R listserve  Fast and free.  State of the art: Statistical researchers provide their methods as R packages. SPSS and SAS are years behind R!  2 nd only to MATLAB for graphics.  Mx, WinBugs, and other programs use or will use R.  Active user community  Excellent for simulation, programming, computer intensive analyses, etc.  Forces you to think about your analysis.  Interfaces with database storage software (SQL) 13

14  Many different datasets (and other “objects”) available at same time  Datasets can be of any dimension  Functions can be modified  Experience is interactive-you program until you get exactly what you want  One stop shopping - almost every analytical tool you can think of is available  R is free and will continue to exist. Nothing can make it go away, its price will never increase.  One datasets available at a given time  Datasets are rectangular  Functions are proprietary  Experience is passive-you choose an analysis and they give you everything they think you need  Tend to be have limited scope, forcing you to learn additional programs; extra options cost more and/or require you to learn a different language (e.g., SPSS Macros)  They cost money. There is no guarantee they will continue to exist, but if they do, you can bet that their prices will always increase 14

15 > Variables > a = 49 > sqrt(a) [1] 7 > a = "The dog ate my homework" > sub("dog","cat",a) [1] "The cat ate my homework“ > a = (1+1==3) > a [1] FALSE numeric character string logical 15

16 > a = c(7,5,1) > a[2] [1] 5 ลิสต์: an ordered collection of data of arbitrary types. > doe = list(name="john",age=28,married=F) > doe$name [1] "john“ > doe$age [1] 28 16

17 data frame: is supposed to represent the typical data table that researchers come up with – like a spreadsheet. It is a rectangular table with rows and columns; data within each column has the same type (e.g. number, text, logical), but different columns may have different types. Example: localisation tumorsize progress XX348 proximal 6.3 FALSE XX234 distal 8.0 TRUE XX987 proximal 10.0 FALSE 17

18  > x<-c(1,3,2,10,5); y<-1:5 # creation of 2 vectors  x [1]  > x+y [1] > x*y [1] > x/y [1] > x^y [1]  > sum(x) #sum of elements in x [1] 21 > cumsum(x) #cumulative sum vector [1]

19 # 20 numbers from 0 to 20, > x = round(runif(20,0,20), digits=1) > x [1] [9] [16] > min(x) [1] 0.1 > max(x) [1] 19.4 > median(x) # médiane [1] > mean(x) # moyenne [1] > var(x) # variance [1] > sd(x) # standard deviation [1] > sqrt(var(x)) [1] > length(x) [1] 20 > round(x) [1] > cor(x,sin(x/20)) # corrélation [1] > quantile(x) # les quantiles, 0% 25% 50% 75% 100%

20  Samples tests ◦ Checking normality  Kolmogorov-Smirnov test > #generate 500 observations from uniform (0,1) distribution > F500 qqnorm(F500) #normal probability plot > qqline(F500) #ideal sample will fall near the straight line >ks.test(F500, "pnorm", mean=a[1], sd=a[2]) One-sample Kolmogorov-Smirnov test data: F500 D = , p-value = alternative hypothesis: two.sided


ดาวน์โหลด ppt ปราณี นิลกรณ์.  R เป็นภาษาและโปรแกรมสำเร็จรูปสำหรับการ คำนวณทางสถิติและสร้างกราฟประเภทให้เปล่า ( free open source package ) ที่พัฒนาขึ้นมาจาก ภาษา S.

งานนำเสนอที่คล้ายกัน


Ads by Google