Probability and Statistics for Computing

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
คอมพิวเตอร์ช่วยสอนการเลือกใช้ ตัวสถิติทดสอบที่ถูกต้อง
Advertisements

Analyze → Compare Means → Paired-Sample T test…
Class 9 การทดสอบสมมติฐาน – 2 ประชากร
การทดสอบที (t) หัวข้อที่จะศึกษามีดังนี้
Chapter 8: Interval Estimation
Chapter 10: Hypothesis Testing: Application
Probability & Statistics
ผศ.(พิเศษ)นพ.นภดล สุชาติ พ.บ. M.P.H.
Dr. Tipsuda Janjamlha 30 AUG. 08
สถิติเชิงสรุปอ้างอิง(Inferential or Inductive Statistics)
การทดสอบความแปรปรวน ANOVA
น.ท.หญิง วัชราพร เชยสุวรรณ วิทยาลัยพยาบาลกองทัพเรือ
Liang, Introduction to Java Programming, Sixth Edition, (c) 2007 Pearson Education, Inc. All rights reserved Java Programming Language.
วิจัย (Research) คือ อะไร
Confidence Interval Estimation (การประมาณช่วงความเชื่อมั่น)
Wilcoxon Signed Ranks test ใช้เมื่อไร? 2 correlated group design ตัวอย่างถูกเลือกมาจากประชากร แล้วทดลองเปรียบเทียบ 1.Before/Method 1 2.After/Method 2 สมมุติฐาน.
Measures of Central Tendency & Measures of Spread or Variation
นางสาวสรัญญา ชื่นเย็น (พี่ออย) เจ้าหน้าที่ศูนย์นวัตกรรมการจัดการ อ.ก้องภู นิมานันท์ อาจารย์ที่ปรึกษา 1.น.ส.นพรัตน์ ปฏิกรณ์ (คุ๊กกี้) นายบุรินทร์
ของนักศึกษาระดับประกาศนียบัตร วิชาชีพ ชั้นปีที่ 2 สาขางานการขาย รวมพร ประพฤติธรรม ผู้วิจัย วิทยาลัยเทคโนโลยีตั้งตรงจิตรพณิชย การ.
Wilcoxon Signed Ranks test
การวิเคราะห์ข้อมูลทางสถิติ เพื่อการทำวิจัยอย่างง่าย
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
Chapter 4 ข้อความสั่ง เลือกทำ.
การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
ISC2102 สถิติเพื่อการวิเคราะห์ข้อมูล
บทที่ 9 การกำหนดขนาดของตัวอย่าง
สถิติในชีวิตประจำวัน : Statistics in Everyday life
สถิติและการวัดทางระบาดวิทยาที่ควรรู้
ความรู้เบื้องต้นเกี่ยวกับ คุณภาพของเครื่องมือวัด
รายวิชาชีวสถิติ (Biostatistics)
ระเบียบวิธีวิจัยทางธุรกิจโรงแรม และท่องเที่ยว
บทที่ 3 ตัวแปรและสมมติฐาน.
สถิติที่ใช้ในงาน การวิจัยเชิงปริมาณ
PHP (2) - condition - loop
บทที่ 7 การสุ่มตัวอย่าง.
ประเภทของสุ่มตัวอย่าง
การใช้ทฤษฎีในงานวิจัย
บทที่ 4 ตัวแปร (Variables)
ความรู้เบื้องต้นเกี่ยวกับสถิติและโปรแกรมสำเร็จรูปทางสถิติ
การทดสอบสมมติฐาน.
บทที่ 10 สถิติเชิงบรรยาย
ตัวแปรและสมมติฐานการวิจัย
บทที่ 1 สถิติเชิงพรรณนา สถิติเบื้องต้น โปรแกรม R เบื้องต้น
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
บทที่ 5 หลักการประมาณค่าและการทดสอบสมมติฐาน
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
ขั้นตอนการทำโครงงานวิจัย
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
ข้อมูล และ เครื่องมือเก็บข้อมูลเชิงปริมาณ
หน่วยการเรียนรู้ที่ 1 การกำหนดประเด็นปัญหา
บทที่ 7 การประมาณค่าและทดสอบสมมติฐานสำหรับค่า สัดส่วนประชากร 1 กลุ่ม
พระพุทธศาสนา.
วิจัยเพื่อพัฒนาการเรียนรู้ ครั้งที่ 4
เวกเตอร์และสเกลาร์ พื้นฐาน
ระเบียบวิธีวิจัยทางการบัญชี
บทที่ 7 การกำหนดราคาสินค้าในตลาด
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
Probability and Statistics for Computing
การเลือกใช้สถิติเพื่อการวิจัย
สถานการณ์ วิกฤติ 7 ระดับ
Training for SPSS BY Assist. Prof. Benchamat Laksaniyanon, Phd
นางสาวกฤษฎาวรรณ ศิวิวงศ์ วิทยาลัยเทคโนโลยีโปลิเทคนิคลานนา เชียงใหม่
ชื่อเรื่องวิจัย ชื่อผู้วิจัย
สมมติฐานการวิจัย.
การนำเสนอผลงานการวิจัยครั้งที่ ๘
Probability and Statistics for Computing
Chapter 5: Function.
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
งานวิจัย.
ใบสำเนางานนำเสนอ:

88520159 Probability and Statistics for Computing บทที่ 11 การประมาณค่าและทดสอบสมมติฐานเกี่ยวกับ 𝜇 1 − 𝜇 2 เมื่อไม่เป็นอิสระต่อกัน 88520159 Probability and Statistics for Computing

ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ข้อมูลสองชุดที่ไม่อิสระต่อกัน เรียกว่า Matched pair data ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 เมื่อตัวอย่างไม่เป็นอิสระต่อกัน (dependent sample) เป็นการวิเคราะห์ข้อมูลที่สนใจค่าผลต่างของข้อมูล ในแต่ละคู่ ตัวอย่าง การทดสอบประสิทธิภาพของอาหารลดน้ำหนักชนิด หนึ่งที่มีต่อผู้ใช้แต่ละคน โดยการชั่งน้ำหนักก่อนและ หลังรับประทานอาหารลดน้ำหนักชนิดนี้ การทดสอบความแม่นยำของเครื่องชั่งน้ำหนักเครื่อง หนึ่ง โดยสุ่มตัวอย่างคนมากลุ่มหนึ่งแล้วชั่งน้ำหนัก ของคนเหล่านี้ด้วยเครื่องชั่งนี้ บันทึกน้ำหนักที่ชั่งได้ กับน้ำหนักที่แท้จริง

ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 กำหนดให้ 𝜇 𝐷 = 𝜇 1 − 𝜇 2 คือ ผลต่างระหว่าง ค่าเฉลี่ย เมื่อตัวอย่างไม่เป็นอิสระต่อกัน ข้อมูลที่ 1 2 3 … n สิ่งทดลองที่ 1 𝑥 1 𝑥 2 𝑥 3 𝑥 𝑛 สิ่งทดลองที่ 2 𝑦 1 𝑦 2 𝑦 3 𝑦 𝑛 ผลต่าง (𝐷 𝑖 ) 𝐷 1 = 𝑥 1 - 𝑦 1 𝐷 2 =𝑥 2 - 𝑦 2 𝐷 3 =𝑥 3 - 𝑦 3 𝐷 𝑛 =𝑥 𝑛 - 𝑦 𝑛

การประมาณค่าผลต่างระหว่างค่าเฉลี่ย ( 𝜇 𝐷 ) การประมาณค่าแบบจุดของผลต่างระหว่าง เฉลี่ย ( 𝜇 𝐷 ) การประมาณค่าแบบช่วงของผลต่างระหว่าง เฉลี่ย ( 𝜇 𝐷 )

การประมาณแบบช่วงของ 𝜇 𝐷 ด้วย โปรแกรม R t.test(x, y, paired = TRUE, conf.level = 0.95) x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามลำดับ paired คือ การวิเคราะห์ข้อมูลแบบจับคู่ กำหนดให้เป็น TRUE conf.level คือ ระดับความเชื่อมั่น Default = 0.95

การทดสอบสมมติฐาน 𝜇 𝐷 การตั้งสมมติฐาน สมมติฐานสองทาง สมมติฐานทางเดียวด้านซ้าย สมมติฐานทางเดียวด้านขวา 𝑑 คือ ค่าผลต่างระหว่างค่าเฉลี่ยของประชากรที่ ต้องการทดสอบสมมติฐาน 𝐻 0 : 𝜇 𝐷 =𝑑 𝐻 1 : 𝜇 𝐷 ≠𝑑 𝐻 0 : 𝜇 𝐷 ≥𝑑 𝐻 1 : 𝜇 𝐷 <𝑑 𝐻 0 : 𝜇 𝐷 ≤𝑑 𝐻 1 : 𝜇 𝐷 >𝑑

ตัวสถิติที่ใช้ทดสอบ 𝜇 𝐷 ตัวสถิติที่ใช้ทดสอบ 𝜇 𝐷 ใช้ตัวสถิติ t test ในการทดสอบ

การทดสอบสมมติฐาน 𝜇 𝐷 ด้วย โปรแกรม R t.test(x, y,paired = TRUE, conf.level = 0.95, alternative=c("two.sided", "less", "greater")) x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามลำดับ paired คือ การวิเคราะห์ข้อมูลแบบจับคู่ กำหนดให้เป็น TRUE conf.level คือ ระดับความเชื่อมั่น Default = 0.95 alternative คือ เครื่องหมายในสมมติฐานรอง ( 𝐻 1 )

ตัวอย่างที่ 1 ถ้าสุ่มตัวอย่างมา 7 คัน ให้อู่ซ่อมรถยนต์ 2 แห่ง ตีราคาค่าซ่อมของรถยนต์ทั้ง 7 คัน เพื่อศึกษา ถึงความแตกต่างในการตีราคารถยนต์พบว่า มี การตีราคา (หน่วยเป็นพันบาท) ดังนี้ 1. จงทดสอบว่าการประมาณค่าซ่อมรถยนต์ เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 แตกต่างกันหรือไม่ ที่ระดับนัยสำคัญ 0.05 2. จงหาช่วงความเชื่อมั่น 90 % ของผลต่าง ระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 รถยนต์คันที่ 1 2 3 4 5 6 7 อู่ที่ 1 7.9 10.1 12.2 8.8 10.4 9.8 11.7 อู่ที่ 2 7.1 9.0 11.0 8.9 9.9 9.1 10.3

ตัวอย่างที่ 1 1. จงทดสอบว่าการประมาณค่าซ่อมรถยนต์เฉลี่ย ของอู่ที่ 1 และ อู่ที่ 2 แตกต่างกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05 กำหนดให้ X คือ ค่าซ่อมรถยนต์ของอู่ที่ 1 Y คือ ค่าซ่อมรถยนต์ของอู่ที่ 2 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 =0 𝐻 1 : 𝜇 𝐷 ≠0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05

ตัวอย่างที่ 1 3. คำนวณหาค่า p-value > U1=c(7.9,10.1,12.2,8.8,10.4,9.8,11.7) > U2=c(7.1,9.0,11.0,8.9,9.9,9.1,10.3) > t.test(U1,U2,paired = TRUE,conf.level = 0.95,alternative = "two.sided") Paired t-test data: U1 and U2 t = 4.2053, df = 6, p-value = 0.005653 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.3345045 1.2654955 sample estimates: mean of the differences 0.8

ตัวอย่างที่ 1 p-value = 0.005653 ซึ่งมีค่าน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ค่า ซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 แตกต่าง กัน

ตัวอย่างที่ 1 2. จงหาช่วงความเชื่อมั่น 90% ของผลต่าง ระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 > U1=c(7.9,10.1,12.2,8.8,10.4,9.8,11.7) > U2=c(7.1,9.0,11.0,8.9,9.9,9.1,10.3) > t.test(U1,U2,paired = TRUE,conf.level = 0.9) Paired t-test data: U1 and U2 t = 4.2053, df = 6, p-value = 0.005653 alternative hypothesis: true difference in means is not equal to 0 90 percent confidence interval: 0.4303334 1.1696666 sample estimates: mean of the differences 0.8 สรุป ช่วงความเชื่อมั่น 90% ของผลต่างระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 มีค่า 0.4303334 ถึง 1.1696666 พันบาท

ตัวอย่างที่ 2 บริษัทแห่งหนึ่งผลิตยาสำหรับลดน้ำหนักชนิดใหม่ ซึ่งก่อนที่จะทำการโฆษณาเกี่ยวกับประสิทธิภาพ ของยาชนิดนี้ บริษัทได้ทำการทดลองใช้ยานี้กับ ตัวอย่างจำนวน 10 คน โดยบันทึกข้อมูลเกี่ยวกับ น้ำหนัก (กิโลกรัม) ก่อนใช้ยาและหลังใช้ยาแล้ว 3 สัปดาห์ ดังนี้ 1. ที่ระดับนัยสำคัญ 0.05 บริษัทผู้ผลิตยาลด น้ำหนักชนิดใหม่ สามารถสรุปได้หรือไม่ว่ายา ดังกล่าวทำให้ผู้ใช้มีน้ำหนักลดลง 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่างระหว่าง น้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยาลดน้ำหนัก ชนิดใหม่ ตัวอย่างคนที่ 1 2 3 4 5 6 7 8 9 10 ก่อนใช้ยา 48 50 58 62 55 57 65 61 54 หลังใช้ยา 45 51 60 59 63 52 56

ตัวอย่างที่ 2 1. ที่ระดับนัยสำคัญ 0.05 บริษัทผู้ผลิตยาลด น้ำหนักชนิดใหม่ สามารถสรุปได้หรือไม่ว่ายา ดังกล่าวทำให้ผู้ใช้มีน้ำหนักลดลง กำหนดให้ X คือ น้ำหนักก่อนใช้ยาลดน้ำหนักชนิด ใหม่ Y คือ น้ำหนักหลังใช้ยาลดน้ำหนักชนิดใหม่ 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 ≤0 𝐻 1 : 𝜇 𝐷 >0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05

ตัวอย่างที่ 2 3. คำนวณหาค่า p-value > before=c(48,50,58,62,55,57,65,61,54,58) > after=c(45,51,57,60,54,59,63,57,52,56) > t.test(before,after,paired = TRUE,conf.level = 0.95,alternative = "greater") Paired t-test data: before and after t = 2.4922, df = 9, p-value = 0.01715 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 0.3702611 Inf sample estimates: mean of the differences 1.4

ตัวอย่างที่ 2 p-value = 0.01715 ซึ่งมีค่าน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 สามารถสรุปได้ว่ายาดังกล่าวทำให้ผู้ใช้มี น้ำหนักลดลง

ตัวอย่างที่ 2 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่าง ระหว่างน้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยา ลดน้ำหนักชนิดใหม่ > before=c(48,50,58,62,55,57,65,61,54,58) > after=c(45,51,57,60,54,59,63,57,52,56) > t.test(before,after,paired = TRUE,conf.level = 0.95) Paired t-test data: before and after t = 2.4922, df = 9, p-value = 0.0343 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.1292483 2.6707517 sample estimates: mean of the differences 1.4 สรุป ช่วงความเชื่อมั่น 95% ของผลต่างระหว่างน้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยาลดน้ำหนักชนิดใหม่ มีค่า 0.1292483 ถึง 2.6707517 กิโลกรัม

ตัวอย่างที่ 3 บริษัทรถแท็กซี่แห่งหนึ่งกำลังจะตัดสินใจว่าการใช้ ยางเรเดียลแทนยางธรรมดาจะช่วยประหยัดน้ำมัน เชื้อเพลิงจริงหรือไม่ โดยรถยนต์ 12 คัน ถูก นำมาใช้ยางเรเดียลแล้ววิ่งไปตามเส้นทางที่กำหนด แล้วใช้รถยนต์คันเดิม ความเร็วเดิม แต่เปลี่ยนมา ใช้ยางธรรมดาขับตามเส้นทางเดิม แล้วบันทึก อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง (กิโลเมตร/ ลิตร) ได้ดังนี้ 1. จงทดสอบว่ารถยนต์ที่ใช้ยางเรเดียลจะช่วย ประหยัดน้ำมันเชื้อเพลิงได้ดีกว่ารถยนต์ที่ใช้ยาง ธรรมดาหรือไม่ ที่ระดับนัยสำคัญ 0.01 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่างระหว่าง อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงเฉลี่ยที่ใช้ยาง เรเดียลและยางธรรมดา รถยนต์คันที่ 1 2 3 4 5 6 7 8 9 10 11 12 ยางเรเดียล 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 ยางธรรมดา 4.1 6.2 6.9 6.8 4.4 5.8

ตัวอย่างที่ 3 กำหนดให้ X คือ อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง ของรถยนต์ที่ใช้ยางเรเดียล Y คือ อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงของ รถยนต์ที่ใช้ยางธรรมดา 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 ≤0 𝐻 1 : 𝜇 𝐷 >0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.01

ตัวอย่างที่ 3 3. คำนวณหาค่า p-value > radial=c(4.2,4.7,6.6,7.0,6.7,4.5,5.7,6.0,7.4,4.9,6.1,5.2) > normal=c(4.1,4.9,6.2,6.9,6.8,4.4,5.7,5.8,6.9,4.7,6.0,4.9) > t.test(radial,normal,paired = TRUE,conf.level = 0.99,alternative = "greater") Paired t-test data: radial and normal t = 2.4845, df = 11, p-value = 0.01516 alternative hypothesis: true difference in means is greater than 0 99 percent confidence interval: -0.01331778 Inf sample estimates: mean of the differences 0.1416667

ตัวอย่างที่ 3 p-value = 0.01516 ซึ่งมีค่ามากกว่าระดับ นัยสำคัญ 4. สรุป ยอมรับ 𝐻 0 ที่ระดับนัยสำคัญ 0.01 รถยนต์ที่ใช้ยางเรเดียลจะช่วยประหยัด น้ำมันเชื้อเพลิงได้ดีกว่ารถยนต์ที่ใช้ยาง ธรรมดา ไม่เป็นความจริง

ตัวอย่างที่ 3 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่าง ระหว่างอัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง เฉลี่ยที่ใช้ยางเรเดียลและยางธรรมดา > radial=c(4.2,4.7,6.6,7.0,6.7,4.5,5.7,6.0,7.4,4.9,6.1,5.2) > normal=c(4.1,4.9,6.2,6.9,6.8,4.4,5.7,5.8,6.9,4.7,6.0,4.9) > t.test(radial, normal,paired = TRUE,conf.level = 0.95) Paired t-test data: radial and normal t = 2.4845, df = 11, p-value = 0.03033 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.01616684 0.26716650 sample estimates: mean of the differences 0.1416667 สรุป ช่วงความเชื่อมั่น 95%ของผลต่างระหว่างอัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงเฉลี่ยที่ใช้ยางเรเดียลและยางธรรมดา มีค่า 0.01616684 ถึง 0.26716650 กิโลเมตร/ลิตร