88520159 Probability and Statistics for Computing บทที่ 11 การประมาณค่าและทดสอบสมมติฐานเกี่ยวกับ 𝜇 1 − 𝜇 2 เมื่อไม่เป็นอิสระต่อกัน 88520159 Probability and Statistics for Computing
ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ข้อมูลสองชุดที่ไม่อิสระต่อกัน เรียกว่า Matched pair data ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 เมื่อตัวอย่างไม่เป็นอิสระต่อกัน (dependent sample) เป็นการวิเคราะห์ข้อมูลที่สนใจค่าผลต่างของข้อมูล ในแต่ละคู่ ตัวอย่าง การทดสอบประสิทธิภาพของอาหารลดน้ำหนักชนิด หนึ่งที่มีต่อผู้ใช้แต่ละคน โดยการชั่งน้ำหนักก่อนและ หลังรับประทานอาหารลดน้ำหนักชนิดนี้ การทดสอบความแม่นยำของเครื่องชั่งน้ำหนักเครื่อง หนึ่ง โดยสุ่มตัวอย่างคนมากลุ่มหนึ่งแล้วชั่งน้ำหนัก ของคนเหล่านี้ด้วยเครื่องชั่งนี้ บันทึกน้ำหนักที่ชั่งได้ กับน้ำหนักที่แท้จริง
ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 ผลต่างระหว่างค่าเฉลี่ยของประชากรสองกลุ่ม 𝜇 1 − 𝜇 2 กำหนดให้ 𝜇 𝐷 = 𝜇 1 − 𝜇 2 คือ ผลต่างระหว่าง ค่าเฉลี่ย เมื่อตัวอย่างไม่เป็นอิสระต่อกัน ข้อมูลที่ 1 2 3 … n สิ่งทดลองที่ 1 𝑥 1 𝑥 2 𝑥 3 𝑥 𝑛 สิ่งทดลองที่ 2 𝑦 1 𝑦 2 𝑦 3 𝑦 𝑛 ผลต่าง (𝐷 𝑖 ) 𝐷 1 = 𝑥 1 - 𝑦 1 𝐷 2 =𝑥 2 - 𝑦 2 𝐷 3 =𝑥 3 - 𝑦 3 𝐷 𝑛 =𝑥 𝑛 - 𝑦 𝑛
การประมาณค่าผลต่างระหว่างค่าเฉลี่ย ( 𝜇 𝐷 ) การประมาณค่าแบบจุดของผลต่างระหว่าง เฉลี่ย ( 𝜇 𝐷 ) การประมาณค่าแบบช่วงของผลต่างระหว่าง เฉลี่ย ( 𝜇 𝐷 )
การประมาณแบบช่วงของ 𝜇 𝐷 ด้วย โปรแกรม R t.test(x, y, paired = TRUE, conf.level = 0.95) x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามลำดับ paired คือ การวิเคราะห์ข้อมูลแบบจับคู่ กำหนดให้เป็น TRUE conf.level คือ ระดับความเชื่อมั่น Default = 0.95
การทดสอบสมมติฐาน 𝜇 𝐷 การตั้งสมมติฐาน สมมติฐานสองทาง สมมติฐานทางเดียวด้านซ้าย สมมติฐานทางเดียวด้านขวา 𝑑 คือ ค่าผลต่างระหว่างค่าเฉลี่ยของประชากรที่ ต้องการทดสอบสมมติฐาน 𝐻 0 : 𝜇 𝐷 =𝑑 𝐻 1 : 𝜇 𝐷 ≠𝑑 𝐻 0 : 𝜇 𝐷 ≥𝑑 𝐻 1 : 𝜇 𝐷 <𝑑 𝐻 0 : 𝜇 𝐷 ≤𝑑 𝐻 1 : 𝜇 𝐷 >𝑑
ตัวสถิติที่ใช้ทดสอบ 𝜇 𝐷 ตัวสถิติที่ใช้ทดสอบ 𝜇 𝐷 ใช้ตัวสถิติ t test ในการทดสอบ
การทดสอบสมมติฐาน 𝜇 𝐷 ด้วย โปรแกรม R t.test(x, y,paired = TRUE, conf.level = 0.95, alternative=c("two.sided", "less", "greater")) x และ y คือ ข้อมูลแบบ vector ของตัวอย่างกลุ่ม 1 และ 2 ตามลำดับ paired คือ การวิเคราะห์ข้อมูลแบบจับคู่ กำหนดให้เป็น TRUE conf.level คือ ระดับความเชื่อมั่น Default = 0.95 alternative คือ เครื่องหมายในสมมติฐานรอง ( 𝐻 1 )
ตัวอย่างที่ 1 ถ้าสุ่มตัวอย่างมา 7 คัน ให้อู่ซ่อมรถยนต์ 2 แห่ง ตีราคาค่าซ่อมของรถยนต์ทั้ง 7 คัน เพื่อศึกษา ถึงความแตกต่างในการตีราคารถยนต์พบว่า มี การตีราคา (หน่วยเป็นพันบาท) ดังนี้ 1. จงทดสอบว่าการประมาณค่าซ่อมรถยนต์ เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 แตกต่างกันหรือไม่ ที่ระดับนัยสำคัญ 0.05 2. จงหาช่วงความเชื่อมั่น 90 % ของผลต่าง ระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 รถยนต์คันที่ 1 2 3 4 5 6 7 อู่ที่ 1 7.9 10.1 12.2 8.8 10.4 9.8 11.7 อู่ที่ 2 7.1 9.0 11.0 8.9 9.9 9.1 10.3
ตัวอย่างที่ 1 1. จงทดสอบว่าการประมาณค่าซ่อมรถยนต์เฉลี่ย ของอู่ที่ 1 และ อู่ที่ 2 แตกต่างกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05 กำหนดให้ X คือ ค่าซ่อมรถยนต์ของอู่ที่ 1 Y คือ ค่าซ่อมรถยนต์ของอู่ที่ 2 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 =0 𝐻 1 : 𝜇 𝐷 ≠0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05
ตัวอย่างที่ 1 3. คำนวณหาค่า p-value > U1=c(7.9,10.1,12.2,8.8,10.4,9.8,11.7) > U2=c(7.1,9.0,11.0,8.9,9.9,9.1,10.3) > t.test(U1,U2,paired = TRUE,conf.level = 0.95,alternative = "two.sided") Paired t-test data: U1 and U2 t = 4.2053, df = 6, p-value = 0.005653 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.3345045 1.2654955 sample estimates: mean of the differences 0.8
ตัวอย่างที่ 1 p-value = 0.005653 ซึ่งมีค่าน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ค่า ซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 แตกต่าง กัน
ตัวอย่างที่ 1 2. จงหาช่วงความเชื่อมั่น 90% ของผลต่าง ระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 > U1=c(7.9,10.1,12.2,8.8,10.4,9.8,11.7) > U2=c(7.1,9.0,11.0,8.9,9.9,9.1,10.3) > t.test(U1,U2,paired = TRUE,conf.level = 0.9) Paired t-test data: U1 and U2 t = 4.2053, df = 6, p-value = 0.005653 alternative hypothesis: true difference in means is not equal to 0 90 percent confidence interval: 0.4303334 1.1696666 sample estimates: mean of the differences 0.8 สรุป ช่วงความเชื่อมั่น 90% ของผลต่างระหว่างค่าซ่อมรถยนต์เฉลี่ยของอู่ที่ 1 และ อู่ที่ 2 มีค่า 0.4303334 ถึง 1.1696666 พันบาท
ตัวอย่างที่ 2 บริษัทแห่งหนึ่งผลิตยาสำหรับลดน้ำหนักชนิดใหม่ ซึ่งก่อนที่จะทำการโฆษณาเกี่ยวกับประสิทธิภาพ ของยาชนิดนี้ บริษัทได้ทำการทดลองใช้ยานี้กับ ตัวอย่างจำนวน 10 คน โดยบันทึกข้อมูลเกี่ยวกับ น้ำหนัก (กิโลกรัม) ก่อนใช้ยาและหลังใช้ยาแล้ว 3 สัปดาห์ ดังนี้ 1. ที่ระดับนัยสำคัญ 0.05 บริษัทผู้ผลิตยาลด น้ำหนักชนิดใหม่ สามารถสรุปได้หรือไม่ว่ายา ดังกล่าวทำให้ผู้ใช้มีน้ำหนักลดลง 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่างระหว่าง น้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยาลดน้ำหนัก ชนิดใหม่ ตัวอย่างคนที่ 1 2 3 4 5 6 7 8 9 10 ก่อนใช้ยา 48 50 58 62 55 57 65 61 54 หลังใช้ยา 45 51 60 59 63 52 56
ตัวอย่างที่ 2 1. ที่ระดับนัยสำคัญ 0.05 บริษัทผู้ผลิตยาลด น้ำหนักชนิดใหม่ สามารถสรุปได้หรือไม่ว่ายา ดังกล่าวทำให้ผู้ใช้มีน้ำหนักลดลง กำหนดให้ X คือ น้ำหนักก่อนใช้ยาลดน้ำหนักชนิด ใหม่ Y คือ น้ำหนักหลังใช้ยาลดน้ำหนักชนิดใหม่ 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 ≤0 𝐻 1 : 𝜇 𝐷 >0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05
ตัวอย่างที่ 2 3. คำนวณหาค่า p-value > before=c(48,50,58,62,55,57,65,61,54,58) > after=c(45,51,57,60,54,59,63,57,52,56) > t.test(before,after,paired = TRUE,conf.level = 0.95,alternative = "greater") Paired t-test data: before and after t = 2.4922, df = 9, p-value = 0.01715 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 0.3702611 Inf sample estimates: mean of the differences 1.4
ตัวอย่างที่ 2 p-value = 0.01715 ซึ่งมีค่าน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 สามารถสรุปได้ว่ายาดังกล่าวทำให้ผู้ใช้มี น้ำหนักลดลง
ตัวอย่างที่ 2 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่าง ระหว่างน้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยา ลดน้ำหนักชนิดใหม่ > before=c(48,50,58,62,55,57,65,61,54,58) > after=c(45,51,57,60,54,59,63,57,52,56) > t.test(before,after,paired = TRUE,conf.level = 0.95) Paired t-test data: before and after t = 2.4922, df = 9, p-value = 0.0343 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.1292483 2.6707517 sample estimates: mean of the differences 1.4 สรุป ช่วงความเชื่อมั่น 95% ของผลต่างระหว่างน้ำหนักเฉลี่ยก่อนใช้ยาและหลังใช้ยาลดน้ำหนักชนิดใหม่ มีค่า 0.1292483 ถึง 2.6707517 กิโลกรัม
ตัวอย่างที่ 3 บริษัทรถแท็กซี่แห่งหนึ่งกำลังจะตัดสินใจว่าการใช้ ยางเรเดียลแทนยางธรรมดาจะช่วยประหยัดน้ำมัน เชื้อเพลิงจริงหรือไม่ โดยรถยนต์ 12 คัน ถูก นำมาใช้ยางเรเดียลแล้ววิ่งไปตามเส้นทางที่กำหนด แล้วใช้รถยนต์คันเดิม ความเร็วเดิม แต่เปลี่ยนมา ใช้ยางธรรมดาขับตามเส้นทางเดิม แล้วบันทึก อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง (กิโลเมตร/ ลิตร) ได้ดังนี้ 1. จงทดสอบว่ารถยนต์ที่ใช้ยางเรเดียลจะช่วย ประหยัดน้ำมันเชื้อเพลิงได้ดีกว่ารถยนต์ที่ใช้ยาง ธรรมดาหรือไม่ ที่ระดับนัยสำคัญ 0.01 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่างระหว่าง อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงเฉลี่ยที่ใช้ยาง เรเดียลและยางธรรมดา รถยนต์คันที่ 1 2 3 4 5 6 7 8 9 10 11 12 ยางเรเดียล 4.2 4.7 6.6 7.0 6.7 4.5 5.7 6.0 7.4 4.9 6.1 5.2 ยางธรรมดา 4.1 6.2 6.9 6.8 4.4 5.8
ตัวอย่างที่ 3 กำหนดให้ X คือ อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง ของรถยนต์ที่ใช้ยางเรเดียล Y คือ อัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงของ รถยนต์ที่ใช้ยางธรรมดา 𝐷=X−Y 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜇 𝐷 ≤0 𝐻 1 : 𝜇 𝐷 >0 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.01
ตัวอย่างที่ 3 3. คำนวณหาค่า p-value > radial=c(4.2,4.7,6.6,7.0,6.7,4.5,5.7,6.0,7.4,4.9,6.1,5.2) > normal=c(4.1,4.9,6.2,6.9,6.8,4.4,5.7,5.8,6.9,4.7,6.0,4.9) > t.test(radial,normal,paired = TRUE,conf.level = 0.99,alternative = "greater") Paired t-test data: radial and normal t = 2.4845, df = 11, p-value = 0.01516 alternative hypothesis: true difference in means is greater than 0 99 percent confidence interval: -0.01331778 Inf sample estimates: mean of the differences 0.1416667
ตัวอย่างที่ 3 p-value = 0.01516 ซึ่งมีค่ามากกว่าระดับ นัยสำคัญ 4. สรุป ยอมรับ 𝐻 0 ที่ระดับนัยสำคัญ 0.01 รถยนต์ที่ใช้ยางเรเดียลจะช่วยประหยัด น้ำมันเชื้อเพลิงได้ดีกว่ารถยนต์ที่ใช้ยาง ธรรมดา ไม่เป็นความจริง
ตัวอย่างที่ 3 2. จงหาช่วงความเชื่อมั่น 95% ของผลต่าง ระหว่างอัตราการสิ้นเปลืองน้ำมันเชื้อเพลิง เฉลี่ยที่ใช้ยางเรเดียลและยางธรรมดา > radial=c(4.2,4.7,6.6,7.0,6.7,4.5,5.7,6.0,7.4,4.9,6.1,5.2) > normal=c(4.1,4.9,6.2,6.9,6.8,4.4,5.7,5.8,6.9,4.7,6.0,4.9) > t.test(radial, normal,paired = TRUE,conf.level = 0.95) Paired t-test data: radial and normal t = 2.4845, df = 11, p-value = 0.03033 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.01616684 0.26716650 sample estimates: mean of the differences 0.1416667 สรุป ช่วงความเชื่อมั่น 95%ของผลต่างระหว่างอัตราการสิ้นเปลืองน้ำมันเชื้อเพลิงเฉลี่ยที่ใช้ยางเรเดียลและยางธรรมดา มีค่า 0.01616684 ถึง 0.26716650 กิโลเมตร/ลิตร