88520159 Probability and Statistics for Computing บทที่ 10 การประมาณค่าและทดสอบสมมติฐานเกี่ยวกับ อัตราส่วนความแปรปรวนของประชากร 𝜎 1 2 / 𝜎 2 2 88520159 Probability and Statistics for Computing
อัตราส่วนความแปรปรวนของประชากร 𝜎 1 2 / 𝜎 2 2 อัตราส่วนความแปรปรวนของประชากร 𝜎 1 2 / 𝜎 2 2 การเปรียบเทียบความแปรปรวนของประชากร สองกลุ่ม การเปรียบเทียบ ความแม่นยำ ความคงตัว ความเสถียร ความคงเส้นคงวา หรือ ความเที่ยง ที่เกิดขึ้นในสองกลุ่มประชากร ตัวอย่าง ความเสถียรของความเร็วอินเตอร์เน็ต บริษัท X กับ บริษัท Y ความแม่นยำการปาลูกดอก ของ X กับ Y ความเที่ยงตรงของการวัดอุณหภูมิด้วย เครื่องมือวัดยี่ห้อ X กับ Y
การประมาณค่าอัตราส่วนความแปรปรวน การเปรียบเทียบความแปรปรวน หรือ ส่วน เบี่ยงเบนมาตรฐาน กำหนดให้ X1, X2 ,· · · , Xn เป็นตัวอย่างสุ่มที่มา จากประชากรที่มีการแจกแจงปกติ ค่าเฉลี่ย 𝜇 𝑋 และความแปรปรวน 𝜎 𝑋 2 และ Y1, Y2 ,· · · , Ym เป็นตัวอย่างสุ่มที่มาจาก ประชากรที่มีการแจกแจงปกติ ค่าเฉลี่ย 𝜇 𝑌 และ ความแปรปรวน 𝜎 𝑌 2 เปรียบเทียบความแปรปรวนสองกลุ่มประชากรใน รูปอัตราส่วน 𝜎 𝑋 2 𝜎 𝑌 2 การประมาณแบบจุดของอัตราส่วนความ แปรปรวนของประชากร คืออัตราความแปรปรวน ของตัวอย่าง 𝑆 𝑋 2 𝑆 𝑌 2
การประมาณค่าอัตราส่วนความแปรปรวน การประมาณแบบช่วงของอัตราส่วนความ แปรปรวนของประชากร โดยอัตราส่วนความแปรปรวนมีการแจกแจง แบบเอฟ ที่มีองศาเสรี 𝑛−1,𝑚−1 เมื่อ 𝑛 และ 𝑚 คือจำนวนตัวอย่างของกลุ่ม 1 และ 2 ตามลำดับ ช่วงความเชื่อมั่น (1−𝛼) 100% ของอัตราส่วน ความแปรปรวน คือ 𝑆 𝑋 2 / 𝑆 𝑌 2 𝐹 𝛼 2 ,𝑛−1,𝑚−1 ≤ 𝜎 𝑋 2 𝜎 𝑌 2 ≤ 𝑆 𝑋 2 / 𝑆 𝑌 2 𝐹 1−𝛼 2 ,𝑛−1,𝑚−1
การประมาณแบบช่วงของ 𝜎 1 2 / 𝜎 2 2 ด้วย โปรแกรม R var.test(x, y, conf.level = 0.95) x และ y คือ ข้อมูลแบบ vector ของตัวอย่าง กลุ่ม 1 และ 2 ตามลำดับ conf.level คือ ระดับความเชื่อมั่น Default = 0.95
ตัวอย่างที่ 1 ปัจจุบัน data channel มีความเร็วในการส่ง ข้อมูล (MBps) ดังนี้ 176, 181, 177 , 180 , 178 , 179 , 177 , 179 , 182 , 178 , 180 , 178, 181, 180, 181 เมื่อหน่วยงานอัพเกรดอุปกรณ์ เพื่อช่วยให้ ความเสถียรของการส่งข้อมูลดีขึ้น ในขณะที่ ความเร็วจะต้องคงเดิม ทำการบันทึกความเร็ว ในการส่งข้อมูลดังนี้ 180 , 180 , 181 , 180 , 180 , 180 , 180 , 180 , 182 , 180 , 181, 179, 181, 179, 180 1. จงประมาณอัตราส่วนความแปรปรวนของ ความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรด อุปกรณ์ พร้อมทั้งอธิบายความหมาย 2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วน ความแปรปรวนของความเร็วในการส่งข้อมูล ก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบาย ความหมาย
ตัวอย่างที่ 1 > x=c(176,181,177,180,178,179,177,179,182,178,180,178,181,180,181) > y=c(180,180,181,180,180,180,180,180,182,180,181,179,181,179,180) > boxplot(x,y)
ตัวอย่างที่ 1 1.จงประมาณอัตราส่วนความแปรปรวนของ ความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรด อุปกรณ์ พร้อมทั้งอธิบายความหมาย > s1=var(x) [1] 3.12381 > s2=var(y) [1] 0.6 > s1/s2 [1] 5.206349 อัตราส่วนความแปรปรวนของความเร็วในการส่งข้อมูลก่อนและหลังอัพเกรดอุปกรณ์มีค่าเป็นมีค่าเป็น 5.206349 หมายความว่า ก่อนอัพเกรดอุปกรณ์ความแปรปรวนของความเร็วในการส่งข้อมูลมีค่าสูงกว่าหลังจากอัพเกรดอุปกรณ์แล้วประมาณ 5.2 เท่า
ตัวอย่างที่ 1 2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วน ความแปรปรวนของความเร็วในการส่งข้อมูล ก่อนและหลังอัพเกรดอุปกรณ์ พร้อมทั้งอธิบาย ความหมาย > var.test(x, y, conf.level=0.95) F test to compare two variances data: x and y F = 5.2063, num df = 14, denom df = 14, p-value = 0.003914 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.747926 15.507567 sample estimates: ratio of variances 5.206349
ตัวอย่างที่ 1 สรุป ช่วงความเชื่อมั่นที่ 95% ของอัตราส่วนความแปรปรวนมีค่าอยู่ในช่วง 1.747926 ถึง 15.507567 หมายความว่า ก่อนอัพเกรดอุปกรณ์ความแปรปรวนของความเร็วในการส่งข้อมูลมีค่ามากกว่าหลังอัพเกรดอุปกรณ์ 1.75 เท่า ถึง 15.51 เท่า แสดงว่าการอัพเกรดอุปกรณ์ช่วยทำให้การส่งข้อมูลมีความเสถียรมากขึ้น
ตัวอย่างที่ 2 ในการศึกษาวิธีการสอน 2 วิธี คือ สอนด้วย โปรแกรม และสอนด้วยวิธีปกติ โดยสุ่มตัวอย่าง นักเรียนมา 16 คน สอนด้วยโปรแกรม และ 21 คน สอนด้วยวิธีปกติ แล้วให้นักเรียนทำข้อสอบ กลุ่มที่สอนด้วยโปรแกรมมีคะแนนดังนี้ 56, 64 , 60, 60, 59, 58, 48, 62, 58, 55, 63, 67, 75, 63, 66, 71 กลุ่มที่สอนด้วยวิธีปกติมีคะแนนดังนี้ 63, 52, 64, 57, 64, 54, 64, 54, 44, 66, 57, 43, 80, 61, 44, 52, 57, 76, 47, 65, 62 จงประมาณอัตราส่วนความแปรปรวนของคะแนน นักเรียนที่เรียนด้วยวิธีการสอนด้วยโปรแกรมและ สอนด้วยวิธีปกติ ที่ช่วงความเชื่อมั่น 90%
ตัวอย่างที่ 2 > x=c(56, 64 , 60, 60, 59, 58, 48, 62, 58, 55, 63, 67, 75, 63, 66, 71) > y=c(63, 52, 64, 57, 64, 54, 64, 54, 44, 66, 57, 43, 80, 61, 44, 52, 57, 76, 47, 65, 62) > var.test(x,y,conf.level = 0.90) F test to compare two variances data: x and y F = 0.43308, num df = 15, denom df = 20, p-value = 0.1031 alternative hypothesis: true ratio of variances is not equal to 1 90 percent confidence interval: 0.1965598 1.0079975 sample estimates: ratio of variances 0.4330751
ตัวอย่างที่ 2 สรุป ช่วงความเชื่อมั่นที่ 90% ของอัตราส่วนความแปรปรวนของคะแนนนักเรียนที่เรียนด้วยวิธีการสอนด้วยโปรแกรมและสอนด้วยวิธีปกติมีค่าอยู่ในช่วง 0.1965598 ถึง 1.0079975
การทดสอบมสมติฐานอัตราส่วนความแปรปรวน การตั้งสมมติฐาน สมมติฐานสองทาง สมมติฐานทางเดียวด้านซ้าย สมมติฐานทางเดียวด้านขวา 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 =1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 ≠1 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 ≥1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 <1 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 ≤1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 >1
การทดสอบสมมติฐานของ 𝜎 1 2 / 𝜎 2 2 ด้วย โปรแกรม R var.test(x, y, conf.level = 0.95, alternative=c("two.sided", "less", "greater")) x และ y คือ ข้อมูลแบบ vector ของตัวอย่าง กลุ่ม 1 และ 2 ตามลำดับ alternative คือ เครื่องหมายในสมมติฐานรอง ( 𝐻 1 ) conf.level คือ ระดับความเชื่อมั่น Default = 0.95
ตัวอย่างที่ 3 ในการเปรียบเทียบความเหนียวของเชือก 2 ชนิด โดยการสุ่มตัวอย่างเชือกทั้ง 2 ชนิด และ ทำการวัดความทนทานในการรับน้ำหนักของ เชือก (กิโลกรัม) แต่ละเส้น สุ่มเชือกชนิดที่ 1 มา 16 เส้น 20.1, 12.5, 20.3, 14.8, 14.6, 14.7, 9.8, 13.2, 18.0, 15.6, 17.1, 13.4, 12.2, 18.3, 12.6, 12.8 และสุ่มเชือกชนิดที่ 2 มา 10 เส้น 17.5, 11.9, 14.0, 17.9, 17.2, 12.3, 16.1, 12.9, 16.6, 17.2 ให้ทดสอบว่าความแปรปรวนในการรับน้ำหนัก ของเชือกชนิดที่ 1 และ ชนิดที่ 2 มีความ แตกต่างกันหรือไม่ ที่ระดับนัยสำคัญ 0.05
ตัวอย่างที่ 3 0.05 1. ตั้งสมมติฐานในการทดสอบ กำหนดให้ 𝜎 1 2 คือ ความแปรปรวนในการรับน้ำหนัก ของเชือกชนิดที่ 1 𝜎 2 2 คือ ความแปรปรวนในการรับน้ำหนักของ เชือกชนิดที่ 2 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 =1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 ≠1 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05 0.05
ตัวอย่างที่ 3 3. คำนวณหาค่า p-value rope1=c(20.1, 12.5, 20.3, 14.8, 14.6, 14.7, 9.8, 13.2, 18.0, 15.6, 17.1, 13.4, 12.2, 18.3, 12.6, 12.8) rope2=c(17.5, 11.9, 14.0, 17.9, 17.2, 12.3, 16.1, 12.9, 16.6, 17.2) var.test(rope1,rope2,conf.level = 0.95, alternative = "two.sided") F test to compare two variances data: rope1 and rope2 F = 1.6682, num df = 15, denom df = 9, p-value = 0.4421 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.4425653 5.2092660 sample estimates: ratio of variances 1.668187
ตัวอย่างที่ 3 p-value = 0.4421 ซึ่งมีค่ามากกว่าระดับ นัยสำคัญ 4. สรุป ยอมรับ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ความแปรปรวนในการรับน้ำหนักของเชือก ชนิดที่ 1 และ ชนิดที่ 2 ไม่มีความแตกต่างกัน
ตัวอย่างที่ 4 โรงงานผลิตน้ำตาลทรายแห่งหนึ่งได้ซื้อเครื่องจักร ใหม่มา 1 เครื่อง ต้องการศึกษาประสิทธิภาพการ ทำงานของเครื่องจักรใหม่ทำงานได้ดีกว่า เครื่องจักรเก่าหรือไม่ ที่ระดับนัยสำคัญ 0.05 โดย เปรียบเทียบประสิทธิภาพจากความแปรปรวนของ น้ำตาลที่บรรจุ หากมีค่าต่ำกว่าแสดงว่าเครื่องจักร นั้นทำงานได้มีประสิทธิภาพมากกว่า จึงสุ่มน้ำตาล บรรจุถุงมาเครื่องจักรละ 20 ถุง (กิโลกรัม) ได้ ข้อมูลดังนี้ เครื่องจักรใหม่ 0.97, 1.01, 0.97, 1.01, 0.96, 0.97, 0.99, 1.01, 1.03, 1.02, 1.00, 0.95, 0.99, 1.00, 0.99, 1.00, 0.94, 0.99, 1.01, 1.02 เครื่องจักรเก่า 0.96, 0.96, 0.99, 1.00, 0.95, 1.02, 1.02, 1.01, 1.00, 0.97, 0.94, 1.02, 0.93, 0.96, 0.98, 1.03, 1.01, 0.99, 1.03, 0.99
ตัวอย่างที่ 4 0.05 1. ตั้งสมมติฐานในการทดสอบ กำหนดให้ 𝜎 1 2 คือ ความแปรปรวนของน้ำหนักน้ำตาลที่ บรรจุด้วยเครื่องจักรใหม่ 𝜎 2 2 คือ ความแปรปรวนของน้ำหนักน้ำตาลที่ บรรจุด้วยเครื่องจักรเก่า 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 ≥1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 <1 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05 0.05
ตัวอย่างที่ 4 3. คำนวณหาค่า p-value > sugar.old=c(0.97, 1.01, 0.97, 1.01, 0.96, 0.97, 0.99, 1.01, 1.03, 1.02, 1.00, 0.95, 0.99, 1.00, 0.99, 1.00, 0.94, 0.99, 1.01, 1.02) > sugar.new=c(0.96, 0.96, 0.99, 1.00, 0.95, 1.02, 1.02, 1.01, 1.00, 0.97, 0.94, 1.02, 0.93, 0.96, 0.98, 1.03, 1.01, 0.99, 1.03, 0.99) > var.test(sugar.new,sugar.old,conf.level = 0.95, alternative = "less") F test to compare two variances data: sugar.new and sugar.old F = 1.5469, num df = 19, denom df = 19, p-value = 0.825 alternative hypothesis: true ratio of variances is less than 1 95 percent confidence interval: 0.000000 3.354118 sample estimates: ratio of variances 1.546923
ตัวอย่างที่ 4 p-value = 0.825 ซึ่งมีค่ามากกว่าระดับ นัยสำคัญ 4. สรุป ยอมรับ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ความแปรปรวนของน้ำหนักน้ำตาลที่บรรจุด้วย เครื่องจักรใหม่มีค่ามากกว่าหรือเท่ากับ เครื่องจักรเก่า แสดงว่าประสิทธิภาพการทำงาน ของเครื่องจักรใหม่ทำงานได้ดีกว่าเครื่องจักร เก่าไม่เป็นความจริง
ตัวอย่างที่ 5 ต้องการเปรียบเทียบประสิทธิภาพของอาหาร 2 ชนิด ที่มีผลต่อน้ำหนักของไก่ โดยวัดจากความ แปรปวนน้ำหนักของไก่ที่กินอาหารชนิด A และ ชนิด B จึงทำการ ที่กินอาหารแต่ละชนิด และชั่งน้ำหนัก (กิโลกรัม) สุ่มไก่ 15 ตัวที่กินอาหารชนิด A ชั่งน้ำหนักได้ ดังนี้ 1.30, 0.86, 1.10, 1.04, 1.14, 1.29, 0.66, 1.27, 1.55, 1.99, 0.94, 1.53, 0.85, 0.99, 1.48 สุ่มไก่ 18 ตัวที่กินอาหารชนิด B ชั่งน้ำหนักได้ ดังนี้ 1.18, 1.30, 0.96, 1.09, 0.86, 0.80, 1.20, 0.80, 1.18, 0.95,0.98, 0.93, 0.89, 0.94, 1.18, 1.00, 1.05, 0.64
ตัวอย่างที่ 5 1. จงประมาณอัตราส่วนความแปรปรวนของ น้ำหนักของไก่ที่กินอาหารชนิด A และชนิด B พร้อมทั้งอธิบายความหมาย ค่าประมาณของอัตราส่วนความแปรปรวนของ น้ำหนักของไก่ที่กินอาหารชนิด A และชนิด B มีค่า เป็น 4.042848 หมายความว่า ความแปรปรวนของน้ำหนักของไก่ ที่กินอาหารชนิด A มากกว่าไก่ที่กินอาหารและ ชนิด B ประมาณ 4 เท่า > chick.A=c(1.30, 0.86, 1.10, 1.04, 1.14, 1.29, 0.66, 1.27, 1.55, 1.99, 0.94, 1.53, 0.85, 0.99, 1.48) > chick.B=c(1.18, 1.30, 0.96, 1.09, 0.86, 0.80, 1.20, 0.80, 1.18, 0.95,0.98, 0.93, 0.89, 0.94, 1.18, 1.00, 1.05, 0.64) > var(chick.A) [1] 0.1169638 > var(chick.B) [1] 0.02893105 > var(chick.A)/var(chick.B) [1] 4.042848
ตัวอย่างที่ 5 2. จงหาช่วงความเชื่อมั่น 95% ของอัตราส่วน ความแปรปรวนของน้ำหนักของไก่ที่กินอาหาร ชนิด A และชนิด B > var.test(chick.A, chick.B, conf.level = 0.95) F test to compare two variances data: chick.A and chick.B F = 4.0428, num df = 14, denom df = 17, p-value = 0.00766 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.468716 11.725303 sample estimates: ratio of variances 4.042848 สรุป ช่วงความเชื่อมั่นที่ 95% ของอัตราส่วนความแปรปรวนของน้ำหนักของไก่ที่กินอาหารชนิด A และชนิด B 1.468716 ถึง 11.725303
ตัวอย่างที่ 5 3. จงทดสอบว่าความแปรปรวนของน้ำหนักไก่ที่ กินอาหารชนิด A มากกว่าอาหารชนิด B หรือไม่ ที่ ระดับนัยสำคัญ 0.05 กำหนดให้ 𝜎 1 2 คือ ความแปรปรวนของน้ำหนักของไก่ที่ กินอาหารชนิด A 𝜎 2 2 คือ ความแปรปรวนของน้ำหนักของไก่ที่กิน อาหารชนิด B 1. ตั้งสมมติฐานในการทดสอบ 𝐻 0 : 𝜎 1 2 / 𝜎 2 2 ≤1 𝐻 1 : 𝜎 1 2 / 𝜎 2 2 >1 2. กำหนดระดับนัยสำคัญ (𝛼) = 0.05
ตัวอย่างที่ 5 3. คำนวณหาค่า p-value > var.test(chick.A,chick.B,conf.level = 0.95, alternative = "greater") F test to compare two variances data: chick.A and chick.B F = 4.0428, num df = 14, denom df = 17, p-value = 0.00383 alternative hypothesis: true ratio of variances is greater than 1 95 percent confidence interval: 1.735909 Inf sample estimates: ratio of variances 4.042848
ตัวอย่างที่ 5 p-value = 0.00383 ซึ่งมีค่าน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ความแปรปรวนของน้ำหนักของไก่ที่กินอาหาร ชนิด A มากกว่าอาหาชนิด B เป็นความจริง