Chapter 6: Estimation การประมาณค่า
เนื้อหา: การประมาณค่าแบบจุด (Point Estimation) การประมาณค่าแบบช่วง (Interval Estimation) การประมาณค่าเฉลี่ยของประชากร 1 กลุ่ม การประมาณค่าผลต่างของค่าเฉลี่ยของประชากร 2 กลุ่ม การประมาณค่าสัดส่วนของประชากร 1 กลุ่ม การประมาณค่าผลต่างของสัดส่วนของประชากร 2 กลุ่ม การประมาณค่าความแปรปรวนของประชากร 1 กลุ่ม การประมาณค่าอัตราส่วนของความแปรปรวนของ ประชากร 2 กลุ่ม การคำนวณขนาดตัวอย่าง
สมมติว่าเราสนใจที่จะประมาณค่าใช้จ่ายเฉลี่ย ต่อเดือนของนิสิตมหาวิทยาลัยมหาสารคาม (population : parameter) เราจะหาค่าดังกล่าวได้อย่างไร (How would you find out?)
Estimation Process
Estimation Methods
การประมาณค่าแบบจุด (Point Estimation) - เป็นการประมาณค่าพารามิเตอร์ (ประชากร) โดยใช้ ค่าสถิติเพียงค่าเดียวเท่านั้นมาประมาณ (Based on Observations from 1 Sample) - ไม่ให้สารสนเทศ (Information)ว่าค่าสถิติที่ใช้ ประมาณนั้นมีค่าใกล้เคียงพารามิเตอร์มากน้อยอย่างไร
ตัวประมาณ (Estimators) ตัวสถิติหรือตัวแปรสุ่มที่ใช้ประมาณค่าพารามิเตอร์นั่นเอง (Statistics or Random Variables used to estimate a population parameter) เช่น Sample Mean, Sample Proportion, Sample Variance
Point Estimates
คุณสมบัติของตัวประมาณที่ดี (Best Estimators) 1. ความไม่เอนเอียง (Unbiasedness) 2. ความมีประสิทธิภาพ (Efficiency) 6. ความคงตัว (Consistency) 4. ความพอเพียง (Sufficiency)
Estimation Methods
การประมาณค่าแบบช่วง (Interval Estimation) 1. เป็นลักษณะการกำหนดช่วงหรือพิสัยของการประมาณ ค่าพารามิเตอร์โดยอาศัยข้อมูลจากตัวอย่าง(ค่าสถิติ) (Based on Observations from 1 Sample) 2. ให้สารสนเทศ (Information) ว่าช่วงของการประมาณ นั้นมีค่า ใกล้เคียงหรือครอบคลุมพารามิเตอร์มากน้อย อย่างไร (Stated in terms of Probability or Confidence interval) Example: ประมาณได้ว่าค่าเฉลี่ย ของประชากร(พารามิเตอร) ์ จะอยู่ระหว่าง 2500 และ 3500 ด้วยความเชื่อมั่น 95%
หรือ กล่าวว่าที่ระดับความเชื่อมั่น 95% ประมาณได้ว่า ค่าเฉลี่ยของประชากร (µ) มีค่าอยู่ในช่วง 2500 ถึง 3500 หรือ เขียนใน ลักษณะความน่าจะเป็นได้ดังนี้
ซึ่ง a และ b เรียกว่า ขีดจำกัดล่างและขีดจำกัด บนของช่วงความเชื่อมั่น (Lower and Upper confidence limits) หรือ เรียกว่า ลิมิตแห่งความเชื่อมั่น (Confidence limits) ช่วง ( a , b ) เรียกว่า ช่วงแห่งความเชื่อมั่น (Confidence interval) และเรียก (1-α) ว่า สัมประสิทธิ์แห่งความเชื่อมั่น (Confidence coefficient)
เนื่องจากช่วงของการประมาณ (a, b) ขึ้นอยู่กับ สถิติที่เป็นตัวประมาณค่า ดังนั้น การประมาณค่าจึง ต้องทราบการแจกแจงของตัวสถิติก่อน แล้วจึงจะ สามารถประมาณค่าพารามิเตอร์ด้วยความเชื่อมั่น (1- α)100% ที่กำหนดให้พิจารณาแต่ละกรณีดังนี้
การประมาณค่าเฉลี่ยของประชากร (µ) 1 กลุ่ม การประมาณค่าเฉลี่ยของประชากร (µ) 1 กลุ่ม
ข้อตกลง (Assumptions) Confidence Interval for µ ( known) ข้อตกลง (Assumptions)
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า µ จะได้ว่า
ข้อตกลง (Assumptions) Confidence Interval for µ ( Unknown) ข้อตกลง (Assumptions)
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า µ จะได้ว่า
ข้อตกลง (Assumptions) Confidence Interval for µ ( Unknown) ข้อตกลง (Assumptions)
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า µ จะได้ว่า
ตัวอย่าง 6.1 สมมติว่าน้ำหนักของนักเรียนในโรงเรียน แห่งหนึ่งมีการแจกแจงปกติ มีส่วนเบี่ยงเบนมาตรฐาน เท่ากับ 15 ปอนด์สุ่มนักเรียนจากโรงเรียนแห่งนี้มา 25 คนพบว่า น้ำหนักเฉลี่ยเป็น 100 ปอนด์ จง ประมาณน้ำหนักเฉลี่ยของนักเรียนโรงเรียนแห่งนี้ที่ช่วง แห่งความเชื่อมั่น 90%
ตัวอย่าง 6.2 ในการศึกษาปริมาณการใช้น้ำมันของ รถบรรทุกรุ่นใหม่ยี่ห้อหนึ่ง รวม 10 คัน โดยบันทึกระยะทางที่รถบรรทุกแต่ ละคันแล่นได้ ในหน่วย : ไมล์/แกลลอน ได้ข้อมูล ดังนี้ 18.6 18.4 19.2 20.8 19.4 20.5 18.7 19.3 19.6 20.2 จงประมาณระยะทางเฉลี่ยที่รถบรรทุก รุ่นนี้แล่นได้ ที่ช่วงแห่งความเชื่อมั่น 99%
ตัวอย่าง 6.3 ในการประมาณจำนวนครั้งเฉลี่ยของ อัตราการเต้นของหัวใจต่อนาทีของประชากรกลุ่มหนึ่ง ผู้วิจัยได้สุ่มตัวอย่างจากประชากรกลุ่มดังกล่าว มา 17 คน แล้ววัดอัตราการเต้นของหัวใจต่อนาทีพบว่า จำนวนครั้งเฉลี่ยของอัตราการเต้นของหัวใจเท่ากับ 90 ครั้งต่อนาทีและ มีค่าความเบี่ยงเบนมาตรฐานของ อัตราการเต้นของหัวใจเท่ากับ 10 ครั้งต่อนาที จง ประมาณจำนวนครั้งเฉลี่ยของอัตราการเต้นของหัวใจ ของประชากรกลุ่มนี้ ที่ช่วงแห่งความเชื่อมั่น 95%
การประมาณค่าผลต่างของค่าเฉลี่ย ประชากร 2 กลุ่ม (µ1 - µ2 ) การประมาณค่าผลต่างของค่าเฉลี่ย ประชากร 2 กลุ่ม (µ1 - µ2 )
จะแบ่งเป็นกรณีต่าง ๆ ดังนี้ เมื่อประชากรทั้งสองมีการแจกแจงปกติและเป็นอิสระกัน
เมื่อประชากรทั้งสองมีการแจกแจงปกติและเป็นอิสระกัน
เขียนสรุปได้ว่า ดังนั้น จะได้ว่า
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า (µ1 - µ2) จะได้ว่า
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า (µ1 - µ2) จะได้ว่า
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า (µ1 - µ2) จะได้ว่า
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า (µ1 - µ2) จะได้ว่า
ตัวอย่าง 6.4 ในการศึกษารายได้ต่อเดือนของ ครัวเรือนเกษตรกรในจังหวัดมหาสารคาม และจังหวัด ร้อยเอ็ด โดยสุ่มครัวเรือนเกษตรจากจังหวัด มหาสารคามและจังหวัดร้อยเอ็ด มาจังหวัดละ 150 และ 200 ครัวเรือน ตามลำดับ พบว่าครัวเรือนเกษตรกรจากจังหวัดมหาสารคามและ จังหวัดร้อยเอ็ด มีรายได้เฉลี่ยต่อเดือนเท่ากับ 3,400 และ 3,200 บาท มีค่าความเบี่ยงเบนมาตรฐานของ รายได้ต่อเดือนเท่ากับ 120 และ 80 บาท ตามลำดับ จงประมาณผลต่างของรายได้เฉลี่ยต่อ เดือนของครัวเรือนเกษตรกรทั้งหมด ในจังหวัด มหาสารคามและจังหวัด ร้อยเอ็ด ที่ช่วงแห่งความ เชื่อมั่น 95%
ตัวอย่าง 6.5 ในการศึกษาการเติมวิตามิน A เพื่อช่วย ในการเพิ่มน้ำหนักของวัว โดยใช้วัวพันธุ์บาร์มันที่มี อายุและน้ำหนักเท่าๆ กันมาจำนวน 28 ตัว แล้วสุ่มวัว ออกเป็น 2 กลุ่ม กลุ่มละ 14 ตัว ในการทดลอง จะเติมวิตามิน A ลงในอาหาร ของวัวเพียงกลุ่ม เดียวเพื่อเปรียบเทียบกับนํ้าหนัก ที่เพิ่ม ขึ้นของวัวอีก กลุ่มหนึ่งซึ่งไม่ได้เติมวิตามิน A ลงในอาหารหลังการ ทดลองไประยะหนึ่ง จึงทำการชั่งน้ำหนักที่เพิ่มขึ้นของ วัวทั้งสองกลุ่มได้ดังนี้ เติมวิตามิน A : 142 311 337 262 302 195 253 199 236 216 211 176 249 214 ไม่เติมวิตามิน A : 175 132 218 151 200 219 234 149 187 123 248 206 179 206 จงประมาณผลต่างของนํ้าหนักเฉลี่ย ที่เพิ่มขึ้นของวัวที่ ได้รับวิตามิน A และไม่ได้รับ วิตามิน A ที่ช่วงแห่งความเชื่อมั่น 95% ถ้าหาก ทราบว่าความแปรปรวนของน้ำหนัก วัวที่เพิ่มขึ้นในประชากรที่ได้รับและไม่ได้รับวิตามิน A เท่ากัน
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-a)100% ของการประมาณค่า µd จะได้ว่า
ตัวอย่าง 6.6 ในการเปรียบเทียบความรู้ก่อนและหลัง การอบรมของนักเรียนสุ่มมา 10 คน วัดความรู้จาก การสอบผลปรากฏดังตาราง จงประมาณผลต่างของ คะแนน เฉลี่ยก่อนและหลังการได้รับการอบรม ที่ระดับความ เชื่อมั่น 95%
การประมาณค่าสัดส่วนของประชากร (p) 1 กลุ่ม
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-a)100% ของการประมาณค่า P จะได้ว่า
ตัวอย่าง 6. 7 จากการสุ่มแม่บ้านในจังหวัด มหาสารคามมาจำนวน 400 คน แล้ว ตัวอย่าง 6.7 จากการสุ่มแม่บ้านในจังหวัด มหาสารคามมาจำนวน 400 คน แล้ว สอบถามเกี่ยวกับยี่ห้อของผงซักฟอกที่ใช้เป็นประจำ ปรากฏว่ามีแม่บ้าน 224 คน ใช้ยี่ห้อแฟ้บเป็นประจำ จงประมาณสัดส่วนของแม่บ้านทั้งหมดใน จังหวัด มหาสารคามที่ชอบใช้ผงซักฟอกแฟ้บเป็นประจำ พิจารณาที่ระดับความเชื่อมั่น 90%
การประมาณค่าผลต่างของสัดส่วนของ ประชากร 2 กลุ่ม (p1 – p2)
เนื่องจากประชากรทั้งสองชุดมีการแจกแจงแบบทวินาม ดังนั้น เมื่อตัวอย่างที่สุ่มมา ขนาด n1 และ n2 มีขนาดใหญ่พอและอาศัย C.L.T จะได้ว่า
เขียนสรุปได้ว่า ดังนั้น จะได้ว่า
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-)100% ของการประมาณค่า P1 - P2 จะได้ว่า
ตัวอย่าง 6.8 จากการสุ่มวัยรุ่นในจังหวัดมหาสารคาม เพศชายจำนวน 600 คน และเพศหญิง จำนวน 400 คน แล้วสอบถามการติดตามข่าวการเมืองหรือไม่ พบว่า วัยรุ่นเพศชาย 300 คน และเพศหญิง 100 คน ติดตามข่าวการเมือง เป็นประจำที่ระดับความ เชื่อมั่น 99% จงประมาณค่าผลต่างของสัดส่วน ของวัยรุ่นเพศชายและเพศหญิงทั้งหมดในจังหวัดที่ ติดตามข่าวการเมืองเป็นประจำ
การประมาณค่าความแปรปรวนของ ประชากร 1 กลุ่ม ( ) การประมาณค่าความแปรปรวนของ ประชากร 1 กลุ่ม ( )
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-a)100% ของการประมาณค่า จะได้ว่า
ตัวอย่าง 6.9 โรงงานเคลือบโลหะพลาสติกแห่งหนึ่งได้ สุ่มพลาสติกที่ผ่านการเคลือบแล้ว มาจำนวน 9 แผ่น วัดความหนาของโลหะที่เคลือบได้ดังนี้ (หน่วย : มม.) 20.5 21.2 18.6 20.4 21.6 19.8 19.9 20.3 20.8 ที่ระดับความเชื่อมั่น 90% จงประมาณค่าความ แปรปรวนของความหนาของโลหะที่เคลือบพลาสติกที่ผลิต จากโรงงานนี้ทั้งหมด
การประมาณค่าอัตราส่วนความ แปรปรวน ของประชากร 2 กลุ่ม ( ) การประมาณค่าอัตราส่วนความ แปรปรวน ของประชากร 2 กลุ่ม ( )
ดังนั้น พิจารณาช่วงแห่งความเชื่อมั่น (1-a)100% ของการประมาณค่า จะได้ว่า แก้ไขสูตรและกราฟ
ตัวอย่าง 6.10 จากการสุ่มคะแนนสอบวิชาสถิติของ นักเรียนชาย 16 คน และนักเรียน หญิง 10 คน ปรากฏว่าคะแนนของนักเรียนชายและ นักเรียนหญิง มีความแปรปรวนเท่ากับ 76.28 และ 29.51 ตามลำดับ ที่ระดับความเชื่อมั่น 95% จง ประมาณค่าอัตราส่วนของความแปรปรวนของคะแนนสอบ ของนักเรียนชายและนักเรียนหญิงทั้งหมดที่เข้าสอบ
ตัวอย่าง 6.11 โรงงานผลิตยาแห่งหนึ่งได้สุ่มยาอัดเม็ดที่ ผลิตโดยใช้เครื่องจักร 2 เครื่องมาจำนวน 21 และ 6 เม็ด ตามลำดับ พบว่า ความแปรปรวนของ น้ำหนักเม็ดยาในตัวอย่างเป็น 0.25 และ 0.08 ม.ก.2 ตามลำดับที่ระดับความเชื่อมั่น 90% จงประมาณค่า อัตราส่วนของความแปรปรวนของน้ำหนักเม็ดยา ทั้งหมด ที่อัดโดยเครื่องจักร 1 และ 2
การหาขนาดตัวอย่าง Finding Sample Sizes
ค่า Z หาได้จากที่เรากำหนดระดับความเชื่อมั่นของ การประมาณ แต่ค่า จะหาได้อย่างไร -ได้จากข้อมูลในอดีตที่เคยมีการศึกษาในเรื่องนี้มา ก่อน -ทำการสำรวจล่วงหน้า (Pilot Survey) โดยใช้ ตัวอย่างขนาดเล็ก
ตัวอย่าง 6.12 ในการศึกษาเพื่อประมาณระดับเอ็นไซม์ เฉลี่ยของประชากรกลุ่มหนึ่งอยากทราบว่าขนาดตัวอย่าง ที่สุ่มมาควรจะเท่ากับเท่าใด ถ้ายอมให้เกิดความผิดพลาด ในการประมาณได้มากสุดไม่เกิน 0.6 และให้พิจารณา ที่ระดับความเชื่อมั่น 95% โดยทราบว่าความแปรปรวน ของระดับเอ็นไซม์ในประชากรเท่ากับ 45
ตัวอย่าง 6.13 โรงงานแห่งหนึ่งต้องการประมาณ ค่าใช้จ่ายในการรักษาพยาบาลของคนงานว่าจะเท่ากับ เท่าใด โดยกำหนดว่าที่ระดับความเชื่อมั่น 90% ของ การประมาณจะยอมให้เกิดความผิดพลาดไม่เกิน ±50 บาทและจากการทำการสำรวจเบื้องต้น (Pilot study) พบว่า ค่าความเบี่ยงเบนมาตรฐานของค่าใช้จ่ายดังกล่าว เท่ากับ 400 บาท อยากทราบว่า ในการประมาณ ครั้งนี้เราควรจะสุ่มตัวอย่างเพื่อทำการศึกษามาขนาด เท่าใด
ตัวอย่าง 6.14 ในการศึกษาการยาที่ใช้ในการรักษาสิว เพื่อประมาณสัดส่วนของประชากรที่สิวหายเมื่อใช้ยานี้ รักษา ขนาดตัวอย่างที่ใช้ในการศึกษาควรเป็นเท่าใดถ้า ยอมให้เกิดความผิดพลาดในการประมาณไม่เกิน 0.02 โดยพิจารณาที่ระดับความเชื่อมั่น 90% และจากการ สำรวจเบื้องต้นทราบว่าสัดส่วนของคนที่ใช้ยานี้แล้วสิว หายเท่ากับ 0.93