การประมาณค่าพารามิเตอร์และ ขนาดของตัวอย่าง

Slides:

Advertisements

งานนำเสนอที่คล้ายกัน

ความคิดเห็นของประชาชนที่มีต่อ พ.ร.บ.ข้อมูลข่าวสารของราชการ พ.ศ. 2548

Advertisements

คณิตคิดเร็วโดยใช้นิ้วมือ

ที่ โรงเรียน เฉลี่ย 1 บ้านหนองหว้า บ้านสะเดาหวาน

การใช้โปรแกรม SPSS ในการตรวจสอบการแจกแจงของข้อมูล

ยินดีต้อน เข้าสู่ โครงงาน.

การทดสอบสมมติฐานเกี่ยวกับ ค่าเฉลี่ยประชากร 1 กลุ่ม

ความน่าจะเป็น Probability.

ไม่อิงพารามิเตอร์เบื้องต้น

พลังงานในกระบวนการทางความร้อน : กฎข้อที่หนึ่งของอุณหพลศาสตร์

การซ้อนทับกัน และคลื่นนิ่ง

1.7 ระเบียบวิธีทางสถิติ 1. การเก็บรวบรวมข้อมูล (Data Collection)

บทที่ 12 การวิเคราะห์การถดถอย

สถิติที่ใช้ในการวิจัย

มิติที่ 1 มิติด้านประสิทธิผลตามแผนปฏิบัติราชการ

เปรียบเทียบจำนวนประชากรทั้งหมดจากฐาน DBPop Original กับจำนวนประชากรทั้งหมดที่จังหวัดถือเป็นเป้าหมาย จำนวน (คน) 98.08% % จังหวัด.

เทคนิคการประเมินผลการเรียนการสอน (การให้ระดับคะแนน:เกรด)

Probability & Statistics

การเลื่อนเงินเดือนข้าราชการ

สำเร็จการศึกษาในเวลา 4 ปี

การประมาณค่าทางสถิติ

จำนวนนับใดๆ ที่หารจำนวนนับที่กำหนดให้ได้ลงตัว เรียกว่า ตัวประกอบของจำนวนนับ จำนวนนับ สามารถเรียกอีกอย่างว่า จำนวนเต็มบวก หรือจำนวนธรรมชาติ ซึ่งเราสามารถนำจำนวนนับเหล่านี้มา.

การขอเบิกเงินนอกงบประมาณ

เป้าเบิกจ่าย งบรวม เป้าเบิกจ่าย งบลงทุน งบรวม เบิกจ่าย.

จำนวนทั้งหมด ( Whole Numbers )

เรื่อง ความรู้เกี่ยวกับการจัดเก็บภาษีสุรา

สถิติเชิงสรุปอ้างอิง(Inferential or Inductive Statistics)

การประเมินผลผลลัพธ์การดำเนินงาน ที่สำคัญ ( พ. ศ. ๒๕๕๓ ) ๑. ความพึงพอใจของประชาชนต่อคุณภาพ การให้บริการของหน่วยงานระดับ Front Office ( ๓. ๑. ๑. ๑ ) ๒. ความพึงพอใจของประชาชนต่อการ.

Office of information technology

การทดสอบสมมติฐาน

ความคิดเห็นของประชาชนเกี่ยวกับ กองทุนหมู่บ้านและชุมชนเมือง

ความคิดเห็นของข้าราชการเกี่ยวกับ สวัสดิการการรักษาพยาบาล พ.ศ. 2546

สำนักงานสถิติแห่งชาติ กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร

ความคิดเห็นของประชาชนเกี่ยวกับผู้มีอิทธิพล

สำนักงานสถิติแห่งชาติ กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร

สรุปผลการสำรวจ ความคิดเห็นของประชาชนที่มีต่อ

สรุปผลการสำรวจ ความต้องการของประชาชนเกี่ยวกับ

สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ กองทุนหมู่บ้านและชุมชนเมือง พ.ศ สำนักงานสถิติแห่งชาติกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร สิงหาคม.

ข้อมูลเศรษฐกิจการค้า

งานอนามัยแม่และเด็ก ปี 2551

การเลื่อนเงินเดือนในระบบใหม่

สำนักวิชาการและแผนงาน

พระราชบัญญัติ คุ้มครองแรงงาน (ฉบับที่ 4) พ. ศ

การวัดการกระจาย (Measures of Dispersion)

การดำเนินงานตามแผนปฏิบัติการ โครงการที่ได้รับ

สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology

ภาพรวมเศรษฐกิจไทยล่าสุด (ณ เดือนตุลาคม) และแนวโน้มไตรมาส 3/50 และ 4/50

การแจกแจงปกติ.

บทที่ 9 สถิติที่ใช้ในการประเมินผล

ความคิดเห็นของประชาชนเกี่ยวกับเกมออนไลน์ ในเขตกรุงเทพมหานคร

F M B N สมบัติของจำนวนนับ ตัวคูณร่วมน้อย (ค.ร.น.).

ผลการทดสอบทางการศึกษา ระดับชาติขั้นพื้นฐาน ( O-NET) ระดับชั้นมัธยมศึกษาปีที่ 6 ผู้จัดทำ นางสาวภัทศิรา ภูมิเมือง เลขที่ 16 นางสาวสุพัชรญา มะโนรา เลขที่

สรุปสถิติ ค่ากลาง ค่าเฉลี่ยเลขคณิต เรียงข้อมูล ตำแหน่งกลาง มัธยฐาน

เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว

คณิตศาสตร์ (ค33101) หน่วยการเรียนรู้ที่ 7 เรื่อง สถิติ

สรุปผลสัมฤทธิ์ปีการศึกษา 2552 ชั้ น จำนว นสาระการเรียนรู้ นักเรี ยนทค ค. เพิ่มวสพ.พ. ศ.ศ. ดน ตรีง.ง. คอ ม. อ อ. เพิ่ม ป.1ป

ขั้นตอนการจัดนักศึกษาเข้าสังกัดสาขาวิชา

บทที่ 4 การวัดการกระจาย

สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ การป้องกันและปราบปรามยาเสพติด (ก่อนและหลัง การประกาศสงครามขั้นแตกหักเพื่อเอาชนะยาเสพติด) พ.ศ สำนักงานสถิติแห่งชาติ

ผลการทดสอบทางการศึกษาระดับชาติขั้นพื้นฐาน

สรุปผลการสำรวจ ความคิดเห็นของประชาชน

Confidence Interval Estimation (การประมาณช่วงความเชื่อมั่น)

สถานการณ์ โรคเฝ้าระวังทางระบาดวิทยา มิถุนายน 2554 งานระบาดวิทยา งานระบาดวิทยา สำนักงานสาธารณสุขอำเภอเมืองลำปาง.

กราฟเบื้องต้น.

ภาวะราคาปาล์มน้ำมัน จังหวัดสุราษฎร์ธานี จังหวัดชุมพร จังหวัดกระบี่

แบบทดสอบก่อนเรียน กลุ่มสาระการเรียนรู้วิทยาศาสตร์ ชั้นมัธยมศึกษาปีที่ 2 เรื่อง การนำเสนอข้อมูลและการวิเคราะห์ข้อมูล คะแนนเต็ม 10 คะแนน.

กราฟเบื้องต้น.

ผลการประเมิน คุณภาพการศึกษาขั้นพื้นฐาน ปีการศึกษา

คณิตศาสตร์ (ค33101) ชั้นมัธยมศึกษาปีที่ 3 หน่วยการเรียนที่ 7

แผนภูมิแสดงแผนและผลการใช้จ่ายงบประมาณปี 2549 การใช้ จ่าย ( สะสม ) ต.ค.ต.ค. พ.ย.พ.ย. ธ.ค.ธ.ค. ม.ค.ม.ค. ก.พ.ก.พ. มี. ค. เม. ย. พ.ค.พ.ค. มิ. ย. ก.ค. ก.ค.

ใบสำเนางานนำเสนอ:

การประมาณค่าพารามิเตอร์และ ขนาดของตัวอย่าง บทที่ 7 การประมาณค่าพารามิเตอร์และ ขนาดของตัวอย่าง

1. ความรู้เบื้องต้น การอนุมานเชิงสถิติ (statistical inference) เป็นกระบวนการใช้ข้อมูลจากตัวอย่าง เพื่อหาข้อสรุปเกี่ยวกับข้อมูลของประชากร เทคนิคของการอนุมานเชิงสถิติสามารถที่จะแบ่งออกเป็นสองส่วนใหญ่ ๆ คือ 2 2

1.1 การประมาณค่าพารามิเตอร์ (parameter estimation) 1.2 การทดสอบสมมุติฐาน (Test of Hypothesis)

2. การประมาณค่าพารามิเตอร์ (Parameter estimation) วิธีการนี้จะเกี่ยวข้องกับการประมาณค่าของพารามิเตอร์ด้วยค่าสถิติที่สมนัยกัน สำหรับการประมาณค่าของพารามิเตอร์นั้น ยังแบ่งออกได้เป็น 2 วิธี ดังนี้ คือ 4

2.1 การประมาณค่าแบบจุด (point estimation) 2.2 การประมาณค่าแบบช่วง (interval estimation)

3. การประมาณค่าแบบจุด (Point Estimation) 3. การประมาณค่าแบบจุด (Point Estimation) ค่าประมาณแบบจุด (point estimate) ของตัวพารามิเตอร์  หมายถึงจำนวนจริงที่มีค่าใกล้เคียงกับค่าของ  ค่าประมาณนี้หาได้โดยการเลือกตัวสถิติที่เหมาะสมแล้วคำนวณค่าของตัวสถิติจากกลุ่มตัวอย่างที่เลือกมา ดังนั้นค่าโดยประมาณนี้จะ เปลี่ยนแปลงไปได้ตามกลุ่มตัวอย่าง 6

ส่วนตัวสถิตินั้นจะเรียกว่า ตัวประมาณแบบจุด (point estimator) ของพารามิเตอร์

ตัวอย่างของการประมาณค่าแบบจุดเป็นดังนี้ คะแนนสอบวิชา Prob & Stat ของนักศึกษาจำนวน 600 คน มีการแจกแจกแบบปกติด้วยค่าของ mean =  และ variance =  2 ที่ยังไม่ทราบค่า

แต่ผู้ตรวจกระดาษคำตอบ ต้องการประมาณค่าของ  และ  2 จึงได้เลือกตัวสถิติเป็น ต่อจากนั้นก็ทำการสุ่มคะแนนนักศึกษามา 10 คน พบว่าคะแนนดังกล่าวเป็นดังนี้ คือ (คะแนนเต็ม 100 คะแนน) 9

คำนวณค่าค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างได้ดังนี้ คือ 10

ดังนั้นในที่นี้ estimator = และ estimate = ค่าเฉลี่ยตัวอย่าง ดังนั้นในที่นี้ estimator = และ estimate = 11

ความแปรปรวนตัวอย่าง Estimator = Estimate = 12

จากตัวอย่างข้างต้นนักศึกษาพบว่าเราได้ใช้ 1) ตัวสถิติ ประมาณค่าเฉลี่ย (ประชากร) 2) ตัวสถิติ ประมาณค่าความแปร- ปรวน (ประชากร)

เหตุผลที่เราเลือกตัวประมาณค่าเช่น นี้ เพราะว่าทั้ง และ ต่างก็เป็นตัวประมาณค่าที่ไม่เอนเอียง (unbiased estimator) ของทั้ง และ ( นั่นคือ และ ) 14

มีคำถามต่อมาก็คือว่าค่าโดยประมาณที่ให้มานี้มีความน่าเชื่อถือมากน้อยเพียง ใด เราจะนำเครื่องมืออะไรมาวัดดี คำตอบก็คือเราสามารถใช้ standard error วัดความเที่ยงตรงของการประมาณค่าแบบจุดได้ * ดังตัวอย่างต่อไปนี้

ตัวอย่าง ขอให้พิจารณาคะแนนของนักศึกษา 10 ท่านตามที่กล่าวไว้ในตัวอย่างข้างต้นนั่นคือ 36 42 34 40 64 50 22 54 60 32 16

* โดยบทนิยาม ถ้า เป็นตัวประมาณค่าของ แล้ว Standard error ของ จะเป็น standard deviation ของ

เราได้คำนวณไว้แล้วว่า ค่าเฉลี่ยตัวอย่าง = 43.40 ค่าเฉลี่ยตัวอย่าง = 43.40 ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง s = 11.26 สำหรับ standard error ของค่าเฉลี่ยตัวอย่าง นั้นได้เคยกล่าวถึงไว้แล้วในบทก่อนว่ามีค่าเท่ากับ 18

แต่เนื่องจาก  เป็นค่าของประชากรที่เราไม่ทราบ ดังนั้นจึงแทน  ในสมการสุดท้ายด้วย ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง คือ s = 11.26 ผลลัพธ์ก็คือ 19

พบว่า standard error มีค่าราว 8

กล่าวโดยสรุปเรื่องการประมาณค่าแบบจุด มีดังนี้ 1) พารามิเตอร์ : ค่าเฉลี่ยประชากร  ข้อมูล : estimator : 21

พารามิเตอร์ : ความแปรปรวนประชากร ข้อมูล : estimator :

3) การวัดความน่าเชื่อถือของการประมาณค่า 3.1 ความเอนเอียง = E[estimator - parameter] 3.2 ส่วนเบี่ยงเบนมาตราฐานของตัวประมาณค่า ซึ่งเราเรียกว่า standard error ในกรณีของ mean 23

(Interval Estimation) 4. การประมาณค่าแบบช่วง (Interval Estimation) ในหลายกรณีการประมาณค่าแบบจุดอาจจะไม่ให้ข้อมูลที่เพียงพอเกี่ยวกับตัวพารามิเตอร์ที่เราสนใจ ดังนั้นในบางครั้งเราจึงชอบที่จะประมาณค่าพารามิเตอร์ ด้วยช่วงของจำนวนจริง เรียกช่วงที่ใช้ในการประมาณค่า นี้ว่า ช่วงความเชื่อมั่น (confidence interval) 24

และเรายังมีวิธีการควบคุม เพื่อที่จะกำหนดว่าช่วงความเชื่อมั่นที่ได้สร้างขึ้นมานี้ มีระดับความเชื่อมั่น (Level of significance) อยู่ในระดับใด

บทนิยาม : ระดับของความเชื่อมั่น (Level of Significance) บทนิยาม : ระดับของความเชื่อมั่น (Level of Significance) หมายถึง โอกาส (หรือความน่าจะเป็น) ที่พารามิเตอร์ของประชากรจะอยู่ในช่วงความเชื่อมั่นหนึ่ง ตัวอย่างเช่นเราเขียน 26

หมายความว่า ความน่าจะเป็นที่พารามิเตอร์ จะอยู่ในช่วง (L,U) มีค่าเท่ากับ 0.95 หรือกล่าวอีกอย่างหนึ่ง ก็คือค่า ของ  จะอยู่ในช่วง (L,U) ด้วยระดับความเชื่อมั่น 95%

รูปข้างล่างนี้แสดงช่วงความเชื่อมั่นต่าง ๆ ที่ใช้ในการประมาณค่าเฉลี่ยประชากร ซึ่งมี true mean = 20 10 15 20 5 25 30 35 Yes Sample number True m = 20 28

4.1 การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยของประชากร พิจารณาออกได้เป็น 2 กรณี ดังนี้ กรณีที่ 4.1.1 : เมื่อขนาดของตัวอย่างเชิง สุ่มมีขนาดใหญ่ n  30 กรณีที่ 4.1.2 : เมื่อขนาดของตัวอย่างสุ่ม มีขนาดน้อย n < 30 29

4.1.1 การสร้างช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย  เมื่อขนาดตัวอย่าง n  30 เราจะเริ่มต้นด้วยการเลือกตัวอย่างเชิงสุ่ม (n  30) มาจากประชากรที่ยังไม่ทราบค่าเฉลี่ย  แต่ขอสมมุติว่าทราบค่าความแปรปรวน แล้วให้ เป็นค่าเฉลี่ยตัวอย่าง 30

จาก ทฤษฎีบทลิมิตเข้าสู่ส่วนกลาง จะได้ว่า ค่าเฉลี่ยตัวอย่าง มีการแจกแจงโดยประมาณเป็นแบบปกติ นั่นคือ 31

ดังนั้น ตัวแปรสุ่ม จึงมีการแจกแจงโดยประมาณแบบปกติ N(0,1)

เพราะฉะนั้น เมื่อมีการกำหนดความน่า จะเป็น 1- มาให้ (  เป็นค่าน้อยๆ เช่น 0.01, 0.05 หรือ 0.10) เราสามารถหาค่าจากตารางการแจกแจงแบบปกติได้ ว่าเท่ากับ (1) 33

ดูรูปนี้ ตัวอย่างเช่น ถ้า แล้ว a/2 m L U 1-a -Z a / 2 Z a / 2 Z X 34

ขอให้สังเกตว่านิพจน์ในวงเล็บของสมการ(1) สามารถที่จะเขียนใหม่ได้เป็น 35

ดังนั้น ความน่าจะเป็นในสมการ (1) จึงเขียนได้ใหม่เป็น (2) เพราะฉะนั้นช่วงสุ่ม (random interval)สำหรับการประมาณค่า คือ 36

เมื่อได้มีการสุ่มตัวอย่างหาค่าเฉลี่ย แล้ว ช่วงสุ่ม (random interval) ก็จะเปลี่ยนเป็นช่วงของจำนวนจริงดังนี้

(3) = error =

ตามความเป็นจริงแล้วเราก็ไม่ทราบว่าช่วง (3) นี้จะบรรจุค่า  อยู่ด้วยหรือเปล่า แต่เราสามารถที่จะกล่าวออกมาได้โดยอ้าง (2) ว่า “ เรามีความเชื่อมั่นถึง (1-)100% ว่าช่วง (3) จะบรรจุ  อยู่ด้วย ” หรืออาจจะกล่าวอีกอย่างหนึ่งว่าช่วง (3) คือ 39

ช่วงความเชื่อมั่น (confidence interval) สำหรับการประมาณค่า  ด้วยระดับความเชื่อ มั่น (1-)100% ขอให้นักศึกษาสังเกตว่าในการหาช่วงความเชื่อมั่น (3) นั้น ต้องทราบค่าต่อไป นี้ คือ

(1) ค่าเฉลี่ยตัวอย่าง ค่านี้หาได้จากการเลือกตัวอย่างเชิงสุ่มขนาด n มา 1 ชุด สมมุติว่าเป็น ต่อจากนั้น ก็คำนวณหาค่าเฉลี่ยตัวอย่าง

(2) ค่า ค่านี้หาได้จากการเปิดตารางการแจกแจงแบบปกติ (ส่วนค่า  นั้นเป็นค่าที่เรากำหนดขึ้นมาเอง ถ้าต้องการให้มีความเชื่อมั่นสูง ก็กำหนด  ให้มีค่าน้อยเพื่อว่า (1-)100% จะได้มีค่ามาก) 42

(3) ต้องทราบค่า  ค่านี้เป็นค่าส่วนเบี่ยง เบนของประชากรค่านี้หาได้ลำบากหน่อย เพราะเป็นค่าประชากร แต่ในทางปฏิบัติแล้ว ค่านี้จะได้จากประสบการณ์ในการทำงานเรื่องนั้นจนชำนาญ ก็พอจะคาดเดาค่า  ได้

ในกรณีที่ไม่สามารถจะคาดเดาค่า  ได้ ก็ให้ใช้ sample standard deviation แทน ในกรณีนี้ช่วงความเชื่อมั่น (3) ก็จะเปลี่ยนเป็น (4) 44

ตัวอย่างที่ 1 จงเปิดตารางค่าการแจกแจงแบบปกติ N(0,1) เพื่อหาค่าของ เมื่อ  = 0.1 และ  =0.05

วิธีทำ กรณีที่ 1 0.05 46

สร้างเป็นตารางได้ดังนี้ วิธีทำ กรณีที่ 2 เปิดตารางได้ สร้างเป็นตารางได้ดังนี้ Confidence level 90% 95% 1.645 1.96 47

ตัวอย่างที่ 2 โรงงานผลิตสายเบรกแห่งหนึ่งต้องการทราบว่าสายเบรกที่ผลิตได้ จะสามารถรับแรงดึงได้โดยเฉลี่ยเท่าใด เพื่อที่จะประมาณค่าเฉลี่ยของแรงดึงนั้น โดยได้มีการเลือกตัวอย่างเชิงสุ่มมา 32 เส้น แล้วทำการตรวจสอบแรงดึงของ

แต่ละเส้นต่อจากนั้นจึงหา sample mean ออกมาได้ = 42,196 ปอนด์ จากประสบการณ์ทางโรงงานทราบว่าส่วนเบี่ยงเบนมาตรฐานของแรงดึงมีค่าเท่ากับ 500 ปอนด์ จงประมาณค่าแรงดึงเฉลี่ยของสายเบรคที่ผลิตจากโรงงานนี้ กำหนดให้  = 0.1 49

วิธีทำ จะประมาณค่าเฉลี่ย  ด้วยการหาช่วงเชื่อมั่นด้วยสูตร (3) เรามี วิธีทำ จะประมาณค่าเฉลี่ย  ด้วยการหาช่วงเชื่อมั่นด้วยสูตร (3) เรามี 1) = 42,196 ปอนด์ 2)  = 0.1 , 3)  = 500 ; 50

ดังนั้น โดยสูตร (3) confidence interval สำหรับ  ด้วยระดับความเชื่อมั่น 90% คือ

กล่าวโดยสรุปก็คือ ค่าของ  จะอยู่ใน ช่วง 42,051 - 42,341 ด้วยระดับความเชื่อมั่น 90% 52

การหาขนาดของตัวอย่าง สูตรของค่าผิดพลาด (error) สามารถใช้ในการหาขนาดของตัวอย่างเพื่อให้เกิด error ไม่เกินข้อกำหนดได้ สมมุติว่าเราต้องการใช้ค่าเฉลี่ยตัวอย่างเพื่อประมาณค่าเฉลี่ยประชากรและ

ต้องการยืนยันว่า error ที่เกิดจากการประมาณนี้มีค่าไม่เกิน E ด้วยความน่าจะเป็นเท่ากับ 1- เราจะคำนวณหาค่าของ n จากการแก้สมการ ได้ค่า 54

ตัวอย่าง A researcher wants to deter-mine the average time it takes a mechanic to rotate the tires of a car, and she wants to be able to assert with 95% confi-

dence that the mean of her sample is off by at most 0. 5 minutes dence that the mean of her sample is off by at most 0.5 minutes. If she can presume from past experience that  = 1.6 minutes, how large sam-ples will she have to take? 56

วิธีทำ ในโจทย์ข้อนี้ E = 0. 50 ,  = 1 วิธีทำ ในโจทย์ข้อนี้ E = 0.50 ,  = 1.6 และ แทนค่าเหล่านี้ลงในสูตรเพื่อหา n ได้ ดังนั้นนักวิจัยก็ควรจะเลือกตัวอย่างมาอย่างน้อย 40 คน

4.1.2 การสร้างช่วงความเชื่อมั่นสำหรับ ค่าเฉลี่ยเมื่อขนาดตัวอย่าง n < 30 ในกรณีนี้ต้องสมมุติว่าประชากรที่เราสนใจ มีการแจกแจงแบบปกติด้วย เพื่อว่าตัวแปรสุ่ม จะมีการแจกแจงแบบ t 58

ช่วงการประมาณค่าของ  ที่ระดับความ เชื่อมั่น (1-)100%

ตัวอย่าง 3 Consider the following sample of fat content (in percen-tage) of n = 10 randomly selected hot dogs 25.2 21.3 22.8 17.0 29.8 21.0 25.5 16.0 20.9 19.5 60

Assume that these were selected from a normal population distri-bution. Find 95% confidence interval for the population mean fat content.

วิธีทำ

The confidence interval of population mean fat content is Point estimate สำหรับโจทย์ข้อนี้ คือ 63

5. การสร้างช่วงความเชื่อมั่นสำหรับ สัดส่วนประชากร ในกรณีที่ข้อมูลไม่ได้เป็นข้อมูลเชิงปริมาณ (ตัวเลข) เราไม่สามารถนำมาหาค่าเฉลี่ยได้ แต่ข้อมูลเป็นข้อมูลเชิงคุณภาพ เช่น ความคิดเห็น คุณภาพของสินค้า เป็นต้น 64

ในกรณีเช่นนี้ เมื่อต้องการประมาณค่าสัดส่วนประชากร เราจะให้ p แทนค่าสัด-ส่วนของประชากร ต่อจากนั้นทำการสุ่มตัวอย่างขนาด n และให้ X เป็นตัวแปรสุ่มแทน success ในตัวอย่าง ถ้า n มีขนาดน้อยเมื่อเทียบกับขนาดของประชากร

แล้ว ตัวแปรสุ่ม X จะมีการแจกแจงแบบทวินาม ด้วย และ นอกจากนี้ถ้า n มีค่ามากพอ ( นั่นคือ np  10 และ nq  10 ) 66

โดยที่ q = 1 – p จากทฤษฎีเข้าสู่ส่วน กลางจะได้ว่า X จะมีการแจกแจงโดย ประมาณเป็นแบบปกติ เราจะเลือกตัวสถิติ เป็น estimator ของ p เนื่องจาก ก็คือ X คูณด้วยค่าคงตัว 1/n ดังนั้น จึงมี

การแจกแจงโดยประมาณเป็นแบบปกติ ด้วย และ

นั่นคือ ดังนั้น 69

a/2 m L U 1-a -Z a / 2 Z a / 2 Z X 70

จากรูปข้างต้นจะได้ว่า 71

(5.1) เนื่องจากเราไม่ทราบค่า p , q เราจึงใช้ 72

หรือเขียนอย่างสั้นๆว่า หมายเหตุ การประมาณค่าสัดส่วนประชากร จะต้องใช้ตัวอย่างขนาดใหญ่เสมอ เนื่องจากผลสรุปเป็นเปอร์เซนต์จึงไม่มีการใช้สถิติ t

ตัวอย่าง 4 There is a reported that in n = 48 trials in a particular laboratory, 16 resulted in ignition of particular type of substrate by a lighted cigarette. Let p denote the long-run proportion of all such trials that would result in ignition.

A point estimate for p is Find a confidence interval for p with  = 0.05 . 75

วิธีทำ ในที่นี้ n=48 และ ส่วน ดังนั้นจึงใช้สูตร (5.1) ได้ช่วงความเชื่อมั่นของ p ที่ระดับความเชื่อมั่น 95% คือ 76

กรุงเทพ ฯ มา 100 คน พบว่าเป็นผู้มีบ้านของตนเอง 60 คน จงประมาณค่า p ตัวอย่าง 5 ต้องการประมาณค่าสัดส่วนของคนกรุงเทพ ฯ ที่มีบ้านเป็นของตนเองที่ระดับความเชื่อมั่น 90% จึงสุ่มคน กรุงเทพ ฯ มา 100 คน พบว่าเป็นผู้มีบ้านของตนเอง 60 คน จงประมาณค่า p 77

จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น วิธีทำ จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น 78

ช่วงของการประมาณค่าที่ระดับความเชื่อมั่น 90% คือ แทนค่า 79

นั่นคือสัดส่วนคนกรุงเทพ ฯ ที่มีบ้านเป็นของตนเองจะอยู่ในช่วง 51 นั่นคือสัดส่วนคนกรุงเทพ ฯ ที่มีบ้านเป็นของตนเองจะอยู่ในช่วง 51.94% ถึง 68.06% ที่ระดับความเชื่อมั่น 90%

6. การประมาณค่าแปรปรวนประชากร ตัวประมาณค่าแบบจุดเราใช้สถิติ ประมาณ โดยที่ 81

ให้ เป็นตัวอย่างเชิงสุ่มจากประชากรที่มีการแจกแจงแบบปกติและมีความแปรปรวน จะได้ว่าตัวแปรสุ่ม จะมีการแจกแจงแบบไคสแควร์ v = n-1

83

84

ดังนั้น หลังจากที่ได้เลือกตัวอย่างขนาด n และคำนวณค่า แล้ว ช่วงความเชื่อมั่นของ ที่ระดับความเชื่อมั่น (1-)100% คือ 85

ตัวอย่าง 5 ถ้าสุ่มตัวอย่างขนาด 31 จากประชากรที่มีการแจกแจงแบบปกติและคำนวณค่าแปรปรวนตัวอย่างได้ 25 จงประมาณค่าแบบช่วงของ ที่ระดับความเชื่อมั่น 95% 86

วิธีทำ ช่วงของการประมาณค่า ที่ระดับความเชื่อมั่น 95% คือ ในที่นี้ 87

(ที่องศาอิสระ = 31- 1 = 30)

แทนค่าได้ นั่นคือค่าแปรปรวนจะอยู่ในช่วง 15.96 และ 44.64 ที่ระดับความเชื่อมั่น 95% 89

แบบฝึกหัดสำหรับบทที่ 7 ข้อ 1. กำหนดให้ เป็นตัวอย่างเชิงสุ่มชุดหนึ่งที่เลือกมาจากประชากรที่มีการแจกแจงแบบแบร์นูลี B(1, p) ดังนั้น จะมี การแจกแจงแบบทวินาม B(n, p) แล้ว เป็นตัวประมาณค่าที่ไม่เอนเอียงของพารามิเตอร์ p หรือไม่

วิธีทำ เนื่องจาก เป็นตัวอย่างเชิงสุ่มชุดหนึ่งที่เลือกมาจากประชากรที่มีการแจกแจงแบบแบร์นูลี ดังนั้น 91

และ จะมีการแจกแจงแบบทวินาม ดังนั้น และ จะมีการแจกแจงแบบทวินาม ดังนั้น 92

เราต้องการทดสอบว่า จริงหรือไม่ วิธีที่ 1 93

วิธีที่ 2 94

แสดงว่า เป็นตัวประมาณค่าที่ไม่เอนเอียง ของพารามิเตอร์ p จะเห็นว่าทั้งสองวิธีได้ผลลัพธ์เหมือนกัน แสดงว่า เป็นตัวประมาณค่าที่ไม่เอนเอียง ของพารามิเตอร์ p 95

ข้อ 2. จากตัวอย่างเกรดเฉลี่ยที่เลือกมาแบบสุ่มของนิสิตปีสุดท้ายจำนวน 36 คน ได้ข้อมูลดังนี้

2.76 3.04 2.61 2.27 2.87 2.90 2.74 2.74 2.22 2.71 3.11 2.19 2.78 3.14 2.12 2.74 2.78 2.74 2.69 2.81 2.66 2.51 2.39 2.63 2.10 2.66 2.08 2.14 3.18 2.61 2.78 2.63 2.14 2.54 2.48 2.33

จากข้อมูล ค่าของเกรดเฉลี่ยเท่ากับ 2. 6 และส่วนเบี่ยงเบนมาตรฐานเป็น 0 จากข้อมูล ค่าของเกรดเฉลี่ยเท่ากับ 2.6 และส่วนเบี่ยงเบนมาตรฐานเป็น 0.3 จงหาช่วงความเชื่อมั่น 99% ของเกรดเฉลี่ยของนิสิตปีสุดท้ายทั้งหมด

ช่วงความเชื่อมั่น 99% ของ  คือ วิธีทำ พิจารณา 1. 2. 3. ช่วงความเชื่อมั่น 99% ของ  คือ 99

ข้อ 3. เพื่อที่จะหาค่าเฉลี่ยของ compressive strength ของแท่งคอน-กรีตที่ผลิตจากโรงงานแห่งหนึ่งวิศวกรโยธาได้เลือก ตัวอย่างเชิงสุ่มแท่งคอนกรีตมา 12 แท่ง แล้วทำการทดสอบหา compressive strength ได้ผลดังนี้

2216 2237 2249 2204 2225 2301 2281 2263 2318 2255 2275 2295 จงหาช่วงประมาณค่าเฉลี่ยของ compressive strength ที่ระดับความเชื่อมั่น 95% 102

วิธีทำ 103

เนื่องจาก n = 12 < 30 ช่วงความเชื่อมั่นของ  คือ

105

นั่นคือค่าเฉลี่ยของ compressive strength อยู่ในช่วง 2237. 31 - 2282

ข้อ 4. ภาชนะที่ใช้บรรจุกรดกำมะถันมีน้ำหนัก(หน่วยออนซ์) ดังนี้ ข้อ 4. ภาชนะที่ใช้บรรจุกรดกำมะถันมีน้ำหนัก(หน่วยออนซ์) ดังนี้ 9.8 10.2 10.4 9.8 10.0 10.2 9.6 จงหาช่วงความเชื่อมั่น 95% สำหรับค่า เฉลี่ยของน้ำหนักภาชนะสำหรับบรรจุกรดกำมะถันซึ่งสมมติว่ามีการแจกแจงแบบปกติ 107

วิธีทำ 108

เนื่องจาก n = 7 < 30 ช่วงความเชื่อมั่นของ  คือ 109

ข้อ 5. สมมติว่า การไฟฟ้าฝ่ายผลิตแห่งประเทศไทยต้องการสำรวจความคิดเห็นเกี่ยวกับให้เงินกู้ยืมกับผู้ที่ต้องการเปลี่ยนตู้เย็นไปเป็นรุ่นใหม่ที่ประหยัดพลังงานไฟฟ้า จึงได้ทำการสุ่มตัวอย่างขนาด n = 100 แล้วสอบถามพบว่ามีผู้เห็นด้วย 110

กับโครงการนี้เท่ากับ x = 36 คน จงหาว่าช่วงแห่งความเชื่อมั่นสำหรับสัดส่วนประชากรที่เห็นด้วยกับโครงการดังกล่าวที่ระดับความเชื่อมั่น 95%

จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น วิธีทำ จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น 112

ช่วงของการประมาณค่าที่ระดับความเชื่อมั่น 95% คือ แทนค่า 113

นั่นคือสัดส่วนประชากรที่เห็นด้วยกับโครงการนี้จะอยู่ในช่วง 26 นั่นคือสัดส่วนประชากรที่เห็นด้วยกับโครงการนี้จะอยู่ในช่วง 26.59% ถึง 45.08% ที่ระดับความเชื่อมั่น 95%

ข้อ 6. จากตัวอย่างสุ่มของครอบครัวในเมืองหลวงแห่งหนึ่งมีขนาด n = 500 มีโทรทัศน์ไว้ในครอบครอง 160 ครอบ ครัว จงหาช่วงความเชื่อมั่น 90% สำหรับสัดส่วนที่แท้จริงของ ครอบครัวในเมืองหลวงที่มีโทรทัศน์ไว้ในครอบครอง 115

จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น วิธีทำ จัดว่าตัวอย่างมีขนาดใหญ่ ดังนั้น 116

ช่วงของการประมาณค่าที่ระดับความเชื่อ มั่น 90% คือ แทนค่า 117

ข้อ 7. สมมติว่าน้ำหนักของแผ่น CD ที่ผลิตจากโรงงานแห่งหนึ่ง มีการแจกแจงแบบปกติ เพื่อที่จะประมาณค่าความแปรปรวน จึงได้สุ่มตัวอย่างแผ่น CD จากโรงงาน 25 แผ่น แล้วตรวจชั่งน้ำหนักคำนวณค่า sample mean 118

mm. และ sample standard derivation 0. 8 mm

THE END 120