ประชากร การคำนวณขนาดตัวอย่าง และวิธีการสุ่มตัวอย่าง รศ.ดร.โยธิน แสวงดี สถาบันวิจัยประชากรและสังคม มหาวิทยาลัยมหิดล
ประชากรในความหมายของการวิจัยในเชิงปริมาณ ต้องพิจารณาถึงพรมแดนที่เป็นหน่วยในเชิงพื้นที่ซึ่งหมายถึงกรอบของประชากรที่จะใช้เป็นฐานคิดเพื่อการคำนวณขนาดตัวอย่างและกรอบในการสุ่มตัวอย่าง (Sampling Frame) ก่อน ต้องมีอ้างอิงเสมอว่าข้อมูลได้มาจากแหล่งใด ข้อมูลของประชากรจะมีสองลักษณะ คือ (1) ประชากรที่นับจำนวนได้แน่นอน เช่น จำนวนทหาร จำนวนนักเรียน จำนวนร้านค้า ฯลฯ (2) ประชากรที่ไม่สามารถนับได้ หรือ ไม่ทราบจำนวนที่แน่นอน เช่น หญิงบริการทางเพศ ผู้ป่วยที่มีเชื้อเอดส์ ผู้ป่วยด้วยโรคทางจิต ฯลฯ
สูตรในการคำนวนขนาดตัวอย่าง ด้วยการที่มีลักษณะของการทราบจำนวนประชากรที่แน่นอน และการไม่ทราบขนาดประชากรที่แน่นอน จึงต้องมีวิธีการคำนวนขนาดตัวอย่างด้วยสูตรที่ต่างกัน สูตรที่นิยมใช้ในการคำนวนขนาดตัวอย่างเมื่อทราบจำนวนประชากรที่แน่นอนคือ สูตรของ Taro Yamane (1973) เหตุผลเพราะเป็นสูตรที่ง่าย ไม่ซับซ้อน ที่สำคัญคือ บอกถึงจำนวนตัวอย่างขั้นต่ำที่ต้องเก็บมาเพื่อการวิเคราะห์
ประชากรกับขนาดตัวอย่างที่คำนวนได้ ที่สำคัญคือการเป็นตัวแทนที่ดีที่สุด ความแม่นตรง ที่ครอบคลุม 240 5000 100,000
N n = 1+Ne2 สูตรในการคำนวนขนาดของตัวอย่างในการวิจัยเชิงปริมาณ เพื่อนำไปสูการเป็นตัวแทนของประชากรที่ไกล้เคียงที่สุด ทุกสูตรให้จำนวนขั้นต่ำ สูตรในการคำนวณขนาดตัวอย่างที่นิยมใช้เมื่อทราบประชากรที่แน่นอน คือ สูตรของ Yamanae (1973) n = N 1+Ne2 n = ขนาดของกลุ่มตัวอย่าง N = จำนวนประชากร e = ค่าความคาดเคลื่อน (นิยมใช้ 0.05) Yamanae, Taro(1973), Statistics: An Introductory Analysis. London: John Weather Hill, Inc.
เมื่อไม่ทราบจำนวนประชากรที่แน่นอน สูตรที่อาศัยฐานคิดจากข้อมูลเดิมที่บอกว่าน่าจะมีเหตุการเกิดขึ้นประมาณร้อยละเท่าใด สูตรในการคำนวนขนาดของตัวอย่างคือ n = Z2P(1-P)/D2 เมื่อ D = ค่าความคลาดเคลื่อน (0.05) P = ร้อยละของเหตุการณ์ที่จะเกิดขึ้น Z = 1.960
เมื่อไม่ทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล เมื่อไม่ทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล สูตรที่ใช้คือ n = Z2σ2 E2 โดย n = ขนาดตัวอย่าง Z= 1.960 E = 0.05 σ2 = ค่าความแปรปรวนของประชากรโดยทั่วไปจะได้จากการสำรวจครั้งที่ ผ่านมา
เมื่อทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล แต่ไม่เลือกซ้ำ (with no replacement) สูตรในการคำนวนคือ n = NZ2σ2 NE2 + Z2σ2 โดย n = ขนาดตัวอย่าง Z= 1.960 E = 0.05 σ2 = ค่าความแปรปรวนของประชากรโดยทั่วไปจะได้จากการสำรวจครั้งที่ ผ่านมา
วิธีการสุ่มตัวอย่างในการวิจัยเชิงปริมาณ หัวใจของการวิจัยในเชิงปริมาณคือ การเป็นตัวแทนที่ถูกต้องที่สุด (Representativeness) วิธีการสุ่มตัวอย่างแบบ Probability Random Sampling และ Non -Probability Random Sampling วิธีการหยิบตัวอย่าง ด้วยวิธีการหยิบแบบจับฉลาก (Simple Random Sampling) วิธีการสุ่มต้องสอดคล้องกับหัวข้อวิจัยและคำถามของการวิจัย วิธีการสุ่มตัวอย่างกับสถิติที่ใช้ในการวิเคราะห์ข้อมูลต้องเกี่ยวข้อง กับโอกาสของความน่าจะเป็น จึงจะนำไปสู่การพิสูจน์ถึง Determinants หรือ ปัจจัยได้
วิธีการสุ่มตัวอย่างในการวิจัยเชิงปริมาณ วิธีการสุ่มตัวอย่างที่กำลังเป็นที่นิยม 1. การจับฉลาก (Simple Random Sampling) ใช้ในการเลือก หรือ หยิบขึ้นมา แต่ต้องมีกรอบการสุ่มที่แน่นอน 2. การสุ่มแบบบังเอิญ (Accidental Sampling) พบที่ไหน ถามใครก็ได้ที่ร่วมมือ 3. การสุ่มตัวอย่างแบบชั้นภูมิ (Multistage Sampling) แบ่งตามชั้นภูมิของที่มาของหน่วยในการสุ่มตัวอย่าง คล้ายกับผังองค์กร หรือ ผังการบริหาร วิธีการคือ แบ่งออกเป็นชั้นๆ 4. การสุ่มตัวอย่างแบบหลายขั้นตอน (Stratified Sampling) แบ่งตามชั้นของที่มาของหน่วยในการสุ่มตัวอย่างแต่แยกตามเขตที่อยู่อาศัย เช่น เขตเมือง และเขตชนบท ตัวอย่างเช่น จากภาค มาจังหวัด มาอำเภอ มาตำบล มาเขตเมืองและเขตชนบท มาหมู่บ้าน 5. การสุ่มตัวอย่างแบบกลุ่มที่เกาะกัน (Cluster Sampling) แบ่งตาม Cluster แล้วหยิบขึ้นมา ต้องเป็น Cluster ตามธุรกิจ
เชียงใหม่ 35,000 คน นครราชสีมา 40,000 คน นครศรีธรรมราช 29,000 คน การคำนวณตามสัดส่วนประชากร การคำนวณตามสัดส่วนประชากร (Probability Proportional to Size : PPS) เชียงใหม่ 35,000 คน นครราชสีมา 40,000 คน นครศรีธรรมราช 29,000 คน ราชบุรี 28,000 คน
ตัวอย่าง เรื่อง: การางแผนครอบครัว กลุ่มตัวอย่าง: ผู้หญิงวัยเจริญพันธุ์ ที่แต่งงานแล้ว อายุ 15-49 ปี จังหวัดตัวอย่าง ประชากร จำนวนตัวอย่าง เชียงใหม่ 35,000 คน 1,114 นครราชสีมา 40,000 คน 1,273 ราชบุรี 28,000 คน 891 นครศรีธรรมราช 29,000 คน 923 รวม 132,000 คน 4,200
วิธีการคำนวณ จังหวัดตัวอย่าง ประชากร จำนวนตัวอย่าง เชียงใหม่ 35,000 คน 1,114 จำนวนตัวอย่างจังหวัดเชียงใหม่ = 35,000 X 4,200 = 1,114 132,000 โดยที่ 4,200/132,000 = 0.00318 เป็นค่าสัดส่วนของจำนวนตัวอย่างต่อจำนวนประชากรจริง