ประชากร การคำนวณขนาดตัวอย่าง และการเลือกวิธีการสุ่มตัวอย่าง รศ.ดร.โยธิน แสวงดี สถาบันวิจัยประชากรและสังคม มหาวิทยาลัยมหิดล
ประชากรในความหมายของการวิจัยในเชิงปริมาณ ต้องพิจารณาถึงพรมแดนที่เป็นหน่วยในเชิงพื้นที่ซึ่งหมายถึงกรอบของประชากรที่จะใช้เป็นฐานคิดเพื่อการคำนวณขนาดตัวอย่างและกรอบในการสุ่มตัวอย่าง (Sampling Frame) ก่อน ต้องมีอ้างอิงเสมอว่าข้อมูลได้มาจากแหล่งใด ข้อมูลของประชากรจะมีสองลักษณะ คือ (1) ประชากรที่นับจำนวนได้แน่นอน เช่น จำนวนทหาร จำนวนนักเรียน จำนวนร้านค้า ฯลฯ (2) ประชากรที่ไม่สามารถนับได้ หรือ ไม่ทราบจำนวนที่แน่นอน เช่น หญิงบริการทางเพศ ผู้ป่วยที่มีเชื้อเอดส์ ผู้ป่วยด้วยโรคทางจิต ฯลฯ
สูตรในการคำนวนขนาดตัวอย่าง ด้วยการที่มีลักษณะของการทราบจำนวนประชากรที่แน่นอน และการไม่ทราบขนาดประชากรที่แน่นอน จึงต้องมีวิธีการคำนวนขนาดตัวอย่างด้วยสูตรที่ต่างกัน สูตรที่นิยมใช้ในการคำนวนขนาดตัวอย่างเมื่อทราบจำนวนประชากรที่แน่นอนคือ สูตรของ Taro Yamane (1973) เหตุผลเพราะเป็นสูตรที่ง่าย ไม่ซับซ้อน ที่สำคัญคือ บอกถึงจำนวนตัวอย่างขั้นต่ำที่ต้องเก็บมาเพื่อการวิเคราะห์
ประชากรกับขนาดตัวอย่างที่คำนวนได้ ที่สำคัญคือการเป็นตัวแทนที่ดีที่สุด ความแม่นตรง ที่ครอบคลุม 240 5000 100,000
N n = 1+Ne2 สูตรในการคำนวนขนาดของตัวอย่างในการวิจัยเชิงปริมาณ เพื่อนำไปสูการเป็นตัวแทนของประชากรที่ไกล้เคียงที่สุด ทุกสูตรให้จำนวนขั้นต่ำ สูตรในการคำนวณขนาดตัวอย่างที่นิยมใช้เมื่อทราบประชากรที่แน่นอน คือ สูตรของ Yamanae (1973) n = N 1+Ne2 n = ขนาดของกลุ่มตัวอย่าง N = จำนวนประชากร e = ค่าความคาดเคลื่อน (นิยมใช้ 0.05) Yamanae, Taro(1973), Statistics: An Introductory Analysis. London: John Weather Hill, Inc.
เมื่อไม่ทราบจำนวนประชากรที่แน่นอน สูตรที่อาศัยฐานคิดจากข้อมูลเดิมที่บอกว่าน่าจะมีเหตุการเกิดขึ้นประมาณร้อยละเท่าใด สูตรในการคำนวนขนาดของตัวอย่างคือ n = Z2P(1-P)/D2 เมื่อ D = ค่าความคลาดเคลื่อน (0.05) P = ร้อยละของเหตุการณ์ที่จะเกิดขึ้น Z = 1.960
เมื่อไม่ทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล เมื่อไม่ทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล สูตรที่ใช้คือ n = Z2σ2 E2 โดย n = ขนาดตัวอย่าง Z= 1.960 E = 0.05 σ2 = ค่าความแปรปรวนของประชากรโดยทั่วไปจะได้จากการสำรวจครั้งที่ ผ่านมา
เมื่อทราบขนาดประชากร และจำนวนประชากรมีจำนวนมากมหาศาล แต่ไม่เลือกซ้ำ (with no replacement) สูตรในการคำนวนคือ n = NZ2σ2 NE2 + Z2σ2 โดย n = ขนาดตัวอย่าง Z= 1.960 E = 0.05 σ2 = ค่าความแปรปรวนของประชากรโดยทั่วไปจะได้จากการสำรวจครั้งที่ ผ่านมา
การเลือกวิธีการสุ่มตัวอย่างในการวิจัยเชิงปริมาณ หัวใจของการวิจัยในเชิงปริมาณคือ การเป็นตัวแทนที่ถูกต้องที่สุด (Representativeness) เพื่อการอนุมาน ชี้กลับไปได้ว่าประชากรเป็นแบบใด การเลือกวิธีการสุ่มตัวอย่าง จะขึ้นอยู่กับหน่วยในการสังเกต (Unit of Observation) หน่วยในการวิเคราะห์ (Unit of Analysis) และจำนวนของประชากรกับขนาดตัวอย่าง เช่น หากประชากรมีจำนวนไม่มาก และ ขนาดตัวอย่างมีจำนวนน้อย จะใช้วิธีการสุ่มตัวอย่างแบบ simple random sampling ก็ได้ หรือ systematic random sampling ก็ได้
แต่ละวิธีการเลือกการสุ่มตัวอย่างจะมีข้อดีและไม่ดีแตกต่างกัน หลักการในการเลือกวิธีการสุ่มตัวอย่าง วิธีการสุ่มตัวอย่างต้องสอดคล้องกับหัวข้อวิจัยและคำถามของการวิจัย วิธีการสุ่มตัวอย่างต้องสอดคล้องกับสถิติที่จะใช้ในการวิเคราะห์ข้อมูล วิธีการสุ่มตัวอย่างต้องขึ้นอยู่กับการออกแบบการวิจัย เช่น การวิจัยเชิงทดลอง (Experimental research design: Randomize control trial (RCT) การวิจัยแบบกึ่งทดลอง (Quasi-experimental research design) ถ้าเลือกได้ใช้วิธีการสุ่มตัวอย่างแบบที่เป็นไปตามโอกาสของความน่าจะเป็นจะดีที่สุด แต่ บางทีไม่สามารถทำได้เพราะขึ้นอยู่กับเป้าหมายของการวิจัย (การสำรวจ) ว่าต้องการทราบอะไร จากใคร ฯลฯ
ดังนั้น วิธีการเลือกการสุ่มตัวอย่าง จะต้องพิจารณาถึงขนาดของงานวิจัยก่อนว่า ต้องการให้ครอบคลุมแบบใด เช่น เป็นตัวแทนประเทศ เป็นตัวแทนภาค เป็นตัวแทนจังหวัด เป็นตัวแทนอำเภอ เป็นตัวแทนตำบล เป็นตัวแทนเขตเมือง เป็นตัวแทนเขตชนบทเป็นตัวแทนหมู่บ้าน ฯลฯ ต้องพิจารณาที่ปรากฏการณ์ลักษณะของหน่วยในการสังเกตก่อนว่ามีลักษณะเป็นอย่างไร เช่น ปรากฏอยู่ในลักษณะแบบเป็นหลายขั้นตอนอยู่หรือไม่ หรือว่ากระจุกตัวเป็นกลุ่มๆ หรือว่าเน้นที่หน่วยในการวิเคราะห์โดยตรงที่สามารถเลือกสุ่มได้เลย ขนาดของกลุ่มตัวอย่าง
วิธีการสุ่มตัวอย่างจะมี 2 แบบ วิธีการสุ่มตัวอย่างที่เป็นไปตามโอกาสของความน่าจะเป็น (Probability Random Sampling) 1.1 Simple random sampling วิธีการหยิบตัวอย่าง ด้วยวิธีการหยิบแบบจับฉลาก (Simple Random Sampling) เป็นวิธีที่เป็นไปตามโอกาสของความน่าจะเป็น ที่มักนิยมให้มีโอกาสของความน่าจะเป็นที่จะเกิดขึ้นเท่าเทียมกัน (with replacement) ประชากรจะขนาดเล็ก ไม่ใหญ่โต และ ขนาดตัวอย่างก็ไม่มาก สามารถหยิบแบบจับฉลากแบบง่ายได้ เช่น หยิบจากนักเรียนในห้องเรียน หยิบจากพนักงานประจำหน่วยในการผลิต ฯลฯ
1.2 การสุ่มตัวอย่างแบบชั้นภูมิ (Multistage Sampling) จะเลือกใช้วิธีการสุ่มตัวอย่างแบบนี้ก็ต่อเมื่อหน่วยในการวิเคราะห์ข้อมูล (Unit of Analysis) ปรากฏอยู่ในลักษณะของชั้นภูมิ เช่น ต้องสุ่มหน่วยตามชั้นภูมิก่อน เพราะองค์กร สังคมมีการแบ่งตามชั้นภูมิของที่มาของหน่วยในการสุ่มตัวอย่าง คล้ายกับผังองค์กร หรือ ผังการบริหาร วิธีการคือ แบ่งออกเป็นชั้นๆ คำว่า Multistage คือหลายชั้น เช่น ชั้นที่ 1 คือ ฝ่าย ชั้นที่ 2 คือ แผนก ชั้นที่ 3 คือ ที่จะเป็นหน่วยในการวิเคราะห์ ที่จะสุ่มตามขนาดตัวอย่างที่คำนวนตาม PPS
1.3 การสุ่มตัวอย่างแบบแบ่งชั้นหลายขั้นตอน (Multistage stratified random sampling) จะเลือกใช้วิธีการสุ่มตัวอย่างแบบนี้ก็ต่อเมื่อหน่วยในการวิเคราะห์ข้อมูล (Unit of Analysis) แบ่งตามชั้นของที่มาของหน่วยในการสุ่มตัวอย่าง แต่แยกตามเขตที่อยู่อาศัย เช่น เขตเมือง และเขตชนบท ตัวอย่างเช่น จากภาค มาจังหวัด มาอำเภอ มาตำบล มาเขตเมืองและเขตชนบท มาหมู่บ้าน กล่าวคือ ขั้นตอนที่ 1 จากภาค เอาทุกภาค ไม่ต้องสุ่ม ขั้นตอนที่ 2 เลือกจังหวัด ของแต่ละภาค ขั้นตอนที่ 3 เลือกอำเภอ จากแต่ละจังหวัด ขั้นตอนที่ 4 เลือกตำบล ที่ต้องแบ่งออกเป็น ตำบลในเมือง (เทศบาล) และตำบลในชนบท ขั้นตอนที่ 5 เลือกหมู่บ้านที่อยู่ในตำบลในเมือง และตำบลในชนบท ขั้นตอนที่ 6 เลือกหลังคาเรือนแบบ systematic random sampling ขั้นตอนที่ 7 เลือกผู้ตอบแบบสอบถาม (Respondent) ที่เป็นหน่วยในการวิเคราะห์
1.4. การสุ่มตัวอย่างแบบชั้นภูมิ (Stratified Random Sampling) เน้นที่การจัดกลุ่มประชากรที่แตกต่างกันออกตามคุณลักษณะ เป็น การจำแนกกลุ่มที่คล้ายกัน เหมือนกันอยู่ด้วยกัน เหมาะกับการวิเคราะห์เปรียบเทียบและหาความแตกต่างระหว่างกลุ่มเช่น จัดกลุ่มอาชีพเดียวกันให้อยู่ในกลุ่มเดียวกันแล้วทำการสุ่มตามจำนวนขนาดตัวอย่างที่ต้องการในแต่ละกลุ่มอาชีพ ตัวอย่างเช่น โครงการวิจัย การใช้อุปกรณ์และเทคโนโลยีทางการเกษตรกรรม อาชีพปลูกอ้อย จำนวน 10000 คน สุ่มมา 300 คน อาชีพปลูกข้าวโพด จำนวน 9000 คน สุ่มมา 300 คน อาชีพปลูกมันสำปะหลัง จำนวน 8700 คน สุ่มมา 300 คน อาชีพปลูกข้าว 12000 คน สุ่มมา 300 จำนวนกลุ่มตัวอย่าง 1200 คน ขนาดตัวอย่างอาจคำนวนตามสัดส่วนประชากรก็ได้ หรือ เก็บเท่ากันก็ได้ แล้วสุ่มด้วย simple random sampling หรือ systematic random sampling ก็ได้
1.5 วิธีการสุ่มตัวอย่างแบบมีระบบ (Systematic random sampling) มีหลายระบบ วิธีการเลือกใช้ขึ้นอยู่กับลักษณะประชากรและขนาดตัวอย่าง ส่วนมากจะเป็นประชากรที่นับได้ เช่น การเลือกนักเรียน ด้วยการกำหนดตามเลขที่ประจำตัว ที่ลงท้ายด้วยเลข 5 การเลือกนักเรียน ที่นับลงท้ายด้วย 7 การเลือกคูหาห้องพักเพื่อเข้าทำการสัมภาษณ์ ตามห้องที่ถูกนับลงเลข 10 เมื่อทำ Block หรือ ชุมรุมอาคาร การสุ่มบ้าน ตามแผนที่เดินดิน เลือกทุกๆหลังที่ 12 เป็นต้น
1.6. การสุ่มตัวอย่างแบบกลุ่มที่เกาะกัน (Cluster Sampling) แบ่งตาม Cluster แล้วหยิบ Cluster ขึ้นมา หน่วยในการสังเกตต้องเป็น Cluster พบมากในงานวิจัยด้านบริหารธุรกิจและการจัดการ การบริหารตามเขตพื้นที่การศึกษา เขตภาษีอากร นิคมอุตสาหกรรม ฯลฯ ตัวอย่าง เช่น Cluster ขายเสื้อผ้าสำเร็จรูป ที่มี 6 Cluster คือ 1) พาหุรัด 2) สำเพ็ง 3) ประตูน้ำ 4) บางลำพู 5) โบ๊เบ้ และ 7) จตุจักร รวมประชากรแล้วเท่าใด แล้วคำนวนขนาดตัวอย่าง วิธีการสุ่มคือ กำหนดว่าจะเอากี่ Cluster คำนวนขนาดตัวอย่างตามสัดส่วนประชากร (Probabilities Proportional to Size: PPS) สุ่มร้านใน cluster ตาม PPS ผู้ตอบแบบสอบถามคือหน่วยในการวิเคราะห์ ที่โดยทั่วไปคือเจ้าของร้าน
1.7. การสุ่มตัวอย่างแบบ Respondent driven sampling: RDS ใช้สำหรับค้นหาบุคคลที่เป็นผู้ตอบแบบสอบถามที่เน้นความลับ ไม่ต้องการเปิดเผยตัวตนต่อคนอื่นยกเว้นเพื่อนสนิทหรือคนรู้จัก คุ้นเคย ที่มีพฤติกรรมเช่นเดียวกัน เช่น งานวิจัยเรื่อง HIV/AIDS ยาเสพติด การเคยกระทำความผิด การเล่นกีฬาบางชนิด เช่น ฟุตบอลพนัน การเล่นพนันฟุตบอล การซื้อขายสินค้าแบบซื้อตรง ฯลฯ วิธีการคือ พบคนแรกก่อน แล้วให้คนนี้พานักสำรวจไปหาคนที่สองโดยเดินทางไปด้วยกันด้วยความมั่นใจว่าได้รับความร่วมมือให้ข้อมูลแน่นอน คนที่สองพานักสำรวจไปหาคนที่สาม ฯลฯโอกาสความน่าจะเป็นเกิดขึ้น 100 % ปัจจุบันกำลังเป็นที่นิยมใช้มาก
เชียงใหม่ 35,000 คน นครราชสีมา 40,000 คน นครศรีธรรมราช 29,000 คน การคำนวณตามสัดส่วนประชากร การคำนวณตามสัดส่วนประชากร (Probability Proportional to Size : PPS) เชียงใหม่ 35,000 คน นครราชสีมา 40,000 คน นครศรีธรรมราช 29,000 คน ราชบุรี 28,000 คน
ตัวอย่าง เรื่อง: การางแผนครอบครัว กลุ่มตัวอย่าง: ผู้หญิงวัยเจริญพันธุ์ ที่แต่งงานแล้ว อายุ 15-49 ปี จังหวัดตัวอย่าง ประชากร จำนวนตัวอย่าง เชียงใหม่ 35,000 คน 1,114 นครราชสีมา 40,000 คน 1,273 ราชบุรี 28,000 คน 891 นครศรีธรรมราช 29,000 คน 923 รวม 132,000 คน 4,200
วิธีการคำนวณ จังหวัดตัวอย่าง ประชากร จำนวนตัวอย่าง เชียงใหม่ 35,000 คน 1,114 จำนวนตัวอย่างจังหวัดเชียงใหม่ = 35,000 X 4,200 = 1,114 132,000 โดยที่ 4,200/132,000 = 0.00318 เป็นค่าสัดส่วนของจำนวนตัวอย่างต่อจำนวนประชากรจริง
2) วิธีการสุ่มตัวอย่างที่ไม่เป็นไปตามโอกาสของความน่าจะเป็น (Non -Probability Random Sampling) 2.1การสุ่มแบบบังเอิญ (Accidental Sampling/Convenient Sampling) พบที่ไหน ถามใครก็ได้ที่ร่วมมือ เหมาะสำหรับการสำรวจทัศนคติ ค่านิยม การใช้บริการภาครัฐที่ทุกคนเป็นผู้มีส่วนได้ส่วนเสีย ต้องการความร่วมมือในการตอบคำถามแบบจิตอาสา พิจารณาแบบแผนทั่วๆไป ยังไม่เน้นการเป็นตัวแทนตามโอกาสของความน่าจะเป็น เช่น การประเมินการใช้สินค้า การพิจารณาการรับรู้ข้อมูลข่าวสารทั่วไป การวัดการยอมรับในกิจกรรมบางอย่าง POLL 2.2 การสุ่มตัวอย่างแบบเจาะจง ( Purposive Sampling) เน้นเจาะจงศึกษาและวิเคราะห์กลุ่มเป้าหมายใดเป้าหมายหนึ่งโดยเฉพาะเจาะจง มีการกำหนดเกณฑ์ใว้ในการเลือกตัวอย่างอย่างน้อย 3 เกณฑ์ เช่น ระบุอายุ เพศ เขตที่อยู่อาศัย กลุ่มอาชีพ เป็นต้น การวิจัยเพื่อการติดตาม การวัดและการประเมินผล ฯลฯ
2.3. การสุ่มตัวอย่างแบบ Quota Sampling มีการกำหนดโควต้าใว้ตามที่ต้องการหลังจากที่มีการกำหนดขนาดกลุ่มตัวอย่างใว้แล้ว เช่น ต้องการศึกษาเรื่อง เกษตรผู้ปลูกพืชเชิงเดี่ยวกับการเป็นหนี้นอกระบบ ขนาดตัวอย่างคือ 2000 คน แบ่ง Quota ในการรวบรวมข้อมูล ออกเป็น ผู้ปลูกข้าว 40 % = 800 คน ผู้ปลูกมันสำปะหลัง 20 % = 400 คน ผู้ปลูกอ้อย 15 % = 300 คน ผู้ปลูกข้าวโพด 10 %= 200 คน ผู้ปลูกปอแก้ว 8% = 160 คน ผู้ปลูกคราม 7 % = 140 คน รวม 100 % = 2000 คน หลังจากนั้น ทำการสุ่มตัวอย่างแบบ systematic random sampling หรือ simple random sampling ก็ได้ ขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง