ประชากรและการสุ่มตัวอย่าง การบรรยายครั้งที่ 8 ประชากรและการสุ่มตัวอย่าง พุทธิวัฒน์ ไวยวุฒิธนาภูมิ มหาวิทยาลัยราชภัฎสวนสุนันทา
ประชากร กลุ่มเป้าหมายทั้งหมดที่อยู่ในขอบข่ายที่ต้องการศึกษาวิจัย ซึ่งเป็นได้ทั้งสิ่งมีชีวิตและสิ่งไม่มีชีวิต ตัวอย่างเช่น กลุ่มคน, สถานพยาบาล, ครัวเรือน เป็นต้น ชนิดของประชากรในการวิจัย ประชากรที่ทราบจำนวนแน่นอน (Finite Population) เราสามารถทราบจำนวนแน่นอน โดยการนับเป็นจำนวนได้ เช่น จำนวนเด็กแรก เกิดในจังหวัดพิษณุโลก 2. ประชากรที่ไม่ทราบจำนวนแน่นอน (Infinite Population) เราไม่สามารถทราบจำนวนที่แน่นอนจากการนับได้ หรือ ถ้านับได้ก็ต้องใช้เวลามาก เช่น จำนวนผู้บริโภคอาหารเสริม จำนวนผู้ติดยาเสพติด
ตัวอย่าง (Sample) ส่วนหนึ่งของประชากรที่ถูกเลือกขึ้นมา หรือถูกกำหนดให้เป็นตัวแทนของประชากรที่ต้องการศึกษา เช่น นักศึกษาสาธารณสุขศาสตร์ มหาวิทยาลัยนเรศวร เป็นส่วนหนึ่งของนักศึกษาสาธารณสุขศาสตร์ ทั้งประเทศ พารามิเตอร์ (Parameter) คือ ค่าตัวเลขที่แสดงลักษณะของประชากร สถิติ (Statistics) คือค่าตัวเลขที่แสดงลักษณะของประชากร
กระบวนการสุ่มตัวอย่าง กำหนดประชากรที่จะศึกษาหรือประชากรเป้าหมาย หน่วยของข้อมูล บุคคลหรือสิ่งที่ผู้วิจัยจะต้องไปสอบถาม สังเกต หรือรวบรวมข้อมูลข่าวสาร หน่วยข้อมูลที่แพร่หลายที่สุด คือ บุคคลแต่ละคน บางกรณีหน่วยข้อมูลอาจเป็น องค์กร ครอบครัว หน่วยตัวอย่าง หน่วยที่กำหนดขึ้นเพื่อใช้ในการสุ่มตัวอย่าง ซึ่งอาจเป็นหน่วยบุคคล หรือหน่วยของสถานที่ หน่วยข้อมูลและหน่วยการสุ่มอาจเป็นอันเดียวกัน หรือ แตกต่างกัน เช่นสุ่มตัวอย่างผู้ป่วยโรคเบาหวานที่มารักษาตัวในโรงพยาบาล จังหวัดพิษณุโลก
กระบวนการสุ่มตัวอย่าง หน่วยข้อมูล : สตรี ช่วงอายุ 20 – 60 ปี หน่วยตัวอย่าง : โรงพยาบาล ขอบเขต : พิษณุโลก ช่วงเวลา : ต.ค. – ธ.ค. 2554
กระบวนการสุ่มตัวอย่าง 2. กำหนดกรอบตัวอย่าง (Sampling frame) หน่วยตัวอย่างทั้งหมดในขอบเขตที่ศึกษา ซึ่งใช้สำหรับสุ่มตัวอย่าง กรอบบัญชีรายชื่อ (List frame) เช่น รายชื่อผู้สูงอายุที่มารับบริการ กรอบพื้นที่ (Area frame) เช่น กรอบแผนที่ กำหนดขนาดตัวอย่าง การเลือกตัวอย่าง
การเลือกตัวอย่าง การเลือกตัวอย่าง หมายถึง วิธีการคัดเลือกตัวอย่างที่เป็นส่วนหนึ่งของประชากร ซึ่งเป็นตัวแทนของประชากรทั้งหมด เพื่อนำมาศึกษาคุณลักษณะเรื่องใดเรื่องหนึ่งที่สนใจเกี่ยวกับประชากร การสุ่มตัวอย่างโดยไม่ใช้หลักความน่าจะเป็น (Non –Probability Sampling) การเลือกตัวอย่างโดยไม่คำนึงถึงโอกาสที่จะถูกเลือก (Law of Chance) ของประชากรแต่ละหน่วย จึงไม่สามารถคำนวณได้ว่าแต่ละหน่วยของประชากรจะมีโอกาสถูกเลือกเป็นเท่าใด ทั้งนี้มักจะคำนึงถึงความสะดวกและประหยัดเวลาในการเก็บรวบรวมข้อมูล ดังนั้น การเลือกตัวอย่างแบบนี้จึงไม่นิยมใช้ แต่ในบางกรณีการเลือกตัวอย่างแบบนี้อาจได้ผลดีในกรณีที่ไม่สามารถกำหนดกรอบตัวอย่างได้ เช่น กลุ่มผู้ติดเชื้อ HIV
1.1 การสุ่มตัวอย่างแบบบังเอิญ (Accidental Sampling) คือ การเก็บรวบรวมข้อมูลจากประชากรเท่าที่จะหาได้จนครบตามจำนวนตัวอย่างที่ผู้วิจัยต้องการ โดยไม่มีกฏเกณฑ์แน่นอน เช่นสัมภาษณ์ผู้ที่ใช้บริการรถไฟฟ้าในสถานีรถไฟฟ้า 1.2 การเลือกตัวอย่างแบบเจาะจง ( Purposive Sampling ) คือ การสุ่มตัวอย่างโดยผู้วิจัยกำหนดคุณสมบัติของกลุ่มตัวอย่าง หรือ กำหนดเกณฑ์ในการเลือกตัวอย่างไว้ล่วงหน้าเพื่อให้เหมาะสมกับชนิดของการวิจัย 1.3 การสุ่มตัวอย่างแบบกำหนดโควต้า (Quota Sampling) การสุ่มตัวอย่างโดยผู้วิจัยกำหนดโควต้าของสัดส่วนขนาดตัวอย่างในกลุ่มย่อย (Subgroup) ก่อน การสุ่มตัวอย่างชนิดนี้ เหมาะสมกับการวิจัยที่ต้องการศึกษากลุ่มประชากรที่มีลักษณะต่างกัน
2. การสุ่มตัวอย่างโดยใช้หลักความน่าจะเป็น (Probability Sampling) คือการสุ่มตัวอย่าง โดยคำนึงถึงโอกาสที่ทุกหน่วยของข้อมูลจะถูกเลือกและสามารถประมาณค่าความน่าจะเป็นได้ 2.1 การสุ่มตัวอย่างแบบง่าย (Simple Random Sampling) เป็นการสุ่มตัวอย่างที่ใช้กับประชากรมีลักษณะคล้ายคลึงกัน (Homogeneous) โดยทุกหน่วยข้อมูลในประชากรมีโอกาสถูกเลือกเป็นตัวอย่างได้เท่า ๆ กัน มักจะใช้ในกรณีที่ทราบขนาดของประชากรที่แน่ชัด และประชากรมีจำนวนไม่มากนัก จับฉลาก - ตารางเลขสุ่ม
หลักแถว 1-4 5-8 9-12 13-16 17-20 21-24 25-28 29-32 33-36 37-40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 64 75 58 38 85 84 12 22 59 20 17 69 61 56 55 95 04 59 59 47 10 30 25 22 89 77 43 63 44 30 38 11 24 90 67 07 34 82 33 28 71 01 79 84 95 51 30 85 03 74 66 59 10 28 87 53 76 56 91 49 60 01 25 56 05 88 41 03 48 79 79 65 59 01 69 78 80 00 36 66 37 33 09 46 56 49 16 14 28 02 48 27 45 47 55 44 55 36 50 90 47 86 96 70 01 31 59 11 22 73 60 62 61 28 22 34 69 16 12 12 39 04 04 27 37 64 16 78 95 78 39 32 34 93 24 88 43 43 87 06 73 50 83 09 08 83 05 48 00 78 36 66 93 02 95 56 46 04 53 36 32 65 34 64 74 84 06 10 43 24 20 62 83 73 19 32 35 64 39 69 97 59 19 95 49 36 63 03 51 06 62 06 99 29 75 95 32 05 77 34 74 01 23 19 55 59 79 09 69 82 66 22 42 40 15 96 74 90 75 89 56 75 42 64 57 13 35 10 50 14 90 96 63 36 74 69 09 63 34 88 49 80 04 99 08 54 83 12 19 98 08 52 82 63 72 92 92 36 50 26 43 58 48 96 47 24 87 85 66 70 00 22 15 01 93 99 59 16 23 77 16 65 37 96 64 60 32 57 13 01 35 74 28 36 36 73 05 88 72 29
2.2 การสุ่มตัวอย่างแบบมีระบบ (Systematic Random Sampling) เป็นการสุ่มตัวอย่างที่คล้ายคลึงกับการสุ่มตัวอย่างแบบง่าย เหมาะกับประชากรที่มีลักษณะคล้ายคลึงกัน (Homogeneous) จะใช้ในกรณีที่ประชากรมีขนาดใหญ่ โดยยึดช่วงห่างของลำดับที่ของประชากรที่เท่ากันเป็นเกณฑ์ในการเลือกตัวอย่าง การสุ่มโดยวิธีนี้ใช้ได้เฉพาะกรณี ที่มีกรอบตัวอย่างของประชากรที่ศึกษามีการเรียงลำดับที่ชัดเจนอยู่แล้ว เช่น ต้องการตัวอย่างพยาบาล 100 คน ในบัญชีรายชื่อทำเนียบพยาบาล 10,000 คน เราก็เลือกพยาบาล 1 คน ในทุกๆ เลขทะเบียนรายชื่อ 100 คน เป็นตัวแทน
วิธีการสุ่มตัวอย่าง: คำนวณหาช่วงของการสุ่ม เมื่อ I = ช่วงของการสุ่ม N = จำนวนประชากรทั้งหมด n = ขนาดของตัวอย่างที่ต้องการ I = N/n สุ่มหาเลขเริ่มต้น ระหว่างเลขที่ 1 ถึง I โดยวิธีการจับฉลากหรือ ใช้ ตารางเลขสุ่ม สมมติได้ = R ดังนั้นตัวอย่างที่จะถูกเลือกจะเป็นลำดับที่ R, R+I, R+2I…, R+(n-1)I ตัวอย่าง ต้องการขนาดตัวอย่าง 100 หน่วยจากประชากร 2000 หน่วย 5, 25, 45, 65, … , 1985
2.3 การสุ่มตัวอย่างแบ่งชั้นภูมิ (Stratified Sampling) คือ การสุ่มตัวอย่างโดย แบ่งประชากรออกเป็นกลุ่มย่อย ๆ (Stratum หรือ Strata) ตามลักษณะที่คล้ายคลึงกัน จากประชากรที่มีหลาย ๆ ลักษณะรวมกันจากการแบ่งจะได้กลุ่มประชากรหลายกลุ่ม ประชากรที่อยู่ในกลุ่มเดียวกันมีความคล้ายคลึงกัน (Homogeneous) มากที่สุด และ ประชากรที่อยู่ต่างกลุ่ม มีความแตกต่างกัน (Heterogeneous) มากที่สุด การกำหนดตัวอย่างในแต่ละชั้นภูมิมีได้หลายแบบ กำหนดให้เท่ากันทุกชั้น (Equal Allocation) กำหนดให้แปรผันตามประชากร (Proportional Allocation ) กำหนดให้แปรผันตามประชากรและส่วนเบี่ยงเบนมาตรฐาน (Neyman’s Allocation ) กำหนดให้แปรผันตามประชากร ส่วนเบี่ยงเบนมาตรฐาน และแปรผกผันกับค่าใช้จ่าย (Optimum Allocation for Fixed Cost)
ความพึงพอใจของผู้ป่วยในการมารับบริการแผนกผู้ป่วยนอก @ = แผนกอายุรกรรม X = แผนกสูติกรรม O = แผนกเด็ก @ X O @ X @ O X @ O @ X O@@ X O @ O X @ O X @ O @ X XX@ แบ่งชั้นภูมิ OOOO @@@@@@ XXXXX สุ่มตัวอย่าง OO @@@@ XXX @@OX@ XO@X ตัวอย่าง
ประเภทของ Stratified Random Sampling (การสุ่มตัวอย่างแบบระดับชั้น) 1. การสุ่มตัวอย่างแบบระดับชั้นแบบไม่ตามสัดส่วน (Non-proportional Stratified Random Sampling) 2. การสุ่มตัวอย่างแบบระดับชั้นแบบตามสัดส่วน (Proportional Stratified Random Sampling)
1. การสุ่มตัวอย่างแบบระดับชั้นแบบไม่ตามสัดส่วน (Non-proportional Stratified Random Sampling) เป็นการสุ่มหน่วยตัวอย่างโดยที่ผู้วิจัยกำหนดจำนวนตัวอย่างในแต่ละระดับชั้น เอง ซึ่งจำนวนตัวอย่างที่กำหนดขึ้นมานั้นไม่เป็นไปตามสัดส่วนของจำนวน หน่วยทั้งหมด Ex จำนวนผู้สำเร็จการศึกษาทั้งหมดทั่วประเทศไทยมีจำนวนทั้งหมด 10,000 คน โดยสามารถแบ่งรายละเอียดได้ดังนี้ ประถมศึกษา 7,000 คน มัธยม 2,000 คน ปริญญาตรี 1,000 คน จำนวนกลุ่มตัวอย่างที่ต้องการ 1,500 คน
2.การสุ่มตัวอย่างแบบระดับชั้นแบบตามสัดส่วน (Proportional Stratified Random Sampling) เป็นการสุ่มหน่วยตัวอย่างโดยที่ผู้วิจัยกำหนดจำนวนตัวอย่างของแต่ละระดับชั้นตามสัดส่วนของจำนวนทั้งหมด จำนวนประชากรของกลุ่ม X จำนวนกลุ่มตัวอย่างที่ต้องการ ประชากรทั้งหมด ประถมศึกษา 7,000 X 1,500/ 10,000 = 1,050 คน มัธยมศึกษา 2,000 X 1,500/ 10,000 = 300 คน ปริญญาตรี 1,000 X 1,500/ 10,000 = 150 คน รวม 1,500 คน
2.4 การสุ่มตัวอย่างแบบแบ่งกลุ่ม ( Cluster Sampling ) เป็นวิธีการสุ่มตัวอย่างโดยทำการแบ่งประชากรออกเป็นกลุ่ม ๆ ตามพื้นที่ทางภูมิศาสตร์ ตามสถาบัน หน่วยงาน แล้วเลือกมาเพียงบางส่วน ด้วยวิธีการสุ่มแบบธรรมดาหรือแบบเป็นระบบก็ได้ โดยให้ประชากรในกลุ่มประกอบด้วยลักษณะที่แตกต่างกันมากที่สุด และ ให้ประชากรระหว่างกลุ่มมีลักษณะคล้ายคลึงกันมากที่สุด การสุ่มตัวอย่างจะสุ่มเลือกเพียงบางกลุ่มเท่านั้น วิธีการสุ่มตัวอย่างแบบแบ่งกลุ่ม จะประหยัดทั้งเงิน เวลา และ การเดินทางเข้าไปเก็บข้อมูล
ปัจจัยที่มีอิทธิพลต่อการสร้างเสริมสุขภาพของประชาชน ในเขตสาธร จังหวัดกรุงเทพมหานคร @ X O @ X @ O X @ O @X X O @ O X @ O X @ O @ X @O@XOO X O@O@OO@ ประชากร @X@O O@XO OX@O @@XO @X@@ OXOO XX@O O@@O OX@O O@X@ แบ่งกลุ่ม OX@O @@XO OX@O O@X@ เลือกตัวอย่าง X = บ้านจัดสรร @ = บ้านตึกแถว O = คอนโดมิเนียม @XXO@O O@XOX@ @@@ ตัวอย่าง
ปัจจัยที่มีอิทธิพลต่อการสร้างเสริมสุขภาพของประชาชน ในเขตสาธร จังหวัดกรุงเทพมหานคร OX@O @@XO @X@@ OXOO @X@O O@XO XX@O O@@O OX@O O@X@ X = บ้านจัดสรร @ = บ้านตึกแถว O = คอนโดมิเนียม @XXOO O@XOX@ @@@
2. 5 การสุ่มเลือกแบบหลายขั้นตอน (Multi-Stage Sampling) เป็นการสุ่มตัวอย่างที่ใช้วิธีหลายแบบผสมกัน มักใช้กับโครงการสำรวจขนาดใหญ่ ต้องใช้การสุ่มตัวอย่างจากประชากรจำนวนมาก เช่น ประชากรทั้งประเทศ โดยมากมักจะเริ่มด้วยการสุ่มแบบกลุ่มหรือแบบแบ่งชั้นก่อน โดยแบ่งประชากรออกเป็นกลุ่มใหญ่ ๆ แล้วแบ่งเป็นกลุ่มย่อย ๆ ต่อไปเรื่อยๆ ต่อจากนั้นก็ทำการสุ่มเป็นกลุ่มจากกลุ่มใหญ่ไปหากลุ่มย่อยตามลำดับ แล้วสุ่มตัวอย่าง จากกลุ่มย่อยที่ได้
การศึกษาพฤติกรรมการบริโภคยาในประเทศไทย ขั้นที่ 1 แบ่งประเทศไทย ออกเป็น 4 ภาค ขั้นที่ 2 เลือกภาคมา 2 ภาค โดยวิธีสุ่ม ขั้นที่ 3 แต่ละภาคจากขั้นที่ 2 เลือกจังหวัดมา 2 จังหวัด โดยวิธีสุ่ม ขั้นที่ 4 แต่ละจังหวัดตัวอย่าง เลือกอำเภอมา 2 อำเภอ โดยวิธีสุ่ม ขั้นที่ 5 ในแต่ละอำเภอตัวอย่าง เลือกตำบลมา 2 ตำบล โดยวิธีสุ่ม ขั้นที่ 6 แต่ละตำบลตัวอย่างเลือกหมู่บ้านมา 2 หมู่บ้าน โดยวิธีสุ่ม ขั้นที่ 7 ในแต่ละหมู่บ้านเลือกเก็บข้อมูลจากครัวเรือน โดยวิธีสุ่ม
การกำหนดขนาดตัวอย่าง ขนาดตัวอย่างเท่าใดจึงเพียงพอที่จะทำให้งานวิจัยน่าเชื่อถือ? ข้อพิจารณาสำหรับการกำหนดขนาดตัวอย่าง วัตถุประสงค์และหรือสมมติฐานของการวิจัย ลักษณะของข้อมูลที่ใช้วัดในการตอบวัตถุประสงค์และหรือสมมติฐาน รูปแบบการวิจัย ความถูกต้องของผลที่ได้ ความแม่นยำในทางสถิติซึ่งวัดด้วยระดับความเชื่อมั่นและอำนาจการทดสอบ กรณีวัตถุประสงค์/สมมติฐานมีหลายข้อ คำนวณขนาดตัวอย่างโดยยึดเกณฑ์ - วัตถุประสงค์/สมมติฐาน ข้อที่สำคัญที่สุด - วัตถุประสงค์/สมมติฐานมีความสำคัญเท่ากัน ใช้ขนาดตัวอย่างที่มากที่สุด