Chapter 1: Introduction to Statistics ความรู้เบื้องต้นเกี่ยวกับ สถิติ
เนื้อหา: ความหมายของสถิติ ลักษณะของสถิติ นิยามศัพท์ที่สำคัญ การเก็บรวบรวมข้อมูล
“สถิติ” ตรงกับคำในภาษาอังกฤษว่า “Statistics” ในความรู้สึกของคน ทั่ว ๆ ไป เมื่อพูดถึงสถิติมักจะนึกถึงตัวเลขที่ได้ จากการเก็บรวบรวมข้อมูล แต่ในข้อเท็จจริงแล้ว สถิติมีความหมายที่ กว้างขวางและเกี่ยวข้องกับ ชีวิตประจำวันของคนเราอย่างหลีกเลี่ยงไม่ได้
ความหมายของ “สถิติ” 1. หมายถึง ตัวเลข หรือ กลุ่มของตัวเลขที่ รวบรวมขึ้นเพื่อแสดงถึงข้อเท็จจริง เกี่ยวกับเรื่องต่าง ๆ เช่น ตัวเลขแสดงสถิติปริมาณน้ำฝน ปี พ.ศ.2561 สถิติจำนวนนิสิตคณะบัญชีและการจัดการ มหาวิทยาลัยมหาสารคาม ปีการศึกษา 2558-2561 เป็นต้น 2. หมายถึง ศาสตร์ที่เป็นแขนงหนึ่งของวิธีการทาง วิทยาศาสตร์หรือเป็นศาสตร์ที่ เกี่ยวข้องกับการวางแผน เพื่อให้ได้มาซึ่งข้อมูลทางสถิติ ซึ่งประกอบด้วย - การเก็บรวบรวมข้อมูล (Collection of Data) - การจัดการและนำเสนอข้อมูล (Organization and Presentation of Data) - การวิเคราะห์ข้อมูล (Analysis of Data) - การแปลความหมายและสรุปผลข้อมูล (Interpretation and Conclusion of Data)
การดำเนินการทางสถิติ ซึ่งประกอบด้วย - การเก็บรวบรวมข้อมูล (Collection of Data) - การจัดการและนำเสนอข้อมูล (Organization and Presentation of Data) - การวิเคราะห์ข้อมูล (Analysis of Data) - การแปลความหมายและสรุปผลข้อมูล (Interpretation and Conclusion of Data) วิธีการต่าง ๆ ที่กล่าวถึงข้างต้น นี้เรียกว่า ระเบียบ วิธีการทางสถิติ
-การเก็บรวบรวมข้อมูล (Collection of Data) เป็นขบวนการที่ให้ได้มาซึ่งข้อมูล อาจมาจากการวัดหรือ นับ โดยอาจเก็บรวบรวมจากแหล่งที่มีผู้เก็บรวบรวมไว้แล้ว หรือ บางครั้งอาจต้องรวบรวมขึ้นเองตั้งแต่ต้น -การจัดการและนำเสนอข้อมูล (Organization and Presentation of Data) เป็นการนำเอาข้อมูลที่รวบรวมได้นั้นมาจัดให้เป็นระเบียบ เป็นหมวดหมู่ เพื่อสะดวกในการวิเคราะห์ซึ่งอาจ นำเสนอในรูปกราฟ ตาราง หรือ บทความ
-การวิเคราะห์ข้อมูล (Analysis of Data) เป็นขบวนการวิเคราะห์ทางสถิติจากข้อมูลที่รวบรวมมา เช่น การหาค่าเฉลี่ย พิสัย ส่วนเบี่ยงเบนมาตรฐาน เป็นต้น -การแปลความหมายและสรุปผลข้อมูล Interpretation and Conclusion of Data) เป็นขั้นสุดท้ายในการระเบียบวิธีสถิติเป็นการสรุปผลข้อมูล และ ตีความหมายข้อมูลจากที่ได้วิเคราะห์มาแล้ว
นิยามศัพท์ที่สำคัญ (Key Definitions) ก่อนที่จะไปศึกษารายละเอียดเนื้อหาวิชาสถิติ เราควร ต้องทราบความหมายหรือนิยามศัพท์ของคำบางคำที่ จำเป็นและเกี่ยวข้อง เพื่อให้เกิดความเข้าใจตรงกัน ดังต่อไปนี้
นิยามศัพท์ที่สำคัญ (Key Definitions) • หน่วยตัวอย่าง (Sampling Unit) หมายถึง หน่วยหรือ สิ่ง ใดสิ่งหนึ่งที่ให้ข้อ เท็จจริงที่ เราสนใจศึกษา ซึ่งอาจเป็นคน สัตว์ หรือสิ่งของก็ได้ขึ้นอยู่กับว่าหน่วยที่ให้ข้อเท็จจริง นั้นคืออะไร เช่น ต้องการบันทึกน้ำหนักของทารก แรกเกิด ใน กรณีนี้ ทารกแรกเกิด 1 คน เป็น 1 หน่วยตัวอย่าง หรือ หน่วยตัวอย่าง อาจเป็นกลุ่มของหน่วยหลาย หน่วยก็ได้ เช่น ต้องการทราบข้อเท็จจริงเกี่ยวกับครัวเรือน ครัวเรือน 1 ครัวเรือน ถือว่าเป็น 1 หน่วยตัวอย่าง แต่ในหน่วยตัวอย่างนี้ประกอบด้วยคนหลายคน เป็น ต้น
นิยามศัพท์ที่สำคัญ (Key Definitions) • ค่าสังเกต (Observation) หมายถึง ค่าที่วัดได้สำหรับลักษณะใดลักษณะหนึ่งที่ สนใจของแต่ละหน่วยตัวอย่าง เช่น บันทึกน้ำหนักของทารกแรกเกิดจำนวน 4 คน ได้ดังนี้ 3.5, 4, 3 และ 2.8 ก.ก. น้ำหนักทารกแต่ละ คนที่ชั่งได้เรียกว่า ค่าสังเกต ซึ่งมีอยู่ 4 ค่า และชุด หนึ่งของค่าสังเกตจากลักษณะหนึ่งที่รวบรวมได้เรียกว่า ข้อมูล (Data)
นิยามศัพท์ที่สำคัญ (Key Definitions) • ตัวแปร (Variable) เป็นลักษณะที่ให้ค่าสังเกตแตกต่างกันออกไป หรือ เป็นลักษณะที่แสดงความ ผันแปรไม่ใช่ค่าคงที่ เช่น น้ำหนัก ส่วนสูง I.Q. เพศ เป็นต้น นิยมใช้อักษร ภาษาอังกฤษ ตัวใหญ่ X, Y หรือ Z แทน ตัวแปร เช่น ให้ X เป็นตัวแปรแทน เพศ เป็นต้น
นอกจากนี้ยังแบ่งตัวแปรเป็น 2 ลักษณะคือ ตัวแปรเชิง ปริมาณและตัวแปรเชิงคุณภาพ - ตัวแปรเชิงปริมาณ (Quantitative variable) คือ ตัวแปรที่สามารถวัดค่าข้อมูลออกมาเป็นตัวเลขได้เช่น น้ำหนัก ส่วนสูง คะแนนสอบ I.Q. เป็นต้น และ ข้อมูลที่ได้จะเรียกว่า ข้อมูลเชิงปริมาณ (Quantitative data) - ตัวแปรเชิงคุณภาพ (Qualitative variable) คือ ตัวแปรที่ไม่สามารถวัดค่าออกมาเป็นตัวเลขได้เช่น เพศ ศาสนา สีของดอกไม้ความคิดเห็น เป็นต้น และข้อมูลที่ได้จะเรียกว่า ข้อมูลเชิงคุณภาพ (Qualitative data)
ในส่วนของตัวแปรเชิงปริมาณ ยังแบ่งเป็น 2 ลักษณะ คือ 1 ในส่วนของตัวแปรเชิงปริมาณ ยังแบ่งเป็น 2 ลักษณะ คือ 1. ตัวแปรชนิดต่อเนื่อง (Continuous variable) เป็นตัว แปรที่วัดค่าสังเกตได้ทุกค่าอย่างต่อเนื่องกันในช่วงของ ค่าจริงใด ๆ เช่น น้ำหนัก ส่วนสูง เป็นต้น 2. ตัวแปรชนิดไม่ต่อเนื่อง (Discrete variable) เป็นตัว แปรที่วัดค่าสังเกตต่าง ๆแยกกันโดยเด็ดขาด เป็น ตัวเลขจำนวนเต็ม เช่น จำนวนนิสิตในแต่ละชั้นปี ของคณะการบัญชีและการจัดการมหาวิทยาลัย มหาสารคาม ปีการศึกษา 2549 เป็นต้น
นิยามศัพท์ที่สำคัญ (Key Definitions) • ประชากร (Population) โดยทั่วไปเข้าใจว่า หมายถึง คน หรือกลุ่มคน แต่ในทางสถิติหมายถึง กลุ่มของหน่วยตัวอย่างหรือ หน่วยแจงนับทั้งหมดที่อยู่ในขอบข่ายที่เราสนใจ ดังนั้นประชากรในทางสถิติอาจหมายถึง คน สัตว์ หรือวัตถุสิ่งของก็ได้ทั้งนี้ขึ้นอยู่กับว่าเรากำลังสนใจ ศึกษาเรื่อง อะไร ประชากร อาจจำแนกได้ 2 ประเภท คือ - ประชากรที่มีจำนวนจำกัด (Finite population) หมายถึงประชากรที่มีหน่วย ตัวอย่างเป็นจำนวนจำกัด สามารถนับจำนวนได้แน่นอน เช่น จำนวนนิสิตแต่ละชั้นปีของคณะการบัญชีและการ จัดการ มหาวิทยาลัยมหาสารคามเป็นต้น - ประชากรอนันต์ (Infinite population) หมายถึง ประชากรที่หน่วยตัวอย่าง มีมากจนไม่สามารถนับจำนวนได้แน่นอน เช่น จำนวน ปลาในแม่น้ำชีเป็นต้น
นิยามศัพท์ที่สำคัญ (Key Definitions) • ตัวอย่าง (Sample) เป็นส่วนหนึ่งของประชากร ทั้งนี้ เพราะประชากรบาง กลุ่มที่เราสนใจมีขนาดใหญ่มากการศึกษาจากทุกหน่วย ในประชากรทำได้ไม่สะดวกและทำให้เกิดความล่าช้า สิ้นเปลือง เวลา ค่าใช้จ่าย และแรงงานมาก จึง ทำการศึกษาเพียงบางหน่วยในประชากรเท่านั้น ซึ่ง ได้มาโดยการสุ่ม (Random) เพื่อให้ได้ตัวอย่างสุ่ม (Random sample) ที่เป็นตัวแทนที่ดีของประชากรและ เพื่อที่จะใช้ข้อมูลที่ได้จากตัวอย่างนั้นมาอ้างอิง ประชากร
นิยามศัพท์ที่สำคัญ (Key Definitions) • พารามิเตอร์ (Parameter) หมายถึง ค่าที่ใช้อธิบายคุณลักษณะของประชากร ซึ่งเป็นค่าคงที่ที่คำนวณได้จากหน่วยตัวอย่างทุกหน่วย ในประชากรนั่นเอง • สถิติ (Statistic) เป็นค่าที่คำนวณได้จากหน่วยตัวอย่างทุกหน่วยใน ตัวอย่าง เพื่อใช้อธิบาย คุณลักษณะของตัวอย่าง และในทางสถิติเรายังสามารถใช้ค่าสถิติไปประมาณ ค่าพารามิเตอร์ของประชากรได้
ขอบข่ายหรือลักษณะของสถิติ สถิติแบ่งออกได้เป็น 2 ประเภท ดังนี้ - สถิติเชิงพรรณา (Descriptive Statistics) - สถิติเชิงอนุมาน (Inferential Statistics)
สถิติเชิงพรรณนา (Descriptive Statistics) เป็นสถิติที่เกี่ยวข้องกับเรื่องต่าง ๆ ต่อไปนี้ การเก็บรวบรวมข้อมูล (Collect data) เช่น ทำการสำรวจ (Survey) เป็นต้น การนำเสนอข้อมูล (Present data) เช่น นำเสนอรูปตารางและกราฟ (Tables and graphs) เป็นต้น การอธิบายลักษณะข้อมูล (Characterize data) เช่น อธิบายด้วยค่าเฉลี่ยตัวอย่าง (Sample mean) =
สถิติเชิงอนุมาน (Inferential Statistics) เป็นสถิติที่ศึกษาจากกลุ่มตัวอย่าง แล้วนำผลที่ได้จาก ตัวอย่างไปอ้างอิง หรืออนุมานถึงกลุ่มประชากรแบ่ง ลักษณะการอ้างอิง เป็น 2 ลักษณะใหญ่ๆ คือ - การประมาณค่า (Estimation) - การทดสอบสมมติฐาน (Test of Hypothesis) เป็นการสรุปผลและ/หรือ เป็นการตัดสินใจที่เกี่ยวข้องกับ ประชากรโดยอาศัยผลลัพธ์หรือข้อมูลจากตัวอย่าง
Inferential Statistics
การเก็บรวบรวมข้อมูล (Collection of Data) เป็นกระบวนการที่จะให้ได้มาซึ่งข้อมูลที่จะนำไป วิเคราะห์ต่อไป - ข้อมูลที่ได้มาในขั้นแรกนี้จะเรียกว่า ข้อมูลดิบ (Raw Data) และจากที่ทราบว่า การเก็บรวบรวมข้อมูลเป็นขั้นตอน แรกและขั้นตอนที่สำคัญ ของระเบียบวิธีการทางสถิติดังนั้นการดำเนินงานใน ขั้นตอนนี้ต้องมีการวางแผน การเก็บรวบรวมข้อมูลอย่างรอบคอบ และต้องทราบด้วย ว่าข้อมูลที่ต้องการนั้น เป็นข้อมูลชนิดใด มาจากแหล่งใด เพื่อให้ได้ข้อมูลที่ ถูกต้องตามจุดประสงค์มากที่สุด ซึ่งจำแนกข้อมูลตามลักษณะต่าง ๆ ได้ดังนี้
ลักษณะของข้อมูล (Types of Data) จำแนกตามแหล่งที่เกิดข้อมูลได้ดังนี้ 1. ข้อมูลจากแหล่งปฐมภูมิ (Primary source) การเก็บ รวบรวมข้อมูล จากแหล่งนี้ ผู้รวบรวมต้องไปเก็บจากต้นตอจริง ๆ ซึ่งอาจได้จากการสัมภาษณ์ วัด นับ สังเกต ทำการทดลอง หรือส่งแบบสอบถาม ทางไปรษณีย์ เป็นต้น ข้อมูลที่รวบรวมได้จากแหล่งนี้ เรียกว่า ข้อมูลปฐมภูมิ (Primary data) 2. ข้อมูลจากแหล่งทุติยภูมิ (Secondary source) การ เก็บรวบรวม ข้อมูลจากแหล่งนี้ ผู้รวบรวมไม่จำเป็นต้องไปแจงนับเอง แต่อาศัยข้อมูลที่ผู้อื่น เก็บรวบรวมไว้แล้ว อาจได้มาจากรายงาน เอกสาร หรือจากทะเบียนต่าง ๆ ที่มี หน่วยงานจัดทำไว้ เป็นต้น ข้อมูลที่รวบรวมได้จาก แหล่งนี้ เรียกว่า ข้อมูลทุติยภูมิ (Secondary data)
ลักษณะของข้อมูล (Types of Data) จำแนกตามลักษณะการเก็บ 1. ได้จากการนับ (Counting data or Enumeration data) ซึ่งข้อมูลจะมีลักษณะไม่ต่อเนื่อง (Discrete data) 2. ได้จากการชั่ง ตวง วัด (Measurement data) ซึ่งข้อมูลจะมีลักษณะต่อเนื่อง (Continuous data)
ลักษณะของข้อมูล (Types of Data) จำแนกตามลักษณะการแสดงข้อเท็จจริง 1. ข้อมูลเชิงคุณภาพ (Qualitative data หรือ Categorical data) 2. ข้อมูลเชิงปริมาณ (Quantitative data หรือ Numerical data) - ข้อมูลไม่ต่อเนื่อง (Discrete data) - ข้อมูลต่อเนื่อง (Continuous data)
Data Type Examples Qualitative or Categorical Data คุณภาพสินค้า ข้อมูลที่วัดได้คือ ดี หรือ เสีย การมีพันธบัตรครอบครอง ข้อมูลที่วัดได้คือ มีหรือ ไม่มี กลุ่มเลือด ข้อมูลที่วัดได้คือ A, B, O, AB Quantitative or Numerical Data - Discrete data จำนวนนิสิตที่เข้ามาใช้บริการห้องสมุดในแต่ละวัน จำนวนนิตยสารในห้องสมุด - Continuous data ความสูง ค่าใช้จ่าย น้ำหนัก อายุ
ก่อนที่จะกล่าวรายละเอียดในการเก็บรวบรวมข้อมูล ให้เรามาพิจารณาข้อมูลหรือตัวเลขที่ได้จากการวัด เสียก่อนว่าเป็นตัวเลขที่อยู่ในมาตราการวัดหรือระดับการ วัดใดแบ่งออกเป็น 4 ระดับดังต่อไปนี้
ระดับของการวัด (Level of Measurements) มีการแบ่งระดับข้อมูลที่วัดหรือเก็บรวบรวมได้เป็น 4 ระดับ ดังนี้ 1. มาตรานามบัญญัติ(Nominal scales) 2. มาตราเรียงอันดับ (Ordinal scales) 3. มาตราอันตรภาค (Interval scales) 4. มาตราอัตราส่วน (Ratio scales)
Level of Measurements 1. มาตรานามบัญญัติ(Nominal scales) มีลักษณะเป็นเพียงการเรียกชื่อ จำแนกกลุ่ม หรือ จำแนกประเภทของข้อมูล (Categorical)
Level of Measurements 2. มาตราเรียงอันดับ (Ordinal scales) - ค่าสังเกตนอกจากถูก Classified เป็น Nominal scale แล้ว ยังมีการเรียงอันดับภายในตัวเองระหว่าง Categories - ค่าสังเกตไม่สามารถวัดออกมาเป็นตัวเลขได้หรือบาง ทีมีการ วัดออกมาเป็นตัวเลข แต่เป็น ตัวเลขที่ไม่มี ความหมายในเชิง ปริมาณ เช่น ระดับความคิดเห็น - เห็นด้วยมาก เห็น ด้วยปานกลาง ไม่เห็นด้วย การประกวดร้องเพลง จำแนกเป็น ชนะเลิศ รองชนะเลิศอันดับ 1, 2
Level of Measurements 3. มาตราอันตรภาค (Interval scales) - ค่าสังเกตวัดออกมาเป็นตัวเลข เป็นช่วง ๆ แต่ละ ช่วงเท่ากัน - ลักษณะสำคัญของมาตรานี้ คือ ไม่มีศูนย์แท้เป็น ศูนย์สมมติ (Arbitrary zero) เช่น IQ อุณหภูมิ คะแนนสอบ เป็นต้น
Level of Measurements 4. มาตราอัตราส่วน (Ratio scales) - ค่าสังเกตวัดออกมาเป็นตัวเลข เป็นช่วง ๆ แต่ ละช่วงเท่ากัน เหมือนกับมาตราอันตรภาค - แต่ดีกว่าตรงที่มีศูนย์แท้(Absolute zero) ซึ่งศูนย์ ในมาตรานี้ หมายถึง ไม่มีอะไรเลย - ข้อมูลสามารถนำมาเปรียบเทียบอัตราส่วนกันได้ เช่น ความสูง อายุ รายได้ น้ำหนัก เป็นต้น
วิธีการเก็บรวบรวมข้อมูล การเก็บรวบรวมข้อมูลมีอยู่หลายวิธี แต่ในที่นี้ ขอ แบ่งเป็น 3 วิธี 1. เก็บรวบรวมข้อมูลจากการสำรวจ (Survey) - การทำสำมะโน (Census) - การสำรวจจากตัวอย่าง (Sample survey) 2. การเก็บรวบรวมข้อมูลจากการทดลอง (Experiment) 3. เก็บรวบรวมข้อมูลจากระบบทะเบียนหรือรายงาน ต่าง ๆ
การสำรวจจากตัวอย่าง (Sample survey) การทำสำมะโน (Census) เป็นการเก็บรวบรวมข้อมูลจากทุก ๆ หน่วยที่ ต้องการศึกษา ซึ่งจะเก็บโดยตรงจากแหล่งข้อมูล นั้น (Primary source) การสำรวจจากตัวอย่าง (Sample survey) เป็นการเก็บรวบรวมข้อมูลจากทุก ๆ หน่วยใน ตัวอย่างแล้วนำผลลัพธ์ ที่ได้ไป คาดหมายหรือพยากรณ์ค่าที่แสดงคุณลักษณะของ ประชากร ซึ่งจะเก็บโดยตรงจาก แหล่งข้อมูลนั้น (Primary source)
ในการศึกษาข้อมูลที่ได้จากการสำรวจจากหน่วย ตัวอย่าง ตัวอย่างที่นำมาศึกษาควรจะได้มาอย่างสุ่ม (Random) ซึ่งตัวอย่างที่ได้โดยการสุ่ม เรียกว่า ตัวอย่างสุ่ม (Random sample) และตัวอย่างได้ที่นั้น จะถูกเลือกโดยไม่เจาะจงว่าหน่วยใดหน่วยหนึ่ง ใน ประชากรจะถูกเลือกมา ซึ่งแบ่งวิธีการสุ่มตัวอย่างหลัก ๆ เป็น 2 วิธีดังต่อไปนี้
วิธีการสุ่มตัวอย่าง การเก็บรวบรวมข้อมูลมีอยู่หลายวิธี แต่ในที่นี้ ขอ แบ่งเป็น 2 วิธี 1. การสุ่มตัวอย่างโดยไม่อาศัยทฤษฎีความน่าจะเป็น (Non - Probability Sampling) 2. การสุ่มตัวอย่างโดยอาศัยทฤษฎีความน่าจะเป็น (Probability Sampling)
การสุ่มตัวอย่างโดยไม่อาศัยทฤษฎีความน่าจะเป็น (Non Probability Sampling) มีหลายวิธี เช่น - การสุ่มตัวอย่างแบบเจาะจง (Purposive Sampling) - การสุ่มตัวอย่างแบบบังเอิญ (Accidental Sampling) - การสุ่มตัวอย่างแบบโควตา (Quota Sampling)
การสุ่มตัวอย่างโดยอาศัยทฤษฎีความน่าจะเป็น (Probability Sampling) มีหลายวิธี เช่น - การสุ่มตัวอย่างอย่างง่าย (Simple Random Sampling) - การสุ่มตัวอย่างแบบมีระบบ (Systematic Sampling) - การสุ่มตัวอย่างแบบมีชั้นภูมิ(Stratified Sampling) - การสุ่มตัวอย่างแบบจัดกลุ่ม (Cluster Sampling)
ในบทเรียนนี้จะอธิบายเฉพาะวิธีการสุ่มตัวอย่างโดย อาศัยทฤษฎีความน่าจะเป็นพอสังเขปเท่านั้น ถ้าผู้เรียน ต้องการศึกษาให้ละเอียดยิ่งขึ้นสามารถหาเอกสาร/ตำรา อ่านเพิ่มเติม ได้ในส่วนที่เกี่ยวกับ “เทคนิคการสุ่ม ตัวอย่าง” (Sampling Techniques) และการสุ่มตัวอย่างโดย อาศัยทฤษฎีความน่าจะเป็น นี้เป็นวิธีการที่นักสถิตินิยม ใช้
Probability Sampling การสุ่มตัวอย่างโดยอาศัยทฤษฎีความน่าจะเป็นนั้น หน่วยตัวอย่างแต่ละหน่วยจะ ถูกเลือกมาโดยอาศัยความรู้เกี่ยวกับความน่าจะเป็นเข้า มาประยุกต์
การสุ่มตัวอย่างอย่างง่าย (Simple Random Sampling : SRS) หน่วยตัวอย่างแต่ละหน่วยจากกรอบประชากรที่ สนใจจะถูกเลือกมาด้วยความ น่าจะเป็นเท่า ๆ กัน การเลือกหน่วยตัวอย่างอาจเลือกมาแบบคืนที่หรือไม่ คืนที่ก็ได้ ตัวอย่างอาจได้มาโดยอาศัยตารางเลขสุ่ม การจับ สลาก หรือ ทำการสุ่มด้วยเครื่องคอมพิวเตอร์ วิธีนี้จะใช้ได้ดีในกรณีหน่วยตัวอย่างในประชากรมี ลักษณะคล้ายคลึง กัน (Homogeneous)
การสุ่มตัวอย่างแบบมีระบบ (Systematic Sampling) ให้แบ่งหน่วยตัวอย่างในประชากรขนาด : N ออกเป็นกลุ่ม ๆ ละ k หน่วย : ซึ่ง k=N/n หาหน่วยตัวอย่างเริ่มต้น (Random start) โดยสุ่ม ตัวอย่างมาหนึ่งหน่วยจากกลุ่มที่หนึ่ง (1st group ) หลังจากนั้นเลือกตัวอย่างมาหนึ่งหน่วยตัวอย่างจากทุก ๆ k หน่วย มักจะใช้กับกรณีที่หน่วยตัวอย่างในประชากรมีจำนวน มาก ๆ และมีการเรียงข้อมูลเป็นระบบอยู่แล้ว เช่น ต้องการสำรวจข้อมูล ที่น่าใจจากครัวเรือนในจังหวัด มหาสารคาม
Systematic Samples
การสุ่มตัวอย่างแบบมีชั้นภูมิ (Stratified Sampling) การสุ่มตัวอย่างแบบมีชั้นภูมิมักใช้ในกรณีที่หน่วย ตัวอย่างในประชากรแตกต่างกัน เนื่องจากหน่วยตัวอย่างในประชากรมีความแตกต่าง กัน จึงทำการแบ่งหน่วยตัวอย่างใน ประชากร ออกเป็นกลุ่มย่อยหรือชั้นภูมิ (subgroups or stratums) ซึ่งอาจแบ่งเป็น 2 หรือมากกว่า 2 ชั้นภูมิโดยภายใน ชั้นภูมิเดียวกันจะมีลักษณะของหน่วย ตัวอย่าง เหมือนกัน (Homogeneous) แต่ต่างชั้นภูมิจะมีลักษณะ ของหน่วย ตัวอย่างต่างกัน (Heterogeneous) เลือกตัวอย่างมาอย่างสุ่มจากแต่ละกลุ่ม รวมหน่วยตัวอย่างจากแต่ละชั้นภูมิที่สุ่มได้เป็นตัวอย่าง หนึ่งชุด
Stratified Samples
การสุ่มตัวอย่างแบบจัดกลุ่ม (Cluster Sampling) ตัวอย่างที่มีลักษณะเหมือนประชากร ทำการสุ่มตัวอย่างมาบาง “Clusters” รวมข้อมูลจากทุก “Clusters” เป็นตัวอย่างหนึ่งชุด แล้ว ศึกษาข้อมูลจาก ทุกหน่วยในตัวอย่างชุดนั้น
Cluster Samples
เหตุผลในการสุ่มตัวอย่าง Reasons for Drawing a Sample ใช้เวลาน้อยกว่าการศึกษาจาก census เสียค่าใช้จ่ายน้อยกว่าการศึกษาจาก census มีความยุ่งยากน้อยกว่าและบริหารจัดการได้ดีกว่า การศึกษาจาก census
คุณสมบัติของข้อมูลที่ดี 1. มีความถูกต้องแม่นยำหรือถ้ามีความผิดพลาดต้อง พยายามให้เกิดขึ้นน้อยที่สุด 2. มีความสมบูรณ์ครบถ้วนและกะทัดรัด 3. ที่สำคัญต้องตรงกับความต้องการของผู้ใช้