บทที่ 9 กรรมวิธีทางข้อมูล บทที่ 9 กรรมวิธีทางข้อมูล หลังจากเก็บรวมรวมข้อมูลแล้ว ขั้นตอนต่อมาก็คือการ เตรียมการก่อนนำข้อมูลมาทำการวิเคราะห์ โดยจะต้องมี การแปลงข้อมูลจากแบบสอบถาม การสัมภาษณ์ หรือการ สังเกตให้อยู่ในรูปแบบที่เครื่องคอมพิวเตอร์สามารมนำไป ทำการประมวลผลได้
ความหมายของกรรมวิธีทางข้อมูล การดำเนินกรรมวิธีทางข้อมูล หมายถึง การเตรียมการกับ ข้อมูลอย่างมีระบบเพื่อให้ได้ข้อมูลที่ถูกต้องและพร้อมที่จะ นำไปวิเคราะห์หรือประมวลผลโดยใช้คอมพิวเตอร์
ตัวอย่างบางส่วนของผู้ตอบแบบสอบถาม ตอนที่ 1. ข้อมูลส่วนตัวผู้ตอบแบบสอบถาม ตัวอย่างบางส่วนของผู้ตอบแบบสอบถาม 1. เพศ [ ] 1 ชาย [ ] 2 หญิง 2. อายุ ………..ปี 3. ระดับการศึกษาสูงสุด [ ] 1 ต่ำกว่าปริญญาตรี [ ] 2 ปริญญาตรี [ ] 3 ปริญญาโท [ ] 4 ปริญญาเอก 4. สถานภาพการสมรส [ ] 1 โสด [ ] 2 สมรส [ ] 3 หม้าย [ ] 4 หย่าร้าง 5. รายได้ต่อเดือน ………………….บาท
ข้อมูลส่วนบุคคลของผู้ตอบแบบสอบถาม คำถาม ชื่อตัวแปร รายการข้อมูล ขนาดตัวแปร ค่าที่เป็นไปได้ ข้อสังเกต 1 SEX เพศ 1 1. ชาย (Male) เลือกได้คำตอบเดียว และความหมาย (จำนวนหลัก/ช่อง) 2 AGE อายุ 2 15 - 98 ปี (จำนวนเต็ม) ระบุอายุตามจริง 2. หญิง (Female) 9. ไม่ตอบ (No Answer) (99 ไม่ตอบ) 3 EDUCA การศึกษา 1 1. ต่ำกว่าปริญญาตรี เลือกได้คำตอบเดียว 2. ปริญญาตรี 3. ปริญญาโท 4. ปริญญาเอก 4 STATUS สถานภาพสมรส 1 1. โสด เลือกได้คำตอบเดียว 2. แต่งงาน 3. หม้าย 4. หย่า 5 INCOME รายได้ต่อเดือน 6 ระบุตามเป็นจริง
ขั้นตอนของกรรมวิธีทางข้อมูล ข้อมูลที่อยู่ใน แบบสอบถาม ขั้นตอนของกรรมวิธีทางข้อมูล บรรณาธิกรข้อมูลเบื้องต้น สร้างรหัสสำหรับข้อมูล สร้างคู่มือการลงรหัส ลงรหัสข้อมูล บันทึกข้อมูลลงคอมพิวเตอร์ บรรณาธิกรข้อมูลที่เก็บไว้ในคอมพิวเตอร์
บรรณาธิกรข้อมูลเบื้องต้น การตรวจแก้ไขข้อมูลในรอบแรก เช่น ตรวจสอบความถูกต้องของข้อมูลถ้าผู้ตอบตอบว่าอายุ 16 ปี มีบุตร 4 คน แสดงว่าอาจจะมีคำตอบอายุหรือจำนวนบุตรผิดพลาด การให้หมายเลขประจำตัวในแบบสอบถาม ควรจะมีการให้หมายเลขประจำตัว (Identification number) ในแต่ละชุดของแบบสอบถามเพื่อประโยชน์ในการตรวจบรรณาธิกรณ์ข้อมูลและการบันทึกข้อมูล
บรรณาธิกรข้อมูลเบื้องต้น 3. การจัดเก็บแบบสอบถามรวมกันเป็นชุด เพื่อสะดวก ในการทวนนับหรือการแบ่งข้อมูลจากแหล่งจาก ต่างๆ ได้ง่ายและสะดวกในการตรวจสอบย้อนหลัง ได้ง่าย
สร้างรหัสสำหรับข้อมูล 1. การกำหนดรหัสให้กับหมายเลขแบบสอบถาม เช่น ID 001 ID 002 .... 2. การกำหนดรหัสให้กับคำถาม เช่น 2.1 คำถามปลายปิด (close end Question) 2.1.1 คำตอบที่มีเพียงคำตอบให้เลือกเพียง 2 คำตอบ (Dichotomous Question) รหัสที่ใช้จะเป็นเพียง 0 กับ 1 มี 2 ค่า แต่ตัวแปรในช่องที่คีย์ข้อมูลตัวแปรเท่ากับ 1 คอลัมน์ เช่น เพศ [ ] 1. ชาย [ ] 2. หญิง
การประมวลผลข้อมูล คือ การจัดการกับข้อมูลอย่างมีระบบด้วยคอมพิวเตอร์ เพื่อให้ข้อมูล ที่ได้รับการประมวลผลแล้ว อยู่ในรูปแบบที่สามารถนำไปใช้งาน ได้อย่างมีประสิทธิภาพ
แสดงขั้นตอนของการประมวลผล 1. การเตรียมข้อมูลนำเข้า 2. การประมวลผล 3.การแสดงผลลัพธ์ Input Data Processing Output Data - กราฟ - ตาราง - รายงาน - การเก็บรวบรวมข้อมูล - การเปลี่ยนสภาพข้อมูล - การลงรหัส - การบรรณาธิกรณ์ - การแปรสภาพข้อมูล - การดึงข้อมูล - เรียงลำดับข้อมูล - การรวมข้อมูล - การคำนวณและการเปรียบเทียบ
1. การเตรียมข้อมูลเพื่อการประมวลผล 1. การเตรียมข้อมูลเพื่อการประมวลผล การเก็บรวบรวมข้อมูล ข้อมูลที่เก็บรวบรวมอาจได้จากเอกสารต่าง ๆ ซึ่งเป็นข้อมูลทุติยภูมิ หรือเป็นข้อมูลปฐมภูมิ ข้อมูลปฐมภูมิส่วนมาก มักจะใช้แบบสอบถามเป็นเครื่องมือในการเก็บข้อมูล
2. การเปลี่ยนสภาพข้อมูล (Data Conversion) เป็นการเปลี่ยนของข้อมูลที่เก็บรวมรวบให้ได้อยู่ในรูปแบบที่สะดวกต่อการนำไปประมวลผล หรือวิเคราะห์ อาจประกอบด้วย 2.1 การลงรหัส (Coding) เป็นการเปลี่ยนรูปแบบข้อมูลโดยให้รหัสแทนข้อมูล เช่น ใช้รหัสตัวแทนแทนข้อมูลเชิงกลุ่ม เช่น อาชีพ 1 แทน อาชีพข้าราชการ 2 แทน อาชีพพนักงานเอกชน
2.2 การบรรณาธิกร (Editing) เป็นการตรวจสอบความถูกต้องของข้อมูลที่ได้แปลงให้เป็นรูปรหัสแล้ว นอกจากนั้น ควรตรวจสอบความสมบูรณ์ครบถ้วนของข้อมูล และแก้ไขปรับปรุงให้ถูกต้อง เช่น ถ้าผู้ตอบตอบว่าอายุ 19 ปี แต่มีประสบการณ์ทำงาน 25 ปี แสดงว่าเป็นไปไม่ได้ 2.3 การแปรสภาพข้อมูล (Transforming) เป็นการเปลี่ยนรูปแบบของข้อมูลเพื่อให้สะดวกในการวิเคราะห์ หรือประมวลผล
2. การประมวลผลข้อมูล (Data Processing) เป็นการนำข้อมูลที่ได้เปลี่ยนสภาพแล้วมาวิเคราะห์ ในปัจจุบันจะใช้โปรแกรมสำเร็จรูปทางสถิติมาวิเคราะห์ การวิเคราะห์แบ่งเป็น 2 ระดับ 1. การวิเคราะห์ขั้นต้น 2. การวิเคราะห์ขั้นสูง
ก. การวิเคราะห์ขั้นต่ำ ประกอบด้วย ก. การวิเคราะห์ขั้นต่ำ ประกอบด้วย การดึงข้อมูล (Retrieving) เป็นการค้นหาข้อมูลเพื่อนำไปประมวลผลต่อไป หรือเพื่อนำไปใช้งานด้านต่าง ๆ เช่น ต้องการทราบยอดเงินกู้ของลูกค้ารายสำคัญ การเรียงลำดับข้อมูล (Sorting) เป็นการจัดการข้อมูลที่มีลักษณะเดียวกันให้เรียงลำดับตามตัวเลข หรือตัวอักษร เช่น การเรียงชื่อลูกค้าตามตัวอักษร หรือเรียงชื่อลูกค้าตามยอดซื้อ เรียงยอดขายจากมากไปน้อย การรวบรวมข้อมูล (Merging) เป็นการนำข้อมูลตั้งแต่ 2 ชุดขึ้นไปมารวมกันเป็นชุดเดียวกัน เช่น นำยอดขายรายเดือนของเครื่องสำอาง BSC แต่ละสาขามารวมกัน เพื่อจะได้ทราบยอดขายของผลิตภัณฑ์นี้ การคำนวณและเปรียบเทียบ เป็นการคำนวณเบื้องต้น เช่น หายอดรวม การหาผลต่าง เช่น ผลรวมของยอดขายเฉลี่ยของ 2 สาขา
ข. การวิเคราะห์ขั้นสูง ประกอบด้วย ข. การวิเคราะห์ขั้นสูง ประกอบด้วย การประมาณค่า (Estimation) เป็นการประมาณค่าประชากรด้วยค่าตัวอย่าง เช่น สัดส่วนหรือค่าร้อยละ ค่าเฉลี่ย ค่าแปรปรวน ซึ่งอาจจะประมาณค่าต่าง ๆ ของประชากรเดียว หรือหลาย ๆ ประชากร การทดสอบสมมติฐาน (Hypothesis Testing) เป็นการทดสอบค่าของประชากร เช่น สัดส่วนของประชากรที่เห็นด้วยกับนโยบายกองทุนหมู่บ้านมากกว่า 60 % หรือไม่ การวิเคราะห์ความสัมพันธ์ของตัวแปร เช่น ต้องการวิเคราะห์ความสัมพันธ์ระหว่างยอดขายกับค่าโฆษณา ราคาขาย จำนวนคู่แข่งขัน ฯลฯ การพยากรณ์ เป็นการประมาณการหรือพยากรณ์ค่าของตัวแปรในอนาคต เช่น การพยากรณ์ยอดขายใน 3 ปี ข้างหน้า เทคนิคการวิเคราะห์เชิงลึกแบบอื่น ๆ เช่น Factor Analysis, Discriminant Analysis, Cluster Analysis ฯลฯ
3. การแสดงผลลัพธ์ (Output) หลังจากที่ได้วิเคราะห์ข้อมูลแล้วควรจะต้องจัดหาผลลัพธ์ที่ได้ในรูปแบบที่เข้าใจง่าย เช่น อาจเป็นการรายงานที่ประกอบด้วยตาราง กราฟรูปต่าง ๆ
สถิติกับงานวิจัยทางธุรกิจ วิธีการจัดการข้อมูลโดยเริ่มตั้งแต่การเก็บรวบรวมข้อมูล ไปจนถึงการวิเคราะห์และแปลผลข้อมูล สถิติ การแจกแจงความถี่ (โดยแสดงเป็นร้อยละ) การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจายข้อมูล สถิติ เชิงพรรณนา สถิติ เชิงวิเคราะห์ เป็นการนำเสนอข้อมูลที่เก็บรวบรวมมาโดยนำมาบรรยายลักษณะของข้อมูลที่เก็บมาได้แต่ไม่สามารถอ้างอิงถึงข้อมูลในส่วนอื่นๆได้
2.การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการหาค่ากลางของข้อมูล สถิติเชิงพรรณนา 1.การแจกแจงความถี่ เป็นการแสดงความถี่ของข้อมูลที่เก็บมาได้จากแบบสอบถาม หรือ แบบสัมภาษณ์มาจัดเป็นระเบียบตามลักษณะของข้อคำตอบในแต่ละคำถามโดยแสดงเป็นจำนวนและร้อยละ 2.การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการหาค่ากลางของข้อมูล 2.1 ค่าเฉลี่ย ( Mean)ค่าของข้อมูลจะต้องมีระดับการวัดแบบช่วง 2.2 มัธยฐาน ( Median ) เป็นลักษณะกระจายข้อมูล 2.3 ฐานนิยม (Mode) วิธีการสรุปและพรรณนาข้อมูล 3.การวัดค่าความเบี่ยงเบนมาตรฐาน
สถิติเชิงวิเคราะห์ เป็นการนำผลข้อมูลที่เก็บมาจากกลุ่มตัวอย่างไปใช้อ้างอิงและอธิบายถึงกลุ่มประชากรทั้งหมด การสรุปผลจะใช้หลักความน่าจะเป็นมาทดสอบสมมติฐาน สถิติเชิงวิเคราะห์แบบมีพารามิเตอร์ สถิติเชิงวิเคราะห์แบบไม่มีพารามิเตอร์ นิยมใช้กับข้อมูลที่มีระดับการวัดตัวแปรเป็นระดับมาตราอันตรภาคและอัตราส่วน ข้อมูลมีการแจกแจงปกติ มีค่าความแปรปรวนไม่แตกต่างกันมาก t - test การวิเคราะห์ความแปรปรวน( ANOVA)
สถิติเชิงวิเคราะห์แบบไม่มีพารามิเตอร์ ใช้กับข้อมูลที่มีระดับการวัดมาตรานามบัญญัติ หรือ มาตราเรียงลำดับ และลักษณะของข้อมูลไม่ได้มีการแจกแจงปกติ ได้แก่ Chi-quare แบบทดสอบ t - test นิยมใช้ในการศึกษาเปรียบเทียบความแตกต่างระหว่างตัวกลางของข้อมูลสองชุดที่มีการวัดในระดับช่วง เช่น การเปรียบเทียบระหว่างข้อมูล 2 ชุดในเรื่องของรายได้ จำนวนบุตร
ตัวแปรตามต้องมีค่าของข้อมูลที่ได้จากการวัด Interval scale การวิเคราะห์ความแปรปรวน (Analysis of Variance :ANOVA เป็นการทดสอบความแตกต่างระหว่างตัวแปรอิสระกับตัวแปรตาม ตัวแปรอิสระต้องมีค่าของข้อมูลที่ได้จากการวัด Nominal scale ตัวแปรตามต้องมีค่าของข้อมูลที่ได้จากการวัด Interval scale ถ้าตัวแปรตามมีค่าของข้อมูลที่ได้จากการวัด Nominal scale ต้องแปลงให้เป็นตัวแปรหุ่น เพื่อให้สามารถกำหนดค่าเป็น 0 และ 1
แบบทดสอบไคสแควร์ วิเคราะห์ความสัมพันธ์ระหว่างตัวแปรว่ามีความสัมพันธ์กันหรือมีความแตกต่าง
การใช้งานโปรแกรม SPSS เบื้องต้น ใช้โปรแกรมช่วยในการนำเสนอข้อมูล ใช้โปรแกรมช่วยในการบรรยายลักษณะของข้อมูล ใช้โปรแกรมช่วยในการตรวจสอบข้อมูล และเครื่องมือที่ใช้เก็บรวบรวมข้อมูล ใช้โปรแกรมช่วยในการสรุปผลข้อมูล
การใช้โปรแกรมช่วยในการนำเสนอข้อมูล นำเสนอด้วยวิธีการทางสถิติ โดยการนับข้อมูลตามค่าที่เป็นไปได้ ซึ่งเรียกว่าการแจกแจงความถี่ ( แจกแจงความถี่ในรูปของตารางด้วยจำนวนและร้อยละ รวมถึงในรูปของกราฟ) การใช้โปรแกรมช่วยในการบรรยายลักษณะข้อมูล โดยการคำนวณค่า สถิติเบื้องต้น เพื่อใช้ในการบรรยายลักษณะข้อมูล เช่น ค่าเฉลี่ย ค่าฐานนิยม ค่าส่วนเบี่ยงเบนมาตรฐาน
การใช้โปรแกรมช่วยในการตรวจสอบข้อมูลและเครื่องมือเก็บข้อมูล เป็นการใช้โปรแกรมมาช่วยในการตรวจสอบคุณภาพของเครื่องมือที่ใช้ในการเก็บข้อมูลโดยการหาความเชื่อมั่นของเครื่องมือ การใช้โปรแกรมช่วยในการสรุปผลข้อมูล เป็นการใช้โปรแกรมมาช่วยในการสรุปผลจากข้อมูลตัวอย่างที่เก็บรวบรวมได้เพื่อนำไปอธิบายข้อมูลทั้งหมด( ประชากร) ซึ่งอาจจะเป็นการประมาณค่า การทดสอบสมมติฐาน การหาความสัมพันธ์
การเปลี่ยนค่าของตัวแปร
การเปลี่ยนค่าในตัวแปรเดิม
การเปลี่ยนค่าไปเก็บไว้ในตัวแปรใหม่
การแจกแจงความถี่แบบ Multiple Reponse เป็นการจำแนกหรือแจกแจงความถี่สำหรับตัวแปรที่มีค่าได้หลายลักษณะ ( ตอบมากกว่า 1 คำตอบ หรือ จัดลำดับ ) ตัวอย่าง รายการโทรทัศน์ใดที่ท่านชอบ 1.ข่าว และ สารคดี 2.ละคร 3.เพลง 4.เกมโชว์ กำหนดรหัสเพียง 0 ไม่เลือก 1. เลือก
แสดงสถานภาพทั่วไปของผู้ตอบแบบสอบถาม ในด้านอายุ ต่ำกว่า 30 ปี 38.40% 50 ปีขึ้นไป 33.33% 30-50 28.28% แผนภูมิที่ 2 แสดงสถานภาพทั่วไปของผู้ตอบแบบสอบถามในด้านอายุ จากแผนภูมิที่ 2 พบว่า ผู้ตอบแบบสอบถามส่วนใหญ่จะมีอายุต่ำกว่า 30 ปี คิดเป็นร้อยละ 38.40 รองลงมาได้แก่อายุ 50 ปีขึ้นไปคิดเป็นร้อยละ 33.33 และ น้อยที่สุด ได้แก่อายุระหว่าง 30-50 คิดเป็นร้อยละ 28.28
2 รูปแบบ การคำนวณหาค่าเฉลี่ย 2 รูปแบบ การคำนวณหาค่าเฉลี่ย 1.ผลของการคำนวณค่าเฉลี่ย ( Mean) ของความพึงพอใจเกี่ยวกับรูปแบบของรายการโดยแสดงเป็นภาพรวมจากคำสั่ง Frequencies 2.การคำนวณหาค่าเฉลี่ย (Mean)แบบจำแนกตามสถานภาพทั่วไปของผู้ตอบแบบสอบถามโดยใช้ Compare Means
การรายงานผลจากการคำนวณหาค่าเฉลี่ย(Mean ) คะแนนเฉลี่ย 4.50 - 5.00 กำหนดให้อยู่ในเกณฑ์ พึงพอใจมากที่สุด คะแนนเฉลี่ย 3.50 - 4.49 กำหนดให้อยู่ในเกณฑ์ พึงพอใจมาก คะแนนเฉลี่ย 2.50 - 3.49 กำหนดให้อยู่ในเกณฑ์ พึงพอใจปานกลาง คะแนนเฉลี่ย 1.50 - 2.49 กำหนดให้อยู่ในเกณฑ์ พึงพอใจน้อย คะแนนเฉลี่ย 1.00 - 1.49 กำหนดให้อยู่ในเกณฑ์ พึงพอใจน้อยที่สุด