การวิเคราะห์แปลผลข้อมูล - การวิเคราะห์ แปลผลและการนำเสนอข้อมูลโดยใช้สถิติบรรยาย - การวิเคราะห์ แปลผลและการนำเสนอข้อมูลโดยใช้สถิติอ้างอิง - การประมวลผลข้อมูล
สถิติ (Statistics) เครื่องมือสำคัญสำหรับการวิเคราะห์ข้อมูล คือ “สถิติ” ข้อมูลหรือข้อเท็จจริงที่อาจเป็นตัวเลขหรือตัวอักษรก็ได้ ที่เก็บรวบรวมมาได้ โดยเดิมนั้นสถิติมีรากศัพท์มาจากคำว่า State คือ Facts of state ซึ่งหมายถึง ข้อมูลที่เกี่ยวข้องหรือเป็นประโยชน์ต่อการบริหารงานของรัฐ
ศาสตร์ที่ว่าด้วยการหาข้อเท็จจริง ด้วยการรวบรวมข้อมูลแล้วนำมาวิเคราะห์เพื่อหาข้อสรุป โดยมีกระบวนการศึกษาข้อมูล 4 ขั้นตอน คือ 1.การเก็บรวบรวมข้อมูล Data collection 2.การประมวลและนำเสนอข้อมูล Data Processing & Presentation 3.การวิเคราะห์ข้อมูล Data Analysis 4.การตีความข้อมูล Data Interpretation
ประเภทของสถิติ สถิติเชิงพรรณนา หรือสถิติบรรยาย Descriptive Statistics สถิติเชิงอนุมาน หรือสถิติอ้างอิง Inferential Statistics
หลักเกณฑ์พื้นฐานเกี่ยวกับการวัด ระดับการวัดมี 2 ประเภท 1. การวัดเชิงคุณภาพ Qualitative scale ข้อมูลที่วัดจะมีลักษณะไม่ต่อเนื่องกัน (category scale) แบ่งระดับการวัดออกได้ 2 ระดับ 2. การวัดเชิงปริมาณ Quantitative scale ข้อมูลที่วัดจะมีลักษณะต่อเนื่องกัน (continuous scale)
ระดับการวัด มาตรานามบัญญัติ norminal or classificatory scale คุณสมบัติ : เป็นตัวเลข จัดแบ่งกลุ่ม ประเภทตามที่ผู้วิจัยต้องการศึกษา เช่น เพศ (ชาย =1 ,หญิง =2) สถิติที่ใช้ : ความถี่ ร้อยละ สัดส่วน ฐานนิยม การทดสอบไคสแควร์ การทดสอบสัดส่วน-ประชากร
มาตราเรียงลำดับ Ordinal or ranking scale คุณสมบัติ : เป็นตัวเลขที่แบ่งกลุ่มประเภทได้ และสามารถบอกความมากน้อยของแต่ละกลุ่มได้ เช่น ระดับการศึกษา (ประถม = 1 , มัธยม = 2 , อุดมศึกษา = 3) สถิติที่ใช้ : ความถี่ ร้อยละ ฐานนิยม มัธยฐาน เปอร์เซ็นต์ไทล์ ไคสแควร์ สหสัมพันธ์ตำแหน่งของสเปียร์แมน
มาตราอันตรภาค Interval scale คุณสมบัติ : เป็นตัวเลขหรือคะแนนที่ใช้วัดแต่ละช่วงแบ่งที่มีขนาดเท่ากัน “ไม่มีจุดศูนย์แท้” มากน้อยกว่ากันเท่าไรไม่ทราบ เช่น อุณหภูมิ 28.5°c คะแนนความรู้เรื่องโรคเอดส์ 65% สถิติที่ใช้ : ความถี่ ร้อยละ ค่าเฉลี่ย ฐานนิยม มัธยฐาน ค่าการกระจาย(พิสัย ค่าเบี่ยงเบนมาตรฐาน ความแปรปรวน สปส.ความผันแปร) การวิเคราะห์ความแปรปรวน
มาตราอัตราส่วน Ratio scale คุณสมบัติ : มีครบถ้วนทุกระดับ “มีจุดศูนย์แท้” ทราบว่ามากน้อยกว่ากันเท่าไร เช่น ส่วนสูง 179 ซม. ระยะเวลาเป็น วินาที นาที ชั่วโมง วัน เป็นต้น สถิติที่ใช้ : เช่นเดียวกับมาตราอันตรภาค
สถิติบรรยาย เป็นสถิติที่ใช้วิเคราะห์เพื่อดูลักษณะทั่วไปของข้อมูลที่ได้จากกลุ่มตัวอย่างเพื่อให้ทราบลักษณะพื้นฐานของกลุ่มตัวอย่างว่าเป็นอย่างไร มีความคล้ายคลึงหรือแตกต่างจากที่คาดการณ์ไว้หรือไม่
สถิติบรรยายที่ใช้ในงานวิจัยทั่วไป การแจกแจงความถี่ การหาค่าร้อยละ การหาค่าสัดส่วน การวัดค่าตัวกลาง การวัดการกระจายของข้อมูล
1. การแจกแจงความถี่ (frequency distribution) เป็นการจัดตัวเลขให้เป็นหมวดหมู่ เพื่อให้ทราบว่าตัวเลขใด/ ข้อมูลใด ซ้ำกันบ้าง และซ้ำกันกี่ครั้ง วิธีการแจกแจงความถี่อาจแบ่งได้ 2 วิธีคือ 1.1 การแจกแจงความถี่ชนิดง่ายไม่จัดเป็นชั้นหรือกลุ่ม (ungrouped data) เป็นการเรียงข้อมูลที่ต่างกันไว้แล้วตรวจนับว่าข้อมูลที่ซ้ำกันมีกี่จำนวน ก็จะได้ความถี่ของข้อมูลแต่ละจำนวนนั้น
1.2 การแจกแจงความถี่แบบจัดข้อมูลเป็นชั้นหรือกลุ่ม (grouped data) เป็นการแจกแจงความถี่ที่นำข้อมูลมาเรียงจากน้อยไปมาก แล้วจัดข้อมูลเป็นกลุ่มหรือชั้น แล้วตรวจนับว่าในแต่ละชั้นมีจำนวนที่ซ้ำกันกี่จำนวน มีหลักการแจกแจงดังนี้
หาค่าต่ำสุด และสูงสุด หาค่าพิสัย (สูงสุด – ต่ำสุด) กำหนดขนาดของชั้นว่าจะให้กว้างเท่าใด (อันตรภาคชั้น) คำนวณหาจำนวนชั้น = ค่าพิสัย / อันตรภาคชั้น เขียนชั้นของข้อมูลให้ครอบคลุม ตรวจนับข้อมูลแต่ละชั้น ก็จะได้ความถี่ของแต่ละชั้น
2. การหาค่าร้อยละ (Percentage) การนำค่าความถี่หรือจำนวนนับของข้อมูลแต่ละประเภทมาเทียบกับฐานซึ่งมีค่า = 100 สูตรคำนวณ = ความถี่ (100) จำนวนรวมทั้งหมด หรือ = f (100) n
3. การหาค่าสัดส่วน (Proportion) การเปรียบเทียบค่าความถี่ของข้อมูลที่ผู้วิจัยสนใจกับจำนวนรวมทั้งหมด การหาค่าสัดส่วนใช้กับข้อมูลเชิงคุณภาพที่มีการวัดระดับนามบัญญัติ ที่มีการแจกแจงแบบทวินาม (binomial distribution) คือลักษณะที่ศึกษาแบ่งออกได้ 2 กลุ่ม เช่น การคลอดบุตรเป็นเพศชาย / หญิง เป็นต้น
สูตรคำนวณ ค่าสัดส่วนของตัวแปร = จำนวนความถี่ของข้อมูลที่สนใจ จำนวนข้อมูลทั้งหมด
4. การวัดค่าตัวกลาง หรือการวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นสิ่งที่บอกลักษณะเบื้องต้นของข้อมูล ตัวกลางที่นิยมใช้กันมากในงานวิจัย ได้แก่ 4.1 ตัวกลางเลขคณิต (arithmetic mean) 4.2 มัธยฐาน (median) 4.3 ฐานนิยม (mode)
4.1 ตัวกลางเลขคณิต (mean) เป็นข้อมูลที่อยู่ในระดับมาตราอันตรภาค หรืออัตราส่วน ข้อมูลชุดนั้นมีการกระจายปกติ ไม่มีคะแนนที่มีค่าสูงมาก หรือต่ำมาก
สูตร x = x n x = ค่าเฉลี่ย = ค่าสังเกตรวม x = ค่าสังเกตแต่ละค่า n = จำนวนค่าสังเกตทั้งหมด
4.2 มัธยฐาน (median) หมายถึง ค่าตัวกลางที่มีตำแหน่งอยู่ตรงกลางเมื่อเรียงข้อมูลตามลำดับจากน้อยไปมาก ซึ่งค่า มัธยฐานมักจะใช้เป็นตัวแทนของข้อมูลที่มีลักษณะดังนี้ เป็นข้อมูลที่อยู่ในระดับอันตรภาคหรืออัตราส่วน ข้อมูลชุดนั้นมีการกระจายเบ้ไปด้านใดด้านหนึ่ง
การหาตำแหน่งค่ามัธยฐาน จำนวนคี่ = (n + 1) 2 จำนวนคู่ = n
4.3 ฐานนิยม (mode) หมายถึง ค่าคะแนนหรือค่าข้อมูลที่มีความถี่สูงสุด หรือมีจำนวนสูงสุดในข้อมูลชุดนั้น ซึ่งค่าฐานนิยมใช้เป็นตัวแทนของข้อมูลที่มีลักษณะดังนี้ เป็นข้อมูลทุกระดับตั้งแต่นามบัญญัติขึ้นไป ข้อมูลที่มีการกระจายทุกลักษณะ
5. การวัดการกระจายของข้อมูล เป็นวิธีการทางสถิติเพื่อหาค่าที่นำมาอธิบายความแตกต่างหรือความใกล้เคียงกันของค่าคะแนนในข้อมูลแต่ละชุด วิธีการวัดการกระจายของข้อมูลมีหลายวิธี ได้แก่ พิสัย (range) คือค่าความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูล ตัวอย่างการหาค่าพิสัย พิสัยอายุผู้ป่วย คือ 72-14 = 58 ปี
5.2 ค่าเบี่ยงเบนมาตรฐาน (standard diviation : SD) คือ ค่าที่บอกว่าข้อมูลชุดนั้นมีการกระจายหรือเบี่ยงเบนไปจากค่าเฉลี่ย โดยเฉลี่ยเป็นจำนวนเท่าใด ค่าเบี่ยงเบนมาตรฐานเป็นค่าการวัดการกระจายที่นิยมใช้มากที่สุด โดยใช้ควบคู่กับค่าเฉลี่ย
สถิติอ้างอิง สถิติที่ใช้ในการวิเคราะห์ข้อมูลจากกลุ่มตัวอย่างที่ได้ เพื่อนำไปอ้างอิงยังกลุ่มประชากรที่มีลักษณะเช่นเดียวกับกลุ่มตัวอย่าง หรือประชากรเป้าหมาย
การใช้สถิติอ้างอิงทำได้ 2 ลักษณะ คือ การทดสอบสมมติฐาน การประมาณค่าประชากร หรือค่าพารามิเตอร์ งานวิจัยทางการพยาบาลส่วนใหญ่จะใช้สถิติอ้างอิงในการทดสอบสมมติฐาน
การทดสอบสมมติฐาน (hypothesis testing) เป็นขบวนการทดสอบสมมติฐานทางสถิติ (statistical hypothesis) เพื่อนำไปสู่การสรุป ตัดสินใจว่าสมมติฐานการวิจัย (research hypothesis) ที่ตั้งไว้เกี่ยวกับประชากรที่ศึกษานั้น ถูกต้องเป็นจริงหรือไม่ อย่างไร
สมมติฐานการวิจัย : การคาดคะเนคำตอบของปัญหาการวิจัย สมมติฐานทางสถิติ : เขียนขึ้นในรูปของประโยคสัญลักษณ์ทางคณิตศาสตร์ เพื่อให้สามารถทดสอบโดยใช้วิธีการทางสถิติได้
การทดสอบสมมติฐานทางสถิติ สมมติฐานศูนย์/ไม่แตกต่าง (null hypothesis : Ho) ไม่มีความแตกต่างหรือไม่มีความสัมพันธ์ระหว่างตัวแปรที่ศึกษา เช่น Ho : µ 1 = µ2 หรือ µ 1 - µ2 = 0 สมมติฐานเลือก (altertive hypothesis :H1, Ha) การทดสอบแบบสองทาง H1 : µ 1 µ2 หรือ µ 1 - µ2 0 การทดสอบแบบทางเดียว H1 : µ 1 > µ2 หรือ µ 1 < µ2
ศัพท์ที่เกี่ยวข้องกับการทดสอบสมมติฐาน ระดับนัยสำคัญ (Level of significance) ค่าวิกฤต (critical value) ความน่าจะเป็น ความคาดเคลื่อนจากการทดสอบฯ ชั้นแห่งความเป็นอิสระ (degree of freedom) ทิศทางการทดสอบสมมติฐาน
ระดับนัยสำคัญ (Level of significance) ความมีนัยสำคัญ (alpha) = การกำหนดขอบเขตของความคาดเคลื่อนที่ยอมให้เกิดในการทดสอบสมมติฐาน โดยทั่วไป = .05 หรือ .01
ค่าวิกฤต critical value & ขอบเขตวิกฤต ขอบเขตของการตัดสินใจว่าจะปฏิเสธหรือยอมรับ H1 ขึ้นอยู่กับ ค่าสถิติจากตารางภายใต้เงื่อนไขของการใช้สถิตินั้นๆ ชนิดของการทดสอบว่าเป็นทางเดียวหรือสองทาง ระดับความมีนัยสำคัญที่กำหนดไว้
ยอมรับ Ho ค่าวิกฤต
การตัดสินใจยอมรับ Ho หรือปฏิเสธ Ho ค่าวิกฤต คอมพิวเตอร์ P > .05 P ≤ .05
ความคาดเคลื่อนจากการทดสอบสมมติฐาน มี 2 แบบ Type І error : α Type П error : β การตัดสินใจ Ho เป็นจริง Ho ไม่จริง เชื่อตาม Ho ตัดสินใจถูก ผิดพลาดแบบ 2 β ไม่เชื่อตาม Ho ผิดพลาดแบบ 1 α
ชั้นแห่งความเป็นอิสระ จำนวนข้อมูลที่มีความเป็นอิสระในการถูกเลือก การคำนวณ ถ้าข้อมูล 1 มิติ df = n-1 ถ้าข้อมูล 2 มิติ df = (r-1) (c-1) r = row, c = colum
การวิเคราะห์ข้อมูลด้วยสถิติ การเปรียบเทียบ t-test , one way ANOVA การหาความสัมพันธ์ correlation การทดสอบไคสแควร์
การวิเคราะห์ข้อมูลด้วย t-test ข้อมูลหรือตัวแปรที่ศึกษาต้องอยู่ในระดับการวัดเป็นระดับช่วง หรือมาตราอันตรภาคขึ้นไป ต้องการทดสอบค่าเฉลี่ยของข้อมูลแต่ไม่เกิน 2 กลุ่ม ตัวอย่างนั้นต้องได้มาจากการสุ่ม และมีการกระจายเป็นโค้งปกติ จำนวนตัวอย่างไม่ควรต่ำกว่า 10
การทดสอบค่าเฉลี่ยหนึ่งกลุ่มตัวอย่าง (one sample t-test) เป็นการทดสอบว่าค่าเฉลี่ยของข้อมูลเพียง 1 กลุ่ม แตกต่างจากค่าเฉลี่ยของกลุ่มประชากรที่เคยศึกษาหรือระบุไว้หรือไม่
การแปลผล : ยอมรับ H1 (P< .05)
การทดสอบค่าเฉลี่ย 2 กลุ่มตัวอย่าง กลุ่มตัวอย่างที่เป็นอิสระจากกัน (Independent sample t-test) ข้อตกลงเบื้องต้น กลุ่มตัวอย่างทั้ง 2 กลุ่มได้สุ่มเลือกมาอย่างอิสระจากกัน ประชากรของกลุ่มตัวอย่างมีการกระจายแบบโค้งปกติ ความแปรปรวนของกลุ่มตัวอย่างทั้ง 2 กลุ่ม เท่ากัน
ความแปรปรวนไม่เท่ากัน : p< .05
กลุ่มตัวอย่างที่ไม่เป็นอิสระจากกัน (dependent or related or paired sample t-test) ข้อมูลที่เก็บรวบรวมได้ไม่เป็นอิสระจากกัน อาจโดยวิธีจับคู่ระหว่างกลุ่มที่มีลักษณะคล้ายคลึงกัน เช่น ฝาแฝดเหมือน หรือกลุ่มตัวอย่างชุดเดียวกันที่ทำการศึกษา 2 ครั้ง เช่น การทดสอบก่อนและหลังการทดลอง การวัดความดันโลหิตก่อนและหลังให้ยา
ตารางเปรียบเทียบคะแนนความรู้หลังให้ความรู้ ผลการวิเคราะห์ ตารางเปรียบเทียบคะแนนความรู้หลังให้ความรู้ คะแนน N x SD t Sig ก่อนให้ความรู้ 170 13.15 3.427 2.039 .043 หลังให้ความรู้ 13.38 3.256 จากตารางแสดงคะแนนความรู้ก่อนให้ความรู้มีค่าเฉลี่ย 13.15 ส่วนเบี่ยงเบนมาตรฐาน 3.427 ส่วนคะแนนควานรู้หลังให้ความรู้มีค่าเฉลี่ย 13.38 ส่วนเบี่ยงเบนมาตรฐาน 3.256 การแปลผล จากตารางหมายความค่าเฉลี่ยคะแนนความรู้ก่อนและหลังให้ความรู้แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 (t = 2.039 p = .043)
การวิเคราะห์ความแปรปรวนทางเดียว One – way analysis of variance : One-way ANOVA ข้อตกลงเบื้องต้น เป็นการทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่มขึ้นไป ตัวแปรต้น : norminal ขึ้นไป ตัวแปรตาม : interval ขึ้นไป 3. กลุ่มตัวอย่างแต่ละกลุ่มต้องมีอิสระจากกัน 4. ความแปรปรวนของประชากรเท่ากัน
การแปลผล : ไม่แตกต่าง p > .05
การหาความสัมพันธ์ การวิเคราะห์สหสัมพันธ์ (correlation) สหสัมพันธ์ เป็นวิธีทางสถิติเพื่อศึกษาความสัมพันธ์ระหว่างข้อมูล 2 ชุด ซึ่งข้อมูลทั้งสองชุดต้องเป็นข้อมูลเชิงปริมาณ
สัมประสิทธ์สหสัมพันธ์ (correlation coefficient : r)
สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน Pearson product-moment correlation coefficient) ข้อตกลงเบื้องต้น ต้องการศึกษา คสพ.ระหว่างตัวแปร 2 ตัว (ต้น,ตาม) ตัวอย่างได้จากการสุ่ม ตัวแปรทั้ง 2 มีการวัดอยู่ในระดับช่วง (interval) การกระจายของประชากรเป็นโค้งปกติ ตัวแปรทั้ง 2 มี คสพ. เป็นแบบเส้นตรง
ระดับความสัมพันธ์ของค่าสหสัมพันธ์ (Hinkle, 1988) ค่า r ระดับความสัมพันธ์ 0.00-0.30 ต่ำมาก 0.31-0.50 ต่ำ 0.51-0.70 ปานกลาง 0.71-0.90 สูง 0.91-1.00 สูงมาก
การแปลผล : ไม่มีความสัมพันธ์กัน p > .05
การทดสอบไคสแควร์ (Chi-square test : :λ2 Tests) การทดสอบไคสแควร์ เป็นวิธีการทดสอบทางสถิติอย่างหนึ่งสำหรับข้อมูลไม่ต่อเนื่องที่มีการวัดระดับมาตรานามบัญญัติ โดยนำข้อมูลที่รวบรวมได้มาจัดกลุ่มเพื่อหาค่าความถี่หรือจำนวนนับของแต่ละกลุ่มแล้วจึงนำความถี่ไปทำการทดสอบ
ข้อตกลงเบื้องต้นในการใช้สถิติไคสแควร์ ข้อมูลอยู่ในรูปของความถี่ ใช้กับข้อมูลในระดับนามมาตราหรืออันดับมาตรา ซึ่งเป็นข้อมูลที่มีลักษณะแยกจากกัน เมื่อใช้ไคสแควร์ทดสอบ (กรณีกลุ่มตัวอย่างมากกว่า 1 กลุ่ม ) ควรคำนึงถึง 3.1 ค่าความถี่จากความคาดหวัง (E) ในแต่ละเซลล์(cell) ควรมีค่ามากกว่า 5 หรือต่ำกว่า 5 ไม่เกิน 20% 3.2 กลุ่มตัวอย่างที่ต้องการทดสอบควรมีความเป็นอิสระต่อกัน
ข้อควรระวังในการวิเคราะห์ข้อมูล วิธีการเก็บรวบรวมข้อมูลที่ขาดประสิทธิภาพ การใช้ศัพท์เฉพาะที่ขาดความคงเส้นคงวา เลือกตัวอย่าง : ขาดความเป็นตัวแทนที่ดี เลือกวิธีวิเคราะห์ไม่เหมาะสมกับข้อมูล ผิดข้อตกลงเบื้องต้นในการนำสถิตินั้นมาใช้ สรุปผิด การนำเสนอขาดความชัดเจน ระวัง !!! การใช้ข้อมูลทุติยภูมิ
การประมวลผลข้อมูล การประมวลผลข้อมูล (data processing) หมายถึง การนำข้อมูลที่ได้จากการจัดเก็บรวบรวม ข้อมูลจากกลุ่มตัวอย่าง มาตรวจสอบความถูกต้องสมบูรณ์ของข้อมูล โดยจัดให้อยู่ในระเบียบวิธีที่เหมาะสม และพร้อมที่จะนำไปวิเคราะห์หาคำตอบตามปัญหาการวิจัย หรือนำผลที่ได้ใช้ไปตัดสินใจตามวัตถุประสงค์การวิจัยที่กำหนดไว้ (เพชรน้อย สิงห์ช่างชัย ,ศิริพร ขัมภลิขิต และทัศนีย์ นะแส ,2539)
การลงรหัสข้อมูล : Code book ส่วนที่ 1 ข้อมูลส่วนบุคคล อายุ..... ปี ; age (จำนวนจริง) สถานภาพสมรส ; mar 1 = โสด 2 = คู่ 3 = หม้าย 4 = หย่า 5 = แยก 3. รายได้ ; income 1 = 1000-3000 บาท/เดือน 2 = 3001-6000 บาท/เดือน 3 = มากกว่า 6000 บาท/เดือน
โครงสร้างแฟ้มข้อมูล 1 อายุ 2 สถานภาพสมรส 1-5 3 รายได้ 1-3 A1 4 X,SD A2 ส่วนที่ ข้อที่ ชื่อตัวแปร ใช้คอลัมภ์ ที่ จำนวนหลักในแต่ละคอลัมภ์ ขอบเขตของตัวแปร สถิติที่ต้องการหา 1 อายุ 2 18-60 N,ร้อยละ สถานภาพสมรส 1-5 3 รายได้ 1-3 A1 4 X,SD A2 5 A3 6 20 A20 23
ตัวอย่างตารางเปล่า (dummy table) ตารางที่ 1 จำนวนและร้อยละของกลุ่มตัวอย่างจำแนกตามข้อมูลทั่วไป ข้อมูลทั่วไป จำนวน (n= 50) ร้อยละ เพศ ชาย หญิง ชั้นปีที่ศึกษา ปี 1 ปี 2 ปี 3 ปี 4
แบบฝึกหัด