การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis) ดร.ชนาธิป ทุ้ยแป สำนักทดสอบทางการศึกษา สพฐ.
1. คุณลักษณะของแบบทดสอบที่ดี การวิเคราะห์คุณภาพแบบทดสอบ 2. วิธีการวิเคราะห์แบบทดสอบ 2.1 วิธีการวิเคราะห์โดยไม่ใช้วิธีการทางสถิติ 2.1 วิธีการวิเคราะห์โดยใช้วิธีการทางสถิติ
1. คุณลักษณะของแบบทดสอบที่ดี 1. ความตรง/ความเที่ยงตรง (validity) 2. ความเที่ยง/เชื่อมั่น (reliability) 3. ความยากง่าย (difficulty) 4. อำนาจจำแนก (discrimination ) 5. เป็นปรนัย (objectivity)
ประเภทของความเที่ยงตรง 1.1 ความตรง/เที่ยงตรง (Validity) 1. ความตรงตามเนื้อหา (Content Validity) เนื้อหาของเครื่องมือ หรือเนื้อหาของข้อคำถามวัดได้ตรง ตามประเด็นหรือตัวชี้วัดที่ต้องการวัดหรือไม่? 2. ความตรงเชิงโครงสร้าง (Construct Validity) เครื่องมือนั้นสามารถวัดได้ครอบคลุมขอบเขต ความหมาย หรือครบตามคุณลักษณะประจำตามทฤษฎีที่ใช้สร้าง เครื่องมือหรือไม่? ความถูกต้องแม่นยำของเครื่องมือในการวัดสิ่งที่ต้องการจะวัด
ประเภทของความตรง (ต่อ) 1.1 ความตรง/เที่ยงตรง (Validity) 3. ความตรงตามเกณฑ์สัมพันธ์ (Criterion-related Validity) เครื่องมือวัดได้ตรงตามสภาพที่ต้องการวัด โดย พิจารณาจากเกณฑ์ที่เกี่ยวข้องว่าเครื่องมือนั้นจะใช้ทำนาย พฤติกรรมของบุคคลในสภาพเฉพาะเจาะจงตามต้องการ หรือไม่? จำแนกได้ 2 ชนิด คือ 3.1 ความตรงร่วมสมัยหรือตามสภาพที่เป็นจริง (Concurrent Validity) สอดคล้องกับสภาพความเป็น จริงในปัจจุบัน 3.2 ความตรงเชิงทำนาย (Predictive Validity) สอดคล้องกับสภาพความเป็นจริง หรือสภาพ ความสำเร็จในอนาคต
1.2 ความเที่ยง/เชื่อมั่น (Reliability) ความคงที่หรือความคงเส้นคงวาของผลที่ ได้จากการวัด ประเภทค่าความเที่ยง 1. การสอบซ้ำ (Test-retest) 2. การวัดความสอดคล้องภายใน (Measure of Internal Consistency) 1 วิธีแบ่งครึ่งข้อสอบ (Split-half) 2 วิธีของ Kuder-Richardson (Kr20, Kr21) สำหรับแบบสอบที่ 2 วิธีของ Kuder-Richardson (Kr20, Kr21) สำหรับแบบสอบที่ให้ คะแนนแบบ วิธีสัมประสิทธ์แอลฟาของ Cronbach (Cronbach’s alpha ( ) method) สำหรับแบบสอบที่ให้ 3 วิธีสัมประสิทธ์แอลฟาของ Cronbach (Cronbach’s alpha ( ) method) สำหรับแบบสอบที่ให้คะแนนแบบ 0-1 หรือ มากกว่า 1
1.3 ความยากง่าย (Difficulty) ความยากง่ายของแบบทดสอบมีความ เหมาะสมกับความสามารถของผู้สอบ ซึ่งพิจารณาจาก สัดส่วน หรือเปอร์เซ็นต์ ของจำนวนคนที่ตอบข้อสอบข้อนั้นถูกจาก คนที่สอบทั้งหมด ความยากง่ายของแบบทดสอบมีความ เหมาะสมกับความสามารถของผู้สอบ ซึ่งพิจารณาจาก สัดส่วน หรือเปอร์เซ็นต์ ของจำนวนคนที่ตอบข้อสอบข้อนั้นถูกจาก คนที่สอบทั้งหมด
1.4 อำนาจจำแนก (Discrimination) ความสามารถของข้อสอบแต่ละข้อ ในการจำแนกคนที่อยู่ในกลุ่มเก่งออก จากคนที่อยู่ในกลุ่มอ่อนได้ ซึ่งพิจารณาจากผลต่างของสัดส่วน ของกลุ่มเก่งที่ตอบถูกกับกลุ่มอ่อนที่ ตอบถูก ความสามารถของข้อสอบแต่ละข้อ ในการจำแนกคนที่อยู่ในกลุ่มเก่งออก จากคนที่อยู่ในกลุ่มอ่อนได้ ซึ่งพิจารณาจากผลต่างของสัดส่วน ของกลุ่มเก่งที่ตอบถูกกับกลุ่มอ่อนที่ ตอบถูก
ความชัดเจนของแบบทดสอบหรือคำถามที่ทุกคน เข้าใจตรงกัน รวมทั้งการตรวจให้คะแนนมีเกณฑ์ที่ แน่นอน ความเป็นปรนัย มีองค์ประกอบ 3 ประการ : 1.โจทย์หรือข้อคำถาม 2.วิธีการตรวจให้คะแนน 3.การแปลความหมายของคะแนน การหาความเป็นปรนัยที่นิยมปฏิบัติกัน คือ ให้ผู้เชี่ยวชาญพิจารณาและตรวจสอบ 1.5 ความเป็นปรนัย (Objectivity)
2. วิธีการวิเคราะห์คุณภาพแบบสอบ 2.2 การวิเคราะห์แบบสอบโดยใช้วิธีการทางสถิติ 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ
แนวทางการพิจารณา 1) การตรวจสอบความถูกต้องและครอบคลุมของ เนื้อหาวิชาและจุดมุ่งหมาย 1) ข้อคำถามครบถ้วนทุกเนื้อหาที่เรียนหรือไม่ 2) จำนวนข้อคำถามของแต่ละเนื้อหามีสัดส่วนตาม น้ำหนักที่กำหนดไว้หรือไม่ 3) ข้อคำถามแต่ละข้อวัดได้ตรงตามพฤติกรรมที่ระบุไว้ใน ตัวชี้วัดหรือไม่
วิธีดำเนินการ 1) ตรวจสอบโดยผู้เชี่ยวชาญในเนื้อหาวิชานั้นๆ 2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน ข้อคำถาม (test Blueprint) 2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน ข้อคำถาม (test Blueprint) 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ 1) การตรวจสอบความถูกต้องและครอบคลุมของ เนื้อหาวิชาและจุดมุ่งหมาย
แนวทางการพิจารณา 2) การตรวจสอบภาษาและความสอดคล้องกับเทคนิค การเขียนคำถาม 1) ข้อความที่ใช้เขียนเป็นข้อคำถามสามารถสื่อ ความหมายได้ดีเพียงไร 2) การเขียนข้อคำถามนั้นมีความถูกต้องตามเทคนิคใน การเขียนข้อคำถามที่ดีหรือไม่ 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ
วิธีดำเนินการ 1) ตรวจสอบโดยผู้เชี่ยวชาญทางด้านภาษา 2) ตรวจสอบโดยผู้เชี่ยวชาญทางด้านวัดผลการศึกษา (ถ้าหากไม่สามารถหาผู้เชี่ยวชาญเพื่อช่วยตรวจสอบได้ อย่างน้อยควรให้เพื่อนครู หรือตัวครูเองเป็นผู้ทำการ ตรวจสอบ) 2) การตรวจสอบภาษาและความสอดคล้องกับเทคนิค การเขียนคำถาม 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ
2) การวิเคราะห์ข้อสอบทั้งฉบับ 2.1) ความเที่ยงตรง (Validity) 2.2) ความเชื่อมั่น (Reliability) 2.1) ความเที่ยงตรง (Validity) 2.2) ความเชื่อมั่น (Reliability) 1) การวิเคราะห์ข้อสอบเป็นรายข้อ 1. 1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) 1.2) ค่าระดับความยากง่าย (Difficulty Index) 1.3) ค่าอำนาจจำแนก (Discrimination Power) 1. 1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) 1.2) ค่าระดับความยากง่าย (Difficulty Index) 1.3) ค่าอำนาจจำแนก (Discrimination Power) 2.2 การวิเคราะห์แบบสอบโดยใช้วิธีการทางสถิติ
1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) ให้ผู้เชี่ยวชาญตั้งแต่ 3 คนขึ้นไป ประเมินความ สอดคล้องระหว่างข้อคำถามในเครื่องมือกับเนื้อหาที่ ต้องการวัด จากนั้นนำผลการประเมินมาคำนวณค่า IOC โดยใช้สูตร IOC = RRRRN เกณฑ์ตัดสิน IOC ควรมีค่ามากกว่า 0.5 วิธีดำเนินการ เมื่อ R แทน ผลรวมของคะแนนจากผู้เชี่ยวชาญ 1) การวิเคราะห์ข้อสอบรายข้อ
ตัวอย่าง ตารางการหาค่า IOC ตัวชี้วัดตามมาตรฐาน ผลการประเมิน ผู้เรียนสามารถบอกถึงหน้าที่ หรือความแตกต่างของ ส่วนประกอบต่างๆของพืชได้ 01 ข้อสอบ 1.หน้าที่ของใบคืออะไร? ก. ยึดลำต้น ข. ดูดอาหาร ค. สังเคราะห์แสง ง. ลำเลียงอาหาร 2. ข้อใดเป็นพืชใบเลี้ยงคู่? ก. ข้าว ข. อ้อย ค. กล้วย ง. มะเขือ 1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) - 1 หมายถึง ไม่สอดคล้อง 0 หมายถึง ไม่แน่ใจ1 หมายถึง สอดคล้อง
ข้อคำถาม คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5 IOC ข้อ /5=0.8 ข้อ /5=-0.2 สรุป... ข้อสอบข้อ 1 มีความสอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม สามารถ นำไปใช้สอบได้ ข้อสอบข้อ 1 มีความสอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม สามารถ นำไปใช้สอบได้ ข้อสอบข้อ 2 ไม่สอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม ไม่ควรนำไปใช้ ต้องตัดทิ้ง หรือปรับปรุงใหม่ ข้อสอบข้อ 2 ไม่สอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม ไม่ควรนำไปใช้ ต้องตัดทิ้ง หรือปรับปรุงใหม่ ตัวอย่าง การคำนวณหาค่า IOC 1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) เกณฑ์การพิจารณา ข้อสอบที่ใช้ได้ คือ ข้อสอบที่มีค่า IOC ตั้งแต่.5 ขึ้นไป
1.2) ค่าระดับความยากง่าย (Difficulty Index) หมายถึง สัดส่วน หรือเปอร์เซ็นต์ของจำนวนคนที่ ตอบข้อสอบข้อนั้นถูกจากคนที่สอบทั้งหมด ใช้สัญลักษณ์ “p” ระดับความยากง่าย หมายถึง สัดส่วน หรือเปอร์เซ็นต์ของจำนวนคนที่ ตอบข้อสอบข้อนั้นถูกจากคนที่สอบทั้งหมด ใช้สัญลักษณ์ “p” 1) การวิเคราะห์ข้อสอบรายข้อ ข้อสอบแบบปรนัย (คะแนนแบบทวิภาค 0 กับ 1) ข้อสอบแบบอัตนัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)
ค่า p = หมายความว่า ข้อสอบข้อนั้นยากเกินไป ค่า p = หมายความว่า ข้อสอบข้อนั้นค่อนข้างยาก ค่า p = หมายความว่า ข้อสอบข้อนั้นยากง่ายปานกลาง ค่า p = หมายความว่า ข้อสอบข้อนั้นค่อนข้างง่าย ค่า p = หมายความว่า ข้อสอบข้อนั้นง่ายเกินไป เกณฑ์ในการแปลความหมายค่าความยากง่ายเกณฑ์ในการแปลความหมายค่าความยากง่าย เกณฑ์: ข้อสอบที่มีค่าความยากง่ายพอเหมาะ หรือมีคุณภาพดี ค่า p ใกล้เคียง.50 หรือ อยู่ระหว่าง 0.20 – ) ค่าระดับความยากง่าย (Difficulty Index) ค่าความยากง่าย (Difficulty Index) มีค่าตั้งแต่ 0.00 จนถึง 1.00 ค่าความยากง่าย (Difficulty Index) มีค่าตั้งแต่ 0.00 จนถึง 1.00
1.2) ค่าระดับความยากง่าย (Difficulty Index) (1) ค่าระดับความยากง่าย (Difficulty Index) ข้อสอบปรนัย Rแทน จำนวนคนที่ตอบข้อนั้นถูก Nแทนจำนวนคนที่สอบทั้งหมด R H แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มสูง R L แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มต่ำ N H แทนจำนวนคนในกลุ่มสูง N L แทนจำนวนคนในกลุ่มต่ำ
ข้อ กลุ่มสูง (R H ) (20 คน ) กลุ่มต่ำ (R L ) (20 คน ) P 1 ก 46 ข*ข* 93 (9+3)/40 = 0.3 ค 35 ง 64 รวม 20
2. แบ่งกลุ่มสูง (H) และกลุ่มต่ำ (L) 3. คำนวณสัดส่วนของคะแนนรวมรายข้อที่ได้จำแนกตามกลุ่ม p = —— —— P H + P L 2 1.2) ค่าระดับความยากง่าย (Difficulty Index) (2) ค่าระดับความยากง่าย (Difficulty Index) ข้อสอบอัตนัย 1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด 4. วิเคราะห์ค่าความยาก (p) P H = —— P L = —— LTLLTL HTHHTH H รวมคะแนนกลุ่มสูง L รวมคะแนน กลุ่มต่ำ T H รวมคะแนนเต็มกลุ่มสูง T L รวม คะแนนเต็มกลุ่มต่ำ
ข้อ คะแน นเต็ม กลุ่มสูง (H) (4 คน ) กลุ่มต่ำ (L) (4 คน ) รว ม
ข้ อ คะแ นน เต็ม กลุ่มสูง (4 คน ) กลุ่มต่ำ (4 คน ) PHPH PLPL PiPi เต็ม ข้อ 1 ง่ายเกินไป อำนาจ จำแนกต่ำ ข้อ 2 – ข้อ 4 เป็นข้อสอบที่ใช้ได้ ข้อ 5 ค่อนข้างยาก อำนา จำแนกต่ำ
อำนาจจำแนก หมายถึง ความสามารถของข้อสอบแต่ละข้อในการจำแนกคน ที่อยู่ในกลุ่มเก่งออกจากคนที่อยู่ในกลุ่มอ่อนได้ (ข้อสอบที่มีอำนาจจำแนกดี คนเก่งจะตอบถูก แต่คนอ่อนจะ ตอบผิด) ใช้สัญลักษณ์ “r” 1.3) ค่าอำนาจจำแนก (Discrimination power) 1) การวิเคราะห์ข้อสอบรายข้อ ข้อสอบแบบปรนัย (คะแนนแบบทวิภาค 0 กับ 1) ข้อสอบแบบอัตนัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)
ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกไม่ได้เลย ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้เล็กน้อย ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ปานกลาง ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ดี ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ดีมาก เกณฑ์ในการแปลความหมายค่าอำนาจจำแนกเกณฑ์ในการแปลความหมายค่าอำนาจจำแนก เกณฑ์: ข้อสอบที่มีคุณภาพดี ค่า r ตั้งแต่ ขึ้นไป 1.3) ค่าอำนาจจำแนก (Discrimination power) ค่าอำนาจจำแนก (Discrimination power) มีค่าตั้งแต่ จนถึง 1.00 ค่าอำนาจจำแนก (Discrimination power) มีค่าตั้งแต่ จนถึง 1.00
หมายเหตุ N H = N L R H แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มสูง R L แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มต่ำ N H แทนจำนวนคนในกลุ่มสูง N L แทนจำนวนคนในกลุ่มต่ำ ค่า r มีค่าตั้งแต่ -1 จนถึง +1 เกณฑ์การพิจารณา คือ r มีค่าตั้งแต่.2 ขึ้นไป เป็นลบ เมื่อคนกลุ่มอ่อนตอบถูกมากกว่าคนกลุ่มเก่ง เป็นบวก เมื่อคนกลุ่มเก่งตอบถูกมากกว่าคนกลุ่มอ่อน 1.3) ค่าอำนาจจำแนก (Discrimination power) (1) ค่าอำนาจจำแนก ข้อสอบปรนัย
ข้อ กลุ่มสูง (R H ) (20 คน ) กลุ่มต่ำ (R L ) (20 คน ) r 1 ก 46 ข*ข* 93 (9 - 3)/20 = 0.3 ค 35 ง 64 รวม 20
1.3) ค่าอำนาจจำแนก (Discrimination power) (2) ค่าอำนาจจำแนก ข้อสอบอัตนัย 1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด 2. แบ่งกลุ่มสูง (H) และกลุ่มต่ำ (L) 3. คำนวณสัดส่วนของคะแนนรวมรายข้อที่ได้จำแนกตามกลุ่ม 4. วิเคราะห์ค่าอำนาจจำแนก (r) P H = —— P L = —— H รวมคะแนนกลุ่มสูง L รวมคะแนน กลุ่มต่ำ T H รวมคะแนนเต็มกลุ่มสูง T L รวม คะแนนเต็มกลุ่มต่ำ r = P H – P L LTLLTL HTHHTH
ข้ อ คะแ นน เต็ม กลุ่มสูง (4 คน ) กลุ่มต่ำ (4 คน ) PHPH PLPL riri เต็ม ข้อ 1 ง่ายเกินไป อำนาจ จำแนกต่ำ ข้อ 2 – ข้อ 4 เป็นข้อสอบที่ใช้ได้ ข้อ 5 ค่อนข้างยาก อำนา จำแนกต่ำ
เกณฑ์ในการสรุปว่าข้อสอบมีคุณภาพดี ข้อสอบข้อนั้นต้องมีค่าความยากง่าย และค่าอำนาจจำแนกเป็นไปตามเกณฑ์ที่กำหนด ข้อ ที่ ตัวเลือก กลุ่มสูง (H=20) กลุ่มต่ำ (L=20) pr ความหมายสรุป ก 347/40 = 0.18(4-3)/20 = 0.05 (ข)(ข)13619/40 = 0.48(13-6)/20=0.35 ยากง่ายปานกลางใช้ได้ 1 ค -33/40 = 0.08(3-0)20 = 0.15 ง 246/40 = 0.15(4-2)/20 = 0.10 จ 235/40 = 0.13(3-2)/20 = 0.05 เกณฑ์: ตัวถูก p = 0.20 – 0.80 r = ขึ้นไป
การคัดเลือกข้อสอบที่มีคุณภาพ ค่าความยากง่าย (p) ค่าอำนาจจำแนก (r) เกณฑ์: ข้อสอบที่มีคุณภาพ p = 0.20 – 0.80 r = ขึ้นไป
ผู้เขียนข้อสอบต้องมีความรู้ในเนื้อหาที่มุ่ง วัดเป็นอย่างดี ผู้เขียนข้อสอบจะต้องมีความรู้เกี่ยวกับ ตัวชี้วัด / พฤติกรรมการเรียนรู้ ผู้เขียนข้อสอบต้องมีความเข้าใจ กลุ่มเป้าหมายของการวัด ผู้เขียนข้อสอบต้องมีความสามารถในการ ใช้ภาษาในการสื่อความหมาย ผู้เขียนข้อสอบจะต้องมีทักษะในสามารถ ใช้เทคโนโลยีสำหรับการเขียนข้อสอบ ผู้เขียนต้องสร้างข้อสอบที่ดีต้องมีความ ละเอียดรอบคอบและถูกต้อง คุณลักษณะของผู้เขียน ข้อสอบที่ดี
ก่อนอบรม หลังอบรม แบบที่ 1 แบบที่ 2 ความรู้ความเข้าใจของ ท่าน แบบที่ 3 แบบที่ 4
ข้อสอบที่มีคุณภาพ วัดได้ตรง ครอบคลุม ความสามารถของผู้เรียนและ มีการบริหารจัดการที่เหมาะสมแล้ว ผลการสอบจะมีคุณอนันต์นัก แต่เมื่อใดข้อสอบไร้ซึ่งคุณภาพ และนำผลไปตัดสินชีวิตคนนั้น การกระทำเช่นนี้จัดว่าเป็น “การทำบาปทางวิชาการที่ทำร้ายคนทั้งชีวิต”
... ไชโย... ได้กลับบ้าน แล้ว...