Quality Testing of Tests การหาคุณภาพของแบบทดสอบ
ปัจจัยที่สำคัญที่เกี่ยวข้องกับคุณภาพของแบบทดสอบ มี 5 องค์ประกอบ คือ ความเที่ยงตรง (Validity) ความเชื่อมั่น (Reliability) ความยากง่าย (Difficulty) อำนาจจำแนก (Discrimination) ความเป็นปรนัย (Objectivity)
ความเที่ยวตรง (Validity) ประกอบด้วย 4 ส่วน ความเที่ยงตรงตามเนื้อหา (Content Validity) ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ความเที่ยงตรงตามสภาพ (Concurrent Validity) ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity)
ความเที่ยงตรงตามเนื้อหา (Content Validity) ระดับความสามารถของแบบทดสอบที่วัดในเนื้อหาที่ต้องการจะวัด การทดสอบความเที่ยงตรงตามเนื้อหาโดยผู้เชี่ยวชาญในลักษณะนี้ เรียกว่า การหาค่าความสอดคล้องระหว่างวัตถุประสงค์กับแบบทดสอบ IOC (Index of Item-Objective Congruence)
ความเที่ยงตรงตามเนื้อหา (Content Validity) เกณฑ์การให้คะแนนเพื่อหาค่า IOC ของผู้เชี่ยวชาญกำหนดเป็น 3 ระดับ คือ แบบทดสอบหรือข้อสอบที่ถือว่ามีความเที่ยงตรงตามเนื้อหาในระดับดี สามารถนำไปวัดผลได้ จะต้องมีค่า IOC >= 0.5
ความเที่ยงตรงตามเนื้อหา (Content Validity) ตัวอย่างแบบทดสอบเพื่อหาค่า IOC และการแปลผล
ความเที่ยงตรงตามเนื้อหา (Content Validity)
ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ความสามารถของแบบทดสอบที่วัดได้ตามลักษณะคุณสมบัติ ทฤษฎี และประเด็นต่างๆของโครงสร้างนั้น ที่อธิบายพฤติกรรมต่างๆ มี 2 วิธี การหาค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) การเปรียบเทียบกับกลุ่มที่มีลักษณะที่ต้องการวัดอย่างเด่นชัด (Know Group Technique)
ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ขอเสนอ 2 วิธี วิธีของคาร์เวอร์ (Carver Method) วิธีการหาค่าสหสัมพันธ์แบบฟี (Phi-Correlation)
ความเที่ยงตรงตามโครงสร้าง (Construct Validity) วิธีของคาร์เวอร์ (Carver Method) ทำได้โดยการนำแบบทดสอบที่สร้างขึ้นไปทดสอบกับกลุ่มผู้เรียนที่เรียนแล้วกับกลุ่มผู้เรียนที่ยังไม่เคยเรียน
ตัวอย่าง
ความเที่ยงตรงตามโครงสร้าง (Construct Validity) วิธีการหาค่าสหสัมพันธ์แบบฟี (Phi-Correlation) ทำได้โดยการหาความสัมพันธ์ของผู้เรียน 2 กลุ่ม คือ 1)กลุ่มผู้เรียนที่ยังไม่ได้รับการสอนหรือไม่ได้สอบก่อนเรียน กับ 2) กลุ่มผู้เรียนที่เรียนแล้วหรือผ่านการสอบหลังเรียนแล้ว
ตัวอย่าง
ความเที่ยงตรงตามสภาพ (Concurrent Validity) แบบทดสอบที่สามารถวัดได้ตามสภาพความเป็นจริงของกลุ่มตัวอย่าง การทดสอบทำได้โดยนำคะแนนของแบบทดสอบที่สร้างขึ้นใหม่ไปหาค่าสหสัมพันธ์กับคะแนนของแบบทดสอบเดิมที่มีความเที่ยงตรง
ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity) การหาความสัมพันธ์ระหว่างคะแนนผลการสอบกับเกณฑ์ของความสำเร็จที่จะเกิดขึ้นในอนาคต โดยใช้คะแนนผลการสอบในการพยากรณ์ในอนาคต การทดสอบทำได้โดยการสร้างความสัมพันธ์ระหว่างคะแนนที่ได้จากแบบทดสอบกับเกณฑ์ที่ใช้ในการวัดความสำเร็จ
ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity)
ความเชื่อมั่น (Reliability) ความคงที่ ความมั่นคง หรือความสม่ำเสมอของผลการวัด สามารถหาได้หลายวิธี การทดสอบซ้ำ (Test-Retest Reliability) การทดสอบแบบใช้ข้อสอบเหมือนกัน (Equivalent-Forms Reliability) การทดสอบแบบแบ่งครึ่ง (Split-Half Reliability) การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21 การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)
การทดสอบซ้ำ (Test-Retest Reliability) เป็นการทดสอบหาความเชื่อมั่นของแบบทดสอบโดยการทำแบบทดสอบฉบับเดียวกัน 2 ครั้งในเวลาต่างกัน จากนั้นไปหาค่าสหสัมพันธ์
การทดสอบแบบใช้ข้อสอบเหมือนกัน (Equivalent-Forms Reliability) การหาความเชื่อมั่นวิธีนี้ทำได้โดยใช้แบบทดสอบ 2 ฉบับที่เหมือนกัน ทำในระยะเวลาที่ห่างกันเพียงเล็กน้อยแบบทดสอบที่เหมือนกันในที่นี้หมายความว่าทั้งสอบวัดในสิ่งเดียวกัน จำนวนข่อเท่ากัน มีโครงสร้างเหมือนกัน มีความยากง่ายในระดับเดียวกัน มีวิธีการทดสอบ การตรวจให้คะแนนและการแปลความหมายของคะแนนเหมือนกัน จากนั้นจึงนำคะแนนจากผลการทดสอบทั้ง 2 ฉบับไป หาค่าสหสัมพันธ์
การทดสอบแบบแบ่งครึ่ง (Split-Half Reliability) หาได้โดยการทดสอบเพียงครั้งเดียวโดยใช้แบบทดสอบเพียงฉบับเดียว จากนั้นแบ่งออกเป็น 2 ส่วน คือ ข้อคู่ กับ ข้อคี่ แล้วจึงนำไปหาค่าสหสัมพันธ์
ตัวอย่าง
ตัวอย่าง
การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21
การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21
ตัวอย่าง
ตัวอย่าง
ตัวอย่าง
ตัวอย่าง
การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)
การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)
ตัวอย่าง
ตัวอย่าง
การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ โดยเฉพาะแบบทดสอบที่ใช้ในการเรียนการสอน มีหลายวิธี ขอเสนอ 2 วิธี วิธีของคาร์เวอร์ (Carver Method) วิธีของแฮมเบิลตันและโนวิก (Hambleton and Novick method)
การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ วิธีของคาร์เวอร์ (Carver Method) เป็นวิธีการหาความเชื่อมั่นแบบสอดคล้องในการตัดสินใจ โดยการทดสอบกับผู้เรียนกลุ่มเดียวกันจำนวน 2 ครั้ง หรือใช้แบบทดสอบคู่ขนานจำนวน 2 ฉบับแล้วทดสอบเพียงครั้งเดียว
ตัวอย่าง
การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ วิธีของแฮมเบิลตันและโนวิก (Hambleton and Novick method) เป็นวิธีการหาความเชื่อมั่นแบบสอดคล้องในการตัดสินใจ โดยการทดสอบกับผู้เรียนกลุ่มเดียวกันจำนวน 2 ครั้ง หรือใช้แบบทดสอบคู่ขนานจำนวน 2 ฉบับแล้วทดสอบเพียงครั้งเดียว
ตัวอย่าง
ความยากง่าย (Difficulty)
ความยากง่าย (Difficulty)
ความยากง่าย (Difficulty)
ตัวอย่าง
อำนาจจำแนก (Discrimination)
อำนาจจำแนก (Discrimination) การหาค่าอำนาจจำแนก มีหลายวิธี คือ การใช้วิธีการตรวจให้คะแนน การใช้สูตรสัดส่วน การใช้ค่าสหสัมพันธ์แบบพอยท์-ไบซีเรียล (Point-Biserial Correlation) การใช้ตารางสำเร็จของจุงเตฟาน (Chung The Fan)
อำนาจจำแนก (Discrimination) การใช้วิธีการตรวจให้คะแนน
ตัวอย่าง
อำนาจจำแนก (Discrimination) การใช้สูตรสัดส่วน
ตัวอย่าง
อำนาจจำแนก (Discrimination) การใช้ค่าสหสัมพันธ์แบบพอยท์-ไบซีเรียล (Point-Biserial Correlation)
ตัวอย่าง
ตัวอย่าง
ความเป็นปรนัย (Objectivity) ความชัดเจนของแบบทดสอบที่ทุกคนอ่านแล้วตีความตรงกัน รวมทั้งการตรวจให้คะแนนมีเกณฑ์ที่แน่นอนไม่ว่าผู้ใดจะเป็นผู้ตรวจก็ตาม ลักษณะของแบบทดสอบที่มีความเป็นปรนัย จะเกี่ยวข้องกับ 3 องค์ประกอบ ได้แก่ ความแจ่มชัดในความหมายของแบบทดสอบ ความแจ่มชัดในวิธีตรวจหรือมาตรฐานการให้คะแนน ความแจ่มชัดในการแปลความหมายของคะแนน
การหาคุณภาพของแบบทดสอบสำหรับบทเรียนคอมพิวเตอร์ แบบทดสอบที่ใช้สำหรับการประเมินผลระหว่างดำเนินการ (Formative Evaluation) แบบทดสอบก่อนบทเรียน (Pretest) แบบทดสอบระหว่างเรียน (Exercise) แบบประเมินผลอื่นๆ เช่น ใบงาน การบ้าน แบบทดสอบที่ใช้สำหรับการประเมินผลสรุป (Summative Evaluation)
ขั้นตอนการหาคุณภาพ ของแบบทดสอบสำหรับ บทเรียนคอมพิวเตอร์
สรุป
Quality Testing of Tests จบการบรรยาย คำถาม
แบบฝึกหัด หน้า 233 -234 ข้อ 14 – 15