Quality Testing of Tests การหาคุณภาพของแบบทดสอบ

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
กระบวนการสร้างแบบทดสอบ
Advertisements

วัดตัวแปร(ตาม)การวิจัยในชั้นเรียน
การสร้างแบบทดสอบ อาจารย์ ปรีชา เครือวรรณ อาจารย์ สมพงษ์ พันธุรัตน์
กระบวนการสร้างแบบทดสอบ อาจารย์พิมพ์ทอง สังสุทธิพงศ์
รศ. ดร. สมศักดิ์ คงเที่ยง
อาจารย์สมพงษ์ พันธุรัตน์
การวิเคราะห์ข้อสอบ อาจารย์ปรีชา เครือวรรณ อาจารย์สมพงษ์ พันธุรัตน์
การออกแบบการวิจัยการเขียนเค้าโครงการวิจัย
การทดลองและการเขียนรายงานผลการทดลองทางวิทยาศาสตร์
ตามหลักสูตรการศึกษาขั้นพื้นฐาน พ.ศ. 2544
การสร้างและการหาคุณภาพเครื่องมือวิจัย
การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis)
หลักการพัฒนา หลักสูตร
ความตรง (validity) ความตรงตามเนื้อหา (content validity)
วิธีการเก็บรวบรวมข้อมูล
นางพัชราภรณ์ หงษ์สิบสอง และผู้ช่วยศาสตราจารย์นันทา เติมสมบัติถาวร
Objective Analysis การวิเคราะห์วัตถุประสงค์
คณะครุศาสตร์อุตสาหกรรม สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
การวิจัยสถาบัน ดร.จักษ์ พันธ์ชูเพชร
การวิเคราะห์ความเชื่อถือได้
การติดตาม และประเมินโครงการ.
4. Research tool and quality testing
วิธีการและเครื่องมือ ที่ใช้ในการวัดผล
บทที่ 6 สถิติที่ใช้ในการ วัดผลการศึกษา. การวิเคราะห์ข้อสอบ ก่อนนำไปใช้  จุดมุ่งหมาย เพื่อนำผลการวิเคราะห์ ไปเป็นข้อมูลในการ ปรับปรุงแก้ไขข้อสอบ ก่อนที่จะนำข้อสอบไปใช้
โครงร่างการวิจัย (Research Proposal)
วิธีการและเครื่องมือ ที่ใช้ในการวัดผล
การเขียนรายงานการใช้เอกสารประกอบการสอน
การวิเคราะห์ข้อสอบ Item analysis.
การเขียนแผนการสอน ด้านทฤษฎี 13. นายบัญญัติ สมสุพรรณ ครูเชี่ยวชาญ
การวิเคราะห์ข้อสอบ ดร.ปรัชญนันท์ นิลสุข
แบบสอบถาม ส่วนที่ 1 ข้อมูลทั่วไป (ด้านสังคมเศรษฐกิจ) ส่วนที่ 2 ความรู้
การตรวจสอบความเชื่อมั่น
วิธีการตรวจสอบ Content Validity
Criterion-related Validity
คุณภาพเครื่องมือวิจัย
บทที่ 7 การวิเคราะห์ความเชื่อถือได้
ความสำคัญและมโนทัศน์พื้นฐานของการวัดและประเมินผลการศึกษา
การวัดผล (Measurement)
แบบทดสอบอิงกลุ่มอิงเกณฑ์
การสร้างข้อสอบ ตามแนวการวัดใน PISA
หน่วยที่ 1 ความหมายและความสำคัญของเครื่องมือวัดผลสัมฤทธิ์ทางการเรียนแบบอัตนัยตามแนวทางการทดสอบระดับนานาชาติ (PISA)
การเขียนเกณฑ์การประเมิน (Rubric)
หลักสูตรพัฒนาความสามารถในการสร้างเครื่องมือ วัดผลสัมฤทธิ์ทางการเรียน
การตรวจสอบคุณภาพของเครื่องมือ วัดผลสัมฤทธิ์ทางการเรียนแบบอัตนัย
การตรวจสอบคุณภาพเครื่องมือ สำนักทดสอบทางการศึกษา สพฐ.
หน่วยที่ 5 การสร้างเครื่องมือวัดคุณลักษณะอันพึงประสงค์
การสร้างและการหาคุณภาพเครื่องมือวิจัย
ชื่อเรื่อง การใช้สื่อแบบฝึกทักษะภาพสามมิติเพื่อพัฒนาการเรียน การสอนหน่วยที่ 1 การบำรุงรักษาเครื่องยนต์เล็ก วิชางานเครื่องยนต์เล็ก รหัส
สื่อประกอบการสอน รายวิชา วิธีวิจัยวิทยาทางนิเทศศาสตร์ COMM (3-0- 6)____________________________________________________________________________________________.
คณะผู้จัดทำ นายอรรถวัฒน์ ราชา นายสุรพล ยอดคำลือ
การตรวจสอบคุณภาพเครื่องมือวิจัย
การตรวจสอบคุณภาพเครื่องมือวิจัย
บทที่ 3 วิธีการดำเนินการวิจัย
การออกแบบการสอน รูปแบบ ADDIE Model
การตรวจสอบคุณภาพ ของเครื่องมือการวิจัย
การใช้สื่อแบบฝึกทักษะภาพสาม
การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis)
ความหมาย รูปแบบหนึ่งของบทเรียน คอมพิวเตอร์ช่วยสอนซึ่ง มีการออกแบบบทเรียน โดยมีเป้าหมายที่จะเสนอ ข้อคำถามในรูปแบบต่าง ๆเพื่อให้ผู้เรียนฝึกปฏิบัติ
ผศ.สุโกศล วโนทยาพิทักษ์
วิทยาลัยเทคโนโลยีชุมพรบริหารธุรกิจ อำเภอหลังสวน จังหวัดชุมพร
ผศ.ดร.ภัทรวรรธน์ จีรพัฒน์ธนธร
การออกแบบสื่อเพื่อการศึกษา ADDIE Model
การ ประเมินผ ล. Outline ความสัมพันธ์ระหว่าง การประเมินกับ วัตถุประสงค์ ความสัมพันธ์ระหว่าง การประเมินกับ วัตถุประสงค์ หลักการทั่วไปของการ ประเมิน หลักการทั่วไปของการ.
วิทยาลัยเทคโนโลยีชุมพรบริหารธุรกิจ อำเภอหลังสวน จังหวัดชุมพร
การตรวจสอบคุณภาพของเครื่องมือ (Test Quality Analysis)
การตรวจสอบคุณภาพเครื่องมือ
การวิจัยในชั้นเรียน ( Classroom Action Research)
Statistical Method for Computer Science
การวัดและประเมินผลการศึกษา
การวัดและประเมินผลการเรียนรู้
ใบสำเนางานนำเสนอ:

Quality Testing of Tests การหาคุณภาพของแบบทดสอบ

ปัจจัยที่สำคัญที่เกี่ยวข้องกับคุณภาพของแบบทดสอบ มี 5 องค์ประกอบ คือ ความเที่ยงตรง (Validity) ความเชื่อมั่น (Reliability) ความยากง่าย (Difficulty) อำนาจจำแนก (Discrimination) ความเป็นปรนัย (Objectivity)

ความเที่ยวตรง (Validity) ประกอบด้วย 4 ส่วน ความเที่ยงตรงตามเนื้อหา (Content Validity) ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ความเที่ยงตรงตามสภาพ (Concurrent Validity) ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity)

ความเที่ยงตรงตามเนื้อหา (Content Validity) ระดับความสามารถของแบบทดสอบที่วัดในเนื้อหาที่ต้องการจะวัด การทดสอบความเที่ยงตรงตามเนื้อหาโดยผู้เชี่ยวชาญในลักษณะนี้ เรียกว่า การหาค่าความสอดคล้องระหว่างวัตถุประสงค์กับแบบทดสอบ IOC (Index of Item-Objective Congruence)

ความเที่ยงตรงตามเนื้อหา (Content Validity) เกณฑ์การให้คะแนนเพื่อหาค่า IOC ของผู้เชี่ยวชาญกำหนดเป็น 3 ระดับ คือ แบบทดสอบหรือข้อสอบที่ถือว่ามีความเที่ยงตรงตามเนื้อหาในระดับดี สามารถนำไปวัดผลได้ จะต้องมีค่า IOC >= 0.5

ความเที่ยงตรงตามเนื้อหา (Content Validity) ตัวอย่างแบบทดสอบเพื่อหาค่า IOC และการแปลผล

ความเที่ยงตรงตามเนื้อหา (Content Validity)

ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ความสามารถของแบบทดสอบที่วัดได้ตามลักษณะคุณสมบัติ ทฤษฎี และประเด็นต่างๆของโครงสร้างนั้น ที่อธิบายพฤติกรรมต่างๆ มี 2 วิธี การหาค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) การเปรียบเทียบกับกลุ่มที่มีลักษณะที่ต้องการวัดอย่างเด่นชัด (Know Group Technique)

ความเที่ยงตรงตามโครงสร้าง (Construct Validity) ขอเสนอ 2 วิธี วิธีของคาร์เวอร์ (Carver Method) วิธีการหาค่าสหสัมพันธ์แบบฟี (Phi-Correlation)

ความเที่ยงตรงตามโครงสร้าง (Construct Validity) วิธีของคาร์เวอร์ (Carver Method) ทำได้โดยการนำแบบทดสอบที่สร้างขึ้นไปทดสอบกับกลุ่มผู้เรียนที่เรียนแล้วกับกลุ่มผู้เรียนที่ยังไม่เคยเรียน

ตัวอย่าง

ความเที่ยงตรงตามโครงสร้าง (Construct Validity) วิธีการหาค่าสหสัมพันธ์แบบฟี (Phi-Correlation) ทำได้โดยการหาความสัมพันธ์ของผู้เรียน 2 กลุ่ม คือ 1)กลุ่มผู้เรียนที่ยังไม่ได้รับการสอนหรือไม่ได้สอบก่อนเรียน กับ 2) กลุ่มผู้เรียนที่เรียนแล้วหรือผ่านการสอบหลังเรียนแล้ว

ตัวอย่าง

ความเที่ยงตรงตามสภาพ (Concurrent Validity) แบบทดสอบที่สามารถวัดได้ตามสภาพความเป็นจริงของกลุ่มตัวอย่าง การทดสอบทำได้โดยนำคะแนนของแบบทดสอบที่สร้างขึ้นใหม่ไปหาค่าสหสัมพันธ์กับคะแนนของแบบทดสอบเดิมที่มีความเที่ยงตรง

ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity) การหาความสัมพันธ์ระหว่างคะแนนผลการสอบกับเกณฑ์ของความสำเร็จที่จะเกิดขึ้นในอนาคต โดยใช้คะแนนผลการสอบในการพยากรณ์ในอนาคต การทดสอบทำได้โดยการสร้างความสัมพันธ์ระหว่างคะแนนที่ได้จากแบบทดสอบกับเกณฑ์ที่ใช้ในการวัดความสำเร็จ

ความเที่ยงตรงเชิงพยากรณ์ (Predictive Validity)

ความเชื่อมั่น (Reliability) ความคงที่ ความมั่นคง หรือความสม่ำเสมอของผลการวัด สามารถหาได้หลายวิธี การทดสอบซ้ำ (Test-Retest Reliability) การทดสอบแบบใช้ข้อสอบเหมือนกัน (Equivalent-Forms Reliability) การทดสอบแบบแบ่งครึ่ง (Split-Half Reliability) การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21 การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)

การทดสอบซ้ำ (Test-Retest Reliability) เป็นการทดสอบหาความเชื่อมั่นของแบบทดสอบโดยการทำแบบทดสอบฉบับเดียวกัน 2 ครั้งในเวลาต่างกัน จากนั้นไปหาค่าสหสัมพันธ์

การทดสอบแบบใช้ข้อสอบเหมือนกัน (Equivalent-Forms Reliability) การหาความเชื่อมั่นวิธีนี้ทำได้โดยใช้แบบทดสอบ 2 ฉบับที่เหมือนกัน ทำในระยะเวลาที่ห่างกันเพียงเล็กน้อยแบบทดสอบที่เหมือนกันในที่นี้หมายความว่าทั้งสอบวัดในสิ่งเดียวกัน จำนวนข่อเท่ากัน มีโครงสร้างเหมือนกัน มีความยากง่ายในระดับเดียวกัน มีวิธีการทดสอบ การตรวจให้คะแนนและการแปลความหมายของคะแนนเหมือนกัน จากนั้นจึงนำคะแนนจากผลการทดสอบทั้ง 2 ฉบับไป หาค่าสหสัมพันธ์

การทดสอบแบบแบ่งครึ่ง (Split-Half Reliability) หาได้โดยการทดสอบเพียงครั้งเดียวโดยใช้แบบทดสอบเพียงฉบับเดียว จากนั้นแบ่งออกเป็น 2 ส่วน คือ ข้อคู่ กับ ข้อคี่ แล้วจึงนำไปหาค่าสหสัมพันธ์

ตัวอย่าง

ตัวอย่าง

การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21

การทดสอบโดยวิธีหาความคงที่ภายในโดยใช้ KR-20 และ KR-21

ตัวอย่าง

ตัวอย่าง

ตัวอย่าง

ตัวอย่าง

การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)

การทดสอบโดยวิธีหาสัมประสิทธิ์แอลฟา (-Coefficient)

ตัวอย่าง

ตัวอย่าง

การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ โดยเฉพาะแบบทดสอบที่ใช้ในการเรียนการสอน มีหลายวิธี ขอเสนอ 2 วิธี วิธีของคาร์เวอร์ (Carver Method) วิธีของแฮมเบิลตันและโนวิก (Hambleton and Novick method)

การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ วิธีของคาร์เวอร์ (Carver Method) เป็นวิธีการหาความเชื่อมั่นแบบสอดคล้องในการตัดสินใจ โดยการทดสอบกับผู้เรียนกลุ่มเดียวกันจำนวน 2 ครั้ง หรือใช้แบบทดสอบคู่ขนานจำนวน 2 ฉบับแล้วทดสอบเพียงครั้งเดียว

ตัวอย่าง

การหาค่าความเชื่อมั่นของแบบทดสอบแนวอิงเกณฑ์ วิธีของแฮมเบิลตันและโนวิก (Hambleton and Novick method) เป็นวิธีการหาความเชื่อมั่นแบบสอดคล้องในการตัดสินใจ โดยการทดสอบกับผู้เรียนกลุ่มเดียวกันจำนวน 2 ครั้ง หรือใช้แบบทดสอบคู่ขนานจำนวน 2 ฉบับแล้วทดสอบเพียงครั้งเดียว

ตัวอย่าง

ความยากง่าย (Difficulty)

ความยากง่าย (Difficulty)

ความยากง่าย (Difficulty)

ตัวอย่าง

อำนาจจำแนก (Discrimination)

อำนาจจำแนก (Discrimination) การหาค่าอำนาจจำแนก มีหลายวิธี คือ การใช้วิธีการตรวจให้คะแนน การใช้สูตรสัดส่วน การใช้ค่าสหสัมพันธ์แบบพอยท์-ไบซีเรียล (Point-Biserial Correlation) การใช้ตารางสำเร็จของจุงเตฟาน (Chung The Fan)

อำนาจจำแนก (Discrimination) การใช้วิธีการตรวจให้คะแนน

ตัวอย่าง

อำนาจจำแนก (Discrimination) การใช้สูตรสัดส่วน

ตัวอย่าง

อำนาจจำแนก (Discrimination) การใช้ค่าสหสัมพันธ์แบบพอยท์-ไบซีเรียล (Point-Biserial Correlation)

ตัวอย่าง

ตัวอย่าง

ความเป็นปรนัย (Objectivity) ความชัดเจนของแบบทดสอบที่ทุกคนอ่านแล้วตีความตรงกัน รวมทั้งการตรวจให้คะแนนมีเกณฑ์ที่แน่นอนไม่ว่าผู้ใดจะเป็นผู้ตรวจก็ตาม ลักษณะของแบบทดสอบที่มีความเป็นปรนัย จะเกี่ยวข้องกับ 3 องค์ประกอบ ได้แก่ ความแจ่มชัดในความหมายของแบบทดสอบ ความแจ่มชัดในวิธีตรวจหรือมาตรฐานการให้คะแนน ความแจ่มชัดในการแปลความหมายของคะแนน

การหาคุณภาพของแบบทดสอบสำหรับบทเรียนคอมพิวเตอร์ แบบทดสอบที่ใช้สำหรับการประเมินผลระหว่างดำเนินการ (Formative Evaluation) แบบทดสอบก่อนบทเรียน (Pretest) แบบทดสอบระหว่างเรียน (Exercise) แบบประเมินผลอื่นๆ เช่น ใบงาน การบ้าน แบบทดสอบที่ใช้สำหรับการประเมินผลสรุป (Summative Evaluation)

ขั้นตอนการหาคุณภาพ ของแบบทดสอบสำหรับ บทเรียนคอมพิวเตอร์

สรุป

Quality Testing of Tests จบการบรรยาย คำถาม

แบบฝึกหัด หน้า 233 -234 ข้อ 14 – 15