งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis) สำนักทดสอบทางการศึกษา สพฐ.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis) สำนักทดสอบทางการศึกษา สพฐ."— ใบสำเนางานนำเสนอ:

1 การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis) สำนักทดสอบทางการศึกษา สพฐ.

2 Before & After ชาย : เค้ารอวันนี้มานานแล้ว ชาย : เค้ารอวันนี้มานานแล้ว หญิง : แล้วเราจะเลิกกันไหม หญิง : แล้วเราจะเลิกกันไหม ชาย : ไม่มีทาง ชาย : ไม่มีทาง หญิง : ถ้าเค้างอนตัวเองจะง้อ เค้ามั้ยล่ะ หญิง : ถ้าเค้างอนตัวเองจะง้อ เค้ามั้ยล่ะ ชาย : สำหรับตัวเค้าทำได้ทุก อย่าง ชาย : สำหรับตัวเค้าทำได้ทุก อย่าง หญิง : ตัวจะไม่ทำให้เค้าเสียใจ ใช่มั้ย หญิง : ตัวจะไม่ทำให้เค้าเสียใจ ใช่มั้ย ชาย : เค้ายอมตาย ถ้าทำอย่าง นั้นกับตัวเอง ชาย : เค้ายอมตาย ถ้าทำอย่าง นั้นกับตัวเอง หญิง : จุ๊บเค้าหน่อยดิ ! หญิง : จุ๊บเค้าหน่อยดิ !

3 3 ขั้นตอนการสร้างข้อสอบ เขียนข้อสอบ ทบทวนร่างข้อสอบ การ ตรวจสอบ เนื้อหา / ความ ลำเอียง วิเคราะห์ มาตรฐาน แผนผังแบบสอบ Item specification นำข้อสอบ ทดลองใช้ การวิเคราะห์ คุณภาพ ข้อสอบ / แบบ สอบ นำข้อสอบ ไปใช้

4 1. คุณลักษณะของแบบทดสอบที่ดี การวิเคราะห์คุณภาพแบบทดสอบ 2. วิธีการวิเคราะห์แบบทดสอบ 2.1 วิธีการวิเคราะห์โดยไม่ใช้วิธีการทางสถิติ 1) การวิเคราะห์คุณภาพข้อสอบรายข้อ 2.1 วิธีการวิเคราะห์โดยใช้วิธีการทางสถิติ 2) การวิเคราะห์คุณภาพข้อสอบทั้งฉบับ

5 1. คุณลักษณะของแบบทดสอบที่ดี 1. ความเที่ยงตรง (validity) 2. ความเชื่อมั่น (reliability) 3. ความยากง่าย (difficulty) 4. อำนาจจำแนก (discrimination ) 5. เป็นปรนัย (objectivity)

6 ประเภทของความเที่ยงตรง 1.1 ความเที่ยงตรง (Validity) 1. ความตรงตามเนื้อหา (Content Validity) เนื้อหาของเครื่องมือ หรือเนื้อหาของข้อคำถามวัดได้ตรง ตามประเด็นของเรื่องที่ต้องการวัดหรือไม่? 2. ความตรงเชิงโครงสร้าง (Construct Validity) เครื่องมือนั้นสามารถวัดได้ครอบคลุมขอบเขต ความหมาย หรือครบตามคุณลักษณะประจำตามทฤษฎีที่ใช้สร้าง เครื่องมือหรือไม่? ความถูกต้องแม่นยำของเครื่องมือในการวัดสิ่งที่ต้องการจะวัด

7 ประเภทของความตรง (ต่อ) 1.1 ความเที่ยงตรง (Validity) 3. ความตรงตามเกณฑ์สัมพันธ์ (Criterion-related Validity) เครื่องมือวัดได้ตรงตามพฤติกรรมที่ต้องการวัด โดย พิจารณาจากเกณฑ์ที่เกี่ยวข้องว่าเครื่องมือนั้นจะใช้ทำนาย พฤติกรรมของบุคคลในสภาพเฉพาะเจาะจงตามต้องการ หรือไม่? จำแนกได้ 2 ชนิด คือ 3.1 ความตรงร่วมสมัย หรือตามสภาพ (Concurrent Validity) เกณฑ์ที่ใช้เปรียบเทียบ คือ สภาพความเป็น จริงในปัจจุบัน 3.2 ความตรงเชิงทำนาย (Predictive Validity) เกณฑ์ที่ใช้เปรียบเทียบ คือ สภาพความเป็นจริง หรือ สภาพความสำเร็จในอนาคต

8 1.2 ความเชื่อมั่น (Reliability) ความคงที่หรือความคงเส้นคงวาของผลที่ ได้จากการวัด วิธีการประมาณค่าความเที่ยง 1. การวัดความคงที่ (Measure of Stability) 2. การวัดความสมมูลกัน หรือเท่าเทียมกัน (Measure of Equivalence) 3. การวัดความคงที่และความเท่าเทียมกัน (Measure of Stability and Equivalence) 4. การวัดความสอดคล้องภายใน (Measure of Internal Consistency) 4.1 วิธีแบ่งครึ่งข้อสอบ (Split-half) 4.2 วิธีของ Kuder-Richardson (Kr20, Kr21) 4.3 วิธีสัมประสิทธ์แอลฟาของ Cronbach (Cronbach’s alpha (  ) method)

9 ความหมาย ความคงเส้นคงวาของคะแนนจากการวัดในช่วงเวลาที่ ต่างกันโดยวิธีสอบซ้ำด้วยแบบสอบฉบับเดิม (test-retest method) ความคงเส้นคงวาของคะแนนจากการวัดในช่วงเวลาที่ ต่างกันโดยวิธีสอบซ้ำด้วยแบบสอบฉบับเดิม (test-retest method)วิธีประมาณค่า คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ จากคนเดียวกันด้วยเครื่องมือเดียวกัน โดยทำการวัดซ้ำสอง ครั้งในเวลาที่ต่างกัน คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ จากคนเดียวกันด้วยเครื่องมือเดียวกัน โดยทำการวัดซ้ำสอง ครั้งในเวลาที่ต่างกัน Measure of Stability Stability 2) การวัดความ เท่าเทียมกัน 2) การวัดความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 4) การวัดความ สอดคล้อง ภายใน 4) การวัดความ สอดคล้อง ภายใน 1) การวัด ความคงที่ 1) การวัด ความคงที่ วิธีประมาณค่า 1.2 ความเชื่อมั่น (Reliability)

10 ความหมาย ความสอดคล้องกันของคะแนนจากการวัดในช่วงเวลา เดียวกันโดยใช้แบบสอบที่สมมูลกันหรือเท่าเทียมกัน (equivalence-form method) ความสอดคล้องกันของคะแนนจากการวัดในช่วงเวลา เดียวกันโดยใช้แบบสอบที่สมมูลกันหรือเท่าเทียมกัน (equivalence-form method)วิธีประมาณค่า คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ ในเวลาเดียวกันจากคนกลุ่มเดียวกัน โดยใช้เครื่องมือ 2 ฉบับที่ทัดเทียมกัน คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ ในเวลาเดียวกันจากคนกลุ่มเดียวกัน โดยใช้เครื่องมือ 2 ฉบับที่ทัดเทียมกัน Measure of Equivalence Equivalence 2) การวัดความ เท่าเทียมกัน 2) การวัดความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 4) การวัดความ สอดคล้อง ภายใน 4) การวัดความ สอดคล้อง ภายใน 1) การวัดความ คงที่ 1) การวัดความ คงที่ วิธีประมาณค่า 1.2 ความเชื่อมั่น (Reliability)

11 ความหมาย ความสอดคล้องกันของคะแนนจากการวัดในช่วงเวลา ต่างกัน โดยวิธีสอบซ้ำด้วยแบบสอบที่สมมูลกันหรือเท่าเทียม กัน (test-retest with equivalence method) ความสอดคล้องกันของคะแนนจากการวัดในช่วงเวลา ต่างกัน โดยวิธีสอบซ้ำด้วยแบบสอบที่สมมูลกันหรือเท่าเทียม กัน (test-retest with equivalence method)วิธีประมาณค่า คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ ในช่วงเวลาที่ต่างกันจากกลุ่มคนกลุ่มเดียวกัน โดยใช้ เครื่องมือ 2 ฉบับที่ทัดเทียมกัน คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคะแนนที่วัดได้ ในช่วงเวลาที่ต่างกันจากกลุ่มคนกลุ่มเดียวกัน โดยใช้ เครื่องมือ 2 ฉบับที่ทัดเทียมกัน Measure of Stability and Equivalence Stability and EquivalenceStability and Equivalence 2) การวัดความ เท่าเทียมกัน 2) การวัดความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 4) การวัดความ สอดคล้อง ภายใน 4) การวัดความ สอดคล้อง ภายใน 1) การวัดความ คงที่ 1) การวัดความ คงที่ วิธีประมาณค่า 1.2 ความเชื่อมั่น (Reliability)

12 ความหมาย ความสอดคล้องกันระหว่างคะแนนรายข้อ หรือความเป็น เอกพันธ์ของเนื้อหารายข้ออันเป็นตัวแทนของคุณลักษณะ เด่นเดียวกันที่ต้องการวัด ความสอดคล้องกันระหว่างคะแนนรายข้อ หรือความเป็น เอกพันธ์ของเนื้อหารายข้ออันเป็นตัวแทนของคุณลักษณะ เด่นเดียวกันที่ต้องการวัดวิธีประมาณค่า มีหลายวิธี ได้แก่ มีหลายวิธี ได้แก่ Measure of Internal Consistency 2) การวัดความ เท่าเทียมกัน 2) การวัดความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 3) การวัดความ คงที่และความ เท่าเทียมกัน 4) การวัดความ สอดคล้อง ภายใน 4) การวัดความ สอดคล้อง ภายใน 1) การวัดความ คงที่ 1) การวัดความ คงที่ วิธีประมาณค่า 1) วิธีแบ่งครึ่งข้อสอบ (Split-half) 2) วิธีของ Kuder-Richardson (KR20, KR21) 3) วิธีสัมประสิทธ์แอลฟาของ Cronbach (Cronbach’s alpha (  ) method) 1.2 ความเชื่อมั่น (Reliability)

13

14 1.3 ความยากง่าย (Difficulty) ความยากง่ายของแบบทดสอบมีความ เหมาะสมกับความสามารถของผู้สอบ ซึ่งพิจารณาจาก สัดส่วน หรือเปอร์เซ็นต์ ของจำนวนคนที่ตอบข้อสอบข้อนั้นถูกจาก คนที่สอบทั้งหมด ความยากง่ายของแบบทดสอบมีความ เหมาะสมกับความสามารถของผู้สอบ ซึ่งพิจารณาจาก สัดส่วน หรือเปอร์เซ็นต์ ของจำนวนคนที่ตอบข้อสอบข้อนั้นถูกจาก คนที่สอบทั้งหมด

15 1.4 อำนาจจำแนก (Discrimination) ความสามารถของข้อสอบแต่ละข้อ ในการจำแนกคนที่อยู่ในกลุ่มเก่งออก จากคนที่อยู่ในกลุ่มอ่อนได้ ซึ่งพิจารณาจากผลต่างของสัดส่วน ของกลุ่มเก่งที่ตอบถูกกับกลุ่มอ่อนที่ ตอบถูก ความสามารถของข้อสอบแต่ละข้อ ในการจำแนกคนที่อยู่ในกลุ่มเก่งออก จากคนที่อยู่ในกลุ่มอ่อนได้ ซึ่งพิจารณาจากผลต่างของสัดส่วน ของกลุ่มเก่งที่ตอบถูกกับกลุ่มอ่อนที่ ตอบถูก

16 ความชัดเจนของแบบทดสอบหรือคำถามที่ทุกคน เข้าใจตรงกัน รวมทั้งการตรวจให้คะแนนมีเกณฑ์ที่ แน่นอน ความเป็นปรนัย มีองค์ประกอบ 3 ประการ : 1.โจทย์หรือข้อคำถาม 2.วิธีการตรวจให้คะแนน 3.การแปลความหมายของคะแนน การหาความเป็นปรนัยที่นิยมปฏิบัติกัน คือ ให้ผู้เชี่ยวชาญพิจารณาและตรวจสอบ 1.5 ความเป็นปรนัย (Objectivity)

17 2. วิธีการวิเคราะห์คุณภาพแบบสอบ 2.2 การวิเคราะห์แบบสอบโดยใช้วิธีการทางสถิติ 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ

18 แนวทางการพิจารณา 1) การตรวจสอบความถูกต้องและครอบคลุมของ เนื้อหาวิชาและจุดมุ่งหมาย 1) ข้อคำถามครบถ้วนทุกเนื้อหาที่เรียนหรือไม่ 2) จำนวนข้อคำถามของแต่ละเนื้อหามีสัดส่วนตาม น้ำหนักที่กำหนดไว้หรือไม่ 3) ข้อคำถามแต่ละข้อวัดได้ตรงตามพฤติกรรมที่ระบุไว้ใน จุดมุ่งหมายของการสอนแต่ละเนื้อหาหรือไม่

19 วิธีดำเนินการ 1) ตรวจสอบโดยผู้เชี่ยวชาญในเนื้อหาวิชานั้นๆ 2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน ข้อคำถาม (test Blueprint) 2) ตรวจสอบโดยการเปรียบเทียบตารางกำหนดจำนวน ข้อคำถาม (test Blueprint) 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ 1) การตรวจสอบความถูกต้องและครอบคลุมของ เนื้อหาวิชาและจุดมุ่งหมาย

20 แนวทางการพิจารณา 2) การตรวจสอบภาษาและความสอดคล้องกับเทคนิค การเขียนคำถาม 1) ข้อความที่ใช้เขียนเป็นข้อคำถามสามารถสื่อ ความหมายได้ดีเพียงไร 2) การเขียนข้อคำถามนั้นมีความถูกต้องตามเทคนิคใน การเขียนข้อคำถามที่ดีหรือไม่ 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ

21 วิธีดำเนินการ 1) ตรวจสอบโดยผู้เชี่ยวชาญทางด้านภาษา 2) ตรวจสอบโดยผู้เชี่ยวชาญทางด้านวัดผลการศึกษา (ถ้าหากไม่สามารถหาผู้เชี่ยวชาญเพื่อช่วยตรวจสอบได้ อย่างน้อยควรให้เพื่อนครู หรือตัวครูเองเป็นผู้ทำการ ตรวจสอบ) 2) การตรวจสอบภาษาและความสอดคล้องกับเทคนิค การเขียนคำถาม 2.1 การวิเคราะห์แบบสอบโดยไม่ใช้วิธีการทางสถิติ

22 2) การวิเคราะห์ข้อสอบทั้งฉบับ 2.1) ความเที่ยงตรง (Validity) 2.2) ความเชื่อมั่น (Reliability) 2.1) ความเที่ยงตรง (Validity) 2.2) ความเชื่อมั่น (Reliability) 1) การวิเคราะห์ข้อสอบเป็นรายข้อ 1. 1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) 1.2) ค่าระดับความยากง่าย (Difficulty Index) 1.3) ค่าอำนาจจำแนก (Discrimination Power) 1. 1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) 1.2) ค่าระดับความยากง่าย (Difficulty Index) 1.3) ค่าอำนาจจำแนก (Discrimination Power) 2.2 การวิเคราะห์แบบสอบโดยใช้วิธีการทางสถิติ

23 1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) ให้ผู้เชี่ยวชาญตั้งแต่ 3 คนขึ้นไป ประเมินความ สอดคล้องระหว่างข้อคำถามในเครื่องมือกับเนื้อหาที่ ต้องการวัด จากนั้นนำผลการประเมินมาคำนวณค่า IOC โดยใช้สูตร IOC = RRRRN เกณฑ์ตัดสิน IOC ควรมีค่ามากกว่า 0.5 วิธีดำเนินการ เมื่อ  R แทน ผลรวมของคะแนนจากผู้เชี่ยวชาญ 1) การวิเคราะห์ข้อสอบรายข้อ

24 ตัวอย่าง ตารางการหาค่า IOC ตัวชี้วัดตามมาตรฐาน ผลการประเมิน ผู้เรียนสามารถบอกถึงหน้าที่ หรือความแตกต่างของ ส่วนประกอบต่างๆของพืชได้ 01 ข้อสอบ 1.หน้าที่ของใบคืออะไร? ก. ยึดลำต้น ข. ดูดอาหาร ค. สังเคราะห์แสง ง. ลำเลียงอาหาร 2. ข้อใดเป็นพืชใบเลี้ยงคู่? ก. ข้าว ข. อ้อย ค. กล้วย ง. มะเขือ 1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) - 1 หมายถึง ไม่สอดคล้อง 0 หมายถึง ไม่แน่ใจ1 หมายถึง สอดคล้อง

25 ข้อคำถาม คนที่ 1 คนที่ 2 คนที่ 3 คนที่ 4 คนที่ 5 IOC ข้อ /5=0.8 ข้อ /5=-0.2 สรุป... ข้อสอบข้อ 1 มีความสอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม สามารถ นำไปใช้สอบได้ ข้อสอบข้อ 1 มีความสอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม สามารถ นำไปใช้สอบได้ ข้อสอบข้อ 2 ไม่สอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม ไม่ควรนำไปใช้ ต้องตัดทิ้ง หรือปรับปรุงใหม่ ข้อสอบข้อ 2 ไม่สอดคล้องกับจุดมุ่งหมายเชิงพฤติกรรม ไม่ควรนำไปใช้ ต้องตัดทิ้ง หรือปรับปรุงใหม่ ตัวอย่าง การคำนวณหาค่า IOC 1.1) ดัชนีความสอดคล้องระหว่างข้อสอบกับจุดประสงค์ (IOC-Index of Item Objective Congruence) เกณฑ์การพิจารณา ข้อสอบที่ใช้ได้ คือ ข้อสอบที่มีค่า IOC ตั้งแต่.5 ขึ้นไป

26 1.2) ค่าระดับความยากง่าย (Difficulty Index) หมายถึง สัดส่วน หรือเปอร์เซ็นต์ของจำนวนคนที่ ตอบข้อสอบข้อนั้นถูกจากคนที่สอบทั้งหมด ใช้สัญลักษณ์ “p” ระดับความยากง่าย หมายถึง สัดส่วน หรือเปอร์เซ็นต์ของจำนวนคนที่ ตอบข้อสอบข้อนั้นถูกจากคนที่สอบทั้งหมด ใช้สัญลักษณ์ “p” 1) การวิเคราะห์ข้อสอบรายข้อ ข้อสอบแบบปรนัย (คะแนนแบบทวิภาค 0 กับ 1) ข้อสอบแบบอัตนัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)

27 1.2) ค่าระดับความยากง่าย (Difficulty Index) (1) ค่าระดับความยากง่าย (Difficulty Index) ข้อสอบปรนัย หรือ Rแทน จำนวนคนที่ตอบข้อนั้นถูก Nแทนจำนวนคนที่สอบทั้งหมด R H แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มสูง R L แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มต่ำ N H แทนจำนวนคนในกลุ่มสูง N L แทนจำนวนคนในกลุ่มต่ำ

28 ข้อ กลุ่มสูง (R H ) (20 คน ) กลุ่มต่ำ (R L ) (20 คน ) P 1 ก 46 (6+4)/40= 0.25 ข*ข* 93 (9+3)/40 = 0.3 ค 35 (5+3)/40= 0.2 ง 46 (6+4)/40= 0.25 รวม 20

29 2. แบ่งกลุ่มสูง (H) และกลุ่มต่ำ (L) 3. คำนวณสัดส่วนของคะแนนรวมรายข้อที่ได้จำแนกตามกลุ่ม p = —— —— P H + P L 2 1.2) ค่าระดับความยากง่าย (Difficulty Index) (2) ค่าระดับความยากง่าย (Difficulty Index) ข้อสอบอัตนัย 1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด 4. วิเคราะห์ค่าความยาก (p) P H = —— P L = —— LTLLTL HTHHTH  H รวมคะแนนกลุ่มสูง  L รวมคะแนน กลุ่มต่ำ  T H รวมคะแนนเต็มกลุ่มสูง  T L รวม คะแนนเต็มกลุ่มต่ำ

30 แบบสอบความเรียงมี 5 ข้อ แต่ละข้อคะแนนเป็น 10,10,20,30,30 คะแนน ตามลำดับ ใช้สอบนักเรียน 8 คน ตรวจให้คะแนน และเรียงลำดับคะแนนจากมากไปน้อย ( อันดับ 1-8) แบ่งนักเรียนเป็น 2 กลุ่ม ( เทคนิค 50%) ได้กลุ่มสูง และกลุ่มต่ำ กลุ่มละ 4 คน การวิเคราะห์ข้อสอบต้องรวมรายข้อของผู้สอบทุกคน แต่ละกลุ่ม ข้อ คะแน นเต็ม กลุ่มสูง (H) (4 คน ) กลุ่มต่ำ (L) (4 คน ) รว ม

31 ข้ อ คะแ นน เต็ม กลุ่มสูง (4 คน ) กลุ่มต่ำ (4 คน ) PHPH PLPL PiPi riri เต็ม ข้อ 1 ง่ายเกินไป อำนาจ จำแนกต่ำ ข้อ 2 – ข้อ 4 เป็นข้อสอบที่ใช้ได้ ข้อ 5 ค่อนข้างยาก อำนา จำแนกต่ำ

32 ค่า p = หมายความว่า ข้อสอบข้อนั้นยากเกินไป ค่า p = หมายความว่า ข้อสอบข้อนั้นค่อนข้างยาก ค่า p = หมายความว่า ข้อสอบข้อนั้นยากง่ายปานกลาง ค่า p = หมายความว่า ข้อสอบข้อนั้นค่อนข้างง่าย ค่า p = หมายความว่า ข้อสอบข้อนั้นง่ายเกินไป เกณฑ์ในการแปลความหมายค่าความยากง่ายเกณฑ์ในการแปลความหมายค่าความยากง่าย เกณฑ์: ข้อสอบที่มีค่าความยากง่ายพอเหมาะ หรือมีคุณภาพดี ค่า p ใกล้เคียง.50 หรือ อยู่ระหว่าง 0.20 – ) ค่าระดับความยากง่าย (Difficulty Index)

33 อำนาจจำแนก หมายถึง ความสามารถของข้อสอบแต่ละข้อในการจำแนกคน ที่อยู่ในกลุ่มเก่งออกจากคนที่อยู่ในกลุ่มอ่อนได้ (ข้อสอบที่มีอำนาจจำแนกดี คนเก่งจะตอบถูก แต่คนอ่อนจะ ตอบผิด) ใช้สัญลักษณ์ “r” 1.3) ค่าอำนาจจำแนก (Discrimination power) 1) การวิเคราะห์ข้อสอบรายข้อ ข้อสอบแบบปรนัย (คะแนนแบบทวิภาค 0 กับ 1) ข้อสอบแบบอัตนัย (คะแนนแบบพหุภาค มากกว่า 2 ค่า)

34 หมายเหตุ N H = N L R H แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มสูง R L แทนจำนวนคนที่ตอบข้อนั้นถูกในกลุ่มต่ำ N H แทนจำนวนคนในกลุ่มสูง N L แทนจำนวนคนในกลุ่มต่ำ ค่า r มีค่าตั้งแต่ -1 จนถึง +1 เกณฑ์การพิจารณา คือ r มีค่าตั้งแต่.2 ขึ้นไป เป็นลบ เมื่อคนกลุ่มอ่อนตอบถูกมากกว่าคนกลุ่มเก่ง เป็นบวก เมื่อคนกลุ่มเก่งตอบถูกมากกว่าคนกลุ่มอ่อน 1.3) ค่าอำนาจจำแนก (Discrimination power) (1) ค่าอำนาจจำแนก ข้อสอบปรนัย

35 1.3) ค่าอำนาจจำแนก (Discrimination power) (2) ค่าอำนาจจำแนก ข้อสอบอัตนัย 1. ตรวจและเรียงคะแนนรวมจากสูงสุดถึงต่ำสุด 2. แบ่งกลุ่มสูง (H) และกลุ่มต่ำ (L) 3. คำนวณสัดส่วนของคะแนนรวมรายข้อที่ได้จำแนกตามกลุ่ม 4. วิเคราะห์ค่าอำนาจจำแนก (r) P H = —— P L = ——  H รวมคะแนนกลุ่มสูง  L รวมคะแนน กลุ่มต่ำ  T H รวมคะแนนเต็มกลุ่มสูง  T L รวม คะแนนเต็มกลุ่มต่ำ r = P H – P L LTLLTL HTHHTH

36 ข้อ กลุ่มสูง (R H ) (20 คน ) กลุ่มต่ำ (R L ) (20 คน ) r 1 ก 46 (6 – 4)/20 =0.1 ข*ข* 93 (9 - 3)/20 = 0.3 ค 35 (5 – 3)/20 =0.1 ง 46 (6 – 4)/20 =0.1 รวม 20

37 ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกไม่ได้เลย ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้เล็กน้อย ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ปานกลาง ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ดี ค่า r = หมายความว่า ข้อสอบข้อนั้นจำแนกได้ดีมาก เกณฑ์ในการแปลความหมายค่าอำนาจจำแนกเกณฑ์ในการแปลความหมายค่าอำนาจจำแนก เกณฑ์: ข้อสอบที่มีคุณภาพดี ค่า r ตั้งแต่ ขึ้นไป 1.3) ค่าอำนาจจำแนก (Discrimination power)

38 เกณฑ์ในการสรุปว่าข้อสอบมีคุณภาพดี ข้อสอบข้อนั้นต้องมีค่าความยากง่าย และค่าอำนาจจำแนกเป็นไปตามเกณฑ์ที่กำหนด ข้อ ที่ ตัวเลือก กลุ่มสูง (H=20) กลุ่มต่ำ (L=20) pr ความหมายสรุป ก 347/40 = 0.18(4-3)/20 = 0.05 (ข)(ข)13619/40 = 0.48(13-6)/20=0.35 ยากง่ายปานกลางใช้ได้ 1 ค -33/40 = 0.08(3-0)20 = 0.15 ง 246/40 = 0.15(4-2)/20 = 0.10 จ 235/40 = 0.13(3-2)/20 = 0.05 เกณฑ์: ตัวถูก p = 0.20 – 0.80 r = ขึ้นไป เกณฑ์: ตัวลวง p = – 0.50 r = – 0.50

39 การคัดเลือกข้อสอบที่มีคุณภาพ ค่าความยากง่าย (p) ค่าอำนาจจำแนก (r) เกณฑ์: ข้อสอบที่มีคุณภาพ p = 0.20 – 0.80 r = ขึ้นไป

40 2.1) ความเที่ยงตรง (Validity) ให้ผู้เชี่ยวชาญตั้งแต่ 3 คนขึ้นไป ประเมินความสอดคล้อง ระหว่างข้อคำถามในเครื่องมือกับเนื้อหาที่ต้องการวัด จากนั้นนำ ผลการประเมินมาคำนวณดัชนีความสอดคล้องระหว่างข้อคำถาม และวัตถุประสงค์ (Item-Objective Congruence Index: IOC) วิธีการตรวจสอบความเที่ยงตรงเชิงเนื้อหา IOC = RRRRN เมื่อ  R แทน ผลรวมของคะแนนจากผู้เชี่ยวชาญ 2) การวิเคราะห์ข้อสอบทั้งฉบับ

41 2.2) ความเชื่อมั่น (Reliability) การทดสอบโดยการหาความสอดคล้องภายในเป็นการ หาความเชื่อมั่นโดยการทดสอบว่าแบบ ทดสอบหรือ แบบสอบถามแต่ละข้อมีความ สัมพันธ์กับข้ออื่น ๆ ใน ฉบับเดียวกันหรือไม่ สูตรในการหาค่าความเชื่อมั่น: Kuder-Richardson (KR-20, KR-21) 1. ให้คะแนนแบบ 0-1 ใช้สูตร Kuder-Richardson (KR-20, KR-21) 2. สัมประสิทธิ์แอลฟ่าของครอนบาค (Cronbach) 2. ให้คะแนนแบบ 0-1 หรือ มากกว่า 1 ใช้สูตร สัมประสิทธิ์แอลฟ่าของครอนบาค (Cronbach) 2) การวิเคราะห์ข้อสอบทั้งฉบับ

42 ... ไชโย... ได้กลับบ้าน แล้ว...

43 1) การวัดความคงที่ (Measure of Stability) ข้อสอบฉบับ A สมชาย ข้อสอบฉบับ A สมชาย ช่วงเวลา ต่อมา

44 2) การวัดความเท่าเทียมกัน (Measure of Equivalence) ข้อสอบฉบับ A สมชาย ข้อสอบฉบับ B คู่ขนานกัน

45 3) การวัดความคงที่และความเท่าเทียมกัน (Measure of Stability and Equivalence ) ข้อสอบฉบับ A สมชาย ข้อสอบฉบับ B สมชาย ช่วงเวลา ต่อมา คู่ขนานกัน


ดาวน์โหลด ppt การวิเคราะห์คุณภาพแบบทดสอบ (Test Quality Analysis) สำนักทดสอบทางการศึกษา สพฐ.

งานนำเสนอที่คล้ายกัน


Ads by Google