งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

1 Dr. Wararat Rungworawut 322475 การทำเหมืองข้อมูล (Data Mining) สอนโดย ผศ. ดร. วรารัตน์ สงฆ์แป้น ( รุ่งวรวุฒิ ) ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "1 Dr. Wararat Rungworawut 322475 การทำเหมืองข้อมูล (Data Mining) สอนโดย ผศ. ดร. วรารัตน์ สงฆ์แป้น ( รุ่งวรวุฒิ ) ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์"— ใบสำเนางานนำเสนอ:

1 1 Dr. Wararat Rungworawut การทำเหมืองข้อมูล (Data Mining) สอนโดย ผศ. ดร. วรารัตน์ สงฆ์แป้น ( รุ่งวรวุฒิ ) ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่น การประเมินโมเดล (Model Evaluation)

2 2 Holdout Method  เป็นวิธีเหมาะกับชุดข้อมูลขนาดใหญ่ ตัวอย่างในชุด ข้อมูลจะถูกแบ่งออกเป็น 2 ส่วน แบบสุ่ม ด้วยอัตราส่วน ขนาดของข้อมูลสอนเท่ากับ 2/3 และขนาดข้อมูล ทดสอบเท่ากับ 1/3 ใช้ชุดข้อมูลสอนในการสร้าง แบบจำลองการทำนาย และตรวจสอบความถูกต้องใน การจำแนกประเภทข้อมูลใหม่หรือที่ไม่เคยเห็นมาก่อน ด้วยชุดข้อมูลทดสอบ ค่าความแม่นยำคำนวณได้จาก อัตราส่วนระหว่างจำนวนตัวอย่างในชุดข้อมูลทดสอบที่ ทำนายกลุ่มได้กับจำนวนตัวอย่างทั้งหมดในชุดข้อมูล ทดสอบ การประเมินโมเดล 1 Correct 0 Incorrect N = No. Test Data Set

3 3 Data Set Training setTest set การประเมินโมเดล แบ่งเป็น 2/3 แบ่งเป็น 1/3

4 4 K-fold Cross validation  เหมาะสำหรับชุดข้อมูลจำนวนไม่มาก สมมติว่าขนาดของ ข้อมูลเท่ากับ N ตัวอย่างในชุดข้อมูลจะถูกแบ่งออกเป็น k ส่วน โดยแต่ละชุดข้อมูลจะมีขนาด N/k วิธีนี้จะเรียนรู้ด้วย ชุดข้อมูลสอนและตรวจสอบความถูกต้งในการจำแนก ประเภทด้วย ชุดข้อมูลทั้งหมด k รอบ โดยที่  รอบที่ i จะใช้ชุดข้อมูลทดสอบชุดที่ i เป็นชุดข้อมูล ทดสอบ ชุดที่เหลือเป็นชุดข้อมูลสอน เป็นต้น  ดังนั้นค่าความแม่นยำจะคำนวณได้จากอัตราส่วนระหว่าง จำนวนตัวอย่างในชุดหารด้วยจำนวนทั้งหมด k รอบ 1 Correct 0 Incorrect N = No. Test Data Set การประเมินโมเดล

5 5  K-Fold Cross Validation Data Set #1 #2 #

6 6 การประเมินโมเดล  Confusion Matrix คือการประเมินผลลัพธ์การทำนาย ( หรือผลลัพธ์จากโปรแกรม ) เปรียบเทียบกับผลลัพธ์จริงๆ  True Positive (TP) คือ ข้อมูลเป็นจริง และผลการทำนายบอกว่า จริง  True Negative (TN) คือ ข้อมูลไม่จริง และผลการทำนายบอกว่า ไม่จริง  False Positive (FP) คือ ข้อมูลจริง แต่ผลการทำนายบอกว่าไม่ จริง  False Negative (FN) คือ ข้อมูลไม่จริง แต่ผลการทำนายบอกว่า จริง

7 7  Sensitivity or Recall คือ ค่าที่แสดงว่าการทำนาย ข้อมูลเป็นจริงถูกต้องอัตราส่วนเท่าไรของข้อมูลจริง ทั้งหมด  Specificity คือ ค่าที่แสดงว่าการทำนายข้อมูลเป็นไม่ จริงอัตราส่วนเท่าไรของข้อมูลไม่จริงทั้งหมด  Precision คือ ค่าที่แสดงว่าข้อมูลทำนายว่าจริง ถูกต้องเป็นอัตราส่วนเท่าไรเมื่อเทียบกับข้อมูลที่ ทำนายว่าจริง การประเมินโมเดล

8 8 Accuracy = (TP+TN) (TP+TN+FP+FN)  Accuracy คือ ค่าที่แสดงว่าแบบจำลองสามารถ ทำนายได้ถูกต้องขนาดไหนเมื่อเทียบอัตราส่วนกับ ข้อมูลทั้งหมด

9 9 Example:  Sensitivity or Recall : 6,954/7,000 =  Specificity: 2,588/ 3,000 =  Precision: 6,954/7,366 =  Accuracy: (6,954+2,588)/10,000 = 0.954


ดาวน์โหลด ppt 1 Dr. Wararat Rungworawut 322475 การทำเหมืองข้อมูล (Data Mining) สอนโดย ผศ. ดร. วรารัตน์ สงฆ์แป้น ( รุ่งวรวุฒิ ) ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์

งานนำเสนอที่คล้ายกัน


Ads by Google