ดาวน์โหลดงานนำเสนอ
งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ
1
การใช้ซอฟต์แวร์ WEKA
2
แนะนำซอฟต์แวร์ WEKA WEKA ย่อมาจาก Waikato Environment for Knowledge Analysis พัฒนาด้วยภาษาจาวาทั้งหมด พัฒนาโดยเน้นทางด้าน Machine learning และ Data mining มีโมดูลย่อยสำหรับจัดการข้อมูล ใช้ GUI และคำสั่งในการสั่งให้ซอฟต์แวร์ประมวลผล สามารถดาวน์โหลดฟรีได้ที่ WEKA Software
3
โปรแกรมหลักของซอฟต์แวร์ WEKA
Explorer เป็นโปรแกรมที่ออกแบบในลักษณะ GUI Experimenter เป็นโปรแกรมที่ออกแบบการทดลองและการทดสอบผล KnowledgeFlow เป็นโปรแกรมออกแบบผังการไหลของความรู้ Simple CLI (Command Line Interface) เป็นโปรแกรมรับคำสั่งการทำงานผ่านการพิมพ์ WEKA Software
4
หน้าต่างหลักของ Explorer
WEKA Software
5
ปุ่มเลือกวิธีการจัดการข้อมูล แสดงข้อมูลของลักษณะเฉพาะ
ส่วนประกอบหลักของ Explorer แถบเมนูหลัก ปุ่มเปิดแฟ้มข้อมูล ปุ่มเลือกวิธีการจัดการข้อมูล แสดงข้อมูลของลักษณะเฉพาะ WEKA Software
6
เมนูหลักของ Explorer Preprocess การเตรียมข้อมูล
Classify เป็นโมดูลการทำเหมืองข้อมูลแบบการจำแนกประเภท (Classification) Cluster เป็นโมดูลการทำเหมืองข้อมูลแบบการแบ่งกลุ่ม (Clustering) Associate เป็นโมดูลการทำเหมืองข้อมูลแบบกฎความสัมพันธ์ (Association rule) Select attribute เป็นโมดูลการเลือกลักษณะเฉพาะ Visualize นำเสนอข้อมูลด้วยภาพนามธรรมสองมิติ WEKA Software
7
ประเภทของแฟ้มข้อมูลที่รับได้
แฟ้มข้อมูลที่รับต้องเป็น ARFF หรือ CSV ในกรณีที่แฟ้มข้อมูลอยู่ในเครือข่ายสามารถเรียกใช้ผ่าน URL ได้ สามารถเรียกใช้มูลจากฐานข้อมูลได้ โดยเชื่อมโยงผ่าน JDBC WEKA Software
8
แฟ้มข้อมูลแบบ ARFF ตัวอย่างแฟ้ม weather.arff
ARFF ย่อมาจาก Attribute-Relation File Format @relation name เป็นบรรทัดที่บอกชื่อตารางข้อมูลเชิงสัมพันธ์ @attribute att-name type เป็นบรรทัดที่บอกชื่อลักษณะเฉพาะและชนิด numeric หรือ real หมายถึงลักษณะเฉพาะที่เก็บค่าเป็นตัวเลข {v1, v, …, vn} หมายถึงลักษณะเฉพาะที่เก็บค่าไม่ต่อเนื่อง @data เป็นบรรทัดที่บอกถึงแถวที่ตามมาจะเป็นข้อมูล โดยแต่ละแถวจะแทนหนึ่งตัวอย่างข้อมูลซึ่งเรียงตามค่าของลักษณะเฉพาะที่บอกไว้ข้างต้น ตัวอย่างแฟ้ม weather.arff @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes … 14 instances WEKA Software
9
ตัวอย่างแฟ้ม weather.arff
WEKA Software 9
10
ตัวอย่างชุดข้อมูล Car Evaluation จาก UCI
แฟ้มข้อมูลแบบ CSV สร้างแฟ้มแบบ CSV ด้วยโปรแกรม Microsoft Excel ชุดข้อมูลตัวอย่างที่ได้จาก UCI ชื่อชุดข้อมูล Car Evaluation Data Set Attribute Information: Class Values: unacc, acc, good, vgood Attributes: buying: vhigh, high, med, low. maint: vhigh, high, med, low. doors: 2, 3, 4, 5more. persons: 2, 4, more. lug_boot: small, med, big. safety: low, med, high. ตัวอย่างชุดข้อมูล Car Evaluation จาก UCI WEKA Software
11
สร้างแฟ้มข้อมูลแบบ CSV
เปิดชุดข้อมูล Car Evaluation Data Set WEKA Software
12
สร้างแฟ้มข้อมูลแบบ CSV
จากตัวช่วยการนำเข้าข้อความ เลือกแบบมีการใช้ตัวคั่น กดปุ่ม ถัดไป > WEKA Software
13
สร้างแฟ้มข้อมูลแบบ CSV
เลือกตัวคั่นแบบ จุลภาค (,) กดปุ่ม เสร็จสิ้น WEKA Software
14
สร้างแฟ้มข้อมูลแบบ CSV
แทรกแถวที่ 1 เพื่อระบุชื่อ Attribute WEKA Software
15
สร้างแฟ้มข้อมูลแบบ CSV
บันทึกแฟ้ม เก็บเป็นชนิด CSV (Comma delimited) (*.csv) WEKA Software
16
ตัวอย่างแฟ้ม car.csv WEKA Software
17
การจำแนกประเภทข้อมูลใน WEKA
WEKA Software 17
18
การเตรียมชุดข้อมูล กำหนด Class ให้กับชุดข้อมูล (ลักษณะเฉพาะตัวสุดท้าย)
บางอัลกอริทึมที่ใช้ในการจำแนกต้องการลักษณะเฉพาะที่มีค่าไม่ต่อเนื่อง ดังนั้นจึงต้องแปลงลักษณะเฉพาะที่มีค่าต่อเนื่องเป็นลักษณะเฉพาะที่มีค่าไม่ต่อเนื่อง WEKA Software 18
19
ตัวอย่างการใช้งาน WEKA
เริ่มต้นเปิด WEKA Explorer เปิดตัวอย่างชุดข้อมูล weather.nominal.arff (ลักษณะเฉพาะทุกตัวมีค่าไม่ต่อเนื่องทั้งหมด) ตัวอย่างชุดข้อมูล weather.nominal.arff WEKA Software 19
20
กดปุ่ม choose เลือก classifiers เลือก classifier ที่ใช้จำแนกประเภท
เลือกแถบ Classify กดปุ่ม choose เลือก classifiers เลือก classifier ที่ใช้จำแนกประเภท เช่น เลือก trees >> Id3 WEKA Software 20
21
เลือกลักษณะเฉพาะ Class
เลือกรูปแบบการทดสอบ เลือกลักษณะเฉพาะ Class กดปุ่ม Start เพื่อเริ่มต้น WEKA Software 21
22
ผลลัพธ์ของตัวจำแนก Confusion matrix แสดงค่าที่ได้จากตัวจำแนก (ด้านบน) กับค่าจริง (ด้านล่าง) WEKA Software 22
23
การแปลงลักษณะเฉพาะให้เป็นค่าไม่ต่อเนื่อง
เริ่มต้นเปิด WEKA Explorer เปิดตัวอย่างชุดข้อมูล weather.arff จะเห็นว่าลักษณะเฉพาะ temperature และ humidity มีค่าต่อเนื่อง ตัวอย่างชุดข้อมูล weather.nominal.arff WEKA Software 23
24
เลือก Discretize ในกล่อง Filter โดยกดปุ่ม Choose เลือก filters unsupervised attribute
WEKA Software
25
ปรับค่าในกล่อง bins ให้เหมาะสม เช่น กำหนดให้เป็น 3 กดปุ่ม OK
แล้วกด Apply WEKA Software
26
ผลที่ได้จากการแปลงเป็นค่าไม่ต่อเนื่อง
WEKA Software
27
การจำแนกประเภทโดยใช้ J48
เลือกแถบ Classify กดปุ่ม choose เลือก classifiers trees J48 เราไม่จำเป็นต้องแปลงลักษณะเฉพาะให้เป็นค่าที่ไม่ต่อเนื่อง เลือกรูปแบบการทดสอบแบบ Use training set กดปุ่ม Start จะได้ผลลัพธ์ดังรูป WEKA Software 27
28
ถ้าใช้ J48 เราสามารถแสดงรูปของต้นไม้ได้
WEKA Software
29
การจำแนกประเภทโดยใช้ Neural Network
เลือกแถบ Classify กดปุ่ม choose เลือก classifiers เลือก functions --> MultilayerPerceptron WEKA Software 29
30
คลิกที่กล่อง Classifier เพื่อกำหนดค่า
เลือก GUI=True เพื่อแสดงภาพโครงข่ายประสาท เลือกจำนวน hidden node เลือกอัตราการเรียนรู้ WEKA Software
31
จำนวน hidden nodes ประมาณได้จาก (input+output)/2
กดปุ่ม Start เพื่อเริ่มสร้าง กดปุ่ม Accept หลังจากการทำงานเสร็จ WEKA Software
32
แสดงผลลัพธ์ที่ได้ Confusion matrix แสดงค่าที่ได้จากตัวจำแนก (ด้านบน) กับค่าจริง (ด้านล่าง) WEKA Software
33
การแปลงลักษณะเฉพาะให้เป็นค่าไม่ต่อเนื่องโดยใช้ MS Excel
จากตัวอย่างชุดข้อมูล weather.arff จะเห็นว่าลักษณะเฉพาะ temperature และ humidity มีค่าต่อเนื่อง WEKA Software 33
34
ค่าต่อเนื่อง ค่าไม่ต่อเนื่อง
แปลงลักษณะเฉพาะ temperature และ humidity ที่มีค่าต่อเนื่องให้เป็นค่าที่ไม่ต่อเนื่อง ลักษณะเฉพาะ temperature จะแบ่งช่วงดังนี้ =IF(B2>78,"hot",IF(B2<71,"cool","mild")) ลักษณะเฉพาะ humidity จะแบ่งช่วงดังนี้ =IF(C2<85,"normal","high") จากนั้นบันทึกเป็น CSV WEKA Software 34
35
อ้างอิง WEKA. [ออนไลน์]. เข้าถึงได้จาก : (กรกฎาคม 2554). กรุง สินอภิรมย์สราญ. การวิเคราะห์การเกาะกลุ่มในซอฟต์แวร์ Weka. [ออนไลน์]. ภาควิชาคณิตศาสตร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย. เข้าถึงได้จาก : (กรกฎาคม 2554). WEKA Software 35
งานนำเสนอที่คล้ายกัน
© 2024 SlidePlayer.in.th Inc.
All rights reserved.