งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

ก ารใช้ซอฟต์แวร์ WEKA. WEKA Software 2 แ นะนำซอฟต์แวร์ WEKA  WEKA ย่อมาจาก Waikato Environment for Knowledge Analysis  พัฒนาด้วยภาษาจาวาทั้งหมด  พัฒนาโดยเน้นทางด้าน.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "ก ารใช้ซอฟต์แวร์ WEKA. WEKA Software 2 แ นะนำซอฟต์แวร์ WEKA  WEKA ย่อมาจาก Waikato Environment for Knowledge Analysis  พัฒนาด้วยภาษาจาวาทั้งหมด  พัฒนาโดยเน้นทางด้าน."— ใบสำเนางานนำเสนอ:

1 ก ารใช้ซอฟต์แวร์ WEKA

2 WEKA Software 2 แ นะนำซอฟต์แวร์ WEKA  WEKA ย่อมาจาก Waikato Environment for Knowledge Analysis  พัฒนาด้วยภาษาจาวาทั้งหมด  พัฒนาโดยเน้นทางด้าน Machine learning และ Data mining  มีโมดูลย่อยสำหรับจัดการข้อมูล  ใช้ GUI และคำสั่งในการสั่งให้ ซอฟต์แวร์ประมวลผล  สามารถดาวน์โหลดฟรีได้ที่ html html

3 WEKA Software 3 โ ปรแกรมหลักของซอฟต์แวร์ WEKA  Explorer เป็นโปรแกรมที่ ออกแบบในลักษณะ GUI  Experimenter เป็นโปรแกรมที่ ออกแบบการทดลองและการ ทดสอบผล  KnowledgeFlow เป็น โปรแกรมออกแบบผังการไหล ของความรู้  Simple CLI (Command Line Interface) เป็นโปรแกรมรับ คำสั่งการทำงานผ่านการพิมพ์

4 WEKA Software 4 ห น้าต่างหลักของ Explorer

5 WEKA Software 5 ส่ วนประกอบหลักของ Explorer แถบเมนู หลัก ปุ่มเปิด แฟ้มข้อมูล ปุ่มเลือก วิธีการ จัดการ ข้อมูล แสดง ข้อมูลของ ลักษณะเฉ พาะ

6 WEKA Software 6 เ มนูหลักของ Explorer  Preprocess การเตรียมข้อมูล  Classify เป็นโมดูลการทำเหมืองข้อมูลแบบการจำแนก ประเภท (Classification)  Cluster เป็นโมดูลการทำเหมืองข้อมูลแบบการแบ่งกลุ่ม (Clustering)  Associate เป็นโมดูลการทำเหมืองข้อมูลแบบกฎ ความสัมพันธ์ (Association rule)  Select attribute เป็นโมดูลการเลือกลักษณะเฉพาะ  Visualize นำเสนอข้อมูลด้วยภาพนามธรรมสองมิติ

7 WEKA Software 7 ป ระเภทของแฟ้มข้อมูลที่รับได้  แฟ้มข้อมูลที่รับต้องเป็น ARFF หรือ CSV  ในกรณีที่แฟ้มข้อมูลอยู่ในเครือข่ายสามารถเรียกใช้ผ่าน URL ได้  สามารถเรียกใช้มูลจากฐานข้อมูลได้ โดยเชื่อมโยงผ่าน JDBC

8 WEKA Software 8 แ ฟ้มข้อมูลแบบ ARFF  ARFF ย่อมาจาก Attribute- Relation File Format name เป็นบรรทัดที่บอก ชื่อตารางข้อมูลเชิงสัมพันธ์ att-name type เป็น บรรทัดที่บอกชื่อลักษณะเฉพาะและ ชนิด  numeric หรือ real หมายถึง ลักษณะเฉพาะที่เก็บค่าเป็น ตัวเลข  {v 1, v, …, v n } หมายถึงลักษณะ เฉพาะที่เก็บค่าไม่ต่อเนื่อง เป็นบรรทัดที่บอกถึงแถวที่ ตามมาจะเป็นข้อมูล โดยแต่ละแถวจะ แทนหนึ่งตัวอย่างข้อมูลซึ่งเรียงตาม ค่าของลักษณะเฉพาะที่บอกไว้ outlook {sunny, overcast, temperature humidity windy {TRUE, play {yes, sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes … 14 instances ตัวอย่างแฟ้ม weather.arff

9 WEKA Software 99 ตั วอย่างแฟ้ม weather.arff

10 WEKA Software 10 แ ฟ้มข้อมูลแบบ CSV  สร้างแฟ้มแบบ CSV ด้วย โปรแกรม Microsoft Excel  ชุดข้อมูลตัวอย่างที่ได้จาก UCI ชื่อชุดข้อมูล Car Evaluation Data Set  Attribute Information: –Class Values: unacc, acc, good, vgood –Attributes: buying: vhigh, high, med, low. maint: vhigh, high, med, low. doors: 2, 3, 4, 5more. persons: 2, 4, more. lug_boot: small, med, big. safety: low, med, high. ตัวอย่างชุดข้อมูล Car Evaluation จาก UCI

11 WEKA Software 11 ส ร้างแฟ้มข้อมูลแบบ CSV  เปิดชุดข้อมูล Car Evaluation Data Set

12 WEKA Software 12 ส ร้างแฟ้มข้อมูลแบบ CSV  จากตัวช่วยการนำเข้า ข้อความ เลือกแบบมีการ ใช้ตัวคั่น  กดปุ่ม ถัดไป >

13 WEKA Software 13 ส ร้างแฟ้มข้อมูลแบบ CSV  เลือกตัวคั่นแบบ จุลภาค (,)  กดปุ่ม เสร็จสิ้น

14 WEKA Software 14 ส ร้างแฟ้มข้อมูลแบบ CSV  แทรกแถวที่ 1 เพื่อระบุชื่อ Attribute

15 WEKA Software 15 ส ร้างแฟ้มข้อมูลแบบ CSV  บันทึกแฟ้ม เก็บเป็นชนิด CSV (Comma delimited) (*.csv)

16 WEKA Software 16 ตั วอย่างแฟ้ม car. csv

17 WEKA Software 17 ก ารจำแนกประเภท ข้อมูลใน WEKA

18 WEKA Software 18 ก ารเตรียมชุดข้อมูล  กำหนด Class ให้กับชุดข้อมูล ( ลักษณะเฉพาะตัว สุดท้าย )  บางอัลกอริทึมที่ใช้ในการจำแนกต้องการลักษณะ เฉพาะที่มีค่าไม่ต่อเนื่อง ดังนั้นจึงต้องแปลง ลักษณะเฉพาะที่มีค่าต่อเนื่องเป็นลักษณะเฉพาะที่ มีค่าไม่ต่อเนื่อง

19 WEKA Software 19 ตั วอย่างการใช้งาน WEKA  เริ่มต้นเปิด WEKA Explorer  เปิดตัวอย่างชุดข้อมูล weather.nominal.arff ( ลักษณะเฉพาะทุกตัวมีค่าไม่ ต่อเนื่องทั้งหมด ) ตัวอย่างชุดข้อมูล weather.nominal.arff

20 WEKA Software 20 - เลือกแถบ Classify - กดปุ่ม choose เลือก classifiers - เลือก classifier ที่ใช้ จำแนกประเภท - เช่น เลือก trees >> Id3

21 WEKA Software 21 - เลือกรูปแบบการทดสอบ - เลือกลักษณะเฉพาะ Class - กดปุ่ม Start เพื่อเริ่มต้น

22 WEKA Software 22 ผลลัพธ์ของตัว จำแนก Confusion matrix แสดง ค่าที่ได้จากตัวจำแนก ( ด้านบน ) กับค่าจริง ( ด้านล่าง )

23 WEKA Software 23 ก ารแปลงลักษณะเฉพาะให้เป็นค่าไม่ ต่อเนื่อง  เริ่มต้นเปิด WEKA Explorer  เปิดตัวอย่างชุดข้อมูล weather.arff  จะเห็นว่าลักษณะเฉพาะ temperature และ humidity มีค่าต่อเนื่อง ตัวอย่างชุดข้อมูล weather.nominal.arff

24 WEKA Software 24 - เลือก Discretize ในกล่อง Filter โดยกดปุ่ม Choose เลือก filters  unsupervised  attribute

25 WEKA Software 25 - ปรับค่าในกล่อง bins ให้ เหมาะสม เช่น กำหนดให้เป็น 3 - กดปุ่ม OK - แล้วกด Apply

26 WEKA Software 26 - ผลที่ได้จากการแปลงเป็น ค่าไม่ต่อเนื่อง

27 WEKA Software 27 ก ารจำแนกประเภทโดยใช้ J48  เลือกแถบ Classify  กดปุ่ม choose เลือก classifiers  trees  J48  เราไม่จำเป็นต้องแปลง ลักษณะเฉพาะให้เป็นค่าที่ไม่ ต่อเนื่อง  เลือกรูปแบบการทดสอบแบบ Use training set  กดปุ่ม Start  จะได้ผลลัพธ์ดังรูป

28 WEKA Software 28 - ถ้าใช้ J48 เราสามารถแสดง รูปของต้นไม้ได้

29 WEKA Software 29 - เลือกแถบ Classify - กดปุ่ม choose เลือก classifiers - เลือก functions --> MultilayerPerceptron ก ารจำแนกประเภทโดยใช้ Neural Network

30 WEKA Software 30 - คลิกที่กล่อง Classifier เพื่อกำหนดค่า - เลือก GUI=True เพื่อ แสดงภาพโครงข่าย ประสาท - เลือกจำนวน hidden node - เลือกอัตราการเรียนรู้

31 WEKA Software 31 - จำนวน hidden nodes ประมาณได้จาก (input+output)/2 - กดปุ่ม Start เพื่อ เริ่มสร้าง - กดปุ่ม Accept หลังจากการ ทำงานเสร็จ

32 WEKA Software 32 แสดงผลลัพธ์ที่ได้ Confusion matrix แสดง ค่าที่ได้จากตัวจำแนก ( ด้านบน ) กับค่าจริง ( ด้านล่าง )

33 WEKA Software 33 ก ารแปลงลักษณะเฉพาะให้เป็นค่าไม่ ต่อเนื่องโดยใช้ MS Excel  จากตัวอย่างชุดข้อมูล weather.arff  จะเห็นว่าลักษณะเฉพาะ temperature และ humidity มีค่าต่อเนื่อง

34 WEKA Software 34  แปลงลักษณะเฉพาะ temperature และ humidity ที่มีค่า ต่อเนื่องให้เป็นค่าที่ไม่ต่อเนื่อง  ลักษณะเฉพาะ temperature จะแบ่งช่วงดังนี้ =IF(B2>78,"hot",IF(B2<71,"cool","mild"))  ลักษณะเฉพาะ humidity จะแบ่งช่วงดังนี้ =IF(C2<85,"normal","high")  จากนั้นบันทึกเป็น CSV ค่า ต่อเนื่อง ค่าไม่ ต่อเนื่อง

35 WEKA Software 35 อ้ างอิง  WEKA. [ ออนไลน์ ]. เข้าถึงได้จาก : ( กรกฎาคม 2554).  กรุง สินอภิรมย์สราญ. การวิเคราะห์การเกาะกลุ่มในซอฟต์แวร์ Weka. [ ออนไลน์ ]. ภาควิชาคณิตศาสตร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย. เข้าถึงได้จาก : ( กรกฎาคม 2554).


ดาวน์โหลด ppt ก ารใช้ซอฟต์แวร์ WEKA. WEKA Software 2 แ นะนำซอฟต์แวร์ WEKA  WEKA ย่อมาจาก Waikato Environment for Knowledge Analysis  พัฒนาด้วยภาษาจาวาทั้งหมด  พัฒนาโดยเน้นทางด้าน.

งานนำเสนอที่คล้ายกัน


Ads by Google