งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

การจำแนกข้อมูล (Classification) CART-Classification and regression Tree อ. วิวัฒน์ ชินนาทศิริกุล.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การจำแนกข้อมูล (Classification) CART-Classification and regression Tree อ. วิวัฒน์ ชินนาทศิริกุล."— ใบสำเนางานนำเสนอ:

1 การจำแนกข้อมูล (Classification) CART-Classification and regression Tree อ. วิวัฒน์ ชินนาทศิริกุล

2 เทคนิค Classification and regression trees (CART) คิดค้น โดย Breiman ในปืค. ศ.1984 ต้นไม้ตัดสินใจ ที่สร้างจากอัลกอริทึม CART จะเป็นต้นไม้ แบบ binary ซึ่งประกอบด้วย กิ่งหรือแขนง 2 กิ่ง สำหรับแต่ละ โหนด เทคนิคแบบ CART จะทำการแบ่ง เรคค อร์ดใน Training Data Set ออกเป็น เรคค อร์ดย่อย ที่ให้ค่าเป้าหมาย (target) ที่ เหมือนกัน

3 CART Algorithm กำหนดเป็นหน่วยวัดค่าที่ดีที่สุดของ การแตกโหนด คู่แข่ง s ที่โหนด t โดยที่

4 - โหนดลูกทางซ้ายของโหนด t - โหนดลูกทางขวาของโหนด t จำนวนเรคคอร์ดที่โหนด t L จำนวนเรคคอร์ดใน Training Set จำนวนเรคคอร์ดที่โหนด t R จำนวนเรคคอร์ดใน Training Set จำนวนเรคคอร์ของคลาส j ที่ t L จำนวนเรคคอร์ที่ t จำนวนเรคคอร์ของคลาส j ที่ t R จำนวนเรคคอร์ที่ t

5 ตัวอย่าง จาก Training Data Set ที่กำหนดให้ดัง ตาราง จะสร้าง Decision Tree ด้วย CART

6 ขั้นตอนการทำงาน นำแอททริบิวต์ Saving, Assets และ income มาสร้าง Candidate Split ดังตาราง

7 For each candidate split, let us examine the values of the various components of the optimality measure (s|t )

8 The maximum observed value for (s|t ) among the candidate splits is therefore attained by split 4, with (s|t ) = CART therefore chooses to make the initial partition of the data set using candidate split 4, assets=low versus assets {medium, high} ใน Candidate Split รายการที่ 4 มีค่า มากที่สุดคือ ดังนั้นจะใช้ Candidate Split รายการที่ 4 คือ Assets=low และ Assets {medium, high} เป็น Root Node

9

10 ตารางแสดง Values of the Components of the Optimality Measure Φ(s |t )for Each Candidate Split, for Decision Node A

11 Here two candidate splits (3 and 7) share the highest value for Φ (s|t ), We arbitrarily select the fi rst split encountered, split 3, savings = high versus savings {low, medium}, for decision node A

12 ภาพแสดง CART decision tree after decision node A split.

13 แบบฝึกหัด จากข้อมูลที่กำหนดให้ ให้นักศึกษาใช้เทคนิค CART เพื่อจำแนกเงินเดือน (Salary) ข้อแนะนำ เนื่องจากตัวเลขอายุ และรายได้มีหลากลายเกินไป ควรจัดกลุ่มอายุ และรายได้ เช่น อายุ <30 ปี รายได้ < อายุ ปี <= รายได้ < อายุ >40 ปี <= รายได้ < รายได้ >55000


ดาวน์โหลด ppt การจำแนกข้อมูล (Classification) CART-Classification and regression Tree อ. วิวัฒน์ ชินนาทศิริกุล.

งานนำเสนอที่คล้ายกัน


Ads by Google