งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

K-Nearest Neighbour Algorithm. Introduction K-Nearest Neighbour คือ วิธีการในการ จัดแบ่งคลาส เทคนิคนี้จะตัดสินใจ ว่าคลาสใดที่จะ แทนเงื่อนไขหรือกรณีใหม่ๆ.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "K-Nearest Neighbour Algorithm. Introduction K-Nearest Neighbour คือ วิธีการในการ จัดแบ่งคลาส เทคนิคนี้จะตัดสินใจ ว่าคลาสใดที่จะ แทนเงื่อนไขหรือกรณีใหม่ๆ."— ใบสำเนางานนำเสนอ:

1 K-Nearest Neighbour Algorithm

2 Introduction K-Nearest Neighbour คือ วิธีการในการ จัดแบ่งคลาส เทคนิคนี้จะตัดสินใจ ว่าคลาสใดที่จะ แทนเงื่อนไขหรือกรณีใหม่ๆ ได้บ้าง โดยการ ตรวจสอบจำนวนบางจำนวน (“K” ใน K-nearest neighbor) ของกรณีหรือเงื่อนไขที่เหมือนกันหรือ ใกล้เคียงกันมากที่สุด โดยจะหาผลรวม (Count Up) ของจำนวนเงื่อนไข หรือกรณีต่างๆสำหรับแต่ละ คลาส และกำหนดเงื่อนไขใหม่ๆ ให้คลาสที่ เหมือนกันกับคลาสที่ใกล้เคียงกันมากที่สุด

3 ในการนำเทคนิคของ K-NN ไปใช้ในนั้นเป็นการ หาวิธีการวัดระยะห่างระหว่างแต่ละ Attribute ในข้อมูล ให้ได้ และจากนั้นคำนวณค่าออกมา ซึ่งวิธีนี้จะ เหมาะสำหรับข้อมูลแบบตัวเลข แต่ตัวแปรที่เป็นค่า แบบไม่ต่อเนื่องนั้นก็สามารถทำได้ เพียงแต่ต้องการ การจัดการแบบพิเศษเพิ่มขึ้น อย่างเช่น ถ้าเป็นเรื่อง ของสี เราจะใช้อะไรวัดความแตกต่างระหว่างสีน้ำ เงินกับสีเขียว ต่อจากนั้นเราต้องมีวิธีในการรวมค่า ระยะห่างของ Attribute ทุกค่าที่วัดมาได้ เมื่อเรา สามารถคำนวณระยะห่างระหว่างเงื่อนไขหรือกรณี ต่างๆ ได้จากนั้นเราเลือกชุดของเงื่อนไข ที่ใช้จัด คลาสมาเป็นฐานสำหรับการจัดคลาสในเงื่อนไข ใหม่ๆ ได้แล้วเราจะตัดสินได้ว่าขอบเขตของจุด ข้างเคียงที่ควรเป็นนั้น ควรมีขนาดใหญ่เท่าไร และ อาจตัดสินใจได้ด้วยว่าจะนับจำนวนจุดข้างเคียงตัว มันได้อย่างไร Introduction(2)

4 TWO MAIN OPERATION  Distance Function  เป็นการคำนวณค่าระยะห่างระหว่างสองเรคค อร์ด เพื่อที่จะมาวัดความคล้ายคลึงกันของ ข้อมูล  Combination Function  เป็นการรวมกันของผลลัพธ์ที่ได้จากการ คำนวณค่า Distance โดยทำการเรียงลำดับค่า Distance จากน้อยไปมาก หลังจากนั้นดูจาก ค่า “K” ว่ากำหนดเป็นเท่าไร แล้วนำลำดับที่ เรียงได้มาเทียบกับคลาสข้อมูลที่เรียงแล้ว นำมาตอบ

5 คุณสมบัติของ DISTANCE FUNCTION  ค่าระยะทาง ( ความห่าง ) ที่คำนวณได้ต้องไม่ติด ลบ  ถ้าตำแหน่งเดียวกันฟังก์ชันต้องเป็นศูนย์ ( ค่า เหมือนกัน )  การคำนวณวัดระยะทางไปกลับต้องเท่ากัน

6 การคำนวณค่า DISTANCE FUNCTION  ใส่ค่าสัมบูรณ์ (Absolute) ให้กับค่า Distance: |A-B|  ยกกำลังสองให้กับค่า Distance: (A-B) 2  ทำการ Normalized Absolute Value: |A-B|/(maximum difference)  ทำการปรับให้เป็นค่ามาตรฐาน : |(A- mean)/(SD)-(B-mean)/(SD)|

7 การรวมค่า DISTANCE ใน Record  Manhattan distance or summation:  เป็นการนำค่าที่คำนวณได้ในหนึ่ง Record มา รวมกัน  Normalized summation:  เป็นการนำค่าที่ได้จากข้อแรกมาหารด้วยค่า Max ของ Attribute  Euclidean distance:  เป็นการหารากที่สอง (Square Root) ในแต่ ละ Attribute แล้วนำมารวมกัน แล้วนำค่าที่ คำนวณได้ในหนึ่ง Record มารวมกัน

8 Case Study No.GenderAgeSalaryinactiv e 1F2719,000No 2M5164,000Yes 3M52105,000Yes 4F3355,000Yes 5M4545,000No newF45100,000???

9 Identic al Gender |A-B| Age |A-B| Salary Distanc e dsum d(1,n)01881, d(2,n)1636, d(3,n)175, d(4,n)01245, d(5,n)1055, Case Study(2) >>> เรียง dsum จากน้อยไปหามากจะได้เป็น

10 Identical Gender |A-B| Age |A-B| Salary Distance dnormal d(1,n)01881,000 1 d(2,n)1636, d(3,n)175, d(4,n)01245, d(5,n)1055, Case Study(3) >>> เรียง dsum จากน้อยไปหามากจะได้เป็น

11 Identical Gender |A-B| Age |A-B| Salary Distance deuclid d(1,n)01881,000 6,561,000,324 d(2,n)1636,000 1,296,000,037 d(3,n)175,000 25,000,050 d(4,n)01245,000 2,025,000,144 d(5,n)1055,000 3,025,000,001 Case Study(4) >>> เรียง dsum จากน้อยไปหามากจะได้เป็น

12 Case Study(5) Neigh- bour Neighbour Attribute K=1K=2K=3K=4K=5 dsum3,2,4,5,1Y,Y,Y,N,NYes dnormal3,2,4,5,1Y,Y,Y,N,NYes Deu-clid3,2,4,5,1Y,Y,Y,N,NYes

13 การวัดค่า Performance  สมมติข้อมูลค่า Training คือ No.GenderAgeSalaryinactive 1F2719,000No 2M5164,000Yes 3M52105,000Yes 4F3355,000Yes 5M4545,000No new_1F45100,000Yes new_2M3555,500No new_3M4855,000No

14 New_1New_2New_3Performance K=1YYN2/3x100 = 66.67% K=2Y???Y1/3x100 = 33.33% K=3YNN3/3x100 = 100% การวัดค่า Performance(2) ควรจะเลือก K = 3 เนื่องจากมีค่า Performance มากที่สุด

15 ข้อดี - ข้อเสียของ KNN  ข้อดี  หากเงื่อนไขการตัดสินใจมีความซับซ้อนวิธี นี้สามารถสร้างโมเดลที่มีประสิทธิภาพได้  ข้อเสีย  ใช้ระยะเวลาในการคำนวณนาน  ถ้า Attribute มีจำนวนมากจะเกิดปัญหาใน การคำนวณค่า


ดาวน์โหลด ppt K-Nearest Neighbour Algorithm. Introduction K-Nearest Neighbour คือ วิธีการในการ จัดแบ่งคลาส เทคนิคนี้จะตัดสินใจ ว่าคลาสใดที่จะ แทนเงื่อนไขหรือกรณีใหม่ๆ.

งานนำเสนอที่คล้ายกัน


Ads by Google