Algorithm to Find Frequent Itemsets
Association Rules Goal: Provide an overview of basic Association Rule mining techniques Association Rules Problem Overview Large itemsets Association Rules Algorithms Apriori FP-Growth Index-BitTableFI
Association Rule Techniques Step1: Find Large Frequent Itemsets. Step 2: Generate rules from frequent itemsets.
Apriori Scan DB
Scan DB
Scan DB
FP-growth การหา Frequent Itemsets ด้วยอัลกอริทึม FP-growth ประกอบไปด้วย 2 ขั้นตอน คือ สร้าง FP-tree จากฐานข้อมูลที่กำหนดโดยจะมีการอ่านฐานข้อมูล 2 ครั้ง อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table อ่านฐานข้อมูลครั้งที่ 2 เพื่อสร้าง FP-tree หา Frequent Itemsets จาก FP-tree
อ่านฐานข้อมูลครั้งที่ 1 เพื่อนับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก หลังจากนั้นนำ items ที่เหลือมาเรียงลำดับตามค่าความถี่ของแต่ละ items จากมากไปน้อยในตารางที่เรียกว่า Hash Table ตัด 4 ออกแล้ว
Index-BitTableFI อ่านฐานข้อมูลเพียง 1 ครั้ง นับค่าความถี่ของแต่ละ items และทำการตัด items ที่มีค่าความถี่ขั้นต่ำออก จะได้ Frequent 1-itemsets หา Index array ของแต่ละ Frequent item โดยการดำเนินการ AND ระหว่างบิตแมปเวกเตอร์ของทรานแซคชั่นที่ Item นั้นปรากฎ นำ Index array ไปหา Frequent k-itemsets
(1,3) (2,3) (2,5) (2,3,5) (3,5)