Data Mining Association Analysis ## Weka

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
กลุ่มคำสั่ง SQL สามารถแบ่งได้ดังนี้
Advertisements

File System Example of File System Employee Department
ประเภทของระบบสารสนเทศในองค์กร
ลักษณะระบบสารสนเทศเพื่อการจัดการ
SQL Server using Transact-SQL
Data Warehousing and Data Mining
Data Management (การจัดการข้อมูล)
CHARPTER 4 การสอบถามข้อมูลแบบมีเงื่อนไข
CHARPTER 3 การสอบถามข้อมูลพื้นฐาน
การใช้งาน ASP.NET 3.5 ด้านฐานข้อมูล
Chapter 10 Session & Cookie.
องค์ประกอบของคอมพิวเตอร์
Customer Relationship Management (CRM)
Database and Application Development Life Cycle 2.
การออกแบบส่วนต่อประสาน
ข้อมูล (data) หมายถึง ข้อเท็จจริงหรือ เหตุการณ์ ที่เกี่ยวข้องกับสิ่งต่าง ๆที่ เป็นตัวเลข ข้อความหรือ รายละเอียดซึ่งอาจอยู่ใน รูปแบบต่าง ๆ เช่น ภาพ เสียง.
ระบบสารสนเทศ อ.วรพจน์ พรหมจักร.
Report การแข่งขัน.
ศูนย์ข้อมูลกลางเพื่อบริหารจัดเก็บและใช้ประโยชน์
Management system at Dell
บทที่ 1 ความรู้เบื้องต้นเกี่ยวกับระบบและการวิเคราะห์ระบบ
Microsoft Access การใช้งานโปรแกรมระบบจัดการฐานข้อมูล
Everything that has a beginning has an end…
บทที่ 10 การออกแบบรายงาน Output Design
ภาษา SQL (Structured Query Language)
ผู้บริหารกรมชลประทานกับระบบEIS
การบริหารความสัมพันธ์ลูกค้า Customer Relationship Management: CRM
SQL (Structured Query Language)
Author (ผู้แต่ง) AuID รหัผู้แต่ง Char 3 PK AuName ชื่อผู้แต่ง Varchar Table name Attribute name Description Data Type Size Key References BookType.
Concept of Programing.
Data Management (การจัดการข้อมูล)
SQL (Structured Query Language)
การแสดงขั้นตอนวิธีด้วยรหัสเทียม (Pseudo-Code)
Information System Development
กฎความสัมพันธ์ Association Rules อาจารย์อนุพงศ์ สุขประเสริฐ
Data mining สุขฤทัย มาสาซ้าย.
Chapter 6 : แบบจำลอง E-R (Entity-Relationship Model)
บทที่ 6 ความรู้เกี่ยวกับรายการอาหารและ เครื่องดื่ม
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
Chapter 9 : ภาษาทางด้านฐานข้อมูลคำสั่ง SQL (SQL Command)
ทิศทางการดำเนินงาน ปีงบประมาณ 2560
ที่รองแขนฟองน้ำ หลักการและเหตุผล : เนื่องจากห้องผ่าตัดมีอุณหภูมิเย็น ผู้ป่วยที่มาผ่าตัดส่วนมากเวลาทำผ่าตัดจะจัด ท่านอนหงายราบ วัตถุประสงค์ : :
Introduction to Data mining
ภาควิชาเวชศาสตร์ฟื้นฟู คณะแพทยศาสตร์ มหาวิทยาลัยธรรมศาสตร์
(On-Line Analytical Processing)
บทที่ 3 แบบจำลองของฐานข้อมูล (Database Model)
E-R Diagram (Entity Relationship Diagram)
Data Management (การจัดการข้อมูล)
บทที่ 4 ฐานข้อมูล.
Database ฐานข้อมูล.
แนวทาง การจัดทำงบประมาณ ปี พ.ศ. 2562
หมู่บ้านอาสาพัฒนาและป้องกันตนเอง
บทที่ 6 การจัดการสินค้าคงคลัง
กฎการ Normalization 1. จะต้องไม่มีเซลล์ใดในตารางที่มีค่าเกิน 1 ค่า ดังนั้นเราสามารถทำให้ตารางผ่านกฎข้อที่ 1 ได้ด้วยการแยกเซลล์ที่มีค่าเกินหนึ่งออกเป็นเรคคอร์ดใหม่
การควบคุม (Controlling)
OLAP Analysis and Design vs TPS (เสริม)
การบูรณาการข้อมูล เพื่อการบริหารจัดการส่งต่อผู้ป่วยฉุกเฉิน/อุบัติเหตุ
Installer Project Prawit Pimpisan Computer Science RERU.
เทคโนโลยีเพื่องานประยุกต์ทางธุรกิจ 3 (2-2-5)
Integrated Mathematics
เทคนิคการเขียน Resume
ระบบสำหรับ Fusion.
Use Case Diagram ระบบเบิก-รับเวชภัณฑ์
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
Weka Installation.
CIT2205 โปรแกรมประยุกต์ด้านการจัดการฐานข้อมูล
Introduction to Structured System Analysis and Design
คลังข้อมูล (Data Warehouse)
การทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio
การรวบรวมข้อมูลข่าวสารการตลาด (The Marketing Information Gathering)
ใบสำเนางานนำเสนอ:

Data Mining Association Analysis ## Weka เป็นตัวอย่างที่โยงส่วนจัดการข้อมูลกับแบบจำลอง เพื่อให้เห็นภาพ สุรินทร์ทิพ ศักดิ์ภูวดล

คำสั่ง install program WEKA 3.8.2

4. องค์ประกอบและการทำงานของสถาปัตยกรรมของระบบสนับสนุนการตัดสินใจ (4/5) 4. องค์ประกอบและการทำงานของสถาปัตยกรรมของระบบสนับสนุนการตัดสินใจ (4/5) ระบบสารสนเทศชนิดอื่น ๆ ส่วนการจัดการข้อมูล ส่วนการจัดการแบบจำลอง ส่วนจัดการองค์ความรู้ ฐานข้อมูลภายใน/ ภายนอก ส่วนจัดการสื่อประสานกับผู้ใช้ ผู้บริหาร (ผู้ใช้/ผู้ตัดสินใจ) องค์ประกอบของสถาปัตยกรรมระบบสนับสนุนการตัดสินใจ ที่มีส่วนจัดการองค์ความรู้

5. การจัดการข้อมูล (Data Management) (2/7) แหล่งข้อมูลภายใน องค์กร แหล่งข้อมูลภายนอก องค์กร ฝ่ายการเงิน ฝ่ายการตลาด ฝ่ายการผลิต ฝ่ายบุคคล ฝ่ายอื่นๆ ฐานองค์ความรู้ของ องค์กร แหล่งข้อมูลส่วนบุคคล ส่วนกลั่นกรองข้อมูล ฐานข้อมูลระบบสนับสนุน การตัดสินใจ คลังข้อมูลขององค์กร ส่วนสอบถามข้อมูล สารบัญข้อมูล ระบบจัดการฐานข้อมูล สืบค้นข้อมูล สอบถามข้อมูล ปรับปรุงข้อมูล สร้างรายงาน ลบข้อมูล ส่วนการจัดการสื่อประสานกับผู้ใช้ ส่วนการจัดการแบบจำลอง โครงสร้างของส่วนจัดการข้อมูล (เฉพาะส่วนที่แรเงา) ส่วนการจัดการองค์ความรู้

โครงสร้างการทำงานของส่วนการจัดการแบบจำลอง ฐานแบบจำลอง เชิงกลยุทธ์ กลวิธี เชิงปฏิบัติ สำเร็จรูป เชิงสถิติ การเงิน การตลาด การจัดการ แบบแผนการสร้างแบบจำลอง สารบัญแบบจำลอง ระบบจัดการฐานแบบจำลอง คำสั่งการสร้างแบบจำลอง การปรับปรุงแบบจำลอง ติดต่อประสานงานกับฐานข้อมูล ภาษาที่ใช้จัดการแบบจำลอง การดำเนินการกับแบบจำลอง การทำงานร่วมกัน การประมวลผลคำสั่ง การประสาน ฯลฯ ส่วนการจัดการ ข้อมูล ส่วนการจัดการ สื่อประสานผู้ใช้ ส่วนการจัดการ องค์ความรู้ โครงสร้างการทำงานของส่วนการจัดการแบบจำลอง

ตัวอย่าง ใบเสร็จรับเงินจากการขายหน้าร้าน Sales transactions (TPS) Cust Id. 001 Date 16/01/2019 Receipt No. F16012019G300001   Time 8:00 Order No. Product Id. Product Name Qty Unit Price Total 1 G003 Bread 20.00 2 G001 Beer 60.00 120.00 3 G015 Milk 4 G004 Candy 10.00 5 G005 Coke 12.00 222.00

คำสั่ง #1 : 5นาที สร้าง คนละ 2 ใบเสร็จ สินค้าชื่อภาษาอังกฤษ กลุ่ม 1 Receive No. F16012019G100001 กลุ่ม 2 Receive No. F16012019G200001 กลุ่ม 3 Receive No. F16012019G300001 กลุ่ม 4 Receive No. F16012019G400001 กลุ่ม 5 Receive No. F16012019G500001 กลุ่ม 6 Receive No. F16012019G600001

ตัวอย่างของข้อมูลการขายในฐานข้อมูลรายวัน Operational Database (TPS) ซึ่งจะมีข้อมูลTable 3 Table คือ Table Sales , Table Product และ Table Sales_Detail Table: Product ProductId (Pk) ProductName Price BalancedQty G001 Beer 60 100 G002 Blanket 200 G003 Bread 20 40 G004 Candy 10 G005 Coke 12 G006 Computer 20000 30 G007 Cookie G008 Diaper 150 G009 Egg G010 Green Tea G011 Make up G012 Meat 190 50 G013 Medicine 290 G014 Microwave 3000 G015 milk G016 Printer 2000 G017 Shampoo G018 Telephone 30000 G019 Television G020 Water 120 Table: Sales ReceiptNo (Pk) Date Time CustomerId TotalNo F16012019G300001 16/01/2019 8:00 001 222 F16012019G300002 8:10 280 … Table: SalesDetail ReceiptNo (Pk) ProductId (Pk) Qty F16012019G300001 G003 1 G001 2 G015 G004 G005 F16012019G300002 3 …

คลังข้อมูล (Data Warehouse) : การวิเคราะห์ข้อมูลในคลังข้อมูล (2/2) ผล แหล่งข้อมูลเพื่อ การปฏิบัติงาน Report Generator รายงาน ข้อมูล ข้อมูล การใช้งาน Data Mining Tools ผล Data Warehouse ข้อมูล การใช้งาน ผู้ใช้งาน แหล่งข้อมูลเพื่อ การวิเคราะห์ OLAP Generator ข้อมูล ผล OLAP คลังข้อมูล ช่วงเวลาที่องค์กรไม่ได้ปฏิบัติงาน ช่วงเวลาที่องค์กรปฏิบัติงาน

ในระบบนี้ เราจะประยุกต์โดยเราจะไม่ทำ Data mart ข้อมูลจาก Data warehouse จะถูกนำไปวิเคราะห์เลย

จัดการข้อมูลจากใบเสร็จ ให้อยู่ในรูปแบบเพื่อการวิเคราะห์ แล้วนำไปจัดเก็บใน Data Staging Area โดยการทำ ETL 1. Extract การสกัดข้อมูล เป็นเลือกข้อมูลที่ดี และข้อมูลตามต้องการ 2. Transform การแปลงรูปแบบข้อมูล ให้อยู่รูปแบบที่ต้องการ เช่น ข้อมูลเงินจาก 50 เป็น 50.00 3. Load การนำข้อมูลที่แปลงรูปแบบ แล้วนำไปเก็บยัง ฐานข้อมูลปลายทาง

จากตัวอย่างข้อมูล การทำ Filtering นั้นเราต้องการข้อมูลที่ต้องการจริงๆ ตัวอย่างข้อมูล ใน Staging Area หลังจาก ETL และ ทำการ Filtering and Cleansing จากตัวอย่างข้อมูล การทำ Filtering นั้นเราต้องการข้อมูลที่ต้องการจริงๆ จากตัวอย่างนี้เราไม่ต้องการข้อมูล ยอดสุทธิ วันที่ ลูกค้า รหัสสินค้า การ Cleansing นั้นข้อมูลใบเสร็จที่ขาดๆ หายๆ หรือ ใบเสร็จที่ยกเลิกเราจะลบออก Receive No Product Qty Unit Price Total F16012019G300001 Bread 1 15.00 Beer 2 60.00 120.00 Milk 10.00 Candy 5.00 Coke 12.00 F16012019G300002 Telephone 3000.00 Water 55.00 Egg F16012019G300003 25.00 50.00 99.00 40.00 … และ จากนั้นนำข้อมูลที่ต้องการจริงๆเท่านั้น จะถูกทำการ ETL เข้าสู่ Data Warehouse ต่อไป

ตัวอย่างข้อมูลใน Data Warehouse Receive No Product Qty Unit Price Total F16012019G300001 Bread 1 15.00 Beer 2 60.00 120.00 Milk 10.00 Candy 5.00 Coke 12.00 F16012019G300002 Telephone 3000.00 Water 55.00 Egg F16012019G300003 25.00 50.00 99.00 40.00 …

ข้อมูลเหล่านี้จะถูกทำการปรับปรุง หรือลบทิ้ง Data Warehouse ข้อมูลจาก Data warehouse นั้นจะถูกจัดการอีกครั้งเพราะ ในการประมวลผลในแต่ละ Technique ข้อมูลจะถูกจัดรูปแบบให้เหมาะกับแต่ละ Technique Association ใน WEKA ข้อมูลเหล่านี้จะถูกทำการปรับปรุง หรือลบทิ้ง

ข้อมูลที่พร้อมประมวลผล

Mining Association Rules Example of Rules: {Milk,Diaper}  {Beer} (s=0.4, c=0.67) {Milk,Beer}  {Diaper} (s=0.4, c=1.0) {Diaper,Beer}  {Milk} (s=0.4, c=0.67) {Beer}  {Milk,Diaper} (s=0.4, c=0.67) {Diaper}  {Milk,Beer} (s=0.4, c=0.5) {Milk}  {Diaper,Beer} (s=0.4, c=0.5) จาก itemset {Milk, Diaper, Beer} k=3 เราจะมีกฏที่เป็นไปได้ 6 กรณี ค่า Support Count ทั้ง 6 Case เท่ากัน Case: 1 Case: 2

Mining Association Rules Case: 3 Case: 4 {Beer}  Milk, Diaper} Case: 5 Case: 6 {Diaper}  {Milk,Beer} {Milk}  {Diaper,Beer}

การ SET ค่าใน WEKA

Result from WEKA

ข้อสังเกตุ : การทดลอง