งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

229-611 Data Warehousing and Data Mining ผศ. ดร. วิภาดา เวทย์ประสิทธิ์ ภาควิชาวิทยาการคอมพิวเตอร์ มหาวิทยาลัยสงขลานครินทร์ ห้อง CS 108

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "229-611 Data Warehousing and Data Mining ผศ. ดร. วิภาดา เวทย์ประสิทธิ์ ภาควิชาวิทยาการคอมพิวเตอร์ มหาวิทยาลัยสงขลานครินทร์ ห้อง CS 108"— ใบสำเนางานนำเสนอ:

1 Data Warehousing and Data Mining ผศ. ดร. วิภาดา เวทย์ประสิทธิ์ ภาควิชาวิทยาการคอมพิวเตอร์ มหาวิทยาลัยสงขลานครินทร์ ห้อง CS Website :

2 Data Warehousing and Data Mining Chapter 1 2 วัตถุประสงค์ 1. ให้นักศึกษามีความรู้ความเข้าใจเกี่ยวกับการ จัดการเหมืองข้อมูลได้ 2. ให้นักศึกษาสามารถทำเหมืองข้อมูลได้ 3. ให้นักศึกษาสามารถศึกษาค้นคว้าด้วยตนเอง เกี่ยวกับการทำ เหมืองข้อมูลได้

3 Data Warehousing and Data Mining Chapter 1 3 เนื้อหา Chapter 1 : Introduction Chapter 2 : Data Warehouse Chapter 3 : Data Mining Chapter 4 : Basic Data Mining Techniques Chapter 5: Data Mining a Closer Look Chapter 6 : Cross Validation Chapter 7 : Decision Tree Chapter 8 : Association Rules Chapter 9 : The K- Means Algorithm Chapter 10 : Neural Networks Chapter 11 : Statistical Techniques Chapter 12 : Rule Base System

4 Data Warehousing and Data Mining Chapter 1 4 เอกสารประกอบการสอน 1. Data Mining A tutorial-Based Primer, Richard J. Roiger and Michael W. Geatz, Pearson Education Inc., Mining Very Large Databases with Parallel Processing, Alex A. Freitas and Simon H. Lavington, Kluwer Academic Publishers, การออกแบบและพัฒนาคลังข้อมูล (Data Warehouse), กิตติ ภักดีวัฒนะกุล, บริษัทเคทีพี คอมพ์ แอนด์ คอนซัลท์, คัมภีร์ระบบสนับสนุนการตัดสินใจ และระบบ ผู้เชี่ยวชาญ (Decision Support Systems and Expert Systems), กิตติพงษ์ กลม กล่อม, บริษัท เคทีพี คอมพ์ แอนด์ คอนซัลท์, 2546

5 Chapter 1 Introduction

6 Data Warehousing and Data Mining Chapter 1 6 Content Data Warehouse ( คลังข้อมูล ) Data Warehousing ( การคลังข้อมูล ) Data Mining ( เหมืองข้อมูล )

7 Data Warehousing and Data Mining Chapter 1 7 ปัญหาของการนำฐานข้อมูลหลาย แบบมารวมกัน 1. H/W S/W หลายชนิด 2. Data Redundancy เกิดความซ้ำซ้อนของข้อมูล 3. Data Inconsistency ข้อมูลไม่สอดคล้องกัน 4. Coding System ระบบการให้รหัสเกิดปัญหา มาตราฐานซ้อน (Multiple Standard) การพัฒนาระบบแบบยุ้งฉาง (Silo-based System) –งานใครงานมัน

8 Data Warehousing and Data Mining Chapter 1 8 ที่มาของคลังข้อมูล Business Integration –ต้องการมีมาตราฐานเดียวในการเก็บข้อมูลขององค์กร มี 2 แบบ 1. Partial Business Integration –Point to Point Business Integration –Middleware Business Integration 2. Overall Business Integration

9 Data Warehousing and Data Mining Chapter 1 9 ที่มาของคลังข้อมูล 1. Partial Business Integration –Point to Point Business Integration เชื่อมโยงระหว่างระบบ 2 ระบบให้ติดต่อกันได้ แต่ละระบบงานทำงานทดแทนกันไม่ได้ มีปัญหา Spaghetti Phenomenon –Middleware Business Integration มีกลุ่ม H/W S/W ที่เป็นตัวกลางในการแปลงและแลกเปลี่ยน ข้อมูลระหว่างระบบงานต่างๆ มีประสิทธิภาพมากขึ้น

10 Data Warehousing and Data Mining Chapter 1 10 Point to Point Business Integration

11 Data Warehousing and Data Mining Chapter 1 11 ที่มาของคลังข้อมูล 2. Overall Business Integration ออกแบบและพัฒนาระบบใหม่ โดยรวมเอาเนื้อหาของข้อมูล ทั้งหมดในองค์กรให้เป็นหนึ่งเดียว ไม่แยกออกเป็นส่วนๆ หลายองค์กรเป็นระบบเดียว เนื้อหาเดียวกัน Unified Standard Maximize data consistency Minimize data redundancy

12 Data Warehousing and Data Mining Chapter 1 12 Data Warehouse ( คลังข้อมูล ) คลังข้อมูล หมายถึง.... หลักการหรือวิธีการ เพื่อรวมระบบ สารสเทศเพื่อ การประมวลผลรายการข้อมูลที่เกิดขึ้น ในแต่ละวันแต่ละสายงาน มารวมเป็นหน่วยเดียวกัน เพื่อสนับสนุนการตัดสินใจให้มีประสิทธิภาพมากยิ่งขึ้น คลังข้อมูล หมายถึง.... ข้อมูลในแหล่งข้อมูลหลายๆแหล่ง เพื่อประกอบการตัดสินใจให้มีประสิทธิภาพมากยิ่งขึ้น คลังข้อมูล ไม่ใช่ผลิตภัณฑ์ หรือระบบสำเร็จรูป คลังข้อมูล มีความเป็นส่วนตัวของแต่ละองค์กร (Organization Customized System)

13 Data Warehousing and Data Mining Chapter 1 13 คุณลักษณะของคลังข้อมูล 1. Subject-Oriented 2. Integrated 3. Time-Variant 4. Non-Volatile

14 Data Warehousing and Data Mining Chapter 1 14 คุณลักษณะของคลังข้อมูล 1. Subject-Oriented –ข้อมูลถูกจัดกลุ่มให้เหมาะสมกับการสืบค้น จัดตามประเด็นหลักของ องค์กร เช่น ลูกค้า สินค้า ยอดขาย –ข้อมูลจะ....ไม่ถูกจัดตามหน้าที่การงาน....ของโปรแกรมใดโปรแกรม หนึ่ง เช่น การควบคุมคลังสินค้า การออกใบกำกับภาษี 2. Integrated –จัดข้อมูลให้อยู่ในรูปแบบเดียวกัน จากแหล่งข้อมูลหลายแหล่ง

15 Data Warehousing and Data Mining Chapter 1 15 คุณลักษณะของคลังข้อมูล 3. Time-Variant –ข้อมูลต้องมีความถูกต้อง เพราะเก็บไว้ใช้นาน 5-10 ปี 4. Non-Volatile –การปรับปรุงข้อมูลเป็นการเพิ่มข้อมูลใหม่เข้าไปเรื่อยๆ ไม่ใช่การ แทนที่ข้อมูลเก่า –ข้อมูลในคลังข้อมูล....ไม่จำเป็น...ต้องทำการ Normalize เหมือนใน ฐานข้อมูล (Data based)

16 Data Warehousing and Data Mining Chapter 1 16 ข้อดีของคลังข้อมูล 1. ให้ผลตอบแทนในการลงทุนสูง 2. ได้เปรียบคู่แข่ง วิเคราะห์ข้อมูลเพื่อกำหนดเป็น แผนกลยุทธ์ได้ก่อนคู่แข่ง เช่นพฤติกรรมผู้บริโภค 3. เพิ่มประสิทธิภาพในการตัดสินใจ มีข้อมูล ครบถ้วนจากอดีตจนถึงปัจจุบัน

17 Data Warehousing and Data Mining Chapter 1 17 ข้อเสียของคลังข้อมูล 1. ขั้นตอนการกรองข้อมูลใช้เวลานาน ต้องอาศัยผู้ ที่มีความชำนาญในการกรองข้อมูล 2. แนวโน้มในการกรองข้อมูลเพิ่มมากขึ้นเรื่อยๆ เพิ่มความซับซ้อนให้กระบวนการทำงาน 3.ใช้เวลานานในการพัฒนาคลังข้อมูล 4.ระบบคลังข้อมูลมีความซับซ้อนสูง

18 Data Warehousing and Data Mining Chapter 1 18 Data Warehousing ( การคลังข้อมูล ) การคลังข้อมูล คือ การออกแบบ และสร้าง โครงสร้างของข้อมูลในคลังข้อมูล รวมถึง – วิธีการได้มาของข้อมูล – วิธีการสร้างผลลัพธ์จากข้อมูลที่มี – วิธีการดูแลรักษา และวิธีการปรับปรุงประสิทธิภาพ

19 Data Warehousing and Data Mining Chapter 1 19 สถาปัตยกรรมของคลังข้อมูล 1. Data Acquisition System 2. Data Staging Area 3. Data Warehouse Database /Data Store 4. Data Provisioning Area /Data Mart 5. End User Terminal 6. Metadata Repository

20 Data Warehousing and Data Mining Chapter 1 20 สถาปัตยกรรมของคลังข้อมูล

21 Data Warehousing and Data Mining Chapter 1 21 สถาปัตยกรรมของคลังข้อมูล 1. Data Acquisition System – รับข้อมูลจากภายนอก 2. Data Staging Area –Data Cleansing ลดความซ้ำซ้อนของข้อมูล –Filtering เลือกเฉพาะข้อมูลที่มีประโยชน์ 3. Data Warehouse Database /Data Store –Data Model การออกแบบจำลองข้อมูล – การจัดเก็บข้อมูล

22 Data Warehousing and Data Mining Chapter 1 22 สถาปัตยกรรมของคลังข้อมูล 4. Data Provisioning Area / Data Mart – การรายงานผลลัพธ์ต่างๆที่จำเป็นสำหรับการวิเคราะห์ข้อมูล 5. End User Terminal –Simple Report Tool –Multi Dimensional Tools –Data Mining Tools 6. Metadata Repository – ใช้เก็บข้อมูลที่ใช้ควบคุมการทำงานในคลังข้อมูล

23 Data Warehousing and Data Mining Chapter 1 23 การวิเคราะห์ข้อมูลในคลังข้อมูล 1. Query and Report Generator 2. Multidimensional Data Analysis 3. Online Analysis Processing (OLAP) 4. Data Mining Tools

24 Data Warehousing and Data Mining Chapter 1 24 การวิเคราะห์ข้อมูลในคลังข้อมูล

25 Data Warehousing and Data Mining Chapter 1 25 การวิเคราะห์ข้อมูลในคลังข้อมูล

26 Data Warehousing and Data Mining Chapter 1 26 Online Analysis Processing (OLAP) กระบวนการประมวลผลข้อมูลทางคอมพิวเตอร์ ที่ช่วยให้วิเคราะห์ข้อมูล ในมิติต่างๆ (Multidimensional Data Analysis) การดำเนินการกับ OLAP –1. Roll up / Consolidation การปรับระดับความละเอียดของข้อมูล จากระดับที่ละเอียด... มาสู่ที่.. หยาบขึ้น –2. Drill Down การปรับระดับความละเอียดของข้อมูล จากระดับที่หยาบ... ไปสู่ที่.. ละเอียดมากขึ้น –3. Slice การเลือกพิจารณาผลลัพธ์บางส่วนที่เราสนใจ โดยเลือกเฉพาะค่าที่ถูก กำกับด้วยข้อมูลบางค่าของแต่ละมิติเท่านั้น –4. Dice กระบวนการพลิกแกนหรือมิติของข้อมูล ให้ตรงตามความต้องการของ ผู้ใช้งาน

27 Data Warehousing and Data Mining Chapter 1 27 Data Mining ( เหมืองข้อมูล ) เหมืองข้อมูล เป็นเครื่องมือที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ โดยตรงจากฐานข้อมูลขนาดใหญ่ เหมืองข้อมูล เป็นเครื่องมือ และ Application ที่สามารถ แสดงผลการวิเคราะห์ข้อมูลทางสถิติได้ เหมืองข้อมูล หมายถึงการวิเคราะห์ข้อมูล เพื่อแยกประเภท จำแนกรูปแบบและความสัมพันธ์ของข้อมูลจากคลังข้อมูล หรือฐานข้อมูลขนาดใหญ่ นำสารสนเทศไปใช้ในการ ตัดสินใจธุรกิจ ได้องค์ความรู้ใหม่ (Knowledge Discovery) อาจอยู่ในรูปแบบของกฎเกณฑ์ (Rule)

28 Data Warehousing and Data Mining Chapter 1 28 เทคนิคการทำเหมืองข้อมูล 1. Classification 2. Clustering 3. Association 4. Visualization

29 Data Warehousing and Data Mining Chapter 1 29 เทคนิคการทำเหมืองข้อมูล 1. Classification : เทคนิคในการจำแนกกลุ่มข้อมูลด้วยคุณลักษณะต่างๆ ที่ได้มีการกำหนดไว้แล้ว – สร้างแบบจำลองเพื่อการพยากรณ์ค่าข้อมูล (Predictive Model) ใน อนาคต เรียกว่า......Supervised Learning – มี 2 รูปแบบ Tree Induction Neural Network 2. Clustering : เทคนิคในการจำแนกกลุ่มข้อมูลใหม่ที่มีลักษณะคล้ายกัน ไว้กลุ่มเดียวกัน โดยไม่มีการจัดกลุ่มข้อมูลตัวอย่างไว้ล่วงหน้า เรียกว่า Unsupervised Learning 3. Association : เทคนิคในการค้นพบองค์ความรู้ใหม่ ด้วยการเชื่อมโยง กลุ่มของข้อมูลที่เกิดขึ้นในเหตุการณ์เดียวกันไว้ด้วยกัน 4. Visualization : เทคนิคที่ใช้ในการแสดงผลในรูปแบบกราฟิกหรือ ข้อมูลหลายมิติ p.85

30 Data Warehousing and Data Mining Chapter 1 30 คุณลักษณะของเหมืองข้อมูล 1. ชี้แนวทางการตัดสินใจและคาดการณ์ผลลัพธ์ 2. เพิ่มความเร็วในการวิเคราะห์ข้อมูล จากฐานข้อมูลขนาด ใหญ่ 3. ค้นหาส่วนประกอบที่ซ่อนอยู่ในเอกสาร รวมถึง ความสัมพันธ์ระหว่างส่วนประกอบต่างๆ 4. จัดกลุ่มเอกสารตามหัวข้อต่างๆตามนโยบายบริษัท

31 Data Warehousing and Data Mining Chapter 1 31 ตัวอย่างการนำเหมืองข้อมูลมาใช้งาน 1. การตลาด – ทำนายยอดขายเมื่อมีการลดจำนวนสินค้าลง 2. การเงินการธนาคาร – คาดการณ์โอกาสในการชำระหนี้ของลูกค้า 3. การค้าขาย 4. โรงงาน การผลิต 5. ตลาดหลักทรัพย์ 6. ธุรกิจการประกัน 7. H/W S/W คอมพิวเตอร์ 8. กระทรวงกลาโหม 9. โรงพยาบาล

32 Data Warehousing and Data Mining Chapter 1 32 ประโยชน์ของเหมืองข้อมูล 1. ค้นหาข้อมูลโดยอาศัยเทคโนโลยีของเหมืองข้อมูล 2. ใช้สถาปัตยกรรมแบบ Client/Server 3. ผู้ใช้ระบบไม่จำเป็นต้องทักษะในการเขียนโปรแกรม 4. ผู้ใช้ต้องกำหนดขอบเขตและเป้าหมายของระบบให้ชัดเจน เพื่อความรวดเร็วและถูกต้องตามความต้องการ 5. การประมวลผลแบบขนานจะช่วยเพิ่มประสิทธิภาพและ ความเร็วในการค้นหาข้อมูล

33 Data Warehousing and Data Mining Chapter 1 33 Homework 1 1. จงหาความหมายของคำนิยามต่อไปนี้ มาอย่างน้อย 2 แหล่ง อ้างอิงพร้อมบอกที่มาของแหล่งอ้างอิงด้วย –Data Warehouse (คลังข้อมูล) –Data Mining (เหมืองข้อมูล) 2. จงหาว่า Data Mining Tool มีอะไรบ้าง พร้อมทั้งอธิบายมาพอสังเขป ส่ง รายงาน (next week in class) »Hard Copy »File »Presentation 2 min (no slide)

34 Jim Miller


ดาวน์โหลด ppt 229-611 Data Warehousing and Data Mining ผศ. ดร. วิภาดา เวทย์ประสิทธิ์ ภาควิชาวิทยาการคอมพิวเตอร์ มหาวิทยาลัยสงขลานครินทร์ ห้อง CS 108

งานนำเสนอที่คล้ายกัน


Ads by Google