งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

Data Management (การจัดการข้อมูล)

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "Data Management (การจัดการข้อมูล)"— ใบสำเนางานนำเสนอ:

1 Data Management (การจัดการข้อมูล)
อาจารย์สุรินทร์ทิพ ศักดิ์ภูวดล สำนักเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยนเรศวร วิทยาเขตสารสนเทศพะเยา

2 เนื้อหา ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) แหล่งข้อมูล (Data Source) การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น ฐานข้อมูล (Database) ระบบจัดการฐานข้อมูล (Database Management System: DBMS) ชนิดของฐานข้อมูล เทคโนโลยีฐานข้อมูล (Database Technology) การแสดงผลข้อมูลในระบบสนับสนุนการตัดสินใจ

3 ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (1/3)
คือ ข้อเท็จจริงเกี่ยวกับสิ่งต่าง ๆ ซึ่งอาจเป็นคน สัตว์ สิ่งของ หรือเหตุการณ์ต่าง ๆ ที่ยังไม่ผ่านการประมวลผล โดยที่ข้อมูลอาจอยู่ในรูปของตัวเลข ตัวอักษร ข้อความ หรือ Multimedia ก็ได้ เนื่องจากข้อมูลเป็นส่วนประกอบที่สำคัญของระบบสารสนเทศรวมทั้งระบบสนับสนุนการตัดสินใจ จึงต้องเป็นข้อเท็จจริงที่ถูกต้อง ครบถ้วน สมบูรณ์ และน่าเชื่อถือ

4 ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (2/3)
คือ ข้อมูลที่ผ่านการประมวลผล และจัดการให้มีความถูกต้อง ทันสมัย และสามารถนำไปใช้งานได้ตามที่ต้องการ Process & Transform Data Information

5 ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (3/3)
คือ สารสนเทศที่ถูกคัดเลือกเพื่อใช้ในการแก้ปัญหาต่าง ๆ ตามต้องการได้อย่างมีประสิทธิภาพ โดยอาศัยประสบการณ์ในการเลือกสารสนเทศมาใช้ในการแก้ไขปัญหาได้อย่างเหมาะสม Wisdom Correct use of Knowledge Knowledge Collection of all Information Information Process & Transform Data

6 แหล่งข้อมูล (Data Source)
แหล่งข้อมูลภายในองค์กร (Internal Data Source) แหล่งข้อมูลภายนอกองค์การ (External Data Source)

7 การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น
วิธีการรวบรวมข้อมูล ปัญหาของข้อมูล คุณภาพของข้อมูล ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ

8 วิธีการรวบรวมข้อมูล การศึกษาเกี่ยวกับเวลาในการปฏิบัติงานต่าง ๆ (Time Study) รวบรวมข้อมูลโดยการสังเกตการณ์ การสำรวจ (Survey) โดยแบบสอบถาม(Questionnaire) การสังเกตการณ์ (Observation) การเฝ้าดูการทำงาน เช่น กล้องวีดีโอ การสัมภาษณ์ (Interview) การรวบรวมข้อมูลจากการบันทึกข้อมูลรายวัน (TPS) การใช้โปรแกรม รวบรวมข้อมูลจาก Internet เช่น Web crawler

9 ปัญหาของข้อมูล ข้อมูลมีความผิดพลาด เช่น ป้อนข้อมูลที่ผิดพลาดเข้าสู่ระบบ ข้อมูลไม่ทันต่อการใช้งาน ข้อมูลไม่เหมาะสมกับการใช้งาน ข้อมูลที่ต้องการไม่มีอยู่ในระบบ การแก้ปัญหา อาจต้องสร้างข้อมูลที่ต้องการขึ้นมาใหม่

10 คุณภาพของข้อมูล (Data Quality)
คุณภาพโดยทั่วไปของข้อมูล ความสอดคล้องของข้อมูล สามารถนำไปใช้ประโยชน์ ทันต่อความต้องการ และมีความครบถ้วนสมบูรณ์ คุณภาพโดยธรรมชาติของข้อมูล ความถูกต้อง และความน่าเชื่อถือ การเข้าถึงข้อมูล ความสามารถในการเข้าถึง และความปลอดภัยของข้อมูล การนำเสนอข้อมูล การสื่อความหมาย ง่ายต่อการใช้งาน กระชับ และมีเนื้อหาที่สอดคล้องกัน

11 ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ
ในระหว่างการรวบรวมข้อมูล ควรตรวจสอบรูปแบบว่าถูกต้องตามความต้องการหรือไม่ เช่น เราต้องการรูปแบบวันเป็น dd/mm/yyyy รูปแบบการจัดเก็บ ชื่อ และนามสกุล ต้องแยกกันเป็นภาษาไทย และอังกฤษ ตรวจสอบความทันสมัยของข้อมูล ตรวจสอบความสมบูรณ์ของข้อมูล เช่น ผลรวมถูกต้องจริง ตรวจสอบปริมาณข้อมูลว่าเพียงพอหรือไม่

12 ฐานข้อมูล (Database) กลุ่มของแฟ้มข้อมูลที่มีความสัมพันธ์กันและถูกนำมารวมกัน เช่น ฐานข้อมูลในบริษัทแห่งหนึ่งอาจประกอบไปด้วยแฟ้มข้อมูลหลายแฟ้ม โดยที่แต่ละแฟ้มจะมีความสัมพันธ์กัน ได้แก่ ข้อมูลพนักงาน ข้อมูลแผนกในบริษัท ข้อมูลลูกค้า ข้อมูลสินค้า ข้อมูลการขาย

13 ข้อดีของการใช้ระบบฐานข้อมูล
ข้อมูลเป็นอิสระจากโปรแกรมที่ใช้งานข้อมูล (Data Independence) ลดความซ้ำซ้อนของข้อมูล (Data Redundancy) หลีกเลี่ยงความไม่สอดคล้องของข้อมูล (Data Inconsistency) ความถูกต้องของข้อมูล (Data Integrity) รูปแบบที่เป็นมาตรฐานเดียวกัน ความปลอดภัยของข้อมูล (Data Security) นำเสนอรายงานได้ง่าย (Easy Reporting) สามารถควบคุมการเข้าถึงข้อมูลจากผู้ใช้หลายคน (Concurrency Control) ตอบสนองความต้องการใช้งานข้อมูลได้หลายแบบ

14 ตัวอย่างความซ้ำซ้อนกันของข้อมูล (Data Redundancy)
แฟ้มข้อมูลพนักงาน (Employee) Emp_No Emp_Name Emp_Address Emp_Salary Emp_Tel E001 นายแพง พลเมืองดี 12/20 ลาดพร้าว กรุงเทพมหานคร 20,000 E002 นางสุดใจ แสนดี 108 บางกะปิ กรุงเทพมหานคร 30,000 E003 นางสาวดวงใจ แสนประเสริฐ 50 บางซื่อ กรุงเทพมหานคร 8,000 E004 นางกนกวรรณ เกิดสุข 60 บางแค กรุงเทพมหานคร 9,500 แฟ้มข้อมูลพนักงานขาย (Salesman) Sale_No Sale_Name Sale_Phone S001 นางสาวดวงใจ แสนประเสริฐ S002 นางกนกวรรณ เกิดสุข

15 ตัวอย่างความไม่สอดคล้องกันของข้อมูล (Data Inconsistency)
แฟ้มข้อมูลพนักงาน (Employee) Emp_No Emp_Name Emp_Address Emp_Salary Emp_Tel E001 นายแพง พลเมืองดี 12/20 ลาดพร้าว กรุงเทพมหานคร 20,000 E002 นางสุดใจ แสนดี 108 บางกะปิ กรุงเทพมหานคร 30,000 E003 นางสาวดวงใจ แสนประเสริฐ 50 บางซื่อ กรุงเทพมหานคร 8,000 E004 นางกนกวรรณ เกิดสุข 60 บางแค กรุงเทพมหานคร 9,500 แฟ้มข้อมูลพนักงานขาย (Salesman) Sale_No Sale_Name Sale_Phone S001 นางสาวดวงใจ แสนประเสริฐ S002 นางกนกวรรณ เกิดสุข หากมีการแก้ไขข้อมูลหมายเลขโทรศัพท์ของดวงใจ แต่แก้ไขเพียงบาง Table

16 ระบบจัดการฐานข้อมูล (Database Management System: DBMS)
ความหมายของระบบจัดการฐานข้อมูล หน้าที่ของระบบจัดการฐานข้อมูล ประโยชน์ของระบบจัดการฐานข้อมูล

17 DBMS : ความหมายของระบบจัดการฐานข้อมูล
โปรแกรมที่ทำหน้าที่เป็นตัวกลางการทำงานระหว่างผู้ใช้งานฐานข้อมูลกับฐานข้อมูล เพื่ออำนวยความสะดวกผู้ใช้ ในการสร้าง ลบ ปรับปรุง สืบค้น และเรียกใช้ข้อมูล ฐานข้อมูล ผู้ดูแลฐานข้อมูล (DBA) DBMS Application ผู้ใช้ (User)

18 DBMS : หน้าที่ของระบบจัดการฐานข้อมูล
การจัดเตรียมมุมมองของผู้ใช้ (User View) การสร้างและแก้ไขฐานข้อมูล การจัดเก็บและเรียกใช้ข้อมูล การดำเนินงานกับข้อมูลและการสร้างรายงาน

19 DBMS : ประโยชน์ของระบบจัดการฐานข้อมูล
ช่วยสนับสนุนการใช้งานโปรแกรมประยุกต์โดยเป็นส่วนจัดการข้อมูลในฐานข้อมูล ผู้ใช้สามารถใช้ข้อมูลร่วมกันได้ ผู้ใช้มีความสะดวกและรวดเร็วในการสืบค้นข้อมูล สามารถควบคุม ความถูกต้องและความสอดคล้องของข้อมูล ลดความซ้ำซ้อนของการจัดเก็บข้อมูล

20 ชนิดของฐานข้อมูล ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database)
ฐานข้อมูลแบบเครือข่าย (Network Database) ฐานข้อมูลเชิงสัมพันธ์ (Relational Database) ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database)

21 ชนิดของฐานข้อมูล : ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database) Parent Node จะมี Child Node ได้มากกว่า 1 Node แต่ Child Node จะมี Parent Node ได้เพียง Node เดียวเท่านั้น คุณสมชาย ภักดี คุณสุชาดา พอดี รหัสสินค้า A1 A2 A3 A2 A3 B1 ตะปู ปูน สี ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 15 150 100 50 10

22 ชนิดของฐานข้อมูล : ฐานข้อมูลแบบเครือข่าย (Network Database) Parent Node จะมี Child Node ได้มากกว่า 1 Node และ Child Node จะมี Parent Node ได้ได้มากกว่า 1 Node ด้วย คุณสมชาย ภักดี คุณสุชาดา พอดี รหัสสินค้า A1 A2 A3 B1 ตะปู ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 115 200 10

23 ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงสัมพันธ์ (Relational Database)
Customer Order_Detail Cust_ID (Pk) Cust_Name 001 คุณสมชาย ภักดี 002 คุณสมหญิง ใจดี Cust_ID (Pk) Prod_ID (Pk) Quantity 001 A1 250 A2 15 A3 150 002 100 50 B1 10 Product Prod_ID (Pk) Prod_Name A1 ตะปู A2 ปูน A3 สี B1 จอบ

24 Sales transactions (TPS)
Cust Id. 001 Date 16/01/2019 Receipt No. F G300001 Time 8:00 Order No. Product Qty Unit Price Total 1 Bread 20.00 2 Beer 60.00 120.00 3 Milk 4 Candy 10.00 5 Coke 12.00 222.00

25 ตัวอย่าง ระบบการขาย (ตามหลัก Database)
Table: Product ProductId ProductName Price BalancedQty G001 Beer 60 100 G002 Blanket 200 G003 Bread 20 40 G004 Candy 10 G005 Coke 12 G006 Computer 20000 30 G007 Cookie G008 Diaper 150 G009 Egg G010 Green Tea G011 Make up G012 Meat 190 50 G013 Medicine 290 G014 Microwave 3000 G015 milk G016 Printer 2000 G017 Shampoo G018 Telephone 30000 G019 Television G020 Water 120 Table: Sale ReceiptNo Date Time CustomerId TotalNo F G300001 16/01/2018 8:00 001 222 F G300002 16/01/2019 8:10 002 30164 Table: SaleDetail ReceiptNo Product Qty F G300001 G003 1 G001 2 G015 G004 G005 F G300002 G018 G020 G009

26 ตัวอย่าง ระบบการขาย (เป็นทางเลือก เพื่อให้ง่ายในการดึง และเป็นข้อมูลสำคัญ)
Table: Product ProductId ProductName Price BalancedQty G001 Beer 60 100 G002 Blanket 200 G003 Bread 20 40 G004 Candy 10 G005 Coke 12 G006 Computer 20000 30 G007 Cookie G008 Diaper 150 G009 Egg G010 Green Tea G011 Make up G012 Meat 190 50 G013 Medicine 290 G014 Microwave 3000 G015 milk G016 Printer 2000 G017 Shampoo G018 Telephone 30000 G019 Television G020 Water 120 Table: Sale ReceiptNo Date Time CustomerId TotalNo F G300001 16/01/2018 8:00 001 222 F G300002 16/01/2019 8:10 002 30164 Table: SaleDetail ReceiptNo Product Qty UnitPrice F G300001 G003 1 20 G001 2 60 G015 G004 10 G005 12 F G300002 G018 30000 G020 G009

27 ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database)
Cust_ID = 001 Cust_Name = อุทัย เซี่ยงเจ็น Class: Customer Attribute: Cust_ID Cust_Name Methods: Print(); getName(); Cust_ID = 002 Cust_Name = มานี มีนา

28 NoSQL Database เป็น Technology ที่มาใหม่ล่าสุด
NoSQL เป็นคำเรียก Technology ที่นอกเหนือไปจาก SQL โครงสร้าง NoSQL Database มีหลายแบบ Column-Oriented :Cassandra and Apache HBase  Key-value :Riak Document :MongoDB, Apache CouchDB Graph :Neo4J, OrientDB

29 เทคโนโลยีฐานข้อมูล (Database Technology)
คลังข้อมูล (Data Warehouse) การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online Analytical Processing: OLAP) เหมืองข้อมูล (Data Mining)

30 เทคโนโลยีฐานข้อมูล : คลังข้อมูล (Data Warehouse)
ความหมายของคลังข้อมูล คุณลักษณะของคลังข้อมูล ข้อดี / ข้อเสีย ของคลังข้อมูล สถาปัตยกรรมของคลังข้อมูล การวิเคราะห์ข้อมูลในคลังข้อมูล

31 คลังข้อมูล (Data Warehouse) : ความหมายของคลังข้อมูล
หลักการหรือวิธีการเพื่อการรวมระบบสารสนเทศเพื่อการประมวลผลรายการข้อมูลที่เกิดขึ้นในแต่ละวันในแต่ละสายงาน มารวมเป็นหน่วยเดียวกัน เพื่อสนับสนุนกระบวนการตัดสินใจของผู้ตัดสินใจให้มีประสิทธิภาพมากยิ่งขึ้น คลังข้อมูล หมายถึง ฐานข้อมูลที่จัดเก็บข้อมูล ที่ได้มาจากการสกัดข้อมูล (Extract) จากฐานข้อมูลอื่น ซึ่งอาจมีโครงสร้างแตกต่างกัน หรืออยู่บนระบบปฏิบัติการแตกต่างกันก็ได้ ทั้งนี้ เพื่อประโยชน์ในการวิเคราะห์ และตัดสินใจเชิงธุรกิจ

32 คลังข้อมูล (Data Warehouse) : คุณลักษณะของคลังข้อมูล
Subject-Oriented : ข้อมูลถูกจัดเก็บตามประเด็นหลักขององค์กร เช่น ข้อมูลลูกค้า สินค้า และยอดขาย เป็นต้น Integrated : รวบรวมและจัดรูปแบบข้อมูลให้อยู่ในรูปแบบเดียวกัน และสร้างความสอดคล้องให้กับข้อมูลก่อนที่จะนำเสนอแก่ผู้ใช้ Time-Variant : ข้อมูลที่จัดเก็บในคลังข้อมูลส่วนใหญ่จะเป็นข้อมูลในอดีตที่ผ่านมาแล้ว 5-10 ปีทำให้เราสามารถเห็นแนวโน้มของข้อมูลได้ Non-Volatile : ข้อมูลที่จัดเก็บภายในคลังข้อมูล จะไม่ถูกแก้ไข แต่จะถูกเพิ่มข้อมูลใหม่ต่อท้าย โดยไม่ทำการแทนที่ข้อมูลเดิม

33 คลังข้อมูล (Data Warehouse) : ข้อดี / ข้อเสีย ของคลังข้อมูล
ให้ผลการตอบแทนจากการลงทุนสูง องค์กรเกิดความได้เปรียบคู่แข่งขัน เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ ข้อเสีย ขั้นตอนการกลั่นกรองและโหลดข้อมูลเข้าสู่คลังข้อมูลใช้เวลานาน และต้องอาศัยผู้ที่มีความชำนาญ แนวโน้มความต้องการข้อมูลมีมากขึ้นเรื่อย ๆ และต้องการคำตอบที่ซับซ้อนขึ้น ใช้เวลานานในการพัฒนาคลังข้อมูล ระบบคลังข้อมูลมีความซับซ้อนสูง

34 คลังข้อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (1/2)
Data Provisioning Area Data Data Staging Area Data Data Warehouse Database Data Data Data Acquisition System Metadata Metadata Metadata Terminal Metadata Metadata Repository

35 คลังข้อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (2/2)
Data Acquisition System : ทำหน้าที่รับข้อมูลจากภายใน/นอกองค์กร มีการตรวจสอบความถูกต้อง Data Staging Area : ทำหน้าที่ Cleansing & Filtering เลือกเฉพาะข้อมูลที่เป็นประโยชน์ ( Filtering), แปลงข้อมูล และ ตรวจสอบความถูกต้องในเบื้องต้น ก่อนจะโหลดเข้าสู่ Data Warehouse Database Data Warehouse Database : บันทึกข้อมูลต่าง ๆ ที่จำเป็นสำหรับการวิเคราะห์ข้อมูลขององค์กร Data Provisioning Area หรือ Data Mart : เหมือน Data Warehouse Database แต่ขอบเขตเนื้อหาข้อมูลจะแคบกว่า คือ เพื่อกลุ่มงานใดกลุ่มงานหนึ่ง End Users Terminal : นำเสนอผลลัพธ์ออกจากหน้าจอ โดยจะใช้เครื่องมือหรือระบบที่ทำหน้าที่ออกรายงาน เช่น Simple Reporting Tools, Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้ Metadata Repository : เป็นพื้นที่สำหรับเก็บข้อมูลต่าง ๆ ที่จำเป็นสำหรับควบคุมการทำงานและควบคุมข้อมูลในคลังข้อมูล เช่น คำนิยามของข้อมูลใน Data Warehouse Database

36 คลังข้อมูล (Data Warehouse) : การวิเคราะห์ข้อมูลในคลังข้อมูล (1/2)
ความยุ่งยากมีน้อย ใช้ปริมาณข้อมูลน้อย ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลน้อย ความยุ่งยากมีมาก ใช้ปริมาณข้อมูลมาก ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลมาก Query and Report Multidimensional Data Analysis Data Mining มีเครื่องมือช่วยในการสร้างมากมาย มีเครื่องมือช่วยในการสร้างน้อย

37 คลังข้อมูล (Data Warehouse) : การวิเคราะห์ข้อมูลในคลังข้อมูล (2/2)
ผล แหล่งข้อมูลเพื่อ การปฏิบัติงาน Report Generator รายงาน ข้อมูล ข้อมูล การใช้งาน Data Mining Tools ผล Data Warehouse ข้อมูล การใช้งาน ผู้ใช้งาน แหล่งข้อมูลเพื่อ การวิเคราะห์ OLAP Generator ข้อมูล ผล OLAP คลังข้อมูล ช่วงเวลาที่องค์กรไม่ได้ปฏิบัติงาน ช่วงเวลาที่องค์กรปฏิบัติงาน

38 การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online Analytical Processing : OLAP)
Multidimensional Database การดำเนินการกับ OLAP ประโยชน์ของ OLAP

39 OLAP : ความหมายของ OLAP (Online Analytical Processing)
กระบวนการประมวลผลข้อมูลทางคอมพิวเตอร์ ที่ช่วยให้ผู้ใช้สามารถวิเคราะห์ในมิติต่าง ๆ (Multidimensional Data Analysis) ของข้อมูลได้ง่ายขึ้น เช่น ผู้ใช้ต้องการเปรียบเทียบข้อมูลยอดการขายบะหมี่กึ่งสำเร็จรูปในเดือนมีนาคม เทียบกับเดือนกันยายน และเทียบกับสินค้าอื่น ๆ ในช่วงเวลาเดียวกัน

40 OLAP : Multidimensional Database (1/4)

41 OLAP : Multidimensional Database (2/4)
จังหวัด ไตรมาส ยอดขาย กรุงเทพฯ 1 750,000 2 800,000 3 825,000 4 680,000 จังหวัด ไตรมาส ยอดขาย เชียงใหม่ 1 550,000 2 600,000 3 650,000 4 500,000 ฐานข้อมูลเชิงสัมพันธ์ จังหวัด กรุงเทพฯ เชียงใหม่ 1 750,000 550,000 2 800,000 600,000 3 825,000 650,000 4 680,000 500,000 ไตรมาส นำเสนอแบบหลายมิติ

42 OLAP : Multidimensional Database (3/4)
สินค้า จังหวัด ไตรมาส ยอดขาย มือถือ กทม. 1 750,000 บัตรเดิมเงิน 350,000 2 800,000 300,000 3 825,000 280,000 4 680,000 380,000 สินค้า จังหวัด ไตรมาส ยอดขาย มือถือ ชม. 1 550,000 บัตรเดิมเงิน 250,000 2 600,000 200,000 3 650,000 260,000 4 500,000 325,000 ฐานข้อมูลเชิงสัมพันธ์

43 OLAP : Multidimensional Database (4/4)
จังหวัด ชม. 550,000 600,000 650,000 750,000 800,000 825,000 500,000 680,000 กทม. มือถือ บัตรเติมเงิน 250,000 550,000 200,000 650,000 260,000 600,000 325,000 500,000 มือถือ สินค้า บัตรเติมเงิน 1 2 3 4 ไตรมาส นำเสนอแบบหลายมิติ

44 OLAP : การดำเนินการกับ OLAP
Roll up และ Drill Down Roll up เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากส่วนของรายละเอียดมาก จนมาเป็นข้อมูลสรุป Drill Down เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากข้อมูลสรุป จนมาเป็นข้อมูลในส่วนรายละเอียด Slice and Dice Slice เป็นการเลือกพิจารณาผลลัพธ์บางส่วนที่เราสนใจ โดยการเลือกเฉพาะค่าที่ถูกกำกับด้วยข้อมูลบางค่าของแต่ละมิติ Dice เป็นกระบวนการพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

45 การดำเนินการกับ OLAP : Roll up และ Drill Down (1/2)
Region Sum North 61,000 South 41,500 Region Roll up Drill Down Product Type Glossary Misc. Region North 55,000 6,000 South 31,000 10,500 Region-Product Type Roll up Drill Down Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type

46 การดำเนินการกับ OLAP : Roll up และ Drill Down (2/2)
Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type Roll up Drill Down Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Region-Shop-Product Type-Product Type

47 การดำเนินการกับ OLAP : Slice (1/2)
10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Source Cube Fish Meat Pork Med. Pencil Glossary Misc. 10,000 8,000 23,000 25,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Glossary 10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Med. Pencil Glossary Misc. แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณา เฉพาะกลุ่มสินค้าประเภท “Glossary”

48 การดำเนินการกับ OLAP : Slice (2/2)
Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Slice:Glossary Product Type Glossary Product Fish Meat Pork Region Shop North ABC 10,000 20,000 Platter 25,000 South Five Mart 8,000 23,000 แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณาเฉพาะกลุ่มสินค้าประเภท “Glossary”

49 การดำเนินการกับ OLAP : Dice (1/2)
Shop Product Type Date Product Type Shop Date การ Dice คือกระบวนการพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

50 การดำเนินการกับ OLAP : Dice (2/2)
Product Type Glossary Misc. Shop ABC 30,000 Platter 25,000 6,000 Five Mart 31,000 10,500 Shop-Product Type Product Type Glossary Misc. Date 6/07/2004 43,000 10,000 7/07/2004 6,500 Date-Product Type การพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

51 OLAP : ประโยชน์ของ OLAP
ช่วยในการวิเคราะห์เปรียบเทียบข้อมูลในมุมต่าง ๆ ทำให้การตัดสินใจมีประสิทธิภาพมากขึ้น ผู้ใช้แต่ละคนสามารถสร้างมุมมองข้อมูลของตนเองได้ เพื่อนำไปใช้ในงานเฉพาะด้าน มีความรวดเร็วในการสอบถามข้อมูล แม้ในฐานข้อมูลขนาดใหญ่และมีความซับซ้อนมาก ทำให้ได้รับข้อมูลมุมมองใหม่ ๆ สำหรับประกอบการตัดสินใจ

52 เทคโนโลยีฐานข้อมูล : เหมืองข้อมูล (Data Mining)
ความหมายของเหมืองข้อมูล เทคนิคในการทำเหมืองข้อมูล คุณลักษณะของเหมืองข้อมูล ประโยชน์ของเหมืองข้อมูล ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน

53 เหมืองข้อมูล (Data Mining) : ความหมายของเหมืองข้อมูล
การวิเคราะห์ข้อมูล เพื่อแยกประเภท จำแนกรูปแบบและความสัมพันธ์ของข้อมูลจากฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล และนำสารสนเทศที่ได้ไปใช้ในการตัดสินใจธุรกิจ ดังนั้นผู้ที่ไม่มีความเชี่ยวชาญด้านการเขียนโปรแกรมคอมพิวเตอร์ ก็สามารถค้นหาข้อมูลต่าง ๆ ได้อย่างรวดเร็ว การวิเคราะห์ข้อมูลโดยใช้เทคนิคบางประการเพื่อค้นหาข้อมูลที่ถูกซ่อนอยู่ จำแนกและเชื่อมโยงความสัมพันธ์ของข้อมูลเหล่านั้นจากคลังข้อมูล ทำให้ค้นพบรูปแบบความสัมพันธ์ที่ไม่เคยมีมาก่อนจนกลายเป็นการค้นพบองค์ความรู้ใหม่ (Knowledge Discovery) ซึ่งเป็นวัตถุประสงค์หลักของการทำเหมืองข้อมูล ซึ่งองค์ความรู้ใหม่ที่ได้อาจรวมถึงกฎ (Rules) บางอย่างเพื่อใช้เป็นแนวทางในการตัดสินใจ และประเมินผลลัพธ์การตัดสินใจได้

54 เหมืองข้อมูล (Data Mining) : เทคนิคในการทำเหมืองข้อมูล
Classification (Support Vector Machines :SVM, Naive Bayes, Decision trees) : เป็นการทำนาย Clustering ( K-means, DBSCAN) Association (Apriori, FP-growth) Visualization

55 เทคนิคในการทำเหมืองข้อมูล : Classification (1/4)
เป็นเทคนิคในการจำแนกกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ ที่ได้มีการกำหนดไว้แล้ว เทคนิคประเภทนี้เหมาะกับการสร้างแบบจำลองเพื่อการพยากรณ์ค่าข้อมูล (Predictive Modeling) ในอนาคต จากการที่ได้จำแนกกลุ่มข้อมูลตัวอย่างไว้แล้ว เรียกว่า “Supervised Learning” เช่น Support Vector Machines :SVM Naive Bayes Decision trees Artificial neural networks (ANN)

56 เทคนิคในการทำเหมืองข้อมูล : Classification (2/4)
อายุเช่าสินทรัพย์ อายุผู้เช่า ซื้อสินทรัพย์ 2 25 YES 3 22 1 28 NO 5 30 4 27 21 23 ... สมมติว่าต้องการพยากรณ์ว่าลูกค้าที่ปัจจุบันได้เช่าสินทรัพย์อย่างใดอย่างหนึ่งไปแล้ว จะมีโอกาสตัดสินใจซื้อสินทรัพย์ชนิดนั้นไปเป็นของตนเองหรือไม่ ?

57 เทคนิคในการทำเหมืองข้อมูล : Classification (3/4)
จากข้อมูลพบว่า “ลูกค้าที่มีอายุเช่าสินทรัพย์ตั้งแต่ 2 ปีขึ้นไปและอายุของผู้เช่าตั้งแต่ 25 ปีขึ้นไป มักจะตกลงซื้อสินทรัพย์เป็นของตนเอง” อายุเช่าสินทรัพย์ >= 2 ? อายุผู้เช่า >= 25 ? เช่า ซื้อ No Yes Tree Induction

58 เทคนิคในการทำเหมืองข้อมูล : Classification (4/4)
Neural Induction 0.5 0.7 0.4 “เช่า” หรือ “ซื้อ” 0.6 0.3 0.4 อายุผู้เช่า >= 25 ? Input Hidden Processing Layer Output

59 เทคนิคในการทำเหมืองข้อมูล : Clustering
เป็นเทคนิคที่ใช้ในการจำแนกกลุ่มข้อมูลใหม่ที่มีลักษณะคล้ายกันไว้ในกลุ่มเดียวกัน โดยที่ไม่มีการจัดกลุ่มข้อมูลตัวอย่างไว้ล่วงหน้า เรียกว่า “Unsupervised Learning” ตัวอย่างเช่น บริษัทประกันภัยพบว่า ลูกค้าเพศชายเสียชีวิตจากอุบัติเหตุมากที่สุด ส่วนลูกค้าเพศหญิงเสียชีวิตจากโรคมะเร็งปากมดลูกมากที่สุด ดังนั้นบริษัทอาจนำข้อมูลข้างต้น มาพิจารณาเพื่อจัดทำกรมธรรม์ฉบับพิเศษสำหรับโรคมะเร็งของลูกค้าเพศหญิงได้

60 เทคนิคในการทำเหมืองข้อมูล : Association (1/2)
เป็นเทคนิคที่ใช้ค้นพบองค์ความรู้หรือสารสนเทศใหม่ ด้วยการเชื่อมโยงข้อมูลหรือกลุ่มข้อมูลที่เกิดขึ้นในเหตุการณ์เดียวกันเข้าด้วยกัน ตัวอย่างเช่น การสำรวจพฤติกรรมการซื้อของลูกค้าว่า ซื้อสินค้าอะไรบ้างพร้อมกัน ในใบเสร็จเดียวกัน เช่น ลูกค้าทุกคนเมื่อซื้อนมเปรี้ยว ขนมปัง มักซื้อน้ำเปล่า เสมอ ในใบเสร็จเดียวกัน จากตัวอย่างบริษัทสามารถนำข้อมูลความสัมพันธ์ในการซื้อ ไปจัดการส่งเสริมการขาย หรือจัดรูปแบบของการวางสินค้าในร้านได้ เพื่อเป็นการเพิ่มยอดขายให้กับบริษัท

61 Mining Association Rules
Example of Rules: {Milk,Diaper}  {Beer} (s=0.4, c=0.67) {Milk,Beer}  {Diaper} (s=0.4, c=1.0) {Diaper,Beer}  {Milk} (s=0.4, c=0.67) {Beer}  {Milk,Diaper} (s=0.4, c=0.67) {Diaper}  {Milk,Beer} (s=0.4, c=0.5) {Milk}  {Diaper,Beer} (s=0.4, c=0.5) Example:

62 เทคนิคในการทำเหมืองข้อมูล : Visualization
เป็นเทคนิคที่ใช้เพื่อการแสดงผลนำเสนอข้อมูลในรูปกราฟิก ที่จะให้ผู้ใช้สามารถค้นพบองค์ความรู้ได้จากการแสดงผล ดังนั้นจึงต้องมีการพัฒนารูปแบบการแสดงผลให้สามารถเห็นได้ชัดเจน อาจมีสีสัน หรือการแสดงผล 3 มิติ แสดงให้เห็นพื้นที่ของกลุ่มข้อมูลทั้งหมดได้ นำไปสู่การพิจารณาข้อมูลกลุ่มนั้นเป็นกรณีพิเศษ และทำให้เกิดองค์ความรู้ใหม่ในที่สุด เช่น การนำเสนอข้อมูลช่วงเวลาในการใช้งานโทรศัพท์ด้วยแผนภูมิ จะแสดงให้เห็นปริมาณผู้ใช้โทรศัพท์ในแต่ละช่วงเวลาได้อย่างชัดเจน และสามารถพิจารณาโปรโมชั่นพิเศษบางช่วงเวลาเพื่อดึงดูดใจลูกค้า

63 เหมืองข้อมูล (Data Mining) : คุณลักษณะของเหมืองข้อมูล
การค้นหาข้อมูลโดยอาศัยเทคโนโลยีการทำเหมืองข้อมูล ภายใต้ฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล ซึ่งข้อมูลอาจถูกสะสมมานานหลายปี มักจะมีสถาปัตยกรรมเป็น Client/Server ผู้ใช้งานระบบสารสนเทศไม่จำเป็นต้องมีทักษะในการเขียนโปรแกรม เนื่องจากมีเครื่องมือช่วยค้นหาข้อมูลจากคลังข้อมูลได้อย่างรวดเร็ว ผู้ใช้ต้องกำหนดขอบเขตการค้นหาข้อมูลให้ชัดเจนเพื่อความรวดเร็ว อาจมีการประมวลผลข้อมูลแบบขนาน เพื่อเพิ่มประสิทธิภาพในการค้นหาและวิเคราะห์ข้อมูล เครื่องมือสำหรับทำเหมืองข้อมูลสามารถใช้งานร่วมกับโปรแกรม Spreadsheet และเครื่องมือพัฒนาต่าง ๆ ได้เป็นอย่างดี

64 เหมืองข้อมูล (Data Mining) : ประโยชน์ของเหมืองข้อมูล
ช่วยชี้แนวทางการตัดสินใจและคาดการณ์ผลลัพธ์ที่จะได้จากการตัดสินใจ เพิ่มความเร็วในการวิเคราะห์ฐานข้อมูลขนาดใหญ่ ค้นหาส่วนประกอบที่ซ่อนอยู่ภายในเอกสาร รวมถึงความสัมพันธ์ของส่วนประกอบต่าง ๆ ด้วย เชื่อมโยงเอกสารที่มีความเกี่ยวข้องกันระหว่างหน่วยงานต่าง ๆ ภายในองค์กร การจัดกลุ่มข้อมูล เช่น จัดกลุ่มลูกค้าทั้งหมดของบริษัทประกันภัยที่ประสบอุบัติเหตุ ลักษณะเดียวกันเพื่อดำเนินการต่าง ๆ ตามนโยบายของบริษัท

65 เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (1/4)
การตลาด การทำนายผลการตอบสนองกับการเปิดตัวสินค้าใหม่ การทำนายยอดขายเมื่อมีการลดราคาสินค้า การทำนายกลุ่มลูกค้าที่น่าจะใช้สินค้าของเรา การเงินการธนาคาร การคาดการณ์ถึงโอกาสในการชำระหนี้ของลูกค้าว่าสูงเท่าไหร่? ค้นหาลูกค้าขาดคุณภาพ เพื่อหลีกเลี่ยงความเสี่ยงในการปล่อยกู้ ค้นหาลูกค้าชั้นดี เพื่อเสนอการปล่อยกู้ ทำนายแนวโน้มของพฤติกรรมการใช้บัตรเครดิต สถานีโทรทัศน์หรือวิทยุ ค้นหารายการที่ดีและเหมาะสมต่อช่วงเวลาที่สุด เพื่อวางผังรายการในแต่ละเดือน

66 เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (2/4)
การค้าขาย ทำนายผลกำไรเมื่อลงทุนซื้อสินค้ามาเพื่อขาย ใช้ค้นหาจุดคุ้มทุน โรงงานและการผลิต ทำนายอายุการใช้งานเครื่องจักร ตลอดจนเวลาที่เหมาะสมในการเปิดปิดเครื่องจักร ค้นหาปัจจัยสำคัญที่มีผลต่อสภาวะการควบคุมการผลิตที่ดีที่สุด คาดการณ์ วันและเวลาที่จำเป็นต่อการซ่อมบำรุงเครื่องจักร โรงพยาบาล ทำนายอาการของโรคได้อย่างแม่นยำขึ้น เพื่อกำหนดวิธีการรักษาได้อย่างเหมาะสมที่สุด

67 เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (3/4)
ตลาดหลักทรัพย์ ค้นหาปัจจัยที่มีผลต่อการเปลี่ยนแปลงราคาหุ้น ทำนายระดับการแปรผันของหุ้นแต่ละตัว หรือภาพโดยรวมของตลาด ทำนายเวลาที่เหมาะสมต่อการปล่อยหุ้นที่ให้ได้ผลกำไรมากที่สุด ทำนายอนาคตว่าหุ้นตัวใดจะสร้างผลกำไรได้มาก และคุ้มค่าต่อการช้อนซื้อ ธุรกิจประกันภัย ค้นหาผู้เอาประกันที่มีแนวโน้มที่จะซื้อประกันเพิ่ม แบ่งรูปแบบการเรียกเงินชดเชยจากการประกันภัย เพื่อจัดอันดับความเสี่ยงภัย

68 เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (4/4)
ฮาร์ดแวร์และซอฟต์แวร์คอมพิวเตอร์ ค้นหาช่วงเวลาที่เหมาะสมกับการผลิตชิพคอมพิวเตอร์ตัวใหม่ เพื่อป้อนสู่ตลาด การทำนายอายุการใช้งานของ Disk Drive หรือ อุปกรณ์ต่าง ๆ การประเมินศักยภาพของซอฟต์แวร์ เมื่อเทียบกับซอฟต์แวร์ของคู่แข่ง กระทรวงกลาโหม กำหนดงบประมาณที่ใช้ในการเคลื่อนย้ายอาวุธยุทโธปกรณ์ทางทหาร ใช้ทดสอบศักยภาพของกลยุทธ์ทางการทหาร ทำนายทรัพยากรที่ใช้ในสงครามแต่ละครั้ง

69 การแสดงผลข้อมูลในระบบสนับสนุนการตัดสินใจ
การแสดงผลข้อมูลแบบกราฟิก การแสดงผลข้อมูลแบบหลายมิติ

70 การแสดงผลข้อมูลแบบกราฟิก (1/2)
ฝ่ายขาย สรุปยอดขายไตรมาสที่ 1 (หน่วย: พันบาท) ตัวแทน ยอดการขาย ภาคเหนือ 35% ภาคตะวันออกเฉียงเหนือ 26% ภาคกลาง 22% ภาคใต้ 17%

71 การแสดงผลข้อมูลแบบกราฟิก (2/2)
ฝ่ายขาย สรุปยอดขายไตรมาสที่ 1 (หน่วย: พันบาท) ของแต่ละปี ปี เนย ขนมปัง ผ้าอ้อม เบียร์ ยอดรวม 2544 12,500 22,500 13,500 8,500 59,544 2545 14,000 23,400 16,250 10,000 66,195 2546 15,250 26,500 20,000 76,796 2547 17,250 30,000 18,400 11,750 79,947 รวม 59,000 102,400 68,150 42,750 282,482

72 ประมาณการณ์ยอดขายปีหน้า
การแสดงผลข้อมูลแบบหลายมิติ (1/4) จาก OLAP สามารถแสดงผลข้อมูลในมุมมองหรือมิติต่างๆได้ดังนี้ ประเทศ สินค้า ยอดขายปีนี้ ประมาณการณ์ยอดขายปีหน้า ไทย วิทยุ 35,000,000.00 42,000,000.00 สิงคโปร์ 72,000,000.00 86,400,000.00 ฟิลิปปินส์ 23,000,000.00 27,600,000.00 มาเลเซีย 48,000,000.00 57,600,000.00 โทรทัศน์ 68,000,000.00 81,600,000.00 52,000,000.00 62,400,000.00 45,000,000.00 54,000,000.00 33,000,000.00 39,600,000.00 ตู้เย็น 43,000,000.00 51,600,000.00 51,000,000.00 61,200,000.00 47,000,000.00 56,400,000.00 36,000,000.00 43,200,000.00 แสดงยอดขายอุปกรณ์ไฟฟ้าในประเทศต่างๆ

73 การแสดงผลข้อมูลแบบหลายมิติ (2/4)
ประเทศ สินค้า ยอดขายปีนี้ ประมาณการณ์ยอดขายปีหน้า ไทย ตู้เย็น 43,000,000.00 51,600,000.00 โทรทัศน์ 68,000,000.00 81,600,000.00 วิทยุ 35,000,000.00 42,000,000.00 ฟิลิปปินส์ 47,000,000.00 56,400,000.00 45,000,000.00 54,000,000.00 23,000,000.00 27,600,000.00 มาเลเซีย 36,000,000.00 43,200,000.00 33,000,000.00 39,600,000.00 48,000,000.00 57,600,000.00 สิงคโปร์ 51,000,000.00 61,200,000.00 52,000,000.00 62,400,000.00 72,000,000.00 86,400,000.00  รวม 553,000,000.00 663,600,000.00 แสดงการเปรียบเทียบยอดขาย และประมาณการณ์ยอดขายอุปกรณ์ไฟฟ้าของสาขาต่างๆ จำแนกตามประเภทอุปกรณ์ไฟฟ้า

74 การแสดงผลข้อมูลแบบหลายมิติ (3/4)
สินค้า  ประเทศ ข้อมูล ตู้เย็น โทรทัศน์ วิทยุ ผลรวมทั้งหมด ไทย ยอดขายปีนี้ 43,000,000.00 68,000,000.00 35,000,000.00 146,000,000.00 ประมาณการณ์ยอดขายปีหน้า 51,600,000.00 81,600,000.00 42,000,000.00 175,200,000.00 ฟิลิปปินส์ 47,000,000.00 45,000,000.00 23,000,000.00 115,000,000.00 56,400,000.00 54,000,000.00 27,600,000.00 138,000,000.00 มาเลเซีย 36,000,000.00 33,000,000.00 48,000,000.00 117,000,000.00 43,200,000.00 39,600,000.00 57,600,000.00 140,400,000.00 สิงคโปร์ 51,000,000.00 52,000,000.00 72,000,000.00 175,000,000.00 61,200,000.00 62,400,000.00 86,400,000.00 210,000,000.00 รวม 177,000,000.00 198,000,000.00 178,000,000.00 553,000,000.00 212,400,000.00 237,600,000.00 213,600,000.00 663,000,000.00 แสดงการเปรียบเทียบยอดขาย และประมาณการณ์ยอดขายอุปกรณ์ไฟฟ้าของสาขาต่างๆ จำแนกตามประเภทอุปกรณ์ไฟฟ้า

75 การแสดงผลข้อมูลแบบหลายมิติ (4/4)
ประเทศ  สินค้า ข้อมูล ไทย ฟิลิปปินส์ มาเลเซีย สิงคโปร์ ผลรวมทั้งหมด ตู้เย็น ยอดขายปีนี้ 43,000,000.00 47,000,000.00 36,000,000.00 51,000,000.00 177,000,000.00 ประมาณการณ์ยอดขายปีหน้า 51,600,000.00 56,400,000.00 43,200,000.00 61,200,000.00 212,400,000.00 โทรทัศน์ 68,000,000.00 45,000,000.00 33,000,000.00 52,000,000.00 198,000,000.00 81,600,000.00 54,000,000.00 39,600,000.00 62,400,000.00 237,600,000.00 วิทยุ 35,000,000.00 23,000,000.00 48,000,000.00 72,000,000.00 178,000,000.00 42,000,000.00 27,600,000.00 57,600,000.00 86,400,000.00 213,600,000.00 ผลรวม  ยอดขายปีนี้ 146,000,000.00 115,000,000.00 117,000,000.00 175,000,000.00 553,000,000.00  ประมาณการณ์ยอดขายปีหน้า 175,200,000.00 138,000,000.00 140,400,000.00 210,000,000.00 663,600,000.00 แสดงการเปรียบเทียบยอดขายปีนี้ และการคาดการณ์ยอดขายปีหน้าของอุปกรณ์ไฟฟ้าประเภทต่างๆ จำแนกตามสาขา

76 Reference กิติ ภักดีวัฒนะกุล, คัมภีร์ระบบสนับสนุนการตัดสินใจ และระบบผู้เชี่ยวชาญ. กรุงเทพฯ: เคทีพี คอมพ์ แอนด์ คอนซัลท์, 2546 ภาคการศึกษาที่ 2 ปีการศึกษา เรียนวันที่ 21/01/2561


ดาวน์โหลด ppt Data Management (การจัดการข้อมูล)

งานนำเสนอที่คล้ายกัน


Ads by Google