Data Management (การจัดการข้อมูล)

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
ปัญหาของระบบแฟ้มข้อมูล ( File System)
Advertisements

บทที่ 2 ระบบฐานข้อมูล Database System BC424 Information Technology.
โดย อ.เธียรชัย พัฒนศิริเวทิน
การขุดค้นข้อมูล (Data Mining)
Data Warehousing and Data Mining
Chapter 1 ระบบฐานข้อมูล (Database System)
Data Management (การจัดการข้อมูล)
Charter 8 1 Chapter 8 การจัดการฐานข้อมูล Database Management.
Data analysis for the making a decision with Business Intelligence
OLAP : การดำเนินการกับ OLAP
System Database Semester 1, 2009 Worrakit Sanpote 1.
Database & DBMS Architecture วรวิทย์ พูลสวัสดิ์. 2 2 ฐานข้อมูล (Database) - Data and its relation - Databases are designed to offer an organized mechanism.
Database and Application Development Life Cycle 2.
ศูนย์ข้อมูลกลางเพื่อบริหารจัดเก็บและใช้ประโยชน์
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
บทที่ 1 ความรู้เบื้องต้นเกี่ยวกับระบบและการวิเคราะห์ระบบ
Microsoft Access การใช้งานโปรแกรมระบบจัดการฐานข้อมูล
ระบบการจัดการฐานข้อมูล
13 October 2007
Chapter 3 : แบบจำลองฐานข้อมูล (Data Model)
ผู้บริหารกรมชลประทานกับระบบEIS
บทที่ 4 แบบจำลองฐานข้อมูลเชิงสัมพันธ์ Relational Database
สถาปัตยกรรมของระบบฐานข้อมูล
บทที่ 5 แบบจำลองกระบวนการ
Chapter 8 Classification อาจารย์อนุพงศ์ สุขประเสริฐ
11 May 2014
เทคโนโลยีสารสนเทศเพื่อการศึกษาค้นคว้า Information Technology for Study Skill 01/12/61.
Data mining สุขฤทัย มาสาซ้าย.
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
บทที่ 6 วิศวกรรมระบบ (System Engineering)
บทที่ 5 ความต้องการ วิศวกรรมความต้องการ แบบจําลองการวิเคราะห์
บทที่ 7 ระบบสารสนเทศ.
การจัดการฐานข้อมูลด้วยโปรแกรม MS Access 2013
7 Entity-Relationship Modeling แผนภาพความสัมพันธ์ ORACLE MS SQL SERVER
การออกแบบระบบ System Design.
Introduction to Data mining
(On-Line Analytical Processing)
บทที่ 3 แบบจำลองของฐานข้อมูล (Database Model)
Chapter 7 Clustering อาจารย์อนุพงศ์ สุขประเสริฐ
แนะนำรายวิชา การออกแบบระบบการจัดการเรียนรู้บนเครือข่าย
Data Management (การจัดการข้อมูล)
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
บทที่ 4 ฐานข้อมูล.
Introduction to information System
Introduction to information System
School of Information & Communication Technology
Yeunyong Kantanet School of Information and Communication Technology
การจัดการระบบฐานข้อมูล
รายวิชา แหล่งสารสนเทศ การเข้าถึงแหล่งสารสนเทศ อาจารย์ ดร.นฤมล รักษาสุข
บรรยายโดย คุณครูกิริยา ทิพมาตย์ สพม. เขต 23
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจระหว่างประเทศ
Data Mining Association Analysis ## Weka
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
โครงสร้างข้อมูล( Data Structure)
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
รหัสแทนข้อมูลในระบบคอมพิวเตอร์
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
บทที่ 2 รูปแบบของฐานข้อมูล
ฐานข้อมูลเชิงสัมพันธ์ Relational Database
[ บทที่ 1 ] ระบบฐานข้อมูล
ประเด็นการขับเคลื่อนองค์การไปสู่ระบบราชการ 4.0
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
제 10장 데이터베이스.
CIT2205 โปรแกรมประยุกต์ด้านการจัดการฐานข้อมูล
Introduction to Structured System Analysis and Design
คลังข้อมูล (Data Warehouse)
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
Data resource management
การรวบรวมข้อมูลข่าวสารการตลาด (The Marketing Information Gathering)
ใบสำเนางานนำเสนอ:

Data Management (การจัดการข้อมูล) อาจารย์สุรินทร์ทิพ ศักดิ์ภูวดล สำนักเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยนเรศวร วิทยาเขตสารสนเทศพะเยา

เนื้อหา ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) แหล่งข้อมูล (Data Source) การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น ฐานข้อมูล (Database) ระบบจัดการฐานข้อมูล (Database Management System: DBMS) ชนิดของฐานข้อมูล เทคโนโลยีฐานข้อมูล (Database Technology) การแสดงผลข้อมูลในระบบสนับสนุนการตัดสินใจ

ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (1/3) คือ ข้อเท็จจริงเกี่ยวกับสิ่งต่าง ๆ ซึ่งอาจเป็นคน สัตว์ สิ่งของ หรือเหตุการณ์ต่าง ๆ ที่ยังไม่ผ่านการประมวลผล โดยที่ข้อมูลอาจอยู่ในรูปของตัวเลข ตัวอักษร ข้อความ หรือ Multimedia ก็ได้ เนื่องจากข้อมูลเป็นส่วนประกอบที่สำคัญของระบบสารสนเทศรวมทั้งระบบสนับสนุนการตัดสินใจ จึงต้องเป็นข้อเท็จจริงที่ถูกต้อง ครบถ้วน สมบูรณ์ และน่าเชื่อถือ

ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (2/3) คือ ข้อมูลที่ผ่านการประมวลผล และจัดการให้มีความถูกต้อง ทันสมัย และสามารถนำไปใช้งานได้ตามที่ต้องการ Process & Transform Data Information

ข้อมูล สารสนเทศ และองค์ความรู้ (Data, Information and Knowledge) (3/3) คือ สารสนเทศที่ถูกคัดเลือกเพื่อใช้ในการแก้ปัญหาต่าง ๆ ตามต้องการได้อย่างมีประสิทธิภาพ โดยอาศัยประสบการณ์ในการเลือกสารสนเทศมาใช้ในการแก้ไขปัญหาได้อย่างเหมาะสม Wisdom Correct use of Knowledge Knowledge Collection of all Information Information Process & Transform Data

แหล่งข้อมูล (Data Source) แหล่งข้อมูลภายในองค์กร (Internal Data Source) แหล่งข้อมูลภายนอกองค์การ (External Data Source)

การเก็บรวบรวมข้อมูลและปัญหาที่เกิดขึ้น วิธีการรวบรวมข้อมูล ปัญหาของข้อมูล คุณภาพของข้อมูล ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ

วิธีการรวบรวมข้อมูล การศึกษาเกี่ยวกับเวลาในการปฏิบัติงานต่าง ๆ (Time Study) รวบรวมข้อมูลโดยการสังเกตการณ์ การสำรวจ (Survey) โดยแบบสอบถาม(Questionnaire) การสังเกตการณ์ (Observation) การเฝ้าดูการทำงาน เช่น กล้องวีดีโอ การสัมภาษณ์ (Interview)

ปัญหาของข้อมูล ข้อมูลมีความผิดพลาด ข้อมูลไม่ทันต่อการใช้งาน ข้อมูลไม่เหมาะสมกับการใช้งาน ข้อมูลที่ต้องการไม่มีอยู่ในระบบ

คุณภาพของข้อมูล (Data Quality) คุณภาพโดยทั่วไปของข้อมูล ความสอดคล้องของข้อมูล สามารถนำไปใช้ประโยชน์ ทันต่อความต้องการ และมีความครบถ้วนสมบูรณ์ คุณภาพโดยธรรมชาติของข้อมูล ความถูกต้อง และความน่าเชื่อถือ การเข้าถึงข้อมูล ความสามารถในการเข้าถึง และความปลอดภัยของข้อมูล การนำเสนอข้อมูล การสื่อความหมาย ง่ายต่อการใช้งาน กระชับ และมีเนื้อหาที่สอดคล้องกัน

ข้อแนะนำเกี่ยวกับข้อมูลก่อนนำเข้าสู่ระบบสนับสนุนการตัดสินใจ ตรวจสอบความถูกต้อง และความสมบูรณ์ของข้อมูล ตรวจสอบความทันสมัยของข้อมูล ตรวจสอบความสมบูรณ์ของข้อมูล เช่น ผลรวมถูกต้องจริง ตรวจสอบปริมาณข้อมูลว่าเพียงพอหรือไม่

ฐานข้อมูล (Database) กลุ่มของแฟ้มข้อมูลที่มีความสัมพันธ์กันและถูกนำมารวมกัน เช่น ฐานข้อมูลในบริษัทแห่งหนึ่งอาจประกอบไปด้วยแฟ้มข้อมูลหลายแฟ้ม โดยที่แต่ละแฟ้มจะมีความสัมพันธ์กัน ได้แก่ ข้อมูลพนักงาน ข้อมูลแผนกในบริษัท ข้อมูลลูกค้า ข้อมูลสินค้า ข้อมูลการขาย

ข้อดีของการใช้ระบบฐานข้อมูล ข้อมูลเป็นอิสระจากโปรแกรมที่ใช้งานข้อมูล (Data Independence) ลดความซ้ำซ้อนของข้อมูล (Data Redundancy) หลีกเลี่ยงความไม่สอดคล้องของข้อมูล (Data Inconsistency) ความถูกต้องของข้อมูล (Data Integrity) รูปแบบที่เป็นมาตรฐานเดียวกัน ความปลอดภัยของข้อมูล (Data Security) นำเสนอรายงานได้ง่าย (Easy Reporting) สามารถควบคุมการเข้าถึงข้อมูลจากผู้ใช้หลายคน (Concurrency Control) ตอบสนองความต้องการใช้งานข้อมูลได้หลายแบบ

ตัวอย่างความซ้ำซ้อนกันของข้อมูล (Data Redundancy) แฟ้มข้อมูลพนักงาน (Employee) Emp_No Emp_Name Emp_Address Emp_Salary Emp_Tel E001 นายแพง พลเมืองดี 12/20 ลาดพร้าว กรุงเทพมหานคร 20,000 02-4410036 E002 นางสุดใจ แสนดี 108 บางกะปิ กรุงเทพมหานคร 30,000 02-2360123 E003 นางสาวดวงใจ แสนประเสริฐ 50 บางซื่อ กรุงเทพมหานคร 8,000 02-4245000 E004 นางกนกวรรณ เกิดสุข 60 บางแค กรุงเทพมหานคร 9,500 02-4418523 แฟ้มข้อมูลพนักงานขาย (Salesman) Sale_No Sale_Name Sale_Phone S001 นางสาวดวงใจ แสนประเสริฐ 02-4245000 S002 นางกนกวรรณ เกิดสุข 02-4418523

ตัวอย่างความไม่สอดคล้องกันของข้อมูล (Data Inconsistency) แฟ้มข้อมูลพนักงาน (Employee) Emp_No Emp_Name Emp_Address Emp_Salary Emp_Tel E001 นายแพง พลเมืองดี 12/20 ลาดพร้าว กรุงเทพมหานคร 20,000 02-4410036 E002 นางสุดใจ แสนดี 108 บางกะปิ กรุงเทพมหานคร 30,000 02-2360123 E003 นางสาวดวงใจ แสนประเสริฐ 50 บางซื่อ กรุงเทพมหานคร 8,000 02-4245000 E004 นางกนกวรรณ เกิดสุข 60 บางแค กรุงเทพมหานคร 9,500 02-4418523 แฟ้มข้อมูลพนักงานขาย (Salesman) Sale_No Sale_Name Sale_Phone S001 นางสาวดวงใจ แสนประเสริฐ 081-4235575 S002 นางกนกวรรณ เกิดสุข 02-4418523 หากมีการแก้ไขข้อมูลหมายเลขโทรศัพท์ของดวงใจ แต่แก้ไขเพียงบาง Table

ระบบจัดการฐานข้อมูล (Database Management System: DBMS) ความหมายของระบบจัดการฐานข้อมูล หน้าที่ของระบบจัดการฐานข้อมูล ประโยชน์ของระบบจัดการฐานข้อมูล

DBMS : ความหมายของระบบจัดการฐานข้อมูล โปรแกรมที่ทำหน้าที่เป็นตัวกลางการทำงานระหว่างผู้ใช้งานฐานข้อมูลกับฐานข้อมูล เพื่ออำนวยความสะดวกผู้ใช้ ในการสร้าง ลบ ปรับปรุง สืบค้น และเรียกใช้ข้อมูล ฐานข้อมูล ผู้ดูแลฐานข้อมูล (DBA) DBMS Application ผู้ใช้ (User)

DBMS : หน้าที่ของระบบจัดการฐานข้อมูล การจัดเตรียมมุมมองของผู้ใช้ (User View) การสร้างและแก้ไขฐานข้อมูล การจัดเก็บและเรียกใช้ข้อมูล การดำเนินงานกับข้อมูลและการสร้างรายงาน

DBMS : ประโยชน์ของระบบจัดการฐานข้อมูล ช่วยสนับสนุนการใช้งานโปรแกรมประยุกต์โดยเป็นส่วนจัดการข้อมูลในฐานข้อมูล ผู้ใช้สามารถใช้ข้อมูลร่วมกันได้ ผู้ใช้มีความสะดวกและรวดเร็วในการสืบค้นข้อมูล สามารถควบคุม ความถูกต้องและความสอดคล้องของข้อมูล ลดความซ้ำซ้อนของการจัดเก็บข้อมูล

ชนิดของฐานข้อมูล ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database) ฐานข้อมูลแบบเครือข่าย (Network Database) ฐานข้อมูลเชิงสัมพันธ์ (Relational Database) ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database)

ชนิดของฐานข้อมูล : ฐานข้อมูลแบบลำดับชั้น (Hierarchical Database) Parent Node จะมี Child Node ได้มากกว่า 1 Node แต่ Child Node จะมี Parent Node ได้เพียง Node เดียวเท่านั้น คุณสมชาย ภักดี คุณสุชาดา พอดี รหัสสินค้า A1 A2 A3 A2 A3 B1 ตะปู ปูน สี ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 15 150 100 50 10

ชนิดของฐานข้อมูล : ฐานข้อมูลแบบเครือข่าย (Network Database) Parent Node จะมี Child Node ได้มากกว่า 1 Node และ Child Node จะมี Parent Node ได้ได้มากกว่า 1 Node ด้วย คุณสมชาย ภักดี คุณสุชาดา พอดี รหัสสินค้า A1 A2 A3 B1 ตะปู ปูน สี จอบ ชื่อสินค้า ปริมาณ 250 115 200 10

ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงสัมพันธ์ (Relational Database) Customer Order Cust_ID Cust_Name 001 คุณสมชาย ภักดี 002 คุณสมหญิง ใจดี Cust_ID Prod_ID Quantity 001 A1 250 A2 15 A3 150 002 100 50 B1 10 Product Prod_ID Prod_Name A1 ตะปู A2 ปูน A3 สี B1 จอบ

ชนิดของฐานข้อมูล : ฐานข้อมูลเชิงวัตถุ (Object-Oriented Database) Cust_ID = 001 Cust_Name = อุทัย เซี่ยงเจ็น Customer Attribute: Cust_ID Cust_Name Methods: Print(); getName(); Cust_ID = 002 Cust_Name = มานี มีนา

เทคโนโลยีฐานข้อมูล (Database Technology) คลังข้อมูล (Data Warehouse) การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online Analytical Processing: OLAP) เหมืองข้อมูล (Data Mining)

เทคโนโลยีฐานข้อมูล : คลังข้อมูล (Data Warehouse) ความหมายของคลังข้อมูล คุณลักษณะของคลังข้อมูล ข้อดี / ข้อเสีย ของคลังข้อมูล สถาปัตยกรรมของคลังข้อมูล การวิเคราะห์ข้อมูลในคลังข้อมูล

คลังข้อมูล (Data Warehouse) : ความหมายของคลังข้อมูล หลักการหรือวิธีการเพื่อการรวมระบบสารสนเทศเพื่อการประมวลผลรายการข้อมูลที่เกิดขึ้นในแต่ละวันในแต่ละสายงาน มารวมเป็นหน่วยเดียวกัน เพื่อสนับสนุนกระบวนการตัดสินใจของผู้ตัดสินใจให้มีประสิทธิภาพมากยิ่งขึ้น คลังข้อมูล หมายถึง ฐานข้อมูลที่จัดเก็บข้อมูล ที่ได้มาจากการสกัดข้อมูล (Extract) จากฐานข้อมูลอื่น ซึ่งอาจมีโครงสร้างแตกต่างกัน หรืออยู่บนระบบปฏิบัติการแตกต่างกันก็ได้ ทั้งนี้ เพื่อประโยชน์ในการวิเคราะห์ และตัดสินใจเชิงธุรกิจ

คลังข้อมูล (Data Warehouse) : คุณลักษณะของคลังข้อมูล Subject-Oriented : ข้อมูลถูกจัดเก็บตามประเด็นหลักขององค์กร เช่น ข้อมูลลูกค้า สินค้า และยอดขาย เป็นต้น Integrated : รวบรวมและจัดรูปแบบข้อมูลให้อยู่ในรูปแบบเดียวกัน และสร้างความสอดคล้องให้กับข้อมูลก่อนที่จะนำเสนอแก่ผู้ใช้ Time-Variant : ข้อมูลที่จัดเก็บในคลังข้อมูลส่วนใหญ่จะเป็นข้อมูลในอดีตที่ผ่านมาแล้ว 5-10 ปีทำให้เราสามารถเห็นแนวโน้มของข้อมูลได้ Non-Volatile : ข้อมูลที่จัดเก็บภายในคลังข้อมูล จะไม่ถูกแก้ไข แต่จะถูกเพิ่มข้อมูลใหม่ต่อท้าย โดยไม่ทำการแทนที่ข้อมูลเดิม

คลังข้อมูล (Data Warehouse) : ข้อดี / ข้อเสีย ของคลังข้อมูล ให้ผลการตอบแทนจากการลงทุนสูง องค์กรเกิดความได้เปรียบคู่แข่งขัน เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ ข้อเสีย ขั้นตอนการกลั่นกรองและโหลดข้อมูลเข้าสู่คลังข้อมูลใช้เวลานาน และต้องอาศัยผู้ที่มีความชำนาญ แนวโน้มความต้องการข้อมูลมีมากขึ้นเรื่อย ๆ และต้องการคำตอบที่ซับซ้อนขึ้น ใช้เวลานานในการพัฒนาคลังข้อมูล ระบบคลังข้อมูลมีความซับซ้อนสูง

คลังข้อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (1/2) Data Provisioning Area Data Data Staging Area Data Data Warehouse Database Data Data Data Acquisition System Metadata Metadata Metadata Terminal Metadata Metadata Repository

คลังข้อมูล (Data Warehouse) : สถาปัตยกรรมของคลังข้อมูล (2/2) Data Acquisition System : ทำหน้าที่รับข้อมูลจากภายใน/นอกองค์กร มีการตรวจสอบความถูกต้อง Data Staging Area : ทำหน้าที่ Cleansing & Filtering เลือกเฉพาะข้อมูลที่เป็นประโยชน์ ( Filtering), แปลงข้อมูล และ ตรวจสอบความถูกต้องในเบื้องต้น ก่อนจะโหลดเข้าสู่ Data Warehouse Database Data Warehouse Database : บันทึกข้อมูลต่าง ๆ ที่จำเป็นสำหรับการวิเคราะห์ข้อมูลขององค์กร Data Provisioning Area หรือ Data Mart : เหมือน Data Warehouse Database แต่ขอบเขตเนื้อหาข้อมูลจะแคบกว่า คือ เพื่อกลุ่มงานใดกลุ่มงานหนึ่ง End Users Terminal : นำเสนอผลลัพธ์ออกจากหน้าจอ โดยจะใช้เครื่องมือหรือระบบที่ทำหน้าที่ออกรายงาน เช่น Simple Reporting Tools, Multi-Dimensional Tools หรือ Data Mining Tools ก็ได้ Metadata Repository : เป็นพื้นที่สำหรับเก็บข้อมูลต่าง ๆ ที่จำเป็นสำหรับควบคุมการทำงานและควบคุมข้อมูลในคลังข้อมูล เช่น คำนิยามของข้อมูลใน Data Warehouse Database

คลังข้อมูล (Data Warehouse) : การวิเคราะห์ข้อมูลในคลังข้อมูล (1/2) ความยุ่งยากมีน้อย ใช้ปริมาณข้อมูลน้อย ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลน้อย ความยุ่งยากมีมาก ใช้ปริมาณข้อมูลมาก ใช้เวลาในการประมวลผลหรือเตรียมข้อมูลมาก Query and Report Multidimensional Data Analysis Data Mining มีเครื่องมือช่วยในการสร้างมากมาย มีเครื่องมือช่วยในการสร้างน้อย

คลังข้อมูล (Data Warehouse) : การวิเคราะห์ข้อมูลในคลังข้อมูล (2/2) ผล แหล่งข้อมูลเพื่อ การปฏิบัติงาน Report Generator รายงาน ข้อมูล ข้อมูล การใช้งาน Data Mining Tools ผล Data Warehouse ข้อมูล การใช้งาน ผู้ใช้งาน แหล่งข้อมูลเพื่อ การวิเคราะห์ OLAP Generator ข้อมูล ผล OLAP คลังข้อมูล ช่วงเวลาที่องค์กรไม่ได้ปฏิบัติงาน ช่วงเวลาที่องค์กรปฏิบัติงาน

การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (Online Analytical Processing : OLAP) Multidimensional Database การดำเนินการกับ OLAP ประโยชน์ของ OLAP

OLAP : ความหมายของ OLAP (Online Analytical Processing) กระบวนการประมวลผลข้อมูลทางคอมพิวเตอร์ ที่ช่วยให้ผู้ใช้สามารถวิเคราะห์ในมิติต่าง ๆ (Multidimensional Data Analysis) ของข้อมูลได้ง่ายขึ้น เช่น ผู้ใช้ต้องการเปรียบเทียบข้อมูลยอดการขายบะหมี่กึ่งสำเร็จรูปในเดือนมีนาคม เทียบกับเดือนกันยายน และเทียบกับสินค้าอื่น ๆ ในช่วงเวลาเดียวกัน

OLAP : Multidimensional Database (1/4)

OLAP : Multidimensional Database (2/4) จังหวัด ไตรมาส ยอดขาย กรุงเทพฯ 1 750,000 2 800,000 3 825,000 4 680,000 จังหวัด ไตรมาส ยอดขาย เชียงใหม่ 1 550,000 2 600,000 3 650,000 4 500,000 ฐานข้อมูลเชิงสัมพันธ์ จังหวัด กรุงเทพฯ เชียงใหม่ 1 750,000 550,000 2 800,000 600,000 3 825,000 650,000 4 680,000 500,000 ไตรมาส นำเสนอแบบหลายมิติ

OLAP : Multidimensional Database (3/4) สินค้า จังหวัด ไตรมาส ยอดขาย มือถือ กทม. 1 750,000 บัตรเดิมเงิน 350,000 2 800,000 300,000 3 825,000 280,000 4 680,000 380,000 สินค้า จังหวัด ไตรมาส ยอดขาย มือถือ ชม. 1 550,000 บัตรเดิมเงิน 250,000 2 600,000 200,000 3 650,000 260,000 4 500,000 325,000 ฐานข้อมูลเชิงสัมพันธ์

OLAP : Multidimensional Database (4/4) จังหวัด ชม. 550,000 600,000 650,000 750,000 800,000 825,000 500,000 680,000 กทม. มือถือ บัตรเติมเงิน 250,000 550,000 200,000 650,000 260,000 600,000 325,000 500,000 มือถือ สินค้า บัตรเติมเงิน 1 2 3 4 ไตรมาส นำเสนอแบบหลายมิติ

OLAP : การดำเนินการกับ OLAP Roll up และ Drill Down Roll up เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากส่วนของรายละเอียดมาก จนมาเป็นข้อมูลสรุป Drill Down เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากข้อมูลสรุป จนมาเป็นข้อมูลในส่วนรายละเอียด Slice and Dice Slice เป็นการเลือกพิจารณาผลลัพธ์บางส่วนที่เราสนใจ โดยการเลือกเฉพาะค่าที่ถูกกำกับด้วยข้อมูลบางค่าของแต่ละมิติ Dice เป็นกระบวนการพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

การดำเนินการกับ OLAP : Roll up และ Drill Down (1/2) Region Sum North 61,000 South 41,500 Region Roll up Drill Down Product Type Glossary Misc. Region North 55,000 6,000 South 31,000 10,500 Region-Product Type Roll up Drill Down Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type

การดำเนินการกับ OLAP : Roll up และ Drill Down (2/2) Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type Roll up Drill Down Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Region-Shop-Product Type-Product Type

การดำเนินการกับ OLAP : Slice (1/2) 10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Source Cube Fish Meat Pork Med. Pencil Glossary Misc. 10,000 8,000 23,000 25,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Glossary 10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Med. Pencil Glossary Misc. แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณา เฉพาะกลุ่มสินค้าประเภท “Glossary”

การดำเนินการกับ OLAP : Slice (2/2) Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Slice:Glossary Product Type Glossary Product Fish Meat Pork Region Shop North ABC 10,000 20,000 Platter 25,000 South Five Mart 8,000 23,000 แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณาเฉพาะกลุ่มสินค้าประเภท “Glossary”

การดำเนินการกับ OLAP : Dice (1/2) Shop Product Type Date Product Type Shop Date การพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

การดำเนินการกับ OLAP : Dice (2/2) Product Type Glossary Misc. Shop ABC 30,000 Platter 25,000 6,000 Five Mart 31,000 10,500 Shop-Product Type Product Type Glossary Misc. Date 6/07/2004 43,000 10,000 7/07/2004 6,500 Date-Product Type การพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

OLAP : ประโยชน์ของ OLAP ช่วยในการวิเคราะห์เปรียบเทียบข้อมูลในมุมต่าง ๆ ทำให้การตัดสินใจมีประสิทธิภาพมากขึ้น ผู้ใช้แต่ละคนสามารถสร้างมุมมองข้อมูลของตนเองได้ เพื่อนำไปใช้ในงานเฉพาะด้าน มีความรวดเร็วในการสอบถามข้อมูล แม้ในฐานข้อมูลขนาดใหญ่และมีความซับซ้อนมาก ทำให้ได้รับข้อมูลมุมมองใหม่ ๆ สำหรับประกอบการตัดสินใจ

เทคโนโลยีฐานข้อมูล : เหมืองข้อมูล (Data Mining) ความหมายของเหมืองข้อมูล เทคนิคในการทำเหมืองข้อมูล คุณลักษณะของเหมืองข้อมูล ประโยชน์ของเหมืองข้อมูล ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน

เหมืองข้อมูล (Data Mining) : ความหมายของเหมืองข้อมูล การวิเคราะห์ข้อมูล เพื่อแยกประเภท จำแนกรูปแบบและความสัมพันธ์ของข้อมูลจากฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล และนำสารสนเทศที่ได้ไปใช้ในการตัดสินใจธุรกิจ ดังนั้นผู้ที่ไม่มีความเชี่ยวชาญด้านการเขียนโปรแกรมคอมพิวเตอร์ ก็สามารถค้นหาข้อมูลต่าง ๆ ได้อย่างรวดเร็ว การวิเคราะห์ข้อมูลโดยใช้เทคนิคบางประการเพื่อค้นหาข้อมูลที่ถูกซ่อนอยู่ จำแนกและเชื่อมโยงความสัมพันธ์ของข้อมูลเหล่านั้นจากคลังข้อมูล ทำให้ค้นพบรูปแบบความสัมพันธ์ที่ไม่เคยมีมาก่อนจนกลายเป็นการค้นพบองค์ความรู้ใหม่ (Knowledge Discovery) ซึ่งเป็นวัตถุประสงค์หลักของการทำเหมืองข้อมูล ซึ่งองค์ความรู้ใหม่ที่ได้อาจรวมถึงกฎ (Rules) บางอย่างเพื่อใช้เป็นแนวทางในการตัดสินใจ และประเมินผลลัพธ์การตัดสินใจได้

เหมืองข้อมูล (Data Mining) : เทคนิคในการทำเหมืองข้อมูล Classification Clustering Association Visualization

เทคนิคในการทำเหมืองข้อมูล : Classification (1/4) เป็นเทคนิคในการจำแนกกลุ่มข้อมูลด้วยคุณลักษณะต่าง ๆ ที่ได้มีการกำหนดไว้แล้ว เทคนิคประเภทนี้เหมาะกับการสร้างแบบจำลองเพื่อการพยากรณ์ค่าข้อมูล (Predictive Modeling) ในอนาคต จากการที่ได้จำแนกกลุ่มข้อมูลตัวอย่างไว้แล้ว เรียกว่า “Supervised Learning” โดยมี 2 รูปแบบคือ Tree Induction Neural Induction

เทคนิคในการทำเหมืองข้อมูล : Classification (2/4) อายุเช่าสินทรัพย์ อายุผู้เช่า ซื้อสินทรัพย์ 2 25 YES 3 22 1 28 NO 5 30 4 27 21 23 ... … สมมติว่าต้องการพยากรณ์ว่าลูกค้าที่ปัจจุบันได้เช่าสินทรัพย์อย่างใดอย่างหนึ่งไปแล้ว จะมีโอกาสตัดสินใจซื้อสินทรัพย์ชนิดนั้นไปเป็นของตนเองหรือไม่ ?

เทคนิคในการทำเหมืองข้อมูล : Classification (3/4) จากข้อมูลพบว่า “ลูกค้าที่มีอายุเช่าสินทรัพย์ตั้งแต่ 2 ปีขึ้นไปและอายุของผู้เช่าตั้งแต่ 25 ปีขึ้นไป มักจะตกลงซื้อสินทรัพย์เป็นของตนเอง” อายุเช่าสินทรัพย์ >= 2 ? อายุผู้เช่า >= 25 ? เช่า ซื้อ No Yes Tree Induction

เทคนิคในการทำเหมืองข้อมูล : Classification (4/4) Neural Induction 0.5 0.7 0.4 “เช่า” หรือ “ซื้อ” 0.6 0.3 0.4 อายุผู้เช่า >= 25 ? Input Hidden Processing Layer Output

เทคนิคในการทำเหมืองข้อมูล : Clustering เป็นเทคนิคที่ใช้ในการจำแนกกลุ่มข้อมูลใหม่ที่มีลักษณะคล้ายกันไว้ในกลุ่มเดียวกัน โดยที่ไม่มีการจัดกลุ่มข้อมูลตัวอย่างไว้ล่วงหน้า เรียกว่า “Unsupervised Learning” ตัวอย่างเช่น บริษัทประกันภัยพบว่า ลูกค้าเพศชายเสียชีวิตจากอุบัติเหตุมากที่สุด ส่วนลูกค้าเพศหญิงเสียชีวิตจากโรคมะเร็งมากที่สุด ดังนั้นบริษัทอาจนำข้อมูลข้างต้น มาพิจารณาเพื่อจัดทำกรมธรรม์ฉบับพิเศษสำหรับโรคมะเร็งของลูกค้าเพศหญิงได้

เทคนิคในการทำเหมืองข้อมูล : Association เป็นเทคนิคที่ใช้ค้นพบองค์ความรู้หรือสารสนเทศใหม่ ด้วยการเชื่อมโยงข้อมูลหรือกลุ่มข้อมูลที่เกิดขึ้นในเหตุการณ์เดียวกันเข้าด้วยกัน ตัวอย่างเช่น เมื่อสำรวจพบว่า ลูกค้าที่มีอายุเช่าสินทรัพย์ตั้งแต่ 2 ปีขึ้นไป และอายุของผู้เช่าสินทรัพย์ตั้งแต่ 25 ปีขึ้นไป มีโอกาสตัดสินใจซื้อสินทรัพย์เป็นของตนเองมากถึง 40 เปอร์เซ็นต์ ในขณะที่ลูกค้าที่มีคุณลักษณะเดียวกัน 35 เปอร์เซ็นต์ ตัดสินใจเช่าสินทรัพย์ต่อไป จากตัวอย่างบริษัทเราต้องมีการปรับกลยุทธ์เพื่อจูงใจให้ลูกค้าอีก 35 เปอร์เซ็นต์ สนใจที่จะซื้อสินทรัพย์

เทคนิคในการทำเหมืองข้อมูล : Visualization เป็นเทคนิคที่ใช้เพื่อการแสดงผลนำเสนอข้อมูลในรูปกราฟิก ที่จะให้ผู้ใช้สามารถค้นพบองค์ความรู้ได้จากการแสดงผล ดังนั้นจึงต้องมีการพัฒนารูปแบบการแสดงผลให้สามารถเห็นได้ชัดเจน อาจมีสีสัน หรือการแสดงผล 3 มิติ แสดงให้เห็นพื้นที่ของกลุ่มข้อมูลทั้งหมดได้ นำไปสู่การพิจารณาข้อมูลกลุ่มนั้นเป็นกรณีพิเศษ และทำให้เกิดองค์ความรู้ใหม่ในที่สุด เช่น การนำเสนอข้อมูลช่วงเวลาในการใช้งานโทรศัพท์ด้วยแผนภูมิ จะแสดงให้เห็นปริมาณผู้ใช้โทรศัพท์ในแต่ละช่วงเวลาได้อย่างชัดเจน และสามารถพิจารณาโปรโมชั่นพิเศษบางช่วงเวลาเพื่อดึงดูดใจลูกค้า

เหมืองข้อมูล (Data Mining) : คุณลักษณะของเหมืองข้อมูล การค้นหาข้อมูลโดยอาศัยเทคโนโลยีการทำเหมืองข้อมูล ภายใต้ฐานข้อมูลขนาดใหญ่หรือคลังข้อมูล ซึ่งข้อมูลอาจถูกสะสมมานานหลายปี มักจะมีสถาปัตยกรรมเป็น Client/Server ผู้ใช้งานระบบสารสนเทศไม่จำเป็นต้องมีทักษะในการเขียนโปรแกรม เนื่องจากมีเครื่องมือช่วยค้นหาข้อมูลจากคลังข้อมูลได้อย่างรวดเร็ว ผู้ใช้ต้องกำหนดขอบเขตการค้นหาข้อมูลให้ชัดเจนเพื่อความรวดเร็ว อาจมีการประมวลผลข้อมูลแบบขนาน เพื่อเพิ่มประสิทธิภาพในการค้นหาและวิเคราะห์ข้อมูล เครื่องมือสำหรับทำเหมืองข้อมูลสามารถใช้งานร่วมกับโปรแกรม Spreadsheet และเครื่องมือพัฒนาต่าง ๆ ได้เป็นอย่างดี

เหมืองข้อมูล (Data Mining) : ประโยชน์ของเหมืองข้อมูล ช่วยชี้แนวทางการตัดสินใจและคาดการณ์ผลลัพธ์ที่จะได้จากการตัดสินใจ เพิ่มความเร็วในการวิเคราะห์ฐานข้อมูลขนาดใหญ่ ค้นหาส่วนประกอบที่ซ่อนอยู่ภายในเอกสาร รวมถึงความสัมพันธ์ของส่วนประกอบต่าง ๆ ด้วย เชื่อมโยงเอกสารที่มีความเกี่ยวข้องกันระหว่างหน่วยงานต่าง ๆ ภายในองค์กร การจัดกลุ่มข้อมูล เช่น จัดกลุ่มลูกค้าทั้งหมดของบริษัทประกันภัยที่ประสบอุบัติเหตุ ลักษณะเดียวกันเพื่อดำเนินการต่าง ๆ ตามนโยบายของบริษัท

เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (1/4) การตลาด การทำนายผลการตอบสนองกับการเปิดตัวสินค้าใหม่ การทำนายยอดขายเมื่อมีการลดราคาสินค้า การทำนายกลุ่มลูกค้าที่น่าจะใช้สินค้าของเรา การเงินการธนาคาร การคาดการณ์ถึงโอกาสในการชำระหนี้ของลูกค้าว่าสูงเท่าไหร่? ค้นหาลูกค้าขาดคุณภาพ เพื่อหลีกเลี่ยงความเสี่ยงในการปล่อยกู้ ค้นหาลูกค้าชั้นดี เพื่อเสนอการปล่อยกู้ ทำนายแนวโน้มของพฤติกรรมการใช้บัตรเครดิต สถานีโทรทัศน์หรือวิทยุ ค้นหารายการที่ดีและเหมาะสมต่อช่วงเวลาที่สุด เพื่อวางผังรายการในแต่ละเดือน

เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (2/4) การค้าขาย ทำนายผลกำไรเมื่อลงทุนซื้อสินค้ามาเพื่อขาย ใช้ค้นหาจุดคุ้มทุน โรงงานและการผลิต ทำนายอายุการใช้งานเครื่องจักร ตลอดจนเวลาที่เหมาะสมในการเปิดปิดเครื่องจักร ค้นหาปัจจัยสำคัญที่มีผลต่อสภาวะการควบคุมการผลิตที่ดีที่สุด คาดการณ์ วันและเวลาที่จำเป็นต่อการซ่อมบำรุงเครื่องจักร โรงพยาบาล ทำนายอาการของโรคได้อย่างแม่นยำขึ้น เพื่อกำหนดวิธีการรักษาได้อย่างเหมาะสมที่สุด

เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (3/4) ตลาดหลักทรัพย์ ค้นหาปัจจัยที่มีผลต่อการเปลี่ยนแปลงราคาหุ้น ทำนายระดับการแปรผันของหุ้นแต่ละตัว หรือภาพโดยรวมของตลาด ทำนายเวลาที่เหมาะสมต่อการปล่อยหุ้นที่ให้ได้ผลกำไรมากที่สุด ทำนายอนาคตว่าหุ้นตัวใดจะสร้างผลกำไรได้มาก และคุ้มค่าต่อการช้อนซื้อ ธุรกิจประกันภัย ค้นหาผู้เอาประกันที่มีแนวโน้มที่จะซื้อประกันเพิ่ม แบ่งรูปแบบการเรียกเงินชดเชยจากการประกันภัย เพื่อจัดอันดับความเสี่ยงภัย

เหมืองข้อมูล (Data Mining) : ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน (4/4) ฮาร์ดแวร์และซอฟต์แวร์คอมพิวเตอร์ ค้นหาช่วงเวลาที่เหมาะสมกับการผลิตชิพคอมพิวเตอร์ตัวใหม่ เพื่อป้อนสู่ตลาด การทำนายอายุการใช้งานของ Disk Drive หรือ อุปกรณ์ต่าง ๆ การประเมินศักยภาพของซอฟต์แวร์ เมื่อเทียบกับซอฟต์แวร์ของคู่แข่ง กระทรวงกลาโหม กำหนดงบประมาณที่ใช้ในการเคลื่อนย้ายอาวุธยุทโธปกรณ์ทางทหาร ใช้ทดสอบศักยภาพของกลยุทธ์ทางการทหาร ทำนายทรัพยากรที่ใช้ในสงครามแต่ละครั้ง

การแสดงผลข้อมูลในระบบสนับสนุนการตัดสินใจ การแสดงผลข้อมูลแบบกราฟิก การแสดงผลข้อมูลแบบหลายมิติ

การแสดงผลข้อมูลแบบกราฟิก (1/2) ฝ่ายขาย สรุปยอดขายไตรมาสที่ 1 (หน่วย: พันบาท) ตัวแทน ยอดการขาย ภาคเหนือ 35% ภาคตะวันออกเฉียงเหนือ 26% ภาคกลาง 22% ภาคใต้ 17%

การแสดงผลข้อมูลแบบกราฟิก (2/2) ฝ่ายขาย สรุปยอดขายไตรมาสที่ 1 (หน่วย: พันบาท) ของแต่ละปี   ปี เนย ขนมปัง ผ้าอ้อม เบียร์ ยอดรวม 2544 12,500 22,500 13,500 8,500 59,544 2545 14,000 23,400 16,250 10,000 66,195 2546 15,250 26,500 20,000 76,796 2547 17,250 30,000 18,400 11,750 79,947 รวม 59,000 102,400 68,150 42,750 282,482

ประมาณการณ์ยอดขายปีหน้า การแสดงผลข้อมูลแบบหลายมิติ (1/4) จาก OLAP สามารถแสดงผลข้อมูลในมุมมองหรือมิติต่างๆได้ดังนี้ ประเทศ สินค้า ยอดขายปีนี้ ประมาณการณ์ยอดขายปีหน้า ไทย วิทยุ 35,000,000.00 42,000,000.00 สิงคโปร์ 72,000,000.00 86,400,000.00 ฟิลิปปินส์ 23,000,000.00 27,600,000.00 มาเลเซีย 48,000,000.00 57,600,000.00 โทรทัศน์ 68,000,000.00 81,600,000.00 52,000,000.00 62,400,000.00 45,000,000.00 54,000,000.00 33,000,000.00 39,600,000.00 ตู้เย็น 43,000,000.00 51,600,000.00 51,000,000.00 61,200,000.00 47,000,000.00 56,400,000.00 36,000,000.00 43,200,000.00 แสดงยอดขายอุปกรณ์ไฟฟ้าในประเทศต่างๆ

การแสดงผลข้อมูลแบบหลายมิติ (2/4) ประเทศ สินค้า ยอดขายปีนี้ ประมาณการณ์ยอดขายปีหน้า ไทย ตู้เย็น 43,000,000.00 51,600,000.00   โทรทัศน์ 68,000,000.00 81,600,000.00 วิทยุ 35,000,000.00 42,000,000.00 ฟิลิปปินส์ 47,000,000.00 56,400,000.00 45,000,000.00 54,000,000.00 23,000,000.00 27,600,000.00 มาเลเซีย 36,000,000.00 43,200,000.00 33,000,000.00 39,600,000.00 48,000,000.00 57,600,000.00 สิงคโปร์ 51,000,000.00 61,200,000.00 52,000,000.00 62,400,000.00 72,000,000.00 86,400,000.00  รวม 553,000,000.00 663,600,000.00 แสดงการเปรียบเทียบยอดขาย และประมาณการณ์ยอดขายอุปกรณ์ไฟฟ้าของสาขาต่างๆ จำแนกตามประเภทอุปกรณ์ไฟฟ้า

การแสดงผลข้อมูลแบบหลายมิติ (3/4)   สินค้า  ประเทศ ข้อมูล ตู้เย็น โทรทัศน์ วิทยุ ผลรวมทั้งหมด ไทย ยอดขายปีนี้ 43,000,000.00 68,000,000.00 35,000,000.00 146,000,000.00 ประมาณการณ์ยอดขายปีหน้า 51,600,000.00 81,600,000.00 42,000,000.00 175,200,000.00 ฟิลิปปินส์ 47,000,000.00 45,000,000.00 23,000,000.00 115,000,000.00 56,400,000.00 54,000,000.00 27,600,000.00 138,000,000.00 มาเลเซีย 36,000,000.00 33,000,000.00 48,000,000.00 117,000,000.00 43,200,000.00 39,600,000.00 57,600,000.00 140,400,000.00 สิงคโปร์ 51,000,000.00 52,000,000.00 72,000,000.00 175,000,000.00 61,200,000.00 62,400,000.00 86,400,000.00 210,000,000.00 รวม 177,000,000.00 198,000,000.00 178,000,000.00 553,000,000.00 212,400,000.00 237,600,000.00 213,600,000.00 663,000,000.00 แสดงการเปรียบเทียบยอดขาย และประมาณการณ์ยอดขายอุปกรณ์ไฟฟ้าของสาขาต่างๆ จำแนกตามประเภทอุปกรณ์ไฟฟ้า

การแสดงผลข้อมูลแบบหลายมิติ (4/4)   ประเทศ  สินค้า ข้อมูล ไทย ฟิลิปปินส์ มาเลเซีย สิงคโปร์ ผลรวมทั้งหมด ตู้เย็น ยอดขายปีนี้ 43,000,000.00 47,000,000.00 36,000,000.00 51,000,000.00 177,000,000.00 ประมาณการณ์ยอดขายปีหน้า 51,600,000.00 56,400,000.00 43,200,000.00 61,200,000.00 212,400,000.00 โทรทัศน์ 68,000,000.00 45,000,000.00 33,000,000.00 52,000,000.00 198,000,000.00 81,600,000.00 54,000,000.00 39,600,000.00 62,400,000.00 237,600,000.00 วิทยุ 35,000,000.00 23,000,000.00 48,000,000.00 72,000,000.00 178,000,000.00 42,000,000.00 27,600,000.00 57,600,000.00 86,400,000.00 213,600,000.00 ผลรวม  ยอดขายปีนี้ 146,000,000.00 115,000,000.00 117,000,000.00 175,000,000.00 553,000,000.00  ประมาณการณ์ยอดขายปีหน้า 175,200,000.00 138,000,000.00 140,400,000.00 210,000,000.00 663,600,000.00 แสดงการเปรียบเทียบยอดขายปีนี้ และการคาดการณ์ยอดขายปีหน้าของอุปกรณ์ไฟฟ้าประเภทต่างๆ จำแนกตามสาขา

Reference กิติ ภักดีวัฒนะกุล, คัมภีร์ระบบสนับสนุนการตัดสินใจ และระบบผู้เชี่ยวชาญ. กรุงเทพฯ: เคทีพี คอมพ์ แอนด์ คอนซัลท์, 2546 ภาคการศึกษาที่ 1 ปีการศึกษา 2555 เรียนวันที่ 26/06/2555