Data mining 483050365-4 สุขฤทัย มาสาซ้าย.

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
วงจรพัฒนาระบบ (System Development Life Cycle)
Advertisements

บทที่ 2 ระบบฐานข้อมูล Database System BC424 Information Technology.
ประเภทของระบบสารสนเทศในองค์กร
Master Degree of Science in Information Technology,
การขุดค้นข้อมูล (Data Mining)
บทที่ 1 ความรู้พื้นฐานในการ พัฒนาระบบ
ศูนย์ปฏิบัติการ ระดับประเทศ. ขั้นตอนการพัฒนาศูนย์ ปฏิบัติการกระทรวง  ขั้นตอนที่ 1: การรวบรวมข้อมูลบทสรุป สำหรับผู้บริหาร (Portal of Governance Information)
Seminar in Information Knowledge and Technology Management ดร. ปรัชญนันท์ นิลสุข
Data Mining การทำเหมืองข้อมูล
Irwin/McGraw-Hill Copyright © 2000 by The McGraw-Hill Companies, Inc. All rights reserved. 1 Irwin/McGraw-Hill Copyright © 2000 by The McGraw-Hill Companies,
Test 4 1. data mining คืออะไร. (อธิบายเป็นแผนภาพประกอบด้วย) 2
Data Mining Dr. Wararat Rungworawut การทำเหมืองข้อมูล (Data Mining) สอนโดย ผศ. ดร. วรารัตน์ สงฆ์แป้น ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์
Database and Application Development Life Cycle 2.
ข้อมูล (data) หมายถึง ข้อเท็จจริงหรือ เหตุการณ์ ที่เกี่ยวข้องกับสิ่งต่าง ๆที่ เป็นตัวเลข ข้อความหรือ รายละเอียดซึ่งอาจอยู่ใน รูปแบบต่าง ๆ เช่น ภาพ เสียง.
ระบบสารสนเทศ อ.วรพจน์ พรหมจักร.
ศูนย์ข้อมูลกลางเพื่อบริหารจัดเก็บและใช้ประโยชน์
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
Management system at Dell
บทที่ 1 ความรู้เบื้องต้นเกี่ยวกับระบบและการวิเคราะห์ระบบ
บทที่ 2 ความรู้เบื้องต้นเกี่ยวกับเทคโนโลยีสารสนเทศ และระบบสารสนเทศ
Information Systems Development
ผู้บริหารกรมชลประทานกับระบบEIS
13 October 2007
การออกแบบสถาปัตยกรรมแอปพลิเคชั่น
Data Management (การจัดการข้อมูล)
Thai Quality Software (TQS)
2 การพัฒนาระบบสารสนเทศ (Information System Development)
11 May 2014
Information System Development
ระบบสารสนเทศเพื่อการจัดการ * Management Information Systems
เทคโนโลยีสารสนเทศเพื่อการศึกษาค้นคว้า Information Technology for Study Skill 01/12/61.
เทคโนโลยีสารสนเทศ (Information Technology)
บทที่ 6 วิศวกรรมระบบ (System Engineering)
ระบบสารสนเทศ (Information System)
บทที่ 2 ระบบสารสนเทศเพื่อการจัดการ
“หลักการแก้ปัญหา”.
Introduction to CRISP-DM
Introduction to Data mining
13 October 2007
Chapter 7 Clustering อาจารย์อนุพงศ์ สุขประเสริฐ
Chapter 4 Data Pre-Processing อาจารย์อนุพงศ์ สุขประเสริฐ
ศูนย์ข้อมูลกลางกระทรวงมหาดไทยและจังหวัด
ระบบเทคโนโลยีสารสนเทศ (Information Technology)
Data Management (การจัดการข้อมูล)
การวิเคราะห์คำค้น ในรูปแบบ Word Cloud เพื่อสนับสนุนงานบริการสารสนเทศของห้องสมุด Keywords Analysis in Word Cloud for supporting library information services.
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
Database ฐานข้อมูล.
การจัดการเทคโนโลยีสารสนเทศ ในสถานศึกษา
Yeunyong Kantanet School of Information and Communication Technology
บทเรียนที่ 1 ความรู้เบื้องต้นเกี่ยวกับเทคโนโลยีสารสนเทศ
การจัดทำแผนอัตรากำลัง 3 ปี
การพัฒนาระบบสารสนเทศ
การออกแบบบทเรียนคอมพิวเตอร์
Data Mining Association Analysis ## Weka
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
(The Marketing Information Gathering)
บทที่ 9 การอธิบายกระบวนการแบบต้นไม้.
วิชา วิศวกรรมซอฟต์แวร์ (Software Engineering)
เทคโนโลยีสารสนเทศ อาจารย์ศิริพร ศักดิ์บุญญารัตน์
อ.พิณรัตน์ นุชโพธิ์ คณะวิทยาการจัดการ มหาวิทยาลัยราชภัฏพิบูลสงคราม
Group Decision Support systems: GDSS
บทที่ 7 การเขียนผังงานระบบ.
บทที่ 2 การพัฒนาระบบสารสนเทศ
การพัฒนา IT ให้บูรณาการเข้ากับโครงสร้างและระบบงาน
Chapter 7 Clustering อาจารย์อนุพงศ์ สุขประเสริฐ
[ บทที่ 3 ] ระบบสารสนเทศ.
Introduction to Structured System Analysis and Design
ระบบสารสนเทศทางธุรกิจ
การทำเหมืองข้อมูลด้วยโปรแกรม RapidMiner Studio
การรวบรวมข้อมูลข่าวสารการตลาด (The Marketing Information Gathering)
ใบสำเนางานนำเสนอ:

Data mining 483050365-4 สุขฤทัย มาสาซ้าย

Data mining Data Mining คือ ชุด software วิเคราะห์ข้อมูลที่ได้ถูกออกแบบมาเพื่อระบบสนับสนุนการตัดสินใจของผู้ใช้ เป็น software ที่สมบรูณ์ทั้งเรื่องการค้นหา การทำรายงาน และโปรแกรมในการจัดการ ซึ่งเราคุ้นเคยดีกับคำว่า Executive Information System ( EIS ) หรือระบบข้อมูลสำหรับการตัดสินใจในการบริหาร ซึ่งเป็นเครื่องมือชิ้นใหม่ที่สามารถค้นหาข้อมูลในฐานข้อมูลขนาดใหญ่หรือข้อมูลที่เป็นประโยชน์ในการบริหาร ซึ่งเป็นการเพิ่มคุณค่าให้กับฐานข้อมูลที่มีอยู่

แผนภาพกระบวนการ Data mining 1.โดยทั่วไปจะเริ่มจาการตั้งสมมุติฐานทางธุรกิจตามความรู้และความเข้าใจของ user ที่มีต่อธุรกิจ 3. หลังจากตรวจสอบแก้ไขสมมติฐานในขั้นสุดท้ายแล้ว user ก็ตัดสินใจ Data Business hypothesis Business modeling (using data mining software) Data mining (analysis) Validation of hypothesis Decision Business knowledge 2. ใช้ระบบ data mining tools โดย user สร้าง model แล้วกลั่นกรองสมมติฐาน ตามด้วยการวิเคราะห์ ซึ่งขบวนการนี้อาจจะต้องมีการทำซ้ำหลาย ๆ ครั้ง

ขั้นตอนการทำงานของ Data Mining 1. Problem formulation การกำหนดวัตถุประสงค์ทางธุรกิจ ต้องเข้าใจปัญหาและความต้องการทางธุรกิจ 2. Data selection and preparation - การเตรียมข้อมูล (Data Preparation) - การเลือกข้อมูล (Data Selection) - การกลั่นกรองข้อมูล (Data Preprocessing) - การสำรวจและตรวจสอบข้อมูล( Data Cleaning and exploration ) - การแปลงข้อมูล (Data Transformation) - การปรับแต่งข้อมูล ( Data Engineering ) 3. Visualization เป็นการนำเสนอข้อมูลในรูปแบบกราฟฟิค 4. Analysis วิเคราะห์ 5. Interprete การตรวจสอบ 6. Presentation แสดงผลการวิเคราะห์ และตีความหมาย

ทำไมจึงต้องมี Data Mining 1.ข้อมูลที่ถูกเก็บไว้ในฐานข้อมูลหากเก็บไว้เฉย ๆ ก็จะไม่เกิดประโยชน์ดังนั้นจึงต้องมีการสกัดสารสนเทศไปใช้ 2.ในอดีตเราใช้คนเป็นผู้สืบค้นข้อมูลต่าง ๆ ในฐานข้อมูลซึ่งผู้สืบค้นจะทำการสร้างเงื่อนไขขึ้นมาตามภูมิปัญญาของผู้สืบค้น 3.ในปัจจุบันการวิเคราะห์ข้อมูลจากฐานข้อมูลเดียวอาจไม่ให้ความรู้เพียงพอและลึกซึ้งสำหรับการดำเนินงานภายใต้ภาวะที่มีการแข่งขันสูงและมีการเปลี่ยนแปลงที่รวดเร็วจึงจำเป็นที่จะต้องรวบรวมฐานข้อมูลหลาย ๆ ฐานข้อมูลเข้าด้วยกัน เรียกว่า “ คลังข้อมูล” ( Data Warehouse) ดังนั้นเราจึงจำเป็นต้องใช้ Data Mining ในการดึงข้อมูลจากฐานข้อมูลที่มีขนาดใหญ่ เพื่อที่จะนำข้อมูลนั่นมาใช้งานให้เกิดประโยชน์สูงที่สุด การสกัดสารสนเทศ หมายถึง การคัดเลือกข้อมูลออกมาใช้งานในส่วนที่เราต้องการ

ปัจจัยที่ทำให้ Data Mining เป็นที่ได้รับความนิยม จำนวนและขนาดข้อมูลขนาดใหญ่ถูกผลิตและขยายตัวอย่างรวดเร็ว การสืบค้นความรู้จะมีความหมายก็ต่อเมื่อฐานข้อมูลที่ใช้มีขนาดใหญ่มาก ปัจจุบันมีจำนวนและขนาดข้อมูลขนาดใหญ่ที่ขยายตัวอย่างรวดเร็ว โดยผ่านทาง Internet ดาวเทียม และแหล่งผลิตข้อมูล อื่น ๆ เช่น เครื่องอ่านบาร์โค้ด , เครดิตการ์ด , อีคอมเมิร์ซ ข้อมูลถูกจัดเก็บเพื่อนำไปสร้างระบบการสนับสนุนการตัดสินใจ ( Decision Support System) เพื่อเป็นการง่ายต่อการนำข้อมูลมาใช้ในการวิเคราะห์เพื่อการตัดสินใจ ระบบ computer สมรรถนะสูงมีราคาต่ำลง เทคนิค Data Mining ประกอบไปด้วย Algorithm ที่มีความซับซ้อนและความต้องการการคำนวณสูง จึงจำเป็นต้องใช้งานกับระบบ computer สมรรถนะสูง ปัจจุบันระบบ computer สมรรถนะสูงมีราคาต่ำลง พร้อมด้วยเริ่มมีเทคโนโลยีที่นำเครื่อง microcomputer จำนวนมากมาเชื่อมต่อกันโดยเครือข่ายความเร็วสูง ( PC Cluster ) การแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า เนื่องจากปัจจุบันมีการแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า มีการผลิตข้อมูลไว้อย่างมากมายแต่ไม่ได้นำมาใช้ให้เกิดประโยชน์ จึงเป็นการจำเป็นอย่างยิ่งที่ต้องควบคุมและสืบค้นความรู้ที่ถูกซ่อนอยู่ในฐานข้อมูลความรู้ที่ได้รับสามารถนำไปวิเคราะห์เพื่อการตัดสินใจในการจัดการในระบบต่าง ๆ

KDD (Knowledge Discovery in Database) KDD หมายถึง กระบวนการในการค้นหาลักษณะแฝงของข้อมูลที่อยู่ในกลุ่มข้อมูลจำนวนมาก ซึ่งมีขั้นตอนการทำ Data Mining เป็นกระบวนการที่สำคัญในการค้นหาลักษณะที่น่าสนใจของข้อมูลเหล่านี้ เช่น รูปแบบ ความสัมพันธ์ การเปลี่ยนแปลง โครงสร้างที่เด่นชัด หรือ ลักษณะที่ผิดปกติของข้อมูลจากข้อมูลจำนวนมากๆ ที่เก็บอยู่ในฐานข้อมูล หรือแหล่งที่เก็บข้อมูลอื่นๆ ซึ่งวิธีการต่างๆ ที่นำมาใช้ในการทำ mining นี้ก็มีวัตถุประสงค์ต่างๆกันขึ้นอยู่กับผลลัพธ์ของ กระบวนการโดยรวมที่ต้องการ ดังนั้นจึงควรมีการนำเสนอวิธีการที่หลากหลายสำหรับเป้าหมายที่แตกต่างกัน เพื่อให้ได้ผลลัพธ์ ที่เหมาะสมตามที่ต้องการ หลังจากนำไปใช้งานแล้ว และเนื่องจากความแพร่หลายของการจัดเก็บข้อมูลในลักษณะที่เป็น รูปแบบทางอิเล็กทรอนิกส์ และความต้องการในการเปลี่ยนข้อมูลเหล่านั้นให้เป็นข้อมูลที่มีประโยชน์ต่อการนำไปประยุกต์ ใช้ในงานด้านต่างๆ เช่น การวิเคราะห์ด้านการตลาด การบริหารธุรกิจ รวมถึงระบบที่ช่วยสนับสนุนการตัดสินใจ

ตัวอย่างการประยุกต์ใช้ Data mining รายได้ > 100k (ต่อเดือน) no yes ทำงาน > 5 ปี แต่งงาน yes no yes no Honda Jazz Yaris CRV Fortuner แบบ Decision Tree