งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

Data mining 483050365-4 สุขฤทัย มาสาซ้าย.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "Data mining 483050365-4 สุขฤทัย มาสาซ้าย."— ใบสำเนางานนำเสนอ:

1 Data mining สุขฤทัย มาสาซ้าย

2 Data mining Data Mining คือ ชุด software วิเคราะห์ข้อมูลที่ได้ถูกออกแบบมาเพื่อระบบสนับสนุนการตัดสินใจของผู้ใช้ เป็น software ที่สมบรูณ์ทั้งเรื่องการค้นหา การทำรายงาน และโปรแกรมในการจัดการ ซึ่งเราคุ้นเคยดีกับคำว่า Executive Information System ( EIS ) หรือระบบข้อมูลสำหรับการตัดสินใจในการบริหาร ซึ่งเป็นเครื่องมือชิ้นใหม่ที่สามารถค้นหาข้อมูลในฐานข้อมูลขนาดใหญ่หรือข้อมูลที่เป็นประโยชน์ในการบริหาร ซึ่งเป็นการเพิ่มคุณค่าให้กับฐานข้อมูลที่มีอยู่

3 แผนภาพกระบวนการ Data mining
1.โดยทั่วไปจะเริ่มจาการตั้งสมมุติฐานทางธุรกิจตามความรู้และความเข้าใจของ user ที่มีต่อธุรกิจ 3. หลังจากตรวจสอบแก้ไขสมมติฐานในขั้นสุดท้ายแล้ว user ก็ตัดสินใจ Data Business hypothesis Business modeling (using data mining software) Data mining (analysis) Validation of hypothesis Decision Business knowledge 2. ใช้ระบบ data mining tools โดย user สร้าง model แล้วกลั่นกรองสมมติฐาน ตามด้วยการวิเคราะห์ ซึ่งขบวนการนี้อาจจะต้องมีการทำซ้ำหลาย ๆ ครั้ง

4 ขั้นตอนการทำงานของ Data Mining
1. Problem formulation การกำหนดวัตถุประสงค์ทางธุรกิจ ต้องเข้าใจปัญหาและความต้องการทางธุรกิจ 2. Data selection and preparation - การเตรียมข้อมูล (Data Preparation) - การเลือกข้อมูล (Data Selection) - การกลั่นกรองข้อมูล (Data Preprocessing) - การสำรวจและตรวจสอบข้อมูล( Data Cleaning and exploration ) - การแปลงข้อมูล (Data Transformation) - การปรับแต่งข้อมูล ( Data Engineering ) 3. Visualization เป็นการนำเสนอข้อมูลในรูปแบบกราฟฟิค 4. Analysis วิเคราะห์ 5. Interprete การตรวจสอบ 6. Presentation แสดงผลการวิเคราะห์ และตีความหมาย

5 ทำไมจึงต้องมี Data Mining
1.ข้อมูลที่ถูกเก็บไว้ในฐานข้อมูลหากเก็บไว้เฉย ๆ ก็จะไม่เกิดประโยชน์ดังนั้นจึงต้องมีการสกัดสารสนเทศไปใช้ 2.ในอดีตเราใช้คนเป็นผู้สืบค้นข้อมูลต่าง ๆ ในฐานข้อมูลซึ่งผู้สืบค้นจะทำการสร้างเงื่อนไขขึ้นมาตามภูมิปัญญาของผู้สืบค้น 3.ในปัจจุบันการวิเคราะห์ข้อมูลจากฐานข้อมูลเดียวอาจไม่ให้ความรู้เพียงพอและลึกซึ้งสำหรับการดำเนินงานภายใต้ภาวะที่มีการแข่งขันสูงและมีการเปลี่ยนแปลงที่รวดเร็วจึงจำเป็นที่จะต้องรวบรวมฐานข้อมูลหลาย ๆ ฐานข้อมูลเข้าด้วยกัน เรียกว่า “ คลังข้อมูล” ( Data Warehouse) ดังนั้นเราจึงจำเป็นต้องใช้ Data Mining ในการดึงข้อมูลจากฐานข้อมูลที่มีขนาดใหญ่ เพื่อที่จะนำข้อมูลนั่นมาใช้งานให้เกิดประโยชน์สูงที่สุด การสกัดสารสนเทศ หมายถึง การคัดเลือกข้อมูลออกมาใช้งานในส่วนที่เราต้องการ

6 ปัจจัยที่ทำให้ Data Mining เป็นที่ได้รับความนิยม
จำนวนและขนาดข้อมูลขนาดใหญ่ถูกผลิตและขยายตัวอย่างรวดเร็ว การสืบค้นความรู้จะมีความหมายก็ต่อเมื่อฐานข้อมูลที่ใช้มีขนาดใหญ่มาก ปัจจุบันมีจำนวนและขนาดข้อมูลขนาดใหญ่ที่ขยายตัวอย่างรวดเร็ว โดยผ่านทาง Internet ดาวเทียม และแหล่งผลิตข้อมูล อื่น ๆ เช่น เครื่องอ่านบาร์โค้ด , เครดิตการ์ด , อีคอมเมิร์ซ ข้อมูลถูกจัดเก็บเพื่อนำไปสร้างระบบการสนับสนุนการตัดสินใจ ( Decision Support System) เพื่อเป็นการง่ายต่อการนำข้อมูลมาใช้ในการวิเคราะห์เพื่อการตัดสินใจ ระบบ computer สมรรถนะสูงมีราคาต่ำลง เทคนิค Data Mining ประกอบไปด้วย Algorithm ที่มีความซับซ้อนและความต้องการการคำนวณสูง จึงจำเป็นต้องใช้งานกับระบบ computer สมรรถนะสูง ปัจจุบันระบบ computer สมรรถนะสูงมีราคาต่ำลง พร้อมด้วยเริ่มมีเทคโนโลยีที่นำเครื่อง microcomputer จำนวนมากมาเชื่อมต่อกันโดยเครือข่ายความเร็วสูง ( PC Cluster ) การแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า เนื่องจากปัจจุบันมีการแข่งขันอย่างสูงในด้านอุตสาหกรรมและการค้า มีการผลิตข้อมูลไว้อย่างมากมายแต่ไม่ได้นำมาใช้ให้เกิดประโยชน์ จึงเป็นการจำเป็นอย่างยิ่งที่ต้องควบคุมและสืบค้นความรู้ที่ถูกซ่อนอยู่ในฐานข้อมูลความรู้ที่ได้รับสามารถนำไปวิเคราะห์เพื่อการตัดสินใจในการจัดการในระบบต่าง ๆ

7 KDD (Knowledge Discovery in Database)
KDD หมายถึง กระบวนการในการค้นหาลักษณะแฝงของข้อมูลที่อยู่ในกลุ่มข้อมูลจำนวนมาก ซึ่งมีขั้นตอนการทำ Data Mining เป็นกระบวนการที่สำคัญในการค้นหาลักษณะที่น่าสนใจของข้อมูลเหล่านี้ เช่น รูปแบบ ความสัมพันธ์ การเปลี่ยนแปลง โครงสร้างที่เด่นชัด หรือ ลักษณะที่ผิดปกติของข้อมูลจากข้อมูลจำนวนมากๆ ที่เก็บอยู่ในฐานข้อมูล หรือแหล่งที่เก็บข้อมูลอื่นๆ ซึ่งวิธีการต่างๆ ที่นำมาใช้ในการทำ mining นี้ก็มีวัตถุประสงค์ต่างๆกันขึ้นอยู่กับผลลัพธ์ของ กระบวนการโดยรวมที่ต้องการ ดังนั้นจึงควรมีการนำเสนอวิธีการที่หลากหลายสำหรับเป้าหมายที่แตกต่างกัน เพื่อให้ได้ผลลัพธ์ ที่เหมาะสมตามที่ต้องการ หลังจากนำไปใช้งานแล้ว และเนื่องจากความแพร่หลายของการจัดเก็บข้อมูลในลักษณะที่เป็น รูปแบบทางอิเล็กทรอนิกส์ และความต้องการในการเปลี่ยนข้อมูลเหล่านั้นให้เป็นข้อมูลที่มีประโยชน์ต่อการนำไปประยุกต์ ใช้ในงานด้านต่างๆ เช่น การวิเคราะห์ด้านการตลาด การบริหารธุรกิจ รวมถึงระบบที่ช่วยสนับสนุนการตัดสินใจ

8 ตัวอย่างการประยุกต์ใช้ Data mining
รายได้ > 100k (ต่อเดือน) no yes ทำงาน > 5 ปี แต่งงาน yes no yes no Honda Jazz Yaris CRV Fortuner แบบ Decision Tree


ดาวน์โหลด ppt Data mining 483050365-4 สุขฤทัย มาสาซ้าย.

งานนำเสนอที่คล้ายกัน


Ads by Google