ความรู้เบื้องต้นเกี่ยวกับฐานข้อมูลและคลังข้อมูล Introduction to Database สอนโดย อ.อภิชาติ สมรัตน์
หัวข้อบรรยาย โครงสร้างข้อมูล ชนิดของข้อมูล ฐานข้อมูล (Database) องค์ประกอบของระบบฐานข้อมูล เครื่องมือสำหรับการจัดการฐานข้อมูล คลังข้อมูล (Data Warehouse) รูปแบบการประยุกต์คลังข้อมูลในธุรกิจ สรุป
ลำดับชั้นของการจัดเก็บข้อมูล
การจัดการข้อมูล (Data Management) บิต (Bits) อักขระ (Characters) ฟิลด์ (Field) ฐานข้อมูล (Database) แฟ้มข้อมูล (Files) เรคอร์ด (records)
โครงสร้างของข้อมูล
ลำดับชั้นของการจัดเก็บข้อมูล บิต (bit) ย่อมาจาก Binary Digit ข้อมูลในคอมพิวเตอร์ 1 บิต จะแสดงได้ 2 สถานะคือ 0 หรือ 1
ลำดับชั้นของการจัดเก็บข้อมูล ไบต์(byte) คือ นำ บิต หลายๆ บิต มาเรียงต่อกัน จำนวน 8 บิต มาเรียงเป็น 1 ชุด เรียกว่า 1 ไบต์ เช่น 10100001 หมายถึง ก 10100010 หมายถึง ข
Bits 01001100 01001111 01010110 0100101 Characters L O V E
ลำดับชั้นของการจัดเก็บข้อมูล เขตข้อมูล(Field) คือ การนำ ไบต์ (byte) หลายๆ ไบต์ มาเรียงต่อกัน เช่น เขตข้อมูล Name ใช้เก็บชื่อ เช่น เขตข้อมูล LastName ใช้เก็บนามสกุล เป็นต้น
เขตข้อมูล (Field) ? คือ รายละเอียดที่เกิดจากกลุ่มอักขระที่รวมกันแล้วก่อให้เกิดความ หมายเช่น ชื่อคน สัตว์ สิ่งของ อายุ ที่อยู่ ฯลฯ รหัสนักศึกษา 47231440138 ชื่อนักศึกษา กาญจนา นามสกุลนักศึกษา น้ำใจงาม เพศ หญิง วันเดือนปีเกิด 21 มิถุยายน 2529 ที่อยู่ติดต่อได้ 119 ถ.ลำปาง- แม่ทะ ... อื่น ๆ หมายเหตุ : แต่ละเขตข้อมูลเมื่อมีการจัดเก็บต้องระบุชนิดตัวแปรให้ชัดเจน
ลำดับชั้นของการจัดเก็บข้อมูล ระเบียน(Record) คือ การนำเขตข้อมูล หลายๆ เขตข้อมูล มาเรียงต่อกัน เรียกว่า ระเบียน (record) เช่น ระเบียน ที่ 1 เก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของ นักเรียนคนที่ 1 เป็นต้น
ลำดับชั้นของการจัดเก็บข้อมูล แฟ้มข้อมูล(File) คือ การเก็บระเบียนหลายๆระเบียน รวมกัน เช่น แฟ้มข้อมูล นักเรียน จะเก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของนักเรียน จำนวน 500 คน เป็นต้น
File Fields Records รหัส ชื่อ สกุล เพศ หมู่เรียน 4740121 นายการัน รักษาเทพ ชาย วค47.ว4.1 4740221 น.สหนึ่งทิพย์ ศิริเยี่ยม หญิง กว47.ค4.1 4740256 นายศิริทรัพย์ เชื้อสะอาด บธ47.บ4.1 470890 นายไกรศร โรจน์สุวรรณ อผ47.ว4.1 Records
ลำดับชั้นของการจัดเก็บข้อมูล ฐานข้อมูล(Database) คือ การจัดเก็บ แฟ้มข้อมูล หลายๆ แฟ้มข้อมูล ไว้ภายใต้ระบบเดียวกัน เช่น เก็บ แฟ้มข้อมูล นักเรียน อาจารย์ วิชาที่เปิดสอน เป็นต้น
ฐานข้อมูล (Database) ? แหล่งเก็บข้อมูลขนาดใหญ่โดยปกติมักจะมีกลุ่มเดียว คุณสมบัติของฐานข้อมูล แหล่งเก็บข้อมูลขนาดใหญ่โดยปกติมักจะมีกลุ่มเดียว มักกำหนดเพียงครั้งเดียวเท่านั้น ข้อมูลจะถูกรวบรวมไว้ด้วยกันเพื่อให้เกิดความซ้ำซ้อนน้อยที่สุด ข้อมูลทรัพยากรสามารถร่วมกันได้หลายหน่วยงานภายใต้องค์กรเดียวกันไม่เป็นของหน่วยงานใดหน่วยงานหนึ่ง
ฐานข้อมูล บรรจุ? กลุ่มข้อมูล อาคาร/สถานที่ อื่น ๆ กลุ่มข้อมูล หลักสูตรการเรียน กลุ่มข้อมูล นักศึกษา กลุ่มข้อมูล การลงทะเบียน ฐานข้อมูลของ ม.ราชภัฏสุรินทร์ กลุ่มข้อมูล ตารางสอน/เรียน กลุ่มข้อมูล งบประมาณ กลุ่มข้อมูล อาจารย์/จนท.
ลำดับชั้นของการจัดเก็บข้อมูล Database Personnel file Department file Payroll file (Project database) Files 098-40-1370 Fiske, Steven 01-05-1985 549-77-1001 Buckley, Bill 02-17-1979 005-10-6321 Johns, Francine 10-07-1997 (Personnel file) Recordประกอบด้วย รหัส , นามสกุลและชื่อ,วันที่จ้างงาน Records 098-40-1370 Fiske, Steven 01-05-1985 Fields Fiske Field นามสกุล Characters (Byte) 1000100 ตัวอักษร F ใน ASCII Bit 0,1
“รูปแบบการจัดเก็บข้อมูลแบบเดิม”
ระบบแฟ้มข้อมูล (File-based System) แฟ้มข้อมูลที่ใช้ในระบบไฟล์จะแยกจากกันเป็นเอกเทศ และอาจไม่มีความสัมพันธ์กัน โดยส่วนใหญ่ข้อมูลและโปรแกรมมักรวมอยู่ด้วยกันเป็นแฟ้มข้อมูล
ระบบแฟ้มข้อมูล (File-based System) โปรแกรมบัญชี การขาย ลูกค้า ฝ่ายบัญชี โปรแกรมการขาย การขาย ลูกค้า สินค้า ฝ่ายขาย โปรแกรมฝ่ายบุคคล พนักงาน ฝ่ายบุคคล
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล ข้อมูลถูกแบ่งและเก็บแยกจากกัน ข้อมูลมีความซ้ำซ้อนกัน มีความขึ้นต่อกันของข้อมูล รูปแบบข้อมูลไม่ตรงกัน โปรแกรมที่ใช้งานมีความคงที่ไม่ยืดหยุ่น
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล ข้อมูลถูกเก็บและเก็บแยกจากกัน เมื่อข้อมูลต่าง ๆ ถูกเก็บกันไว้คนละไฟล์ หากต้องการนำข้อมูลต่าง ๆ มาสร้างเป็นรายงาน โปรแกรมเมอร์ต้องสร้างไฟล์ชั่วคราว(Temporary file)ขึ้นมา เพื่อดึงข้อมูลต่าง ๆ จากไฟล์ต่าง ๆ มารวมกันก่อน แล้วค่อยสร้างเป็นรายงาน
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล ข้อมูลมีความซ้ำซ้อน สืบเนื่องจากข้อมูลถูกเก็บแยกจากกัน ทำให้ไม่สามารถควบคุมความซ้ำซ้อนข้อมูลได้ ทำให้สูญเสียพื้นที่ในการจัดเก็บข้อมูลมากขึ้น และก่อให้เกิดความผิดพลาดในการดำเนินการกับข้อมูล 3 ลักษณะ ได้แก่ ความผิดพลาดจากการเพิ่มข้อมูล(Insertion anomalies) ความผิดพลาดจากการปรับปรุงข้อมูล(Modification anomalies) ความผิดพลาดจากการลบข้อมูล(Deletion anomalies)
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล มีความขึ้นต่อกันของข้อมูล เนื่องจากโครงสร้างทางกายภาพและการจัดเก็บข้อมูลถูกสร้างโดยการเขียนโปรแกรมประยุกต์(Application program) ดังนั้นหากต้องการเปลี่ยนแปลงโครงสร้างข้อมูล เช่น ชื่อของพนักงาน จากเดิม 20 ตัวอักษร เป็น 30 ตัวอักษร มีขั้นตอนการทำงานดังนี้ 1. เปิดไฟล์หลักพนักงานเพื่ออ่านข้อมูล 2. เปิดไฟล์ชั่วคราวที่มีโครงสร้างคล้ายไฟล์หลัก แต่ปรับโครงสร้างของชื่อพนักงาน จาก 20 ตัวอักษร เป็น 30 ตัวอักษร 3. อ่านข้อมูลจากไฟล์หลัก และย้ายไปเก็บไว้ในไฟล์ชั่วคราว จนกระทั่งครบทุกรายการ 4. ลบไฟล์หลักทิ้ง 5. เปลี่ยนชื่อไฟล์ชั่วครามให้ชื่อเดียวกับไฟล์หลัก
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล รูปแบบข้อมูลไม่ตรงกัน โครงสร้างข้อมูลจะขึ้นอยู่กับภาษาคอมพิวเตอร์ที่ใช้ในการเขียนโปรแกรมประยุกต์ ถ้าแต่ละฝ่ายใช้ภาษาในการเขียนต่าง ๆ กัน ก็อาจทำให้โครงสร้างข้อมูลของแฟ้มไม่ตรงกัน ทำให้ไม่สามารถนำไฟล์ข้อมูลมาใช้ร่วมกันได้
ข้อจำกัดของการประมวลผลแบบแฟ้มข้อมูล โปรแกรมที่ใช้งานคงที่ไม่ยืดหยุ่น ระบบแฟ้มข้อมูล มีความขึ้นกับโปรแกรมประยุกต์ ข้อมูลหรือรายงานต่าง ๆ จะถูกกำหนดรูปแบบตายตัวในโปรแกรมแล้ว ดังนั้นหากต้องการรายงานใหม่ จะต้องให้โปรแกรมเมอร์เขียนโปรแกรมขึ้นมาใหม่ ทำให้เสียค่าใช้จ่าย
“ระบบฐานข้อมูล”
ความหมายของฐานข้อมูล ฐานข้อมูล (Database) หมายถึง โครงสร้างของการจัดเก็บข้อมูลที่มีความสัมพันธ์เกี่ยวข้องกันไว้ในที่เดียวกัน เพื่อให้สามารถนำข้อมูลมาประมวลเพื่อช่วยในการตัดสินใจ และสามารถใช้ข้อมูลร่วมกันได้ ในการจัดการข้อมูลในฐานข้อมูลจะใช้ซอฟต์แวร์ประเภท ระบบจัดการฐานข้อมูล(Database Management System : DBMS)
ฐานข้อมูล(Database) ฐานข้อมูลมีส่วนที่ทำหน้าที่ในการอธิบายความหมายของรายการข้อมูลที่เก็บอยู่ในฐานข้อมูลด้วย เรียกส่วนนี้ว่า บัญชีระบบ(System catalog) หรือ พจนานุกรมของข้อมูล(Data Dictionary) หรือ เมตาดาต้า(Meta - data)
ฐานข้อมูล(Database) โครงสร้างของข้อมูลจะถูกแยกออกจากโปรแกรมประยุกต์และเก็บเอาไว้ในส่วนที่เรียกว่า “ฐานข้อมูล” ถ้ามีการเพิ่มหรือปรับปรุงโครงสร้างของข้อมูลก็จะไม่มีผลกระทบกับโปรแกรมประยุกต์
ระบบฐานข้อมูล (Database System) โปรแกรมบัญชี ฝ่ายบัญชี ลูกค้า พนักงาน การขาย สินค้า DBMS โปรแกรมการขาย ฝ่ายขาย Database โปรแกรมฝ่ายบุคคล ฝ่ายบุคคล
ระบบจัดการฐานข้อมูล (Database Management System : DBMS) หมายถึง ซอฟต์แวร์ที่ใช้ในการจัดการข้อมูลในฐานข้อมูล DBMS จะทำหน้าที่เป็นตัวกลางระหว่างฐานข้อมูลกับโปรแกรมที่มาใช้งานฐานข้อมูลและผู้ใช้งานฐานข้อมูล ที่ติดต่อไปยังฐานข้อมูลเพื่อทำงานที่ผู้ใช้ต้องการให้สำเร็จ เช่น การจัดเก็บข้อมูลลงในฐานข้อมูล , การค้นหาข้อมูลที่ต้องการออกมาแสดง หรือ การลบข้อมูล เป็นต้น
หน้าที่ของ DBMS จัดการพจนานุกรมของข้อมูล(Data dictionary management) จัดการการจัดเก็บข้อมูล(Data storage management) การแปลงข้อมูลและการนำเสนอข้อมูล(Data transformation and presentation) การจัดการด้านความปลอดภัย(Security management) ควบคุมการเข้าใช้งานของผู้ใช้พร้อมกัน(Multiuser accesss control)
หน้าที่ของ DBMS การจัดการเรื่องการสำรองและกู้คืนข้อมูล(Backup and recovery management) การจัดการความคงสภาพของข้อมูล(Data integrity management) ภาษาในการเข้าถึงข้อมูลและส่วนประสานผู้ใช้ในโปรแกรมประยุกต์(Database access languages and application programming interfaces)
การประยุกต์ใช้ระบบงานฐานข้อมูล การซื้อของจากซูเปอร์มาเก็ต การซื้อของโดยใช้บัตรเครดิต การจองตั๋วเครื่องบินผ่านตัวแทนจำหน่าย การใช้บริการห้องสมุด การใช้งานอินเทอร์เน็ต การเรียนในมหาวิทยาลัย การบริหารในองค์กร ฯลฯ อีกมากมาย
องค์ประกอบของระบบฐานข้อมูล ฮาร์ดแวร์ Hardware ซอฟต์แวร์ Software ข้อมูล Data กระบวนการ Procedure บุคลากร People เครื่อง มนุษย์ สะพาน
ฮาร์ดแวร์(Hardware) หมายถึงคอมพิวเตอร์และอุปกรณ์รอบข้างซึ่งเกี่ยวข้องกับการใช้งานฐานข้อมูล
ซอฟต์แวร์(Software) หมายถึง ระบบปฏิบัติการ , ระบบจัดการฐานข้อมูล , โปรแกรมประยุกต์ และโปรแกรมยูทิลิตี้ต่าง ๆ ที่เกี่ยวข้องกับการใช้งานในระบบงานฐานข้อมูล
ข้อมูล(Data) หมายถึง ข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล เพื่อนำไปใช้ในการประมวลต่อไป ใน DBMS จะส่วนที่ใช้อธิบายข้อมูล ซึ่งจะเป็นข้อมูลที่บรรยายคุณลักษณะของข้อมูล(meta data)
โพรซีเยอร์(Procedure) หมายถึง คำสั่งและกฎต่าง ๆ ในขั้นตอนการปฏิบัติงานที่เกี่ยวข้องกับชุดคำสั่ง กฏเกณฑ์ในการออกแบบและการใช้งานฐานข้อมูล
บุคลากร(People) หมายถึงบุคคลที่เกี่ยวข้องกับระบบงานฐานข้อมูล ทั้งส่วนที่เป็นการออกแบบและการใช้งาน เช่น ผู้ใช้ทั่วไป , นักออกแบบฐานข้อมูล , นักออกแบบระบบ
ผู้ที่มีส่วนเกี่ยวข้องกับการใช้งานฐานข้อมูล ผู้บริหารฐานข้อมูล(Database Administrator :DBA) นักออกแบบฐานข้อมูล(Database Designer) นักพัฒนาโปรแกรม(Application Developers) ผู้ใช้(End User)
ข้อดีของการใช้งานฐานข้อมูล มีความเป็นอิสระต่อกันระหว่างโปรแกรมและข้อมูล ลดความซ้ำซ้อนของข้อมูล เพิ่มความตรงกันของข้อมูล สามารถใช้ข้อมูลร่วมกันได้ บังคับให้เป็นมาตรฐานเดียวกันได้ ป้องกันและควบคุมการเข้าถึงข้อมูลได้ง่ายขึ้น ลดปัญหาในการบำรุงรักษาโปรแกรม
ข้อจำกัดของระบบการจัดการฐานข้อมูล ซับซ้อน(Complexity) ขนาดใหญ่(Size) ราคาของDBMSแพง(Cost of DBMS) ราคาของฮาร์ดแวร์แพงตามไปด้วย(Additional hardware cost) ค่าใช้จ่ายในการแปลงระบบ(Cost of conversion) ผลกระทบจากความเสียหายสูง(Higher impact of a failure)
ชนิดของระบบฐานข้อมูล ในการจำแนกชนิดของระบบฐานข้อมูลมีเกณฑ์ในการแบ่งเป็น 2 ชนิดคือ แบ่งตามลักษณะการใช้งาน แบ่งตามสถานที่ตั้ง
ชนิดของฐานข้อมูล:ลักษณะการใช้งาน ฐานข้อมูลที่มีผู้ใช้คนเดียว(Single-User) บางครั้งเรียกว่า Stand alone database หรือ Desktop database
ชนิดของฐานข้อมูล:ลักษณะการใช้งาน ฐานข้อมูลที่มีผู้ใช้ครั้งละหลายคน(Multi-User) ระบบฐานข้อมูลแบบนี้จะสนับสนุนการใช้งานของผู้ใช้หลายคนในเวลาเดียวกัน
ชนิดของฐานข้อมูล : สถานที่ตั้งของฐานข้อมูล ฐานข้อมูลแบบรวมศูนย์(Centralized Database System) Client Server Client Client Client
ฐานข้อมูลแบบกระจาย(Distributed Database System) ชนิดของฐานข้อมูล : สถานที่ตั้งของฐานข้อมูล ฐานข้อมูลแบบกระจาย(Distributed Database System)
คลังข้อมูล(Data Warehouse) อ.อภิชาติ สมรัตน์
ทำไมต้องมี Data Warehouse พิจารณาการดำเนินการขององค์กรในปัจจุบัน - มีการแข่งขันกันสูง - มีความต้องการใช้ข้อมูล ในการตัดสินใจมากขึ้น - ข้อมูลขององค์กรมีมาก แต่ไม่ได้ใช้ให้เกิดประโยชน์ - ข้อมูลกระจาย ไม่ได้อยู่ในรูปแบบเดียวกัน
คลังข้อมูล คลังข้อมูล เกิดจากแนวคิด ความต้องการโครงสร้างการจัดเก็บที่มีประสิทธิภาพ เพื่อนำข้อมูลที่มีคุณภาพเหล่านั้นมาช่วยในการตัดสินใจ เพื่อให้ผู้บริหารสามารถเรียกใช้ข้อมูลได้อย่างรวดเร็ว
ความหมายคลังข้อมูล คลังข้อมูล คือ คลังข้อมูล คือ ระบบจัดเก็บ รวบรวมข้อมูลที่มีอยู่ในระบบปฏิบัติการต่าง ๆ ขององค์กรขนาดกลางถึงขนาดใหญ่ที่มีอยู่อย่างกระจัดกระจายเข้าไว้เป็นศูนย์กลาง สามารถเก็บข้อมูลย้อนหลังได้หลาย ๆ ปี เพื่อช่วยในการสนับสนุนการตัดสินใจ สามารถวิเคราะห์ได้ทั้งแบบหลายมิติ วิเคราะห์ทางธุรกิจ (พยากรณ์) วิเคราะห์แบบ “ถ้าเป็นอย่างนี้ แล้วอะไรจะเกิดขึ้น” และวิเคราะห์แบบเหมืองข้อมูล
คลังข้อมูล (Data Warehouse) ฐานข้อมูลที่มีข้อมูลเพื่อใช้สำหรับองค์กรที่มีขนาดใหญ่ ซึ่งอาจประกอบด้วยข้อมูลย้อนหลังหลายๆ ปีจนถึงข้อมูลปัจจุบัน นำมาใช้เพื่อการวิเคราะห์และตัดสินใจสำหรับธุรกิจขององค์กรและสนับสนุนการใช้งานสำหรับผู้ใช้งานหลายระดับ OLAP : Online Analytical Processing คือ เทคโนโลยีที่ใช้ข้อมูลจากคลังข้อมูล เพื่อนำไปใช้ในการวิเคราะห์และตัดสินใจทางธุรกิจอย่างมีประสิทธิภาพ
โหลดและ OLAP แปลงข้อมูล Data Warehouse Server Data Warehouse User Client Information Source OLAP Server User ETL process โหลดและ แปลงข้อมูล OLAP Data Warehouse Group ข้อมูลที่เกิดขึ้นรายวัน Data Warehouse Server ข้อมูลที่ใช้ช่วยในการ วิเคราะห์และการตัดสินใจ
ขั้นตอนในการทำคลังข้อมูล แสดงรายงาน วิเคราะห์ จัดเก็บ ตรวจสอบ เก็บข้อมูล
คุณสมบัติของคลังข้อมูล ตามหัวข้อเรื่องที่ต้องการ (Subject Oriented) หลอมรวมข้อมูล (Integrated) ความสัมพันธ์แกนเวลา (Time-variant) คุณสมบัติไม่เปลี่ยนแปลงบ่อย ๆ (Non-volatile)
Subject-Oriented ข้อมูลในคลังข้อมูล มีการแบ่งโครงสร้างตามหัวข้อที่สนใจ คลังข้อมูลจะถูกออกแบบตามเนื้อหาที่สนใจ และจำเป็นต่อกระบวนการตัดสินใจ
Integrated (การรวมเป็นหนึ่ง) เป็นการรวบรวมข้อมูลจากแหล่งต่างๆทั้งภายในและภายนอกองค์กร จากหลายระบบปฏิบัติการ ให้มาอยู่ในที่เดียวกัน ทำให้ข้อมูลมีความสอดคล้องกัน
Time-Varient (ความสัมพันธ์กับเวลา) การเก็บข้อมูลในคลังข้อมูล จะเป็นข้อมูลลักษณะ Historical Data (เก็บข้อมูลย้อนหลังไปหลายๆปี) เพื่อนำไปวิเคราะห์ เปรียบเทียบหาแนวโน้มของข้อมูล
Non-Volatile (ความเสถียรของข้อมูล) ข้อมูลในคลังข้อมูลจะไม่มีการแก้ไข เปลี่ยนแปลง หลังจากที่โหลดเข้าสู่คลังข้อมูลแล้ว ผู้ใช้ทำได้เพียงการเข้าถึงข้อมูลเท่านั้น
ฐานข้อมูลปฏิบัติการ(Operatinal Database) ข้อมูลในฐานข้อมูล OLTP เป็นลักษณะ Relational มีการเข้าถึงข้อมูลบ่อย และปรับปรุงข้อมูลให้เป็นปัจจุบันเสมอ สนับสนุนการปฏิบัติงานประจำวัน (Day to day operation)
ความแตกต่างระหว่างฐานข้อมูลปฏิบัติการและคลังข้อมูล การใช้งาน ฐานข้อมูลปฏิบัติการ คลังข้อมูล ลักษณะการจัดการข้อมูล ตามโปรแกรมที่ต้องการ ตามหัวข้อที่ต้องการ โครงสร้างข้อมูล ซับซ้อน แล้วแต่เครื่องมือและการคำนวณ แต่เป็นรูปแบบที่ชัดเจน มีโครงสร้างไม่แน่นอน ประมวลผลแบบวิเคราะห์แต่ง่ายและเหมาะกับองค์กร เนื้อหาและช่วงเวลา ปัจจุบัน อดีตและปัจจุบัน การปรับปรุงข้อมูล อาจจะมีการปรับปรุงย่อยและเพิ่มข้อมูลจำนวนมากในแต่ละวัน และทำเป็นประจำ แล้วแต่สถานการณ์และความต้องการ ไม่มีการปรับปรุงข้อมูลโดยตรง
ความแตกต่างระหว่างฐานข้อมูลปฏิบัติการและคลังข้อมูล การใช้งาน ฐานข้อมูลปฏิบัติการ คลังข้อมูล การเคลื่อนไหวของข้อมูล ตลอดเวลา คงที่จนกว่าจะปรับปรุงใหม่ เวลาในการทำงาน เร็ว ช้ากว่า หรือแล้วแต่ขนาดข้อมูล ความแน่นอนในการใช้ข้อมูล แน่นอน ไม่แน่นอน แหล่งข้อมูล ภายในองค์กร ทั้งภายในและภายนอกองค์กร ขนาดของข้อมูล กิกะไบต์ กิกะไบต์ถึงเทราไบต์ (ใหญ่กว่า)
องค์ประกอบภายในคลังข้อมูล ส่วนของการใส่ข้อมูล ได้แก่ การพัฒนาข้อมูล วางแผนในการดึงข้อมูล วิธีการจัดเก็บ ส่วนของการจัดเก็บข้อมูล ประกอบด้วย ส่วนของการบันทึกสถิติของข้อมูล รายละเอียดของข้อมูล(ชื่อแฟ้ม โปรแกรมที่เขียน ที่มาของข้อมูล) ส่วนที่ได้รับจากการใช้คลังข้อมูล เช่น การสอบถามข้อมูลและการเข้าถึงข้อมูล
การเตรียมข้อมูลเข้าสู่คลังข้อมูล การเก็บข้อมูลประจำวัน เก็บอยู่ในรูปแบบฐานข้อมูล เช่น ข้อมูลด้านการเงิน การสั่งของ รายการสินค้าคงคลัง การรวบรวมข้อมูล เพื่อปรับแต่งข้อมูลให้อยู่ในรูปแบบเดียวกัน อาจต้องใช้วิธีการ ดังนี้ 1. การตรวจสอบความผิดปกติและแก้ไข 2. การแปลงรูปแบบข้อมูล
การนำข้อมูลเข้าสู่คลังข้อมูล การปรับปรุงข้อมูล ในคลังข้อมูล มีการกำหนดว่าจะ ปรับปรุงเมื่อไหร่ อย่างไร ตามระยะเวลาที่กำหนด การนำเข้า โดยผ่านโปรแกรม ที่มีประสิทธิภาพ Data Warehouse
การประยุกต์ใช้งาน วิเคราะห์การฉ้อโกงของมิจฉาชีพ เช่น กิจการโทรคมนาคม , ธนาคารใช้ป้องกันการฉ้อโกง การวิเคราะห์ผลิตภัณฑ์ เช่น รวบรวมราคา, การสร้างโมเดล การวิเคราะห์บัตรเครดิต เช่น การตัดสินใจให้บัตรเครดิต การวิเคราะห์ลูกค้า เช่น วิเคราะห์ลูกค้าตรงตามเป้าหมาย การวิเคราะห์การขาย เช่น ช่วยธุรกิจขายปลีก ช่วยด้านโฆษณา Text Mining คือปรับการใช้ Data Mining ในรูปข้อมูลตัวอักษร พาณิชย์อิเล็กทรอนิกส์ เช่น เข้าใจพฤติกรรมลูกค้าที่เข้า Web ลดความเสี่ยงในการตัดสินใจ เช่น การควบคุม การลดหนี้สูญ
แบบฝึกหัด การจัดการข้อมูลนั้น ข้อมูลมีโอกาสซ้ำกันหรือไม่ จะมีวิธีแก้ไขได้อย่างไร จงอธิบายพอสังเขป จงอธิบายถึงประโยชน์ของคลังข้อมูลที่มีต่อพนักงานขององค์กร เหตุใดจึงต้องนำเอาระบบฐานข้อมูลมาใช้ในการทำงาน จงอธิบายและยกตัวอย่างประกอบ ความซ้ำซ้อนกันของข้อมูล (Data Redundancy) คืออะไร จงอธิบาย DBMS มีประโยชน์อย่างไรต่อการใช้งานฐานข้อมูล