ระบบฐานข้อมูลแบบกระจาย อาจารย์วิทวัส พันธุมจินดา
ระบบฐานข้อมูลแบบกระจาย แนวคิดของระบบฐานข้อมูลแบบกระจาย ระบบจัดการฐานข้อมูลแบบกระจาย
แนวคิดของระบบฐานข้อมูลแบบกระจาย สถาปัตยกรรมของระบบฐานข้อมูลแบบกระจาย ข้อมูลจะถูกจัดเก็บไว้ในหลายๆเครื่อง และเชื่อมต่อกันผ่านระบบเครือข่าย แต่ละที่จะมีระบบจัดการฐานข้อมูลของตนเอง คอมพิวเตอร์แต่ละที่ เรียกว่า ไซต์ หรือ โหนด
แนวคิดของระบบฐานข้อมูลแบบกระจาย ระดับของระบบฐานข้อมูลแบบกระจาย แบ่งเป็น 3 ระดับ คือ โปรแกรมส่วน Server รับผิดชอบเกี่ยวกับการจัดการข้อมูล เหมือนกับโปรแกรม DBMS แบบรวมศูนย์ โปรแกรมส่วน Client รับผิดชอบเกี่ยวกับการเข้าถึงข้อมูล และทำการร้องขอบริการไปยังไซต์อื่น โปรแกรมส่วน Communication สนับสนุนการสื่อสารข้อมูลบนระบบเครือข่าย
แนวคิดของระบบฐานข้อมูลแบบกระจาย ลักษณะของฐานข้อมูลแบบกระจาย ความเป็นอิสระของการกระจายของข้อมูล ความถูกต้องในการประมวลผลทรานแซกชันแบบกระจาย ข้อมูลที่กระจายไปตามไซต์ต่างๆ และมีระบบจัดการฐานข้อมูลเดียวกัน เรียกว่า Homogeneous distributed database system นอกนั้นจะเรียกว่า Heterogeneous distributed database system การสร้าง Heterogeneous system ต้องอาศัย มาตรฐานที่เรียกว่า gateway protocols ในที่นี้ หมายถึง API ซึ่งทำหน้าที่เชื่อมต่อ DBMS กับโปรแกรม
แนวคิดของระบบฐานข้อมูลแบบกระจาย การเก็บข้อมูลของระบบฐานข้อมูลแบบกระจาย การทำสำเนา (Replication) การทำสำเนาของรีเลชันไว้หลายๆสำเนา และแต่ละสำเนาเก็บไว้ต่างไซต์กัน การแยกรีเลชัน (Fragmentation) การแยกรีเลชันออกเป็นหลายๆส่วน และจัดเก็บแต่ละส่วนไว้ต่างไซต์กัน วิธี Replication และ Fragmentation การแยกรีเลชันออกเป็นหลายๆส่วน และแต่ละส่วนก็จะมีการจัดการแบบสำเนา
ระบบจัดการฐานข้อมูลแบบกระจาย ข้อดีของระบบฐานข้อมูลแบบกระจาย การกระจายข้อมูลตามลักษณะระบบงาน เพิ่มความน่าเชื่อถือ การยอมให้มีการใช้ข้อมูลร่วมกันได้ ปรับปรุงการทำงาน
ระบบจัดการฐานข้อมูลแบบกระจาย หน้าที่ที่เพิ่มขึ้นจากระบบจัดการฐานข้อมูลแบบรวมศูนย์ คือ สามารถที่จะติดต่อไปยังไซต์อื่นๆ และส่งแบบสอบถามและข้อมูลผ่านทางระบบเครือข่ายได้ สามารถจัดเก็บข้อมูลที่มีการกระจาย และข้อมูลที่มีการสำเนา ไว้ในแคตตาลอกของ DDBMSได้ สามารถวางแผนการสืบค้นข้อมูลได้ และการทำทรานแซกชันที่มีการใช้ข้อมูลมากกว่า 1 ไซต์
ระบบจัดการฐานข้อมูลแบบกระจาย หน้าที่ที่เพิ่มขึ้นจากระบบจัดการฐานข้อมูลแบบรวมศูนย์ คือ สามารถตัดสินใจได้ว่าจะเข้าถึงข้อมูลที่ได้มีการสำเนาไว้จากไซต์ไหน สามารถที่จะจัดการความสอดคล้องของข้อมูลที่ได้มีการทำสำเนาไว้ สามารถที่จะกู้คืนข้อมูลจากไซต์ที่ล้มเหลวได้
ระบบจัดการฐานข้อมูลแบบกระจาย กระบวนการสืบค้นข้อมูลแบบกระจาย Simple join processing Semijoin strategy Join strategies that exploit paralellism
ระบบจัดการฐานข้อมูลแบบกระจาย การควบคุมสภาวะการทำงานพร้อมกันและการฟื้นสภาพข้อมูล System structure ตัวจัดการทรานแซกชัน (Transaction Manager) ตัวประสานงานทรานแซกชัน (Transaction Coordinator) Commit Protocols Two-phase commit Three-phase commit Coordinator Selection
ระบบจัดการฐานข้อมูลแบบกระจาย การควบคุมสภาวะการทำงานพร้อมกันและการฟื้นสภาพข้อมูล Concurrency Control Locking Protocol Timestamping Deadlock Handling Centralized Approach Fully Distributed Approach