Distributed Administration
ระบบการจัดการฐานข้อมูลแบบกระจาย ระบบการจัดการฐานข้อมูลแบบกระจาย (Distributed database management system) คือ ซอฟต์แวร์ที่ใช้สำหรับจัดการฐานข้อมูลแบบกระจาย เพื่ออำนวยความสะดวกแก่ผู้ใช้งานในการปฎิบัติงานบนฐานข้อมูลแบบกระจาย
การประมวลผลแบบกระจาย (Distributed Processing) การประมวลผลแบบกระจายนั้นคือฐานข้อมูลแบบรวมศูนย์ (centralized database) ที่สามารถแอกเซสบนระบบเครือข่ายคอมพิวเตอร์ โดยข้อมูลที่เป็นศูนย์กลาง user สามารถ accessได้บนระบบเครือข่าย แต่นั่นไม่ได้หมายถึงว่าเป็นระบบการจัดการฐานข้อมูลแบบกระจาย ซึ่งสามารอธิบายและเปรียบเทียบได้
ระบบการจัดการฐานข้อมูลแบบขนาน (Parallel DBMS) ระบบการจัดการฐานข้อมูลแบบขนานคือ DBMS ที่รันบนมัลติโปรเซสเซอร์ และดิสก์จัดเก็บข้อมูลได้ถูกออกแบบให้ Execute ในลักษณะคู่ขนาน ส่งผลให้ระบบทำงานมีประสิทธิภาพยิ่งขึ้นทั้งในด้านของ scalability, reliability และ performance ซึ่งสามารถนำเครื่องคอมพิวเตอร์หลาย ๆ เครื่องมาเชื่อมต่อในลักษณะคู่ขนานเป็นเครือข่ายเสมือนกับเป็นการทำงานบนเครื่องเดียว และมีความสามารถในการประมวลผลด้วยความเร็วเทียบเท่ากับเครื่องระดับใหญ่
ชนิดของระบบการจัดการฐานข้อมูลแบบกระจาย (Types of DDBMS) Homogeneous DDBMS เป็นระบบการจัดการฐานข้อมูลแบบกระจายที่ทุก ๆ ไซต์จะใช้ผลิตภัณฑ์ DBMS เดียวกัน ทำให้รูปแบบข้อมูลของฐานข้อมูลในแต่ละไซต์มีรูปแบบเดียวกันส่งผลให้การออกแบบและการจัดการมีความสะดวกและง่าย
Heterogeneous DDBMS เป็นระบบการจัดการฐานข้อมูลแบบกระจายที่ไซต์บางไซต์อาจจะใช้ผลิตภัณฑ์ DBMS คนละตัวกัน วึ่งเป็นไปได้ว่าในแต่ละไซต์หรือแต่ละสาขานั้นได้มีการพัฒนาฐานข้อมูลไว้ใช้งานของตนเอง โดยวิธีนี้อาจทำให้มีความแตกต่างทั้งในด้านฮาร์ดแวร์ ผลิตภัณฑ์ DBMS หรือความแตกต่างทั้งฮาร์ดแวร์และ DBMS ดังนั้น จึงส่งผลให้แต่ละสาขาต่างก็มีฐานข้อมูลที่พัฒนาขึ้นมาในรูปแบบที่แตกต่างกัน ก่อให้เกิดปัญหาในด้านของการนำข้อมูลมารวมกัน (Integrated) จึงจำเป็นต้องใช้อุปกรณ์ที่ทำหน้าที่เป็นตัวกลางในการแปลงข้อมูลต่าง ๆ ที่เรียกว่าgetaway
ข้อดีและข้อเสียของ DDBMS การทำงานเป็นไปแบบอิสระต่อกัน หากข้อมูลของส่วนงานอื่นเสียหายก็ไม่ส่งผลกระทบกับส่วนงานอื่น ๆ มีความเชื่อถือสูง มีประสิทธิภาพสูง ประหยัดค่าใช้จ่ายเมื่อเทียบกับเครื่องคอมพิวเตอร์ระดับใหญ่ ง่ายต่อการขยาย กล่าวคือเหมาะสำหรับหน่วยงานที่มีแนวโน้มการเจริญเติบโตอยู่ตลอดเวลาเช่น การเพิ่มไซต์หรือสาขา ซึ่งรองรับต่อการขยายระบบในอนาคต
ข้อเสีย มีความสลับซับซ้อนกว่าแบบรวมศูนย์ เนื่องจากระบบมีความซับซ้อนจึงมีค่าใช้จ่ายเกี่ยวกับการบำรุงรักษาสูง สูญเสียการควบคุมความปลอดภัยเมื่อเทียบกับแบบรวมศูนย์ซึ่งควบคุมง่ายกว่า รวมทั้งความสามารถในการนำข้อมูลจากสาขาอื่น ๆ มาใช้งานได้ง่าย การควบคุมความถูกต้องตรงกันในข้อมูลเป็นไปได้ค่อนข้างยาก ยังไม่มีหลักการหรือมาตรฐานการจัดการที่แน่นอนและชัดเจน ขาดแคลนผู้เชี่ยวชาญหรือผู้ที่มีประสบการณ์ การออกแบบฐานข้อมูลมีความซับซ้อนสูง
ความหมายของการประมวลผลสอบถาม การประมวลผลสอบถาม (Query Processing) เป็นหน้าที่หนึ่งของระบบการจัดการฐานข้อมูล โดยระบบการจัดการฐานข้อมูลจะทำการประมวลผลสอบถามที่เกิดจากภาษาสอบถาม (Query Language) ได้แก่ ภาษา SQL (Structured Query Language) ภาษา QBE (Query By Example) เป็นต้น และหาคำตอบที่ดีที่สุด
โครงสร้างของตัวประมวลผลสอบถาม ส่วนตรวจสอบภาษา (Parser) ทำหน้าที่ตรวจเช็คกฏและหลักเกณฑ์ (Syntax) ของคำสั่งสอบถามข้อมูลที่กำหนดไว้ในระบบฐานข้อมูล ออฟติไมเซอร์ (Optimizer) ทำหน้าที่ในการกลยุทธ์หรือวิธีการที่เหมาะสมเพื่อให้การเข้าถึงข้อมูลประหยัดเวลาที่สุด เมื่อคำสั่งในภาษาสอบถามผ่านตัวตรวจสอบภาษา
ขั้นตอนของการทำกระบวนการสอบถามข้อมูลและการสอบถามข้อมูลที่ได้คำตอบที่ดีที่สุด ขั้นตอนที่ 1 การตรวจเช็คกฏไวยากรณ์ของภาษา ( syntax checking) ขั้นตอนที่ 2 การแปลงการสอบถามให้อยู่ในรูปที่เหมาะสมที่สุด (query optimizer) ขั้นตอนที่ 3 การสร้างชุดคำสั่งของภาษาสอบถาม (query code generator) ขั้นตอนที่ 4 การประมวลผลในฐานข้อมูล (runtime database processor)
ค่าใช้จ่ายในการประมวลผลสอบถาม ค่าใช้จ่ายที่เกิดขึ้นจากการเข้าถึงข้อมูลที่เก็บอยู่ในดิสค์ซึ่งเป็นหน่วยเก็บข้อมูลสำรอง ค่าใช้จ่ายที่เกิดจากแฟ้มข้อมูลชั่วคราว(intermediate file)ที่ต้องเก็บอยู่ในดิสค์ แฟ้มข้อมูลชั่วคราว
ค่าใช้จ่ายในการประมวลผลสอบถาม ค่าใช้จ่ายที่เกิดจากการคำนวณของการค้นหาข้อมูล การเรียงลำดับของระเบียนข้อมูล การนำข้อมูลมารวมกัน และการคำนวณค่าต่างของข้อมูลที่เป็นตัวเลขในแต่ละเขตของข้อมูล (field) ค่าใช้จ่ายที่เกิดจากการส่งภาษาสอบถาม (query) บนฐานข้อมูลที่อยู่ในที่หนึ่งไปยังฐานข้อมูลที่อยู่อีกที่หนึ่ง