บทที่ 7 การเรียงลำดับภายนอก External sorting

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
การเรียงลำดับข้อมูล (Sorting).
Advertisements

เรื่อง การแก้ไขปัญหาด้วยกระบวนการเทคโนโลยีสารสนเทศ
วิชาหัวข้อเรื่องที่ทันสมัยทางวิทยาการคอมพิวเตอร์ 6 มกราคม 2555
บทที่ 2 เทคนิคการปรับปรุงคุณภาพ
การใช้งานเมนูคำสั่งของ Microsoft Excel 2003
บทที่ 2 มาตรฐานการเขียนแบบ (The Convention of Drawing)
Distributed Administration
โดย ดร.วรินทร์ สุวรรณวิสูตร อาจารย์ผู้ประสานงานวิชาโครงการ
เครื่องบันทึกข้อมูลสำหรับสถานีไฟฟ้าย่อย Substation Data Logger
บทที่ ๖ หลักการแก้ปัญหาด้วยคอมพิวเตอร์
SORTING.
INDEXED FILES แฟ้มดรรชนี.
Building native COBOL applications คอมไพเลอร์ตรวจหา syntax errors แล้วสร้าง native machine code จากนั้น linker ทำหน้าที่ link native machine code ให้เป็น.
Software คือ ชุดคำสั่งหรือ ขั้นตอนการทำงานของคอมพิวเตอร์
การเรียงลำดับและการค้นหาแบบง่าย
ขั้นตอนการปรับแต่งหน้าเว็บของคุณ 1. คลิ้กที่ แท็บ หน้าเว็บของคุณ จะเห็นหน้าเว็บของคุณดังภาพ 2. คลิ้กที่ เพิ่มรูป เพื่อจะเปลี่ยนรูปเป็นรูปของคุณ.
สถาปัตยกรรมฐานข้อมูล
การจัดเรียงข้อมูล Sorting.
สาขาวิชาคอมพิวเตอร์และเทคโนโลยี อ.เลาขวัญ งามประสิทธิ์
การแทรกหัวข้อย่อยและเลขลำดับ
หลักการทำงาน ของคอมพิวเตอร์
การพัฒนากิจกรรม การเรียนรู้ โดยโครงงาน
วิชา การออกแบบและพัฒนาซอฟต์แวร์
Zip Drive.
T a p e B a c k – u p D r i v e.
บทที่ 1. พื้นฐานความรู้ทั่วไป
การวางแผนและการดำเนินงาน
จดหมายเวียน (Mail Merge)
สาขาวิชาคอมพิวเตอร์และเทคโนโลยี อ.เลาขวัญ งามประสิทธิ์
ส่วนประกอบของคอมพิวเตอร์ (Personal Computer : PC)
Operating System ฉ NASA 4.
การสร้างจดหมายเวียน.
ขั้นตอนวิธี (Algorithm)
การสืบค้น ฐานข้อมูล กลุ่มงานบริการสารสนเทศ สำนักวิทยบริการ มหาวิทยาลัยมหาสารคาม.
องค์ประกอบของระบบคอมพิวเตอร์
ชั้นมัธยมศึกษาตอนต้น
ขั้นตอนการทำงานและอุปกรณ์คอมพิวเตอร์
การจัดทำคู่มือ การปฏิบัติงาน Work Manual
CDEX => MP3 โปรแกรมบันทึกเสียงขนาดเล็ก ปรับปรุง 10 มิถุนายน
โครงสร้างการจัดเก็บข้อมูลเชิงกายภาพ
ความรู้เบื้องต้นเกี่ยวกับระบบฐานข้อมูล
บทที่ 7 การเรียงลำดับแบบภายนอก External Sorting
บทที่ 8 การจัดเรียงแฟ้มลำดับเชิงดรรชนี
เทคนิคการเรียงลำดับ Sorting Techniques
เทคนิคการค้นหาข้อมูล
บทที่ 5 เทคนิคการค้นหาข้อมูล (Searching Techniques)
วิธีการทางคอมพิวเตอร์
หลักการวิเคราะห์และออกแบบระบบฐานข้อมูล
Charter 7 1 Chapter 7 การจัดการไฟล์ข้อมูล Data File Management.
เรื่อง ซอฟต์แวร์ตัวเก่ง
โครงสร้างข้อมูลคืออะไร ?
เรื่องการออกแบบฐานข้อมูล
Week 12 Engineering Problem 2
การวิเคราะห์เนื้อหา.
2.1 วิธีแก้ปัญหาด้วยคอมพิวเตอร์ (Computer problem solving methods)
ระบบคอมพิวเตอร์และการประมวลผล
A Comparison on Quick and Bubble sort on large scale data
ใส่ชื่อเรื่องงานวิจัย กะทัดรัด มีตัวแปรต้น ตัวแปรตาม อย่างชัดเจน
ง การงานอาชีพและเทคโนโลยี 1 ครูสหรัฐ บัวทอง
อธิบายหลักการทำงาน บทบาท และประโยชน์ของคอมพิวเตอร์
หลักการแก้ปัญหา
หลักการเขียนโปรแกรม ( )
บทที่ สร้างงานเอกสารและการแก้ไข
ประโยชน์ของคอมพิวเตอร์
การทำงานของระบบคอมพิวเตอร์
การจัดเรียงข้อมูล (sorting)
Magnetic Tape แบ่งออกเป็น 2 ประเภท
บทที่3 ระบบการผลิตและการวางแผนกระบวนการผลิต
CPE Project 1 บทที่ 2. ภาพรวม บทที่ 2 ทฤษฎีและหลักการ ทฤษฎี (theory) = สมมติฐานที่ได้รับการตรวจสอบ และทดลองหลายครั้งหลายหนจนสามารถอธิบาย ข้อเท็จจริงสามารถคาดคะเนทำนายสิ่งที่เกี่ยวข้อง.
วิชาเทคโนโลยีคอมพิวเตอร์และระบบปฏิบัติการ รหัสวิชา Computer Technology and Operating System บทที่ 1 เทคโนโลยีคอมพิวเตอร์ อ.รจนา วานนท์ Master.
ใบสำเนางานนำเสนอ:

บทที่ 7 การเรียงลำดับภายนอก External sorting

ความนำ การเรียงลำดับข้อมูลเป็นเรื่องปกติในงานคอมพิวเตอร์ที่ทำกันอยู่เป็นประจำ เช่นการเรียงแฟ้มรายการเพื่อนำไปปรับปรุงแฟ้มข้อมูลหลัก การจัดพิมพ์รายงาน ดังนั้นการเลือกใช้วิธีการเรียงลำดับแฟ้มข้อมูลจึงมีความจำเป็นต่อระบบงานคอมพิวเตอร์

การที่ศึกษาในบทที่ 6 การเรียงลำดับภายในข้อมูลจะต้องทำพร้อมกันในหน่วยความจำ ดังนั้นจึงไม่เหมาะกับแฟ้มข้อมูลขนาดใหญ่ ในหัวข้อนี้จะกล่าวถึงการเรียงข้อมูลจำนวนมากๆ Sort sublist 1 Merge list (Record 1-1000) MERGE Sort sublist 2 (sort list record1-2000) (Record 1001-2000)

เทคนิคการเรียงลำดับข้อมูลภายนอกเกือบทุกวิธีใช้หลักการดังนี้ แบ่งระเบียนที่ต้องเรียงลำดับออกเป็นกลุ่ม และจัดการเรียงลำดับภายในกับระเบียนกลุ่มย่อยเหล่านั้นโดยเก็บระเบียนส่วนย่อยนั้นอยู่ในลักษณะแฟ้มลำดับ จากนั้นจึงนำแฟ้มย่อยเหล่านั้นมาผสานกันเป็นแฟ้มเดียว หมายเหตุ แฟ้มย่อยที่เรียงลำดับแล้ว โดยผ่านวิธีการเรียงลำดับแบบภายในเรียกว่า run

การเรียงลำดับภายนอกมี 3 ขั้นตอน ดังนี้ Internal Sort phase เรียงลำดับภายใน Merge phase ช่วงการรวมการรัน Output phase คัดลอกแฟ้มไปไว้ในสื่อบันทึกข้อมูล การประเมินการเรียงลำดับภายในวัดจากจำนวนครั้งของการเปรียบเทียบ แต่การเรียงลำดับภายนอกวัดจากจำนวนครั้งในการถ่ายโอนข้อมูล

การผสานและการเรียงลำดับภายนอก มีหลายวิธีดังนี้ Natural merge Balanced merge Polyphase merge Cascade merge

1. Natural merge ผสานครั้งละ 2 input file เรียกว่า Two-way merge ถ้าผสานครั้งละ M input file เรียกว่า M-way merge Internal sort phase 6 record subfile @1000 record 6000 record

Marge phase (Two-way merge) ใช้เทปแม่เหล็ก 3 ม้วน เป็น Input file 2 ม้วน และOutput file 1 ม้วน รูปหน้า 132

Balanced merge ดีกว่า natural merge ซึ่งต้องใช้แฟ้ม M+1 file ในขณะที่ balanced merge ใช้ 2M file ในการเคลื่อนย้ายข้อมูลไปมา รูปหน้า 136

Polyphase merge เนื่องจากแบบ M-way balanced merge ในช่วงเวลาทำงานจะมีเทป 1 ม้วนที่ไม่ได้ใช้งาน เพื่อใช้เนื้อที่เทปอย่างเต็มที่จึงปรับมาใช้แบบ unbalanced merge หรือเรียกว่า Polyphase merge

ในช่วงการเรียงลำดับภายในของ M-way polyphase จะต้องกระจาย sorted run ไว้ใน M-1 input files นั่นคือ มีเทป 4 ม้วน ให้เป็น input tape 3 และ Output tape 1 ม้วน และช่วงการเรียงลำดับภายในจะได้ 17 sorted

Cascade Merge เป็นการพยายามลดจำนวนครั้งในการคัดลอกระเบียน

การผสานโดยใช้ Disk มีข้อจำกัดคือต้องใช้ tape อย่างน้อย 3 drives ถ้ามีมากกว่านี้จะทำให้ผสานเร็วขึ้น

แบบฝึกหัด 1.เขียนอธิบายหัวใจหลักการผสานของ 1.1 Natural merge 1.2 Balanced merge 1.3 Polyphase merge 1.4 Cascade merge