01 การจัดเก็บและค้นคืนสารสนเทศ พัฒนาการ
หัวข้อบรรยาย 1. พัฒนาการการจัดเก็บและสืบค้นได้ 2. ความหมายความสำคัญของการจัดเก็บและสืบค้น 3. ประเภทและรูปแบบของการจัดเก็บและสืบค้น 4. ตัวอย่างประกอบของการจัดเก็บและค้นคืนสารสนเทศ
02 02 Information Retrieval (IR) เป็นศาสตร์ของการค้นหาข้อความ หรือสารสนเทศในเอกสาร หรือการค้นหาตัวเอกสารเอง หรือสิ่งเป้าหมายที่มีเป็นจำนวนมากให้ได้มาอย่างรวดเร็ว IR เป็นศาสตร์หลายแขนง เช่น วิทยาการคอมพิวเตอร์ คณิตศาสตร์ สารสนเทศศาสตร์ ห้องสมุดศาสตร์ ภาษาศาสตร์ สถิติ เป็นต้น
Information Retrieved Documents 04 Query IR Information Retrieved
02 ขอบเขตของ IR เป็นชื่อเฉพาะ เนื้อหาที่ครอบคลุมเป็นข้อความสารสนเทศ หรือสิ่งเป้าหมายที่เป็น Unstructured Formatหรือ Free-form บางส่วนเป็นประเภท Semi-Structured ต่างจาก Data Retrieval ซึ่งหมายถึง สิ่งที่เป็นเป้าหมายเป็น Structured Format หรือ Well-defined Syntax เช่น Database ที่มีโครงสร้างข้อมูลที่ชัดเจนทุกระเบียบของข้อมูลมีการกำหนดอย่างมีกฎเกณฑ์ และการค้นหาข้อมูลที่สอบถามทำได้ ด้วย DBMS
04 IR System DBMS Finding answers and information Creating answers and new information Browsing Searching by query Unstructured Information IR System Finding answers and information 04 Semi-structured DBMS Structured Information Data analysis Systems Expert system ตาราง ขอบเขตของ IR ในแนวคิด
02 สิ่งเป้าหมายของ IR ตามความหมาย คือ เอกสารที่เขียนเป็นข้อความเป็นตัวอักษรที่เรียงต่อกันเป็นคำ วลี ประโยคอย่างมีกฎเกณฑ์ (Syntax) และให้ความหมาย (Semitic) การค้นหาสารสนเทสในรูปแบบนี้เรียกว่า Text Retrieval สิ่งเป้าหมายของ IR ยังครอบคลุมเนื้อหาดังนี้
02 Speech Retrieval เป็นการสืบค้นเรื่องของเสียง เป็นได้ทั้งเสียงคน เสียงสัตว์ในส่วนแรก จำเป็นต้องอาศัยผลงานจากวิชาการรู้จำเสียง เป็นสำคัญ Image Retrieval เป็นการสืบค้นเรื่องของภาพ ทั้งรูปแบบและสีสัน ในส่วนต้นจำเป็นต้องอาศัยผลงานจากวิชาการประมวลภาพ (Image Processing)
02 Music Retrieval เป็นการสืบค้นเรื่องของดนตรี หรือเสียงเพลง เมื่อทำการสอบถามด้วยส่วนของเสียงเพลง หรือเสียงจากเครื่องเสียง ที่ต้องการคล้ายกับเรื่องของ Speech Retrieval Cross-Language Retrieval เป็นการสืบค้นข้ามภาษา กล่าวคืออาจจะกำหนดคำสอบถามเป็นภาษาหนึ่ง แต่ให้สืบค้นในสิ่งเป้าหมายเป็นภาษาหนึ่ง ผลที่ได้เป็นภาษาแรกที่ถาม ใช้ผลงานจากวิชาการแปลภาษา Question-Answer System เป็นการถาม-ตอบจากระบบสืบค้น คำสอบถามเป็นลักษณะ What, When, Where, Who
02 การเลือกสร้างโมเดลที่เหมาะสม จะมีผลกระทบต่อระบบการสืบค้นเป็นอย่างมาก โดยทั่วไป มีการนำเสนอ 3 โมเดล ต้นแบบหลักในเบื้องต้น ได้แก่ Classical Boolean Model Vector Space Model Probabilistic Relevance Model
02 การประเมินผลของ IR การประเมิน IR ใช้ หาค่า Recall เป็นการวัดความสามารถของระบบในการค้นหาเอกสารที่เกี่ยวพัน Precision เป็นการวัดความแม่นยำของระบบในการค้นหาเอกสารที่เกี่ยวพันได้ถูกต้อง หากการสืบค้นจากการสอบถาม
02 ขั้นตอนการประมวลผลของ IR 1. การทำดรรชนี (indexing) เป็นการสร้างตัวแทนเอกสาร 2. การจัดรูปแบบคำสอบถาม (Query Formulation) เป็นการสร้างตัวแทนคำสอบถาม 3. การเทียบเคียงจับคู่ (Matching) ตัวแทนคำสอบถามกับตัวแทนเอกสาร 4. การเลือก (Selection) รายการผลลัพธ์ที่ตรงประเด็น 5. การปรับเปลี่ยนคำถามใหม่ (Query Reformulation)ในรอบต่อไป
02 การทำดรรชนี (indexing) Documents Lexical Analysis Stop-words Elimination Stemming Term Selection Thesaurus Construction Indexing Documents
02 วิวัฒนาการของ IR 1945 Vannevar Bush เครื่องมือ Memex Memory Extenderg เครื่อง Memex game เครื่อง Memex Visited hyperlinks like this
หัวข้อบรรยายแหล่งบริการสารสนเทศ 1. แหล่งบริการสารสนเทศ หน่วยงาน 2. แหล่งบริการสารสนเทศ ออนไลน์
หัวข้อบรรยายความรู้พื้นฐานกระบวนการจัดเก็บและค้นคืนด้วยระบบมือและด้วยระบบอัตโนมัติ 1. ความหมายความสำคัญของการจัดเก็บและค้นคืนด้วยระบบมือ 2. การวิเคราะห์สถานการณ์ของการจัดเก็บและค้นคืนด้วยระบบอัตโนมัติ
หัวข้อบรรยายความรู้พื้นฐานการทำดรรชนี/และสาระสังเขป 1. ความหมายความสำคัญของความรู้พื้นฐานการทำดรรชนี/และสาระสังเขป 2. รูปแบบของการทำดรรชนี/และสาระสังเขป 3. การทำดรรชนี/และสาระสังเขป
หัวข้อบรรยายความรู้พื้นฐานการจัดหมวดหมู่ ความรู้พื้นฐานการทำทีซอรัส หัวข้อบรรยายความรู้พื้นฐานการจัดหมวดหมู่ ความรู้พื้นฐานการทำทีซอรัส 1. ความหมายความสำคัญของการจัดหมวดหมู่ ความรู้พื้นฐานการทำทีซอรัส 2. รูปแบบการจัดหมวดหมู่ ความรู้พื้นฐานการทำทีซอรัส 3. การสร้างการจัดหมวดหมู่ ความรู้พื้นฐานการทำทีซอรัส
หัวข้อบรรยายการพัฒนาเว็บไซด์จากโปรแกรมสำเร็จรูป 1. ความหมายความสำคัญของการพัฒนาเว็บไซด์จากโปรแกรมสำเร็จรูป 2. รูปแบบกระบวนการสร้างการพัฒนาเว็บไซด์จากโปรแกรมสำเร็จรูป
หัวข้อบรรยายระบบห้องสมุดอัตโนมัติ 1. ความหมายความสำคัญระบบห้องสมุดอัตโนมัติ 2. รูปแบบกระบวนการระบบห้องสมุดอัตโนมัติ 3. วิเคราะห์รูปแบบความเป็นไปได้ของระบบงานด้านอื่น ๆ
หัวข้อบรรยายความรู้พื้นฐาน Flow chart และ Data Flow Diagram
หัวข้อบรรยายความรู้พื้นฐาน marc ความรู้พื้นฐาน ดับบลินคอร์ 2. รูปแบบกระบวนการลงรายการของ marc และ Dublin core
หัวข้อบรรยายการสืบค้นฐานข้อมูลและอินเทอร์เน็ต 1. ความหมายความสำคัญการสืบค้นฐานข้อมูลและอินเทอร์เน็ต 2. รูปแบบการสืบค้นฐานข้อมูลและอินเทอร์เน็ต
หัวข้อบรรยายการทำธุรกรรมบนเครือข่าย 1. ความหมายความสำคัญของการทำธุรกรรมบนเครือข่าย 2. รูปแบบ ประเภทการทำธุรกรรมบนเครือข่าย 3. การสร้างทางเลือกและการกำหนดการทำธุรกรรมบนเครือข่าย
หัวข้อบรรยายแนวทางเทคโนโลยีในการจัดเก็บและค้นคืนในอนาคต 1. เพื่อศึกษาแนวทางเทคโนโลยีในการจัดเก็บและค้นคืนในอนาคต 2. เพื่อศึกษากรณีตัวอย่างแนวทางเทคโนโลยีในการจัดเก็บและค้นคืนในอนาคต