การค้นคืนสารสนเทศ สัมมนาเข้ม ชุดวิชาการจัดเก็บและการค้น คืนสารสนเทศ สมพร พุทธาพิทักษ์ผล 16 กรกฎาคม 2548
ความเชื่อมโยงระหว่างการจัดเก็บ และการค้นคืน การจัดเก็บเพื่อประโยชน์ของการ ใช้และการเข้าถึงสารสนเทศ การจัดเก็บ มุ่งจัดโครงสร้างในทาง – กายภาพ เช่น รหัสหมวดหมู่ ดรรชนีเชื่อมโยงไปยังที่จัดเก็บ สารสนเทศ ( แฟ้มข้อมูล ) – เนื้อหา เช่น ศัพท์ดรรชนี สาระสังเขป
การค้นคืนและการค้น ( หา ) การค้นคืน (retrieval) เป็น การค้น เพื่อให้ได้ผลการค้นตามต้องการ มุ่งเน้น ที่ผลการค้นเป็นสำคัญ การค้น การค้นหา (searching) เป็น กระบวนการค้น เช่น การค้นจากหนังสือ การค้นจากฐานข้อมูลโดยใช้ชื่อผู้แต่ง ระบบจัดเก็บและค้นคืนสารสนเทศ (Information Storage and Retrieval System – ISAR system) ระบบค้นคืน สารสนเทศ (Information Retrieval System – IR system) ระบบจัดเก็บและค้นหาสารสนเทศ ใช้ น้อย ( จากวรรณกรรม )
การค้นคืนสารสนเทศ การค้นคืน วิธีการค้นหาแบ่งออกเป็น –browsing หรือ การสำรวจเลือกดู –searching หรือ analytical search หรือ การค้นด้วยคำหรือ ลักษณะของสารสนเทศ เช่น สี ขนาด จุดประสงค์หลัก คือ ให้ค้นคืน สารสนเทศที่ “ เข้าเรื่อง ” (relevance) หรือ “ ตรงกับความ ต้องการ ” (pertinence)
ความซับซ้อนของการจัดเก็บและ การค้นคืน สารสนเทศ สารสนเทศปริมาณมาก สารสนเทศในรูปแอนะล็อก และ ดิจิทัล สารสนเทศต่างรูปลักษณ์หรือรูปแบบ (format) เช่น เอกสาร บทความ หนังสือ วารสาร แผ่นพับ สารสนเทศต่างประเภท เช่น เสียง ภาพลักษณ์ ภาพกราฟิก และ ข้อความ
ข้อคำถาม มักอยู่ใน รูป คำศัพท์ และ เทคนิค ศัพท์ ดรรชนี แทน สารสนเทศ ที่สะสมไว้ เปรียบเทียบ หรือ จับคู่ ผลการค้นคืน หลักการพื้นฐานของการค้นคืน
ตัวแบบการค้น ตัวแบบการค้น เป็น หลักการหรือ แนวคิดในการพิจารณาการจับคู่หรือ เปรียบเทียบ ระหว่างข้อคำถาม และดรรชนีแทนสารสนเทศที่สะสม ไว้ ให้สามารถค้นคืนสารสนเทศที่ เข้าเรื่องหรือตรงกับความต้องการ ตัวแบบบูเลียน (Boolean model) เป็นการจับคู่แบบตรงกันระหว่าง ศัพท์ดรรชนีและคำค้น
ตัวแบบการค้น (2) ตัวแบบเวกเตอร์ แทนเอกสารและข้อคำถามในรูป เวกเตอร์ ( คณิตศาสตร์ ) โดย กำหนดค่าน้ำหนักของคำ ด้วย ความถี่ของคำที่ปรากฎในเอกสาร และคำที่ปรากฎในฐานข้อมูล ( มวล เอกสาร )
ตัวแบบการค้น (3) ตัวแบบความน่าจะเป็น จัดลำดับเอกสารในมวลทรัพยากร สารสนเทศตามความน่าจะเป็นด้าน ความเข้าเรื่องของแต่ละเอกสารกับ ข้อคำถาม โดยเรียงลำดับจากมาก ไปหาน้อย
การวิจัยและการพัฒนา แบ่งออกได้เป็น 2 ประเภท คือ – เชิงเทคนิค การจับคู่ได้มี ประสิทธิภาพขึ้น การทำดรรชนี หรือสาระสังเขปอัตโนมัติ – เชิงผู้ใช้และการใช้ ไม่มุ่งเน้น เฉพาะการจับคู่หรือเทคนิคเท่านั้น >> ระบบจัดเก็บและค้นคืน สารสนเทศที่มุ่งประโยชน์เพื่อการ จัดเก็บที่มีประสิทธิภาพและการใช้ ที่ตรงตามความต้องการ
ห้องสมุดดิจิทัล องค์ประกอบสำคัญ คือ มวลทรัพยากรในรูปดิจิทัล กระบวนการจัดเก็บ บริการสารสนเทศ ผู้ใช้ เทคโนโลยี
ห้องสมุดดิจิทัล สิ่งพิมพ์วิชาการ : การเผยแพร่และ การเข้าถึง ปัญหาความคงทน การสร้าง URN ที่เข้าถึงได้โดยไม่ ใช้ URL เสถียรภาพ หรือ ความคงที่ การจัดการเวอร์ชัน และ การจัดทำ จดหมายเหตุหรือที่เก็บเอกสารเก่าที่ มีคุณค่า