การประชุมวิชาการประจำปี ศสท การประชุมวิชาการประจำปี ศสท.ครั้งที่ 5 ณ อุทยานวิทยาศาสตร์ประเทศไทย จังหวัดปทุมธานี 28 เมษายน 2546 การประยุกต์ดับลินคอร์เมทาดาเพื่อการสืบค้นสารสนเทศ โดย ประดิษฐา ศิริพันธ์
ห้องสมุดอเล็กซานเดรีย ในยุคห้องสมุดอเล็กซานเดรีย “It is a symbol of man’s wrongful endeavor to control and understand what he cannot control or understand. By establishing a constructed,artificial and ultimately erroneous notion of truth, and vainly surrounding it with a myriad of treatises carefully guarded from profane use, the library and the librarians are contradicting the nature of things.” คนโบราณเก็บรักษาคัมภีร์ทางศาสนา หวงแหนกีดกั้นคนสามัญที่ต้องการศึกษหาความรู้ แต่ห้องสมุดและบรรณารักษ์เท่านั้นกระทำสิ่งตรงข้าม
AACR2 Sir Anthony Panizzi, Charles A. Cutter, Melvil Dewey, Seymour Lubetzkey etc. เจ้าตำหรับการทำรายการสื่อบันทึกความรู้ทุกรูปแบบ บรรณารักษ์คือ ผู้กำหนดหลักเกณฑ์จัดหาความรู้ จัดเก็บอย่างเป็นระบบ ให้สามารถเข้าถึงความรู้ได้ทุกช่องทาง ไม่ว่าจะมีผู้แต่งหลายคน หนังสือหลายชื่อหลายภาษา สื่อทุกรูปแบบ ปีที่พิมพ์/ปรับปรุงแก้ไข สำนักพิมพ์ เนื้อเรื่องเดียวกันแต่เรียกชื่อด้วยภาษาต่างกัน ต้องสืบค้นได้ AACR, LCC, DDC เป็นที่มาของเมทาดาทา
Marc 21 Marc รับผิดชอบโดยหอสมุดรัฐสภาอเมริกัน - Marc 21 หอสมุดรัฐสภาอเมริกันร่วมกับหอสมุดแห่งชาติแคนาดา ปรับข้อกำหนดหน่วยข้อมูลย่อยให้ครอบคลุมการทำรายการสารสนเทศอิเล็กทรอนิกส์ และใช้งานประกอบกับ AACR 2 Marc เป็นมาตรฐานแห่งชาติสหรัฐอเมริกา Z 39.2 Marc เป็นมาตรฐานสากล ISO 2709 Marc 21คือโครงสร้างข้อมูลที่ใช้เมทาดาทา ประกอบด้วยชุดหน่วยข้อมูลย่อย คำจำกัดความที่ทำให้ระบบห้องสมุดหรือฐานข้อมูลต่างกันสามารถใช้ข้อมูลร่วมกันได้
MARC record display
Dublin Core Metadata Initiative-DCMI dublincore.org
ความหมายของ Metadata “data describing Web resources and e-documents” ข้อมูลที่มีโครงสร้างสำหรับอธิบายรายละเอียดของข้อมูล(ดิจิทัลในเว็บ) ใช้หลักเกณฑ์การทำข้อมูลเช่นเดียวกับการกำหนดโครงสร้างฐานข้อมูลบรรณานุกรม และการทำรายการหนังสือ มีการระบุว่า ใคร/หน่วยงานใดเป็นเจ้าของงาน งานชิ้นนั้นชื่อเรื่องอะไร และมีคำสำคัญ/ดัชนีบอกเนื้อเรื่อง บอกประเภทว่าเป็นรายงานการประชุม (สิ่งพิมพ์ หรือ homepageหรือ computer file: HTMLหรือ PDF) หรือเป็นรายการบรรณานุกรม มีภาพประกอบ/มัลติมีเดีย และ URL ผลงานเผยแพร่ปีใด
เหตุจูงใจให้เกิดดับลินคอร์ สารสนเทศจำนวนมหาศาลในเวิลด์ไวด์เว็บ มาตรฐานของห้องสมุดต้องลงทุนสูงและยากสำหรับผู้ที่ไม่ใช่บรรณารักษ์ เจ้าของผลงานต้องการแบบกรอกข้อมูลที่เข้าใจง่ายใช้เพียงสัญชาตญาณของคนทั่วไปก็สามารถพรรณนาสารสนเทศในหน้าเว็บของตนได้ การแสดงข้อมูลหน้าจอจากการสืบค้นในเวิลด์ไวด์เว็บที่แสดงรายการที่สื่อให้เข้าถึงสารสนเทศเช่นเดียวกับห้องสมุด ได้แก่ ชื่อสารสนเทศ เจ้าของงาน สำนักพิมพ์ ปีที่พิมพ์ รหัสหรือเลขหมู่ เพื่อให้ผู้ใช้เข้าถึงได้ง่าย
Dublin Core metadata / XML / RDF การจัดการสารสนเทศดิจิทัลจำเป็นต้องใช้เมทาดาทาในการกำหนดโครงสร้างข้อมูล เพื่อให้การค้นคืนถูกต้องและให้ข้อมูลที่ส่งถ่ายข้อมูลต่างระบบ/ต่างฐานข้อมูลเป็นข้อมูลที่ตรงเรื่องกัน ดับลินคอร์เมทาดาทาคือมาตรฐานในการจัดเก็บและพรรณนาสารสนเทศดิจิทัล เพื่อให้เจ้าของผลงานจัดทำเมทาดาทาด้วยตัวเอง และสามารถใช้งานเพื่อการจัดเก็บและค้นคืนต่างระบบได้ XML/RDF คือมาตรฐานภาษากำกับเพิ่มสำหรับการสร้างเอกสารอิเล็กทรอนิกส์โดยพรรณนา อธิบายขอบเขตของข้อมูลและระบุพฤติกรรมการปฏิบัติการของข้อมูลที่จัดเก็บ เพื่อให้การสืบค้นเนื้อหาสารสนเทศได้อย่างถูกต้อง XML - Extensible Markup Language RDF - Resource Definition Framework
ชุดหน่วยข้อมูลย่อยดับลินคอร์ 1.1(ไทย-อังกฤษ) DC.ชื่อเรื่อง<Title> DC. เจ้าของงาน<Creator> DC. ลักษณะ <Description> DC. หัวเรื่อง <Subject> DC. สำนักพิมพ์ <Publisher> DC. ผู้ร่วมงาน <Contributor> DC. ปี <Date> DC. ประเภท <Type> DC. รูปแบบ <Format> DC. รหัส <Identifier> DC. ต้นฉบับ <Source> DC. ภาษา <Language> DC. เรื่องที่เกี่ยวข้อง <Relation> DC. ขอบเขต <Coverage> DC. สิทธิ <Rights>
ตัวขยาย- DC.Qualifiers ในการบันทึกข้อมูล เจ้าของงาน (Creator) ควรใช้เกณฑ์มาตรฐานสำหรับตัวขยาย ตัวอย่างเช่น AACR 2 สำหรับบรรณารักษ์ หรือ เกณฑ์ ISO สำหรับงานประเภทอื่น ที่มิได้ใช้ระบบเดียวกันกับห้องสมุด หัวเรื่อง หรือ คำสำคัญ(Subject or Keywords) ควร ใช้หัวเรื่องของสมาคมห้องสมุดแห่งประเทศไทยฯ หรือระบบหอสมุดรัฐสภาอเมริกัน หรือ หัวเรื่องของห้องสมุดแพทย์ หรือ Agrovoc สำหรับสารสนเทศ เกษตร เป็นต้น ตัวขยาย อาจจัดทำเป็นเมนูกำกับไว้ที่แต่ละหน่วยข้อมูลย่อยในแบบ บันทึกข้อมูล เพื่อให้สะดวกเวลาบันทึกข้อมูล ดับลินคอร์ไม่บังคับว่าทุกคนต้องใช้ตัวขยาย
The Core - ground rules ไม่ต้องใช้หน่วยข้อมูลย่อยทั้งหมด เลือกเฉพาะที่ต้องการ ใช้หน่วยข้อมูลย่อยซ้ำได้ตามต้องการ จัดลำดับการแสดงผลได้ตามต้องการ เพิ่มขยายหน่วยข้อมูลย่อยได้ ใช้งานระดับสากล
ดับลินคอร์เป็นมาตรฐานประกาศอย่างเป็นทางการ CEN Workshop Agreement (EU) - Dublin Core elements endorsed as CWA 13874 - Usage guidelines for European industry NISO Z39.85 (U.S.A.) ISO 15836 (2003-04-08) http://www.niso.org/international/SC4/sc4docs.html
ความสำคัญของมาตรฐาน ทำให้การสร้างฐานข้อมูลมีวิธีการจัดเก็บเป็นแนวทาง/โครงสร้างแบบเดียวกัน เพื่อให้แลกเปลี่ยนและรวมหลายฐานข้อมูลเป็นหนึ่งเดียวได้ ทำให้การค้นคืนสารสนเทศร่วมกันเป็นไปได้สำหรับฐานข้อมูลต่างระบบ ต่างรูปแบบ และต่างภาษา มาตรฐานคือปัจจัยสำคัญของการประกันคุณภาพของสารสนเทศ
หน่วยงานที่รับผิดชอบการมาตรฐาน 1. องค์การระหว่างประเทศว่าด้วยการมาตรฐาน (ISO-International Standard Organization) 2. สถาบันแห่งชาติสหรัฐอเมริกาว่าด้วยการมาตรฐาน (ANSI-American National Standard Institute) 3. องค์การแห่งชาติสหรัฐอเมริกาว่าด้วยการมาตรฐานสารสนเทศ (NISO-National Information Standards Organization) 4. สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรม (ส.ม.อ.) 5. สหพันธ์ระหว่างประเทศว่าด้วยสมาคมและสถาบันห้องสมุด (IFLA-International Federation of Library and Information Associations) 6. ภาคีเวิลไวด์เว็บ (W3C-World Wide Web Consortium) 7. หอสมุดรัฐสภาอเมริกัน และหอสมุดแห่งชาติ +++
ตัวอย่างมาตรฐานสำหรับการจัดการสารสนเทศดิจิทัล 1. มาตรฐานในการลงอักขระ ได้แก่ มาตรฐานการเข้ารหัสหลายภาษาโดย ISO และ UNICODE มาตรฐานการถอดอักษรต่างภาษา 2. มาตรฐานสำหรับการพรรณนาสารสนเทศ ได้แก่ มาตรฐานการลงรายการบรรณานุกรม AACR มาตรฐานการลงรายการบรรณานุกรมที่เครื่องอ่านได้ Marc มาตรฐานในการจัดทำดรรชนีและสารสังเขป ดับลินคอร์เมทาดาทาสำหรับการจัดเก็บสารสนเทศดิจิทัล มาตรฐานสำหรับภาษาตัวกำกับ 3. มาตรฐานในการค้นสารสนเทศจากฐานข้อมูลต่างระบบ ได้แก่ มาตรฐานการสื่อสารเชื่อมต่อระบบเปิด มาตรฐาน Z 39.50 ANSI/NISO Z39.50-1995 มาตรฐานสำหรับภาษาเชิงตรรกะ
ฐานข้อมูลงานวิจัยของประเทศไทย ปัญหา ฐานข้อมูลใช้โครงสร้างหลายรูปแบบ การใช้ข้อมูลร่วมกันต้องเสียเวลาสืบค้นจากเว็บไซท์ของภาคีหลายครั้งจากแต่ละแห่ง (ศูนย์แห่งชาติภายใต้ สวทช. สกว. สวรส. วช.) ทุกคนต้องการรูปแบบโครงสร้างฐานข้อมูลที่ใช้ร่วมกันทุกแห่ง คำตอบ ชุดหน่วยข้อมูลย่อยดับลินคอร์เมทาดาทา คือกลไกเบื้องต้นสู่โครงสร้างมาตรฐานสากล ใช้เป็นเกณฑ์กำหนดคำจำกัดความหน่วยข้อมูลย่อยร่วมกัน เพื่อให้การรวมฐานข้อมูลมีประสิทธิภาพ โดยจับคู่หน่วยข้อมูลย่อยเดิมกับดับลินคอร์ ไม่ต้องพิมพ์ข้อมูลใหม่ บริการสืบค้นได้เสมือนเป็นฐานข้อมูลเดียว
การประยุกต์ชุดหน่วยข้อมูลย่อย 1.1 “ฐานข้อมูลงานวิจัยของประเทศไทย” ทะเบียนวิจัย<DC.รหัส > (ไม่บังคับ) คำสำคัญ< DC.หัวเรื่อง > (ไม่บังคับ) รูปแบบ< DC.รูปแบบ > (ไม่บังคับ) ต้นฉบับ< DC. ต้นฉบับ> (ไม่บังคับ) ภาษา< DC.ภาษา > สิ่งพิมพ์< DC.เรื่องที่เกี่ยวข้อง > (ไม่บังคับ) สิทธิ< DC.สิทธิ > (ไม่บังคับ) ชื่อเรื่อง <DC.ชื่อเรื่อง> ผู้วิจัย<DC.เจ้าของงาน> หน่วยงานวิจัย< DC.สำนักพิมพ์ > ผู้ให้ทุน< DC. ผู้ร่วมงาน> สถานภาพ<DC.ประเภท> ระยะเวลา< DC.ขอบเขต > ปีสิ้นสุด< DC.ปี > บทคัดย่อ< DCลักษณะ >
การประยุกต์ดับลินคอร์โดยใช้ XML อ่านรายละเอียดที่ Guidelines for implementing Dublin Core in XML www.dublincore.org/documents/2003/04/02/dc-xml-guidelines/
สถานภาพและแนวโน้มของการใช้เมทาดาทา รัฐบาลอิเล็กทรอนิกส์ พาณิชย์อิเล็กทรอนิกส์ การเรียนออนไลน์ ห้องสมุดดิจิทัล
รัฐบาลอิเล็กทรอนิกส์ หน่วยราชการประเทศต่างๆที่ใช้ดับลินคอร์ในการจัดระบบเอกสารอิเล็กทรอนิกส์ จากการสำรวจปี 2001 ประเทศกลุ่มบุกเบิก ได้แก่ ออสเตรเลีย แคนาดา เดนมาร์ค ไอร์แลนด์ อังกฤษ สหรัฐอเมริกา รัฐบาลเหล่านี้บังคับว่าสิ่งพิมพ์รัฐบาลต้องมีฉบับอิเล็กทรอนิกส์เพื่อเผยแพร่ให้ประชาชนเข้าถึงได้ทางอินเทอร์เน็ต และใช้เมทาดาทาในการสร้างเอกสาร โดยให้ใช้หน่วยข้อมูลย่อยดับลินคอร์เป็นเมทาดาทาพื้นฐาน จากการประชุมดับลินคอร์ ปี 2002 มีประเทศในยุโรปนำไปใช้เพิ่มขึ้นหลายประเทศ รวมทั้งหน่วยงานของสหประชาชาติ เช่น องค์การอาหารและเกษตร (FAO)
พาณิชย์อิเล็กทรอนิกส์ XML/RDF INDECS ในการประชุมดับลินคอร์ 2002 บริษัทข้ามชาติแสดงความต้องการจะนำชุดหน่วยข้อมูลย่อยดับลินคอร์ไปประยุกต์ สำหรับการสื่อสารข้อมูลระหว่างสาขาของบริษัทที่ตั้งอยู่ในหลายประเทศทั่วโลก ข้อดีของหน่วยข้อมูลย่อยดับลินคอร์ คือ การกำหนดศัพท์และคำอธิบายความหมายร่วมของหน่วยข้อมูลย่อยสำหรับใช้ ต่างระบบ ต่างสาขาอาชีพ ต่างภาษา ทำให้การแลกเปลี่ยนข้อมูลต่างระบบทำได้กว้างขวาง สามารถลดการทำข้อมูล ซ้ำซ้อน ประหยัดเวลาและใช้ข้อมูลร่วมกันในอินเทอร์เน็ตได้อัตโนมัติในหลายระดับ
การเรียนออนไลน์ การทำรายการสหบรรณานุกรมสิ่งพิมพ์อิเล็กทรอนิกส์ออนไลน์ ภาคีสมาชิกของเครือข่ายการศึกษาร่วมกันทำรายการบทเรียน เอกสารแบบ OPAC โดยเจ้าของงานเป็นผู้ทำรายการเอง พร้อมเชื่อมโยงไปยัง URL/URI หน้าที่มีข้อมูล Article Union Cataloging System (AUCS) เกาหลี EdNA (Education Network Australia) Gateway to Educational Materials (GEM)สหรัฐอเมริกา
ห้องสมุดดิจิทัลคืออะไร? จากการประชุมนานาชาติได้สรุปคำจำกัดความห้องสมุดดิจิทัลและการพิมพ์อิเล็กทรอนิกส์ เพื่อส่งเสริมการเข้าถึงสารสนเทศแบบเปิด (Open Access to Information) ห้องสมุดดิจิทัล คือการรวมฐานข้อมูลสารสนเทศเพื่อให้บริการสืบค้นร่วมกันจากอินเทอร์เน็ตได้ทุกฐานข้อมูลในคราวเดียว การรวมเว็บไซท์เพื่อสร้างดรรชนีสำหรับสืบค้นฐานข้อมูลหลากหลายและต่างภาษาร่วมกันได้อย่างมีประสิทธิภาพ การบริการเว็บพอร์ทัล และเว็บไซท์เฉพาะสาขาวิชา การพิมพ์อิเล็กทรอนิกส์ คือการจัดทำวารสารอิเล็กทรอนิกส์
ห้องสมุดดิจิทัลและเวิลด์ไวด์เว็บ การรวมเครือข่ายสารสนเทศห้องสมุดเสมือนให้เป็นห้องสมุดแห่งเดียว การรวมฐานข้อมูลวารสารอิเล็กทรอนิกส์ (ฉบับเต็ม)จากหลายฐานข้อมูลสู่ฐานข้อมูลเดียว Web technology and digital libraries initiatives ตัวอย่างNational Science Digital Library (U.S.A) Strategy: support eight standard formats collect all existing metadata in these formats provide crosswalks to Dublin Core assemble all metadata in a central depository expose all such records o harvesters focus limited human effort on metadata for collections generate metadata automatically when possible
Open Archives Initiatives โครงการริเริ่มของสหรัฐอเมริกา เป็นงานวิจัยที่ได้รับทุนสนับสนุนจาก National Science Foundation ดำเนินงานโดยมหาวิทยาลัยคอร์แนล OAI พัฒนามาตรฐานและส่งเสริมการใช้มาตรฐานสำหรับการทำงานเครือข่ายข้อมูลต่างระบบโดยมีจุดมุ่งหมายที่จะช่วยให้การเผยแพร่เนื้อหาความรู้เป็นไปได้ง่ายและสะดวก เริ่มมาจากการที่มีสิ่งพิมพ์วิชาการในรูปอิเล็กทรอนิกส์มากขึ้น และการสร้างสรรค์สารสนเทศวิชาการเหล่านี้ล้วนดำเนินไปอย่างอิสระโดยเจ้าของผลงานมีส่วนสร้างสรรค์ OAI เสนอกลไกสำหรับเจ้าของสารสนเทศให้เปิดเผยเมทาดาทาที่ใช้ เพื่อให้ระบบสามารถใช้เทคโนโลยีในการค้นและเข้าถึงข้อมูลหรือเอกสารที่ใช้ดับลินคอร์ XMLทั้งหมดที่เผยแพร่ในเวิลด์ไวด์เว็บได้
กิจกรรมความร่วมมือด้านห้องสมุดดิจิทัล APEC Workshop on Resources Sharing in Digital Libraries Taiwan Institute of Information Science เป็นผู้ดำเนินการในการสร้างความร่วมมือด้านการพัฒนาเทคโนโลยีและการจัดทำเนื้อหาสารสนเทศสำหรับห้องสมุดดิจิทัลโดยการเรียนรู้ร่วมกัน จากประสบการณ์ของไต้หวันที่ประสบความสำเร็จ และได้ทำวิจัยมาเป็นเวลานาน APIN Asia-Pacific Information Network โดยยูเนสโกเป็นแกนนำเพื่อเสนอแนวปฏิบัติต่อ WSIS- World Summit of Information Society สาระได้แก่การใช้เทคโนโลยีจากอินเทอร์เน็ตในการสร้างสารสนเทศที่เป็นความรู้ทางวิทยาศาสตร์ การศึกษาและวัฒนธรรมในรูปดิจิทัล เพื่อเปิดโอกาสให้มวลชนเข้าถึงความรู้ได้สะดวก ง่าย และทั่วถึง INASP International Network for the Availability of Scientific Publications โดยยูเนสโกและ ICSU ทำหน้าที่ประสานงานระดับสากลให้มีความร่วมมือในการใช้ทรัพยากรสารสนเทศวิทยาศาสตร์และเทคโนโลยีร่วมกันด้วยความช่วยเหลือจากประเทศที่พัฒนาแล้วแก่ผู้ด้อยพัฒนาเพื่อลดช่องว่างทางดิจิทัล ASEAN-India Science and Technology Digital Library
ความหวัง หอสมุดดิจิทัลแห่งชาติ บรรณานุกรมแห่งชาติ-รวมทุกห้องสมุดเสมือนเป็นแห่งเดียว ฐานข้อมูลงานวิจัยของประเทศไทย ฐานข้อมูลวิทยานิพนธ์ไทย ฐานข้อมูลสารบัญวารสารไทยพร้อมเรื่องเต็ม ฐานข้อมูลคลังสมอง คนไทยทุกคนสามารถเรียนรู้ เข้าถึงความรู้ ทรัพย์สินทางปัญญาของชาติได้ทั่วถึงจากอินเทอร์เน็ต
E-Library 2003- กระทรวงวิทยาศาสตร์ฯ