เทคโนโยลีเว็บและมาตรฐานสำหรับห้องสมุดดิจิทัล เนณุภา สุภเวชย์
Internet และ World Wide Web WWW (World Wide Web) Web site, Web page, Homepage URL (Uniform/Universal Resource Locator) http://www.mwa.or.th:8080/services/news.html Protocol domain port path file name
https ? (=secure server)
มาตรฐานด้านการสื่อสาร TCP/IP เป็นprotocol ในการสื่อสารบนเครือข่ายอินเทอร์เนต ประกอบด้วย protocol ย่อย มากมาย เช่น FTP (File Transfer Protocol), Telnet, SMTP (Simple Mail Transfer Protocol) HTTP เป็น protocol ของ world wide web ใช้เป็นมาตรฐานการรับส่งข้อมูลระหว่าง server และ client หรือ web browser (เช่น Internet Explorer, Netscape) การรับส่งข้อมูล ทำผ่าน IIS (Internet Information Server) เช่น Apache, Microsoft IIS เป็นต้น Z39.50, ISO 23950 (search and retrieve protocol) เป็น protocol สำหรับการค้นคืนสารนิเทศข้ามระบบห้องสมุดโดยใช้เครื่อง terminal เดียว (origin) ส่ง request ไปยัง server (target) ต่างๆ ISO10160 และ ISO10161 เป็นมาตรฐานด้านการยืมระหว่างห้องสมุดที่เป็นไปในทำนองเดียวกับมาตรฐาน Z39.63 สำหรับการสื่อสารข้ามระบบห้องสมุด EDI มาตรฐานการสื่อสารระหว่างห้องสมุดกับ supplier มี 3 standards Tradacoms, Edifact และ X12. Edifact ใช้ในกระบวนการจัดซื้อ
การค้นหาสารนิเทศด้วย Z39.50 เป็น Protocol หนึ่งสำหรับการค้นสารนิเทศข้ามระบบห้องสมุด ค้นหาข้อมูลในฐานข้อมูลหลายฐานได้พร้อมกัน (เช่น online databases หรือระบบห้องสมุด) ค้นหาโดยหน้าจอใช้งานเดียว (Interface) ส่งเสริมการยืมคืนระหว่างห้องสมุด ดูการทำงานของ z39.50 ได้จาก www.copac.ac.uk http://www.webclarity.info/video/BookWhere5Features.html
มาตรฐานด้านการเข้ารหัส ASCII เป็นชุดอักขระ 7 บิต เช่น A จะแสดงเป็น 1000001 ต่อมาขยายชุดแอสกีเป็น 8 บิต มีอักขระเพิ่มขึ้นเป็น 256 อักขระ คือ 0-255 ครอบคลุมอักขระที่จำเป็นในภาษาอังกฤษและมีอักขระพิเศษหลายตัวด้วย UNICODE (Universal Character Set, ISO10646) เป็นแบบ 16 บิต แทนค่าได้มากกว่า 65,000 อักขระ ใช้แทนอักขระได้ทุกตัว ทุกภาษา รวมถึงเครื่องหมายต่างๆ มอก.620 หรือ TIS-620 เป็นอักขระชุดภาษาไทย Windows-874 เป็นอักขระชุดภาษาไทย เช่นกัน
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร Mark up language เป็นโครงสร้างภาษาที่ใช้ในการแสดงรายละเอียดของสารนิเทศ ประกอบไปด้วย tag ต่างๆ SGML เริ่มสร้างในปี 1969 โดย IBM และเป็นมาตรฐานเปิดในปี 1986 ประกอบไปด้วย 3 ส่วนคือ Declaration Document Type Definition (DTD) Document (ตัวข้อมูล)
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร HTML เริ่มต้นในปี 1990 พัฒนามาจาก SGML เพื่อช่วยให้แสดงผลข้อมูลได้ง่ายขึ้น ประกอบด้วย Tag attribute ของ tag ข้อความที่ต้องการแสดง อยู่ระหว่าง tag เปิดและ tag ปิด ปัญหาเกิดเพราะ เริ่มมีคนใช้ www มาก ใช้ HTML สร้างเว็บไซต์มาก เริ่มมี search engine แต่ค้นหาข้อมูลได้ไม่ละเอียดมาก มี Meta tag สำหรับช่วยให้คำสำคัญและรายละเอียดของเว็บเพจ ซึ่ง search engine จะนำไป index ในฐานข้อมูล
มาตรฐานด้านการแสดงรายละเอียดทรัพยากร XML คิดค้นในปี 1996 มุ่งเน้นสำหรับการจัดโครงสร้างข้อมูล แต่ไม่สามารถแสดงผลข้อมูลหรือจัดหน้า/สี/ข้อความได้ในตัว การแสดงผล ต้องใช้ Style sheet เช่น XSL (eXtensible Stylesheet Language) ในการใช้ XML จะประกอบด้วย XML – ตัวข้อมูล XSL – สำหรับแสดงผล DTD (Document Type Declaration) หรือ XML Data Schema สำหรับตรวจสอบโครงสร้างข้อมูล โดยประกาศว่า 1 record ประกอบด้วย element และ element ย่อยอะไรบ้าง มีชนิดของข้อมูล เช่น empty, textonly เป็นต้น Database (หากต้องการใช้ ต้องมีการแปลงข้อมูลเป็น XML ก่อน)
มาตรฐานห้องสมุดทั่วไป ห้องสมุดทั่วไป ใช้ MARC ในการลงรายการทางบรรณานุกรม MARC มีหลาย Format ซึ่งแต่ละ Format เป็นผลการนำไปประยุกต์ใช้งานจากมาตรฐาน ISO 2709:1981 Format for Bibliographic Information Interchange ซึ่งระบุว่า record หนึ่งๆ ต้องประกอบด้วย record label (indicator, subfield), directory, data fields, record terminator
มาตรฐานห้องสมุดทั่วไป2 MARC เป็นการ Map ISBD ลงไปใน field ต่างๆ ปัญหาของ ISO2709 คือไม่ได้ระบุความหมายของชื่อ field หรือ tag ทำให้เกิด MARC format ต่างๆมากมาย เช่น Statement of Responsibility ใน USMARC ใช้ 245$h UNIMARC ใช้ 200$b การแลกเปลี่ยน import/export MARC record ต้องเป็น MARC ตระกูลเดียวกัน software บางชื่อจะมี converter ติดตั้งในตัว เช่น import AusMARC>UniMARC เป็นต้น
ปัญหาของ MARC เมื่อจะนำมาใช้กับ Digital Library ขนาดของข้อมูลใน field(tag) และrecord ใน tag จำกัดที่ 9,999 และรวมขนาด record ทั้งหมด ต้องไม่เกิน 99,999 character ในขณะที่ข้อมูลใน digital library ส่วนใหญ่เป็น Full-text ทำให้มี record ขนาดใหญ่ ไม่ support สารนิเทศที่ digitally born, digitally live. ขัดแย้งกับ Entity-relationship Model การสร้าง library software ที่ support MARC จะทำให้โครงสร้างฐานข้อมูล complex มากกว่า Non-MARC system MARC ต้องทำ Inverted File Index ขณะที่ RDBMS เช่น MS Accessสามารถค้นหาคำใน field ได้ โดยไม่ต้องตัดแบ่งคำมาทำ inverted file
XML กับห้องสมุด ใช้เป็นสื่อกลางในการ import/export ข้อมูล สำหรับ MARC ทุก Format และ Non-MARC อาจใช้ หรือไม่ใช้ Database ช่วยในการจัดเก็บอีกชั้นหนึ่งก็ได้ มาตรฐาน MARC สำหรับ XML ดูได้ที่ http://www.loc.gov/standards/marcxml
XML กับ Other industries เนื่องจากสามารถประกาศโครงสร้างข้อมูลเองได้ใน DTD/Schema หากต้องการแลกเปลี่ยนข้อมูลกันจริงๆ ต้องกำหนดมาตรฐานโครงสร้างข้อมูลขึ้นมาใช้ร่วมกัน มาตรฐานที่กำหนดขึ้นมาแล้ว เป็น Metadata เช่น Dublin Core สำหรับทรัพยากรห้องสมุด GILS สารนิเทศภาครัฐ (สหรัฐอเมริกา) TEI นิยมใช้ในทางวรรณกรรมและภาษา มีtag revision EAD (Encoded Archival Description) สำหรับสารนิเทศจดหมายเหตุ ใช้สร้าง finding aids
XML กับ Other industries ใช้ในวงธุรกิจ และ computer system เนื่องจาก Microsoft ผลักดันให้มีการใช้ XML ใช้ใน E-Commerce ใช้ในการแลกเปลี่ยนข้อมูล ทั้งนี้ หากต้องการนำข้อมูล XML record ไปใช้งานต่อ ต้องมีโปรแกรมรองรับ ใช้ในการสร้างเว็บไซต์ เนื่องจากการแยกส่วนของข้อมูลกับ Programming ทำให้การทำงานร่วมกันระหว่าง graphic และ Programmer ง่ายขึ้น
Link XML และ Metadata ที่น่าสนใจ How does XML Help Libraries http://www.infotoday.com/cilmag/sep02/Banerjee.htm Encoded Archival Description (EAD) http://www.loc.gov/ead/ Text Encoding Initiative (TEI) Consortium http://www.tei-c.org http://etext.lib.virginia.edu/bin/tei-tocs-p3?div=DIV1&id=HD มาตรฐานต่างๆบน web www.w3c.org Z39.50 Maintenance Agency http://lcweb.loc.gov/z3950/agency
มาตรฐานด้านสื่อประเภทต่างๆ Graphic Interchange Format – Gif Joint Photographic Experts Group – Jpeg Portable Network Graphics – PNG Audio Interchange File Format – AIFF Musical Instrument Digital Interface – MIDI MPEG Audio Player3 – MP3 Moving Picture Experts Group - MPEG
More information http://www.loc.gov/standards/marcxml/ How does xml help libraries? http://www.infotoday.com/cilmag/sep02/Banerjee.htm More from e-journal articles