เทคโนโลยีสารสนเทศเพื่อการศึกษาค้นคว้า บทที่ 5 การสืบค้นข้อมูล อาจารย์หลักสูตรสาขาวิทยาการคอมพิวเตอร์และสาขาเทคโนโลยีสารสนเทศ
Outline สารบัญเว็บ (Web Directory) เสิร์ชเอนจิ้น (Search Engines) เว็บท่า (Portal Site)
การค้นหาข้อมูลบนอินเทอร์เน็ต อินเทอร์เน็ตเปรียบเสมือนกับห้องสมุดอิเล็กทรอนิกส์ ขนาดใหญ่ที่มีข้อมูลและข่าวสารอยู่เป็นจำนวนมาก การที่จะค้นหาข้อมูลเรื่องใดเรื่องหนึ่งโดยไม่รู้ว่า ข้อมูลนั้นจัดเก็บอยู่ที่ใดเป็นไปได้ยากในอินเทอร์เน็ต ดังนั้นจึงจำเป็นต้องใช้เครื่องมือที่ช่วยในการค้นหา ข้อมูลซึ่งเรียกว่า Search Engine ซึ่งแปลตามตัวว่า เครื่องจักรค้นหา ช่วยในการค้นหาข้อมูลบน อินเทอร์เน็ต โดยปัจจุบันมีมากมายหลายเว็บไซต์ทั้งของไทยและ ต่างประเทศให้เราได้เลือกใช้งาน ซึ่งแต่ละเว็บไซต์ก็ มีวิธีการที่ใช้ค้นหาข้อมูลที่แตกต่างกัน โดย search engine ของคนไทยมีข้อดีคือค้นหา ภาษาไทยได้ แต่ข้อเสียคือข้อมูลที่ค้นหาได้มีน้อย หรืออาจไม่มีเลย แต่หากเป็นของต่างประเทศ มี ข้อดีคือ สามารถค้นหาข้อมูลได้เกือบ 100% หากรู้ วิธีและเทคนิคการใช้ที่ถูกต้อง
สารบัญเว็บ (Web Directory) สารบัญเว็บ เป็นเว็บไซต์ที่รวบรวมรายชื่อเว็บไซต์ คล้ายกับสมุดหน้าเหลืองขององค์การโทรศัพท์ โดย แสดงรายชื่อเว็บไซต์ไว้เป็นหมวดหมู่ในลักษณะ ลิงก์ให้ผู้ใช้คลิกเพื่อเชื่อมโยงไปยังเว็บไซต์ที่ ต้องการ โดยเจ้าของเว็บไซต์ที่ต้องการแสดง รายชื่อสารบัญเว็บจะต้องลงทะเบียนกับผู้ให้บริการ เท่านั้น หากไม่นำเว็บไซต์มาลงทะเบียน ก็จะไม่ แสดงผลในสารบัญได้ ตัวอย่างสารบัญเว็บเช่น www.sanook.com, www.siamhrm.com, www.yahoo.com, www.looksmart.com และ www.blagkokcity.com เป็นต้น
สารบัญเว็บ (Web Directory) ตัวอย่างสารบัญเว็บ : www.yahoo.com
เสิร์ชเอนจิ้น (Search Engines) เสิร์ชเอนจิ้น (Search Engines)หมายถึง โปรแกรมที่ถูกสร้างขึ้นมาเพื่อใช้เป็นเครื่องมือในการ ค้นหาข้อมูลจากเว็บไซต์ทั่วโลก เสิร์ชเอนจิ้นจะให้ ผู้ใช้พิมพ์ “คำค้น (Keyword)” ซึ่งอาจเป็นวลีที่ ตรงกับข้อมูลที่ต้องการลงไปในช่องว่าง หลังจาก คลิกที่ปุ่ม “ค้นหา” แล้วเสิร์ชเอนจิ้นจะแสดงรายการ เว็บไซต์ทั้งหมดที่เกี่ยวข้องกับคำค้น ภายในเวลา ไม่กี่วินาที จึงนับว่าเสิร์ชเอนจิ้นเป็นฐานข้อมูล เว็บไซต์ที่ใหญ่ที่สุด เนื่องจากได้รวบรวมจัดเก็บ และจัดลำดับเว็บไซต์ทั่วโลกไว้ เสิร์ชเอนจิ้น แตกต่างจาก สารบัญเว็บคือการจัด ฐานข้อมูลเว็บไซต์นั้นจะเป็นแบบอัตโนมัติ ดังนั้น เว็บไซต์ที่ไม่ได้ลงทะเบียน จะถูกบรรจุอยู่ใน ฐานข้อมูลเว็บไซต์ได้เช่นกัน
การทำงานของเสิร์ชเอนจิ้น (Search Engines) การที่เสิร์ชเอนจิ้นสามารถจัดทำฐานข้อมูลได้โดย อัตโนมัติ เนื่องจากมีหลักการทำงานอยู่ 3 อย่าง ได้แก่ 1. ครอวเลอร์(Crawler) เรียกอีกอย่างหนึ่งว่า “สไปเดอร์ (Spider)”, “เวอร์ม (Worm)” เป็นกลไกที่ สร้างขึ้นให้เป็นตัวสแกนเพื่อท่องไปตามเว็บไซต์ต่างๆ แล้วรวบรวมข้อมูลที่อยู่ในเว็บไซต์นั้น ด้วยวิธีการ ดาวน์โหลดเช่นเดียวกับการใช้เว็บเบราเซอร์นำมา จัดเก็บไว้ในฐานข้อมูล หรือ อินเด็กเซอร์
การทำงานของเสิร์ชเอนจิ้น (Search Engines) 2. อินเด็กเซอร์ (Indexer)หลังจากที่ครอวเลอร์ รวบรวมข้อมูลเว็บไซต์มาให้แล้ว อินเด็กเซอร์จะทำ หน้าที่ในการจัดหมวดหมู่ให้กับข้อมูลเหล่านั้น และ จัดเก็บลงในฐานข้อมูล ซึ่งวิธีในการจัดหมวดหมู่ก็จะ แตกต่างกันออกไป เช่นตามประเภทของเว็บไซต์เมื่อ ผู้ใช้ป้อนคำค้น การแสดงผลลัพธ์จะแตกต่างกันขึ้นอยู่ กับวิธีการของผู้ให้บริการ เช่น เรียงลำดับจาก เว็บไซต์ที่มีผู้เยี่ยมชมมากที่สุด ซึ่งเป็นกลไกที่ซับซ้อน มากยิ่งขึ้น
การทำงานของเสิร์ชเอนจิ้น (Search Engines) 3. คิวรี่พรอเซส (Query Process)เป็นส่วนการ ทำงานที่ซับซ้อนที่สุดของเสิร์ชเอนจิ้น เนื่องจาก จะต้องค้นหาข้อมูลในอินเด็กเซอร์และนำคำค้นหรือ ปัจจัยต่างๆ มาเปรียบเทียบเพื่อตัดสินใจว่าจะแสดง ผลลัพธ์ใดบ้างที่ใกล้เคียงหรือมีความสัมพันธ์กับคำค้น และเงื่อนไขในการค้นหามากที่สุด ตลอดจนต้อง ตัดสินใจว่าเว็บไซต์ใดที่ไม่อยู่ในขอบเขตการค้นหา ซึ่งเป็นส่วนการทำงานที่ต้องนำหลักการทาง คณิตศาสตร์มาใช้ ทำให้ผลลัพธ์ที่ได้จากการค้นหา ข้อมูลของผู้ใช้บริการแต่ละรายแตกต่างกัน เนื่องจาก ใช้หลักการทางคณิตศาสตร์เพื่อการค้นหาที่แตกต่าง กันนั่นเอง
ตัวอย่างเสิร์ชเอนจิ้น ตัวอย่าง Search engine ของไทย www.thaismartsearch.com www.siamguru.com www.searchthai.com www.thaifine.com ตัวอย่าง Search engine ของต่างประเทศ www.google.com www.altavista.com www.mamma.com www.excite.com
เทคนิคในการใช้คำค้นเพื่อค้นหาข้อมูลในเสิร์ชเอนจิ้น หากต้องการค้นหาข้อมูลให้ได้ผลลัพธ์ที่ตรงตามความ ต้องการมากที่สุด ผู้ใช้จะต้องศึกษาวิธีใช้จากผู้ให้บริการ รู้จักใช้เครื่องมือ (Tool) และ การค้นหาขั้นสูง (Advanced Search) ที่ให้มาเป็นประโยชน์มากที่สุด ไม่ควรใช้คำทั่วไปเป็นคำค้น คำทั่วไป ได้แก่ คำเชื่อม คำนำหน้านาม คำวิเศษณ์ เช่น if, on, about, be เป็น ต้น แต่หากต้องการใช้คำเหล่านี้ให้เขียนอยู่ใน เครื่องหมายคำพูด ควรใช้เครื่องหมายคำพูด(“ ”) ในการรวมคำ เมื่อ ต้องการค้นหาคำที่เป็นประโยค หรือกลุ่มของคำที่มีเว้น ช่องว่าง เช่น ชื่อ และนามสกุล สามารถทำได้โดยใช้ เครื่องหมายคำพูดปิดคำที่ต้องการรวมการใช้เครื่องหมาย คำพูดในการค้นหาจะได้ผลการค้นหาเพียง 6 รายการ ในขณะที่ถ้าไม่ใช้จะได้ผลการค้นหาถึง 41,200 รายการ
เทคนิคในการใช้คำค้นเพื่อค้นหาข้อมูลในเสิร์ชเอนจิ้น เปรียบเทียบผลการค้นหาโดยใช้เครื่องหมายคำพูด (“ ”) จาก www.google.co.th
เทคนิคในการใช้คำค้นเพื่อค้นหาข้อมูลในเสิร์ชเอนจิ้น ใช้เครื่องหมายบวก ( + ) นำหน้าคำค้นที่ต้องการให้ผล ลัพธ์ที่ได้ตรงกับคำค้นนั้น เช่น หากต้องการค้นหาคำ ว่า “แอปเปิ้ล” ที่เป็นเครื่องคอมพิวเตอร์ สามารถใช้ คำค้นได้ว่า แอปเปิ้ล +คอมพิวเตอร์ เป็นต้น และใช้ เครื่องหมายลบ ( - ) นำหน้าคำค้นที่ไม่ต้องการให้ แสดงผลลัพธ์ตามคำค้นนั้น
เทคนิคในการใช้คำค้นเพื่อค้นหาข้อมูลในเสิร์ชเอนจิ้น ใช้เครื่องหมายดอกจัน ( * ) แทนกลุ่มคำหรือประโยคที่ ผู้ใช้ไม่แน่ใจว่าจะใช้คำใด หรือไม่แน่ใจว่าสะกดคำ นั้นอย่างไร โดยเขียนให้อยู่ในเครื่องหมาย “ ” เช่น “กระทรวง*” เป็นต้น เสิร์ชเอนจิ้นจะค้นหาคำว่า “กระทรวง” โดยที่กลุ่มคำข้างหลังจะเป็นคำว่าอะไรก็ได้
บริการต่างๆ ของ Google http://images.google.co.th ค้นหารูปภาพที่มีอยู่บนเว็บ http://docs.google.com สร้างเอกสารออนไลน์ http://translate.google.co.th ดูหน้าเว็บต่างๆ ใน ภาษาอื่น
บริการต่างๆ ของ Google http://www.google.com/trends เครื่องมือวิเคราะห์ การตลาด http://www.google.com/calendar จัดการตารางงาน http://maps.google.co.th ดูแผนที่และเส้นทาง การเดินทาง
เว็บท่า (Portal Site) เว็บท่า (Portal Site) หมายถึง เว็บไซต์ที่เป็นจุด เชื่อมต่อหรือเป็นประตูไปสู่เว็บไซต์หรือแหล่งข้อมูล อื่น ๆ ในอินเทอร์เน็ต เป็นศูนย์กลางการ ให้บริการเชื่อมโยงไปยังแหล่งข้อมูลแหล่งอื่น ๆ ได้อีกมากมายทั่วโลก โดยจะแสดงรายการเป็น หมวดหมู่ ภายในเว็บท่าอาจรวมบริการค้นหาข้อมูล ด้วยเสิร์ชเอนจิ้น หรือสารบัญเว็บไว้เป็นส่วนหนึ่ง ของบริการด้วย
ตัวอย่างเว็บท่า : www.sanook.com เว็บท่า (Portal Site) ตัวอย่างเว็บท่า : www.sanook.com
แบบฝึกหัดท้ายบทเรียนบทที่ 5 1. เสิร์ชเอนจิ้น คืออะไร มีลักษณะอย่างไร 2. สารบัญเว็บ คืออะไร มีลักษณะอย่างไร 3. เว็บท่า คืออะไร มีลักษณะอย่างไร 4. จงบอกรายชื่อเว็บไซต์ที่ให้บริการค้นหาข้อมูลที่ได้รับ ความนิยม อย่างน้อย 5 ชื่อ 5. จงบอกเทคนิควิธีในการสืบค้นข้อมูลจากอินเทอร์เน็ต เพื่อให้ได้ข้อมูลที่ถูกต้องและใช้เวลาน้อย