เจาะลึก google หลักการทำงานของ search engine

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
Slide :1. Slide :2 ข้อมูลบนเว็บไซต์มีจำนวนมากมายมหาศาลทำให้เข้าถึงได้ ยาก ผู้ใช้ต้องการข้อมูลที่ตรงกับความต้องการและสามารถสืบค้น ได้ง่าย พื้นฐานมาจากเทคนิคสืบค้นสารสนเทศในห้องสมุด.
Advertisements

Internet Marketing (e-Marketing)
AI02 กูเกิ้ล: กลไกการสืบค้นข้อมูลบนระบบอินเทอร์เน็ต Google: the Internet System Search Engine อาจารย์ที่ปรึกษา อาจารย์ธวัชวงศ์ ลาวัลย์ โดย นางสาวธัญพร.
HTML (คืออะไร) ภาษา HTML (HyperText Markup Language) เป็นภาษาที่ใช้คำสั่งที่เรียกว่า Tag มีทั้งเปิดและปิด เพื่อกำหนดบริเวณที่มีผลของคำสั่ง คำสั่งภาษา HTML.
การสืบค้นข้อมูลบนระบบเครือข่าย อินเทอร์เน็ต
– Web Programming and Web Database
การใช้ Internet ในการเรียน
Search Engine อ. กฤษฎา ศักดิ์คำดวง.
สมชาย สมผดุง สถาบันบัณฑิตนบริหารศาสตร์ 18 กรกฎาคม 2546
การออกแบบและพัฒนาเว็บไซต์
การออกแบบและพัฒนาเว็บไซต์
Types of Search Engine Marketing
เทคนิคการสืบค้น Google
เทคนิกการค้นหาข้อมูลจาก Internet
การใช้ Internet ในการเรียน
13 October 1. Information and Communication Technology Lab 8 Web Browser and Seach Engine โดย ผู้ช่วยศาสตราจารย์วิชัย.
การใช้ Internet ในการ เรียน คอมพิวเตอร์สมัยนี้ กล้วยเรียก “ พี่ ”
World Wide Web. You will know หัวเรื่องหลักๆทั้งหมด 5 หัวข้อดังนี้ Basic Web Concept Web application in daily life Essential Web Developer Language How.
บทที่ 1 รู้จักกับการออกแบบเว็บ ไซท์. รู้จักกับการออกแบบเว็บไซท์ ความสำคัญของการออกแบบเว็บไซท์ สร้างความได้เปรียบเหนือคู่แข่ง การออกแบบเว็บไซท์ที่ดี ออกแบบให้ตรงกับเป้าหมายและลักษณะ.
กลยุทธ์การนำ SEO ไป ใช้งานจริง Apirak Simarak (Gootum)‏ SANOOK.com.
Mr. Winai Purikasem. Introduction  Hypertext model  Use of hypertext in World Wide Web (WWW)  WWW client-server model  Use of TCP/IP protocols in.
เพิ่มเติม. แนะนำการการโปรโมทเว็บไซต์ 1. การโปรโมทเว็บไซต์โดยใช้บริการเว็บได เร็กทอรี่ (Web Directory) - yahoo.com, google.com 2. การโปรโมทเว็บไซต์โดยใช้บริการของ.
ศูนย์ส่งเสริมวิชาการ 231/4 ซอยวัดสังข์กระจาย เขตบางกอกใหญ่ กทม Tel , การเขียนเว็บเพจด้วยภาษา HTML ( ) 1 ประเภทของ.
การค้นคืนสารสนเทศ สัมมนาเข้ม ชุดวิชาการจัดเก็บและการค้น คืนสารสนเทศ สมพร พุทธาพิทักษ์ผล 16 กรกฎาคม 2548.
คณะเภสัชศาสตร์ มหาวิทยาลัยอุบลราชธานี
Creating an Effective Product Listing on Thaitrade.com
HTML HyperText Markup Language
Information Technology For Life
บทที่ 2 ไฮเปอร์เท็กซ์และไฮเปอร์มีเดีย
บทที่ 4 อินเตอร์เน็ต.
จัดทำโดย นายณัฐศุภญกร ตานาคา ปวส.2/5 การตลาด นางสาวสุพัตรา แจ่มมั่งคั่ง ปวส.2/5 การตลาด นางสาวสุวนันท์ ธรรมจิตร ปวส.2/5 การตลาด
การใช้งานฐานข้อมูล Emerald Insight
การสอบประมวลความรู้ (Comprehensive Examination)
อาจารย์ชนิดา เรืองศิริวัฒนกุล หลักสูตรสาขาวิชาเทคโนโลยีสารสนเทศ
การออกแบบเว็บไซต์.
การใช้ฐานข้อมูล ASCE สำนักหอสมุด มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
การสืบค้นข้อมูลทางเคมี
หลักสูตรการพัฒนาเว็บไซต์ส่วนงานด้วย CMS ส่วนกลาง
อินเทอร์เน็ตเบื้องต้น
บทที่ 4 การใช้งานอินเทอร์เน็ตเบื้องต้น Introduction to Internet
การใช้อินเตอร์เน็ตในการเรียน
ทักษะการสืบค้นและการนำเสนอสาร
เทคนิคการสืบค้น Google/Scholar Google
มหาวิทยาลัยราชภัฏนครปฐม
ระบบงานสืบค้นสารสนเทศออนไลน์
Yahoo Search Engine.
อาจารย์สุธารัตน์ ชาวนาฟาง
โครงสร้างพื้นฐานของ HTML5
เทคโนโลยีสารสนเทศเพื่อการศึกษาค้นคว้า
พ.ร.บ. ข้อมูลข่าวสารของราชการ พ.ศ. 2540
เทคนิคการสืบค้น Google/Scholar Google
Chapter 8 การประชาสัมพันธ์ร้านค้าบนอินเทอร์เน็ต Edit
อรกัญญา เมธา สำนักหอสมุด มหาวิทยาลัยเชียงใหม่
ปรัชญา วิสัยทัศน์ ปณิธาน พันธกิจ
การโฆษณาพาณิชย์อิเล็กทรอนิกส์
| AGRICULTURAL DEVELOPMENT EXTENSION |
โรงเรียนแพทย์ระดับโลก ที่มีคุณค่าต่อสังคมไทย และมวลมนุษยชาติ
หลักการ และ กระบวนการขายออนไลน์
ระบบเครือข่ายคอมพิวเตอร์ Internet
การออกข้อบัญญัติท้องถิ่น ตามพระราชบัญญัติการสาธารณสุข
วิชา วิทยาศาสตร์สำหรับเด็กปฐมวัย
การสืบค้นข้อมูลทางเคมี
การประเมินสารสนเทศ และแหล่งสารสนเทศ
ฐานข้อมูลวิทยานิพนธ์อิเล็กทรอนิกส์ฉบับเต็ม จัดทำโดย งานบริการสารสนเทศ ฝ่ายบริการ สำนักหอสมุดกลาง มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ.
ความรู้พื้นฐานเกี่ยวกับการสร้างเว็บไซต์
เจาะลึก google หลักการทำงานของ search engine
ภาคเรียนที่ 1 ปีการศึกษา 2558 วิทยาลัยเทคโนโลยีอุตรดิตถ์
ทบทวนกฎหมายรัฐธรรมนูญ บทบัญญัติที่สำคัญซี่งมีมิติในเชิงคดี
การพัฒนาเว็บไซต์ ในงานธุรกิจ
การเขียนรายงานการวิจัย
ใบสำเนางานนำเสนอ:

เจาะลึก google หลักการทำงานของ search engine

Search engine คือ เว็บไซต์พิเศษที่ออกแบบมา เพื่อช่วยในการค้นหา หรือเข้าถึงข้อมูล ซึ่งถูกเก็บอยู่ในไซต์ต่างๆ วิธีการทำงานของ Search Engine ก็จะแตกต่างกันออกไป ขึ้นอยู่กับระบบของ Search Engine แต่ละตัว ที่มา : http://computer.howstuffworks.com/search-engine.htm

Search engine เปรียบเสมือนเครื่องจักรชนิดหนึ่ง ที่สามารถให้รายละเอียดหรือข้อมูลเกี่ยวกับสิ่งที่ผู้ใช้งานต้องการค้นหา ที่มา : นวรัตน์ ธนะรุ่งรักษ์ และพิรพร หมุนสนิท. กูเกิล (Google). กรุงเทพฯ: เคทีพี คอมพ์ แอนด์ คอนซัลท์, 2549.

การทำงานของ Search engine Crawler ค้นหา และสำรวจเว็บ Indexer รวบรวม และจัดเก็บข้อมูลเกี่ยวกับเว็บ Query Processor ติดต่อเพื่อเรียกดูผลลัพธ์ จากการค้นหา การทำงานของ Search engine

การทำงานของ Crawler หรือ Spider หรือ Robots สำรวจและอ่านหน้าเว็บจากโดเมนต่างๆ  และหากพบ links ก็จะทำการติดตาม links ภายใน site จนครบ ซึ่งจากการทำงานในลักษณะโยงใยนี้ จึงเป็นที่มาของคำว่า spider หรือ crawler จากนั้น spider จะนำข้อมูลเว็บดังกล่าวไปเก็บไว้ในฐานข้อมูลของ Search Engine และ spider จะกลับไปตรวจสอบข้อมูลในเว็บนั้นๆ อย่างสม่ำเสมอ เช่น ทุก 1 หรือ 2 เดือน เพื่อสำรวจความเปลี่ยนแปลง

การทำงานของ Indexer

ข้อมูลที่โปรแกรม spider พบจะถูกทำสำเนาและส่งมาจัดเก็บที่รายการดรรชนี (index  หรือ catalog) ตามบัญชีดรรชนีที่ (มนุษย์) กำหนดไว้ หากข้อมูลที่เว็บต้นฉบับมีการเปลี่ยนแปลงข้อมูลในสมุดดรรชนีจะเปลี่ยนแปลงด้วย

การทำงานของ Query Processor จะเป็นโปรแกรมส่วนที่ผู้ใช้อินเทอร์เน็ตติดต่อเข้าใช้บริการ จะทำหน้าที่ในการค้นคืนข้อมูลจากฐานข้อมูลของ search engine จะเริ่มต้นการทำงานเมื่อผู้ใช้ป้อนคำค้น โปรแกรมจะนำคำค้นของผู้ใช้ไปจับคู่กับดรรชนีในฐานข้อมูล แล้วทำการดึงข้อมูล (เอกสารเว็บ) ที่ตรงกับคำค้นออกมา จัดลำดับผลการค้นตามระดับความเกี่ยวข้องที่โปรแกรมประเมินได้   Search engine แต่ละตัวจะใช้ตรรกะที่แตกต่างกันไป

การ Rank result ของ Google ขึ้นกับปัจจัยหลายอย่างเช่น จำนวน links ไปเว็บเพจนั้นๆ จำนวนของ terms(ถ้อยคำ) ที่ปรากฎบนเว็บเพจ

การวิเคราะห์ Keyword Density Keyword Density คือการคำนวณหาความหนาแน่นของ keyword ที่ปรากฏในเว็บเพจหนี่งๆ เพื่อใช้ในการ Rank search result ของ search engine สูตรการคำนวณคือ จำนวนครั้งที่ keyword นั้นปรากฏ / จำนวนคำทั้งหมด ตัวอย่าง keyword = “Thailand” content = “Thailand is the best land” keyword density = 1/4 = 25% (Keyword Density Index: KDI)

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ สิ่งที่มนุษย์เห็นจากเว็บเพจ

<title>Information Technology</title>

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ (ต่อ) การใส่ HTML tag : Meta tag Meta tags จะใช้เพื่ออธิบายเว็บไซต์ หรือเว็บเพจแต่ละหน้าว่ามีเนื้อหาเกี่ยวข้องกับเรื่องอะไร Meta tag จะปรากฏอยู่ส่วนของ header ในเอกสาร html Meta tag มีอยู่หลายชนิด แต่ที่สำคัญมีอยู่ 3 ชนิดคือ keywords, description และ title

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ (ต่อ) ตัวอย่าง <HEAD> <TITLE>My site</TITLE> <META name="description" content="Everything you wanted to know about the universe."> <META name="keywords" content="planets, stars, moons, solar system, comets"> </HEAD>

ตัวอย่างการสร้างเกณฑ์ในการกำหนดค่าน้ำหนักให้กับคำดรรชนีของ Search engine อาจจัดลำดับ  ดังนี้ (Bradley, 2002)  1. จะให้ค่าน้ำหนักความเกี่ยวข้องกับคำค้นมากที่สุด (ตามที่มนุษย์ได้ตั้งค่าโปรแกรมไว้) 2. คำ หรือวลี ที่ปรากฏใน Meta tag elements (เป็นส่วนหนึ่งของการเขียนเอกสาร html) 3. คำ หรือวลี ที่ปรากฏใน Title tag (ปรากฏที่บรรทัดแรกของ Title bar) 4. คำ หรือวลี ที่ปรากฏใน Main heading และ Sub heading (ข้อความที่เป็นขนาดใหญ่  ขนาดรอง ในแต่ละ Web page) 5. จำนวนครั้งที่ คำ หรือวลี ปรากฏในส่วนเนื้อหาของเอกสาร 6. ความถี่ที่เว็บอื่นๆ เชื่อมโยงเข้ามา (มีการตรวจสอบโดยใช้โปรแกรม)

ปัจจัยที่ช่วยเพิ่มประสิทธิภาพ ในการค้นหาด้วย Google 1. การเลือกใช้คำในการค้นหา ไม่คำนึงถึงรูปแบบของตัวอักษร โดยถือว่าทุกตัวอักษรเป็นตัวพิมพ์เล็ก เช่น FedEx หรือ fedex หรือ FeDex ให้ผลลัพธ์เหมือนกัน

ไม่ควรใช้คำที่ค้นหาเกิน 32 คำ การใช้เครื่องหมายคำพูด “…” เพื่อรวมคำ เช่น ชื่อ นามสกุล “ปริศนา มัชฌิมา” มิฉะนั้น google จะมองว่าเป็นคำที่แยกกัน ไม่ควรใช้คำ Stop Words

คำ Stop Words คือ คำที่มีความหมายกว้าง คำเชื่อม คำกริยาวิเศษณ์ คำนำหน้า เครื่องหมายต่างๆ หรือเป็นส่วนหนึ่งของคำพูด

การเลือกใช้ข้อมูลชนิดบูลีน (Boolean) เพื่อค้นหาข้อมูล ข้อมูลชนิดบูลีน (Boolean) เป็นข้อมูลพื้นฐานทางคณิตศาสตร์ที่เกี่ยวข้องกับตรรกศาสตร์ และพีชคณิต ประกอบด้วย AND, OR และ NOT

ตัวดำเนินการอื่นๆ ที่ใช้ใน Google นอกจาก AND และ OR + คือ การรวมทั้งหมด - คือ การยกเว้นหรือไม่ต้องการ (NOT) * คือ การแทนที่คำ  คือ การหาคำที่คล้ายกัน

การค้นหาด้วยตัวดำเนินการ (+) แตกต่างจาก การค้นหาด้วยตัวดำเนินการ (“ ”) โดยผลลัพธ์ที่ได้จากตัวดำเนินการ (+) สามารถปรากฏคำที่ค้นหาลสับกันได้ แต่ผลลัพธ์ที่ได้จากตัวดำเนินการ (“ ”) จะต้องเป็นประโยคเรียงตามลำดับคำที่ได้กำหนดไว้

ตัวดำเนินการ (-) ใช้สำหรับละเว้นคำที่เขียนเหมือนกัน แต่มีความหมายต่างกัน เช่น คำว่า “apple”  ผลไม้ คอมพิวเตอร์ “apple -computer”  ผลไม้

ตัวดำเนินการ (*) ใช้แทนกลุ่มคำหรือประโยคที่ผู้ใช้งาน ไม่แน่ใจเรื่องการใช้คำ หรือไม่แน่ใจว่า สะกดคำนั้นอย่างไร โดยเขียนให้อยู่ในเครื่องหมาย “ ” เช่น ค้นหาคำว่า “กระทรวง*” หมายเหตุ: สามารถใช้ * แทนที่คำในการค้นหาที่มีความซับซ้อน และอ่านยาก เช่น “นักแสดง อาร์โนลด์*” จะได้ผลลัพธ์เป็นนามสกุล “ชวาร์เซเน็กเกอร์”

ตัวดำเนินการ () ใช้แทนคำที่ใกล้เคียงกับคำที่ต้องการค้นหา ตัวดำเนินการ () ใช้แทนคำที่ใกล้เคียงกับคำที่ต้องการค้นหา (แทนคำที่เขียนต่างกัน แต่มีความหมายเหมือนหรือใกล้เคียงกัน) เช่น  meat  beef pork lamb เป็นต้น

AND “ ” OR NOT หรือ -

ตัวดำเนินการ ที่ใช้ในการค้นหาข้อมูลขั้นสูง cache: แสดงเพจล่าสุดที่ Google จัดเก็บ (ใช้เมื่อเพจนั้นไม่สามารถดูข้อมูลได้) related: แสดงเพจที่คล้ายกับ URL ที่กำหนด link: แสดงทุกเพจที่เชื่อมโยงไปยัง URL ที่กำหนด (มีใครอ้างเว็บนี้บ้าง)

info: แสดงข้อมูลของ URL ที่กำหนด ผลลัพธ์จะประกอบด้วย แสดงหน้าเว็บที่ Google เก็บไว้ (cache:) ค้นหาหน้าเว็บที่คล้ายคลึงกัน (related:) ค้นหาหน้าเว็บที่ link ไป (link:) หาเว็บเพจจากไซต์ ค้นหาหน้าเว็บที่มีคำค้น

filetype: จำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด ext: จำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด (เหมือน filetype:) ทำหน้าที่เหมือนกับตัวกรอง “ชนิดของไฟล์” ในเพจ “การค้นหาโดยมีตัวเลือก” เพื่อจำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด

Search engine filetype:pdf ตัวอย่าง: Search engine filetype:pdf

allintext: แสดงเพจที่มีคำค้นหาทั้งหมดที่ปรากฏอยู่ในเนื้อหาของเพจ allintext: หุ่นยนต์ เอไอ

allintitle: แสดงเพจที่มีคำค้นหาทั้งหมดที่ปรากฏอยู่ในชื่อเรื่อง (Title) ต่างกันที่ intitle: ค้นหาหนึ่งคำจากกลุ่มคำที่กำหนดทั้งหมด แต่ allintitle: ค้นหากลุ่มคำที่กำหนดทั้งหมด

ลองค้นแล้วดูความแตกต่างสิ allinurl: แสดงเพจที่มีคำค้นหาที่ปรากฏอยู่ใน URL allinurl:crazy eights inurl: แสดงเพจที่มีคำค้นหาเพียง 1 คำ ที่ปรากฏอยู่ใน URL allinurl:crazy eights ลองค้นแล้วดูความแตกต่างสิ