เจาะลึก google หลักการทำงานของ search engine

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
การสร้างเว็บเพจด้วยภาษา Html
Advertisements

เป็นการนำความรู้ด้าน Microsoft Excel ที่มีความพิเศษตรงที่สามารถ กำหนดสูตรการคำนวณในแต่ละเซลล์ ของ Sheet งานนั้นๆได้ โดยอาศัย ความแม่นยำในการคีย์ข้อมูลเข้าไป.
อ. สิริพร มีนะนันทน์ ภาคเรียนที่ 2 ปีการศึกษา
การจัดทำเว็บไซต์สำเร็จรูปด้วยโปรแกรม Joomla!
เป็นหลักสำคัญในการนำเสนอเนื้อหา ของบทเรียนคอมพิวเตอร์ช่วยสอนก็คือ ควร นำเสนอภาพที่เกี่ยวข้องกับเนื้อหา ประกอบ กับคำอธิบายสั้นๆ ง่ายๆ แต่ได้ใจความ การใช้ภาพประกอบจะทำให้ผู้เรียน.
จัดทำโดย น. ส. ดวงกมล งามอยู่เจริญ เลขที่ 8 น. ส. ณัชชา เชื้อตา เลขที่ 6 เตรียมบริหารธุรกิจปี 1.
เทคนิคการเขียนข่าว การเขียนข่าวเพื่อการประชาสัมพันธ์เบื้องต้น มีโครงสร้างการเขียนข่าว ประกอบด้วย 1.พาดหัวข่าว (Headline) 2.ความนำ (Lead) 3.ส่วนเชื่อม (Neck/Bridge)
น. ส. สุธาสินี แซ่ซู กลุ่ม B06 1 แนะนำโปรแกรมที่ นิสิตชอบ จัดทำ โดย น. ส. สุธาสินี แซ่ซู เอกบรรณารักษศาสตร์และ สารสนเทศศาสตร์ คณะมนุษย์ศาสตร์
และสร้างเว็บไซต์ประเภทCMS
กระบวนการของการอธิบาย
ซอฟต์แวร์และการเลือกใช้
พยาบาลวิชาชีพชำนาญการพิเศษ
7 เทรนด์ การตลาดออนไลน์ปี 2014 แรงแน่ ! ในปีที่ผ่านมา การเปิดตัวเครือข่าย 3G ในประเทศ ทำให้คำว่า “การตลาดออนไลน์ (Online Marketing)” กันมากขึ้น แล้วในปี
ในเครือข่ายอินเทอร์เน็ต โปรแกรมประยุกต์ หลายชนิด มีการทำงานร่วมกันระหว่างเครื่อง คอมพิวเตอร์ ที่ต่ออยู่ในเครือข่าย โดยอาศัยเครือข่ายเป็น สื่อกลาง ในการติดต่อสื่อสารระหว่างกันและกัน.
Intro Excel 2010 ข้อมูลจาก... ellession1.htm.
โปรแกรมคำนวณคะแนน สหกรณ์ ตามเกณฑ์ดีเด่นแห่งชาติ กรมส่งเสริม สหกรณ์ กองพัฒนาสหกรณ์ด้านการเงิน และร้านค้า วิธีการใ ช้
การจัดเก็บข้อมูลในแฟ้มข้อมูลธรรมดา นั้น อาจจำเป็นที่ใช้แต่ละคน จะต้องมีแฟ้มข้อมูลของตนไว้เป็นส่วนตัว จึง อาจเป็นเหตุให้มีการเก็บข้อมูล ชนิดเดียวกันไว้หลาย.
การพัฒนาบทเรียนคอมพิวเตอร์ช่วยสอน เรื่อง หลักการทำงานของคอมพิวเตอร์ วิชาคอมพิวเตอร์พื้นฐาน สำหรับนักเรียนชั้นมัธยมศึกษาปีที่ 1 โรงเรียนเฉลิมราชประชาอุทิศ.
เทคนิคการใช้ Microsoft Excel. 1. การตีตารางในรูปแบบต่าง ๆ 2. การแทรกภาพในตาราง 3. การตกแต่งข้อมูลด้วย Format Cells 4. การคำนวณ บวก ลบ คูณ หาร 5. การย่อ.
วิธีการใ ช้ โปรแกรมคำนวณคะแนน กลุ่มเกษตรกรดีเด่น กองพัฒนาสหกรณ์ด้าน การเงินและร้านค้า กรมส่งเสริม สหกรณ์
บทที่ 3 นักวิเคราะห์ระบบและการ วิเคราะห์ระบบ. 1. นักวิเคราะห์ระบบ (System Analysis) 1.1 ความหมายของนักวิเคราะห์ระบบ นักวิเคราะห์ระบบ (System Analysis:
การจัดกิจกรรมการ เรียนรู้แบบการทำ โครงงานคอมพิวเตอร์ การจัดกิจกรรมการ เรียนรู้แบบการทำ โครงงานคอมพิวเตอร์ ครูชาญณรงค์ ปานเลิศ โรงเรียนพระบางวิทยา ครูชาญณรงค์
ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts.
เรื่อง กระบวนการเทคโนโลยีสารสนเทศ
ระบบตัวแทนจำหน่าย/ ตัวแทนขายอิสระ
Material requirements planning (MRP) systems
stack #2 ผู้สอน อาจารย์ ยืนยง กันทะเนตร
การค้นคว้าข้อมูลจากฐานข้อมูลต่างๆ ในอินเทอร์เน็ต
หน่วยการเรียนที่ 6 เรื่อง การจัดการฐานข้อมูลด้วย PHP Function
Content Team: คู่มือการป้องกันสินค้าลอกเลียนแบบ 9 July 2015
บทที่ 1 สถาปัตยกรรมของระบบฐานข้อมูล (Database Architecture)
การพัฒนาการใช้งานในระบบเว็บ
บทที่ 5 เครื่องมือสืบค้นข้อมูล (Search Engine)
BC320 Introduction to Computer Programming
แนวทางการออกแบบโปสเตอร์
บทที่ 1 ความรู้ทั่วไปเกี่ยวกับคอมพิวเตอร์
บทที่ 3 การสร้างเว็บไซต์ และการปรับคุณสมบัติของเว็บเพจ
บทที่ 8 การควบคุมโครงการ
หลักการแต่ง คำประพันธ์ประเภท โคลง. หลักการแต่ง คำประพันธ์ประเภท โคลง.
ระบบบริหารจัดการงานวิจัยของหน่วยงาน Department Research Management System DRMS โดยทีมพัฒนาระบบ DRMS สำนักงานคณะกรรมการวิจัยแห่งชาติ (วช.)
การจัดการข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
ความรู้เบื้องต้นเกี่ยวกับคอมพิวเตอร์และเทคโนโลยีสารสนเทศ
บทที่ 5 ภาษาสคริปต์ ที่ใช้สำหรับการผลิตระบบการสอนบนเครือข่าย
ขั้นตอนการออกแบบ ผังงาน (Flow Chart)
ประกาศกระทรวงทรัพยากรธรรมชาติและสิ่งแวดล้อม
การสร้างโมเดลจำลองความสัมพันธ์ ระหว่างข้อมูล E-R Model
โครงการจัดทำระบบฐานข้อมูล วัตถุเสพติดของกลาง (ระยะที่1)
วิธีการกำหนดค่า Microsoft SharePoint ของคุณ เว็บไซต์ออนไลน์
การขอโครงการวิจัย.
บริษัท พัฒนาวิชาการ (2535) จำกัด
หลักในการออกแบบเว็บไซต์
Integrated Information Technology
SMS News Distribute Service
เจาะลึก google หลักการทำงานของ search engine
วัฏจักรหิน วัฏจักรหิน : วัดวาอาราม หินงามบ้านเรา
การสร้างแบบสอบถาม และ การกำหนดเงื่อนไข.
หน่วยการเรียนรู้ การเขียนโปรแกรมภาษาขั้นพื้นฐาน เรื่อง โครงสร้างพื้นฐาน HTML 5 รหัส รายวิชา ง23102 การงานอาชีพและเทคโนโลยี 6 กลุ่มสาระ การงานอาชีพและเทคโนโลยี
บรรยายครั้งที่ 8 - กราฟฟิกวิศวกรรม 1
บทที่ 9 การเรียงลำดับข้อมูล (Sorting)
การวิจัยทางการท่องเที่ยว
การเปลี่ยนแปลงประมาณการทางบัญชี และข้อผิดพลาด
หลักเกณฑ์การเก็บรักษาข้อมูลจราจรทางคอมพิวเตอร์ ของผู้ให้บริการ
กิจกรรมที่ 7 นายปรีชา ขอวางกลาง
เริ่มต้นสร้างบล็อกเวิร์ดเพรส
อินเทอร์เน็ตเบื้องต้น และการออกแบบเว็บไซต์
การเขียนเว็บ Web Editor
การเขียนโปรแกรมด้วยภาษาไพทอน การเขียนโปรแกรมแบบทางเลือก
การออกแบบและพัฒนาเว็บไซต์
กระดาษทำการ (หลักการและภาคปฏิบัติ)
การใช้ระบบสารสนเทศในการวิเคราะห์ข่าว
ใบสำเนางานนำเสนอ:

เจาะลึก google หลักการทำงานของ search engine

Search engine คือ เว็บไซต์พิเศษที่ออกแบบมา เพื่อช่วยในการค้นหา หรือเข้าถึงข้อมูล ซึ่งถูกเก็บอยู่ในไซต์ต่างๆ วิธีการทำงานของ Search Engine ก็จะแตกต่างกันออกไป ขึ้นอยู่กับระบบของ Search Engine แต่ละตัว ที่มา : http://computer.howstuffworks.com/search-engine.htm

Search engine เปรียบเสมือนเครื่องจักรชนิดหนึ่ง ที่สามารถให้รายละเอียดหรือข้อมูลเกี่ยวกับสิ่งที่ผู้ใช้งานต้องการค้นหา ที่มา : นวรัตน์ ธนะรุ่งรักษ์ และพิรพร หมุนสนิท. กูเกิล (Google). กรุงเทพฯ: เคทีพี คอมพ์ แอนด์ คอนซัลท์, 2549.

การทำงานของ Search engine Crawler ค้นหา และสำรวจเว็บ Indexer รวบรวม และจัดเก็บข้อมูลเกี่ยวกับเว็บ Query Processor ติดต่อเพื่อเรียกดูผลลัพธ์ จากการค้นหา การทำงานของ Search engine

การทำงานของ Crawler หรือ Spider หรือ Robots สำรวจและอ่านหน้าเว็บจากโดเมนต่างๆ  และหากพบ links ก็จะทำการติดตาม links ภายใน site จนครบ ซึ่งจากการทำงานในลักษณะโยงใยนี้ จึงเป็นที่มาของคำว่า spider หรือ crawler จากนั้น spider จะนำข้อมูลเว็บดังกล่าวไปเก็บไว้ในฐานข้อมูลของ Search Engine และ spider จะกลับไปตรวจสอบข้อมูลในเว็บนั้นๆ อย่างสม่ำเสมอ เช่น ทุก 1 หรือ 2 เดือน เพื่อสำรวจความเปลี่ยนแปลง

การทำงานของ Indexer

ข้อมูลที่โปรแกรม spider พบจะถูกทำสำเนาและส่งมาจัดเก็บที่รายการดรรชนี (index  หรือ catalog) ตามบัญชีดรรชนีที่ (มนุษย์) กำหนดไว้ หากข้อมูลที่เว็บต้นฉบับมีการเปลี่ยนแปลงข้อมูลในสมุดดรรชนีจะเปลี่ยนแปลงด้วย

การทำงานของ Query Processor จะเป็นโปรแกรมส่วนที่ผู้ใช้อินเทอร์เน็ตติดต่อเข้าใช้บริการ จะทำหน้าที่ในการค้นคืนข้อมูลจากฐานข้อมูลของ search engine จะเริ่มต้นการทำงานเมื่อผู้ใช้ป้อนคำค้น โปรแกรมจะนำคำค้นของผู้ใช้ไปจับคู่กับดรรชนีในฐานข้อมูล แล้วทำการดึงข้อมูล (เอกสารเว็บ) ที่ตรงกับคำค้นออกมา จัดลำดับผลการค้นตามระดับความเกี่ยวข้องที่โปรแกรมประเมินได้   Search engine แต่ละตัวจะใช้ตรรกะที่แตกต่างกันไป

การ Rank result ของ Google ขึ้นกับปัจจัยหลายอย่างเช่น จำนวน links ไปเว็บเพจนั้นๆ จำนวนของ terms(ถ้อยคำ) ที่ปรากฏบนเว็บเพจ

การวิเคราะห์ Keyword Density Keyword Density คือการคำนวณหาความหนาแน่นของ keyword ที่ปรากฏในเว็บเพจหนี่งๆ เพื่อใช้ในการ Rank search result ของ search engine สูตรการคำนวณคือ จำนวนครั้งที่ keyword นั้นปรากฏ / จำนวนคำทั้งหมด ตัวอย่าง keyword = “Thailand” content = “Thailand is the best land” keyword density = 1/4 = 25% (Keyword Density Index: KDI)

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ สิ่งที่มนุษย์เห็นจากเว็บเพจ

<title>Information Technology</title>

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ (ต่อ) การใส่ HTML tag : Meta tag Meta tags จะใช้เพื่ออธิบายเว็บไซต์ หรือเว็บเพจแต่ละหน้าว่ามีเนื้อหาเกี่ยวข้องกับเรื่องอะไร Meta tag จะปรากฏอยู่ส่วนของ header ในเอกสาร html Meta tag มีอยู่หลายชนิด แต่ที่สำคัญมีอยู่ 3 ชนิดคือ keywords, description และ title

การสร้างเว็บเพจเพื่อให้สืบค้นได้อย่างมีประสิทธิภาพ (ต่อ) ตัวอย่าง <HEAD> <TITLE>My site</TITLE> <META name="description" content="Everything you wanted to know about the universe."> <META name="keywords" content="planets, stars, moons, solar system, comets"> </HEAD>

ตัวอย่างการสร้างเกณฑ์ในการกำหนดค่าน้ำหนักให้กับคำดรรชนีของ Search engine อาจจัดลำดับ  ดังนี้ (Bradley, 2002)  1. จะให้ค่าน้ำหนักความเกี่ยวข้องกับคำค้นมากที่สุด (ตามที่มนุษย์ได้ตั้งค่าโปรแกรมไว้) 2. คำ หรือวลี ที่ปรากฏใน Meta tag elements (เป็นส่วนหนึ่งของการเขียนเอกสาร html) 3. คำ หรือวลี ที่ปรากฏใน Title tag (ปรากฏที่บรรทัดแรกของ Title bar) 4. คำ หรือวลี ที่ปรากฏใน Main heading และ Sub heading (ข้อความที่เป็นขนาดใหญ่  ขนาดรอง ในแต่ละ Web page) 5. จำนวนครั้งที่ คำ หรือวลี ปรากฏในส่วนเนื้อหาของเอกสาร 6. ความถี่ที่เว็บอื่นๆ เชื่อมโยงเข้ามา (มีการตรวจสอบโดยใช้โปรแกรม)

ปัจจัยที่ช่วยเพิ่มประสิทธิภาพ ในการค้นหาด้วย Google 1. การเลือกใช้คำในการค้นหา ไม่คำนึงถึงรูปแบบของตัวอักษร โดยถือว่าทุกตัวอักษรเป็นตัวพิมพ์เล็ก เช่น FedEx หรือ fedex หรือ FeDex ให้ผลลัพธ์เหมือนกัน

ไม่ควรใช้คำที่ค้นหาเกิน 32 คำ การใช้เครื่องหมายคำพูด “…” เพื่อรวมคำ เช่น ชื่อ นามสกุล “ปริศนา มัชฌิมา” มิฉะนั้น google จะมองว่าเป็นคำที่แยกกัน ไม่ควรใช้คำ Stop Words

คำ Stop Words คือ คำที่มีความหมายกว้าง คำเชื่อม คำกริยาวิเศษณ์ คำนำหน้า เครื่องหมายต่างๆ หรือเป็นส่วนหนึ่งของคำพูด

การเลือกใช้ข้อมูลชนิดบูลีน (Boolean) เพื่อค้นหาข้อมูล ข้อมูลชนิดบูลีน (Boolean) เป็นข้อมูลพื้นฐานทางคณิตศาสตร์ที่เกี่ยวข้องกับตรรกศาสตร์ และพีชคณิต ประกอบด้วย AND, OR และ NOT

ตัวดำเนินการอื่นๆ ที่ใช้ใน Google นอกจาก AND และ OR + คือ การรวมทั้งหมด - คือ การยกเว้นหรือไม่ต้องการ (NOT) * คือ การแทนที่คำ  คือ การหาคำที่คล้ายกัน (Similarity sign)

การค้นหาด้วยตัวดำเนินการ (+) แตกต่างจาก การค้นหาด้วยตัวดำเนินการ (“ ”) โดยผลลัพธ์ที่ได้จากตัวดำเนินการ (+) สามารถปรากฏคำที่ค้นหาลสับกันได้ แต่ผลลัพธ์ที่ได้จากตัวดำเนินการ (“ ”) จะต้องเป็นประโยคเรียงตามลำดับคำที่ได้กำหนดไว้

เช่น Thailand -tourism ตัวดำเนินการ (-) ใช้เมื่อไม่ต้องการให้หน้าเว็บที่มีคำนี้ปรากฏอยู่ในผลการค้นหา เช่น Thailand -tourism แก้ไข slide หน้านี้ด้วย

เช่น ถ้าค้นด้วยคำว่า thailand คำเดียว จะมีข้อมูลที่เกี่ยวกับ Tourism ปรากฏขึ้นมาด้วย

ตัวดำเนินการ (*) ใช้แทนกลุ่มคำหรือประโยคที่ผู้ใช้งาน ไม่แน่ใจเรื่องการใช้คำ หรือไม่แน่ใจว่า สะกดคำนั้นอย่างไร โดยเขียนให้อยู่ในเครื่องหมาย “ ” เช่น ค้นหาคำว่า “กระทรวง*” หมายเหตุ: สามารถใช้ * แทนที่คำในการค้นหาที่มีความซับซ้อน และอ่านยาก เช่น “นักแสดง อาร์โนลด์*” จะได้ผลลัพธ์เป็นนามสกุล “ชวาร์เซเน็กเกอร์”

ตัวดำเนินการ () ใช้แทนคำที่ใกล้เคียงกับคำที่ต้องการค้นหา ตัวดำเนินการ () ใช้แทนคำที่ใกล้เคียงกับคำที่ต้องการค้นหา (แทนคำที่เขียนต่างกัน แต่มีความหมายเหมือนหรือใกล้เคียงกัน) เช่น  meat  beef pork lamb เป็นต้น (ไม่นิยมใช้)

AND “ ” OR NOT หรือ -

ตัวดำเนินการ ที่ใช้ในการค้นหาข้อมูลขั้นสูง cache: แสดงเพจล่าสุดที่ Google จัดเก็บ (ใช้เมื่อเพจนั้นไม่สามารถดูข้อมูลได้) related: แสดงเพจที่คล้ายกับ URL ที่กำหนด link: แสดงทุกเพจที่เชื่อมโยงไปยัง URL ที่กำหนด (มีใครอ้างเว็บนี้บ้าง)

info: แสดงข้อมูลของ URL ที่กำหนด ผลลัพธ์จะประกอบด้วย แสดงหน้าเว็บที่ Google เก็บไว้ (cache:) ค้นหาหน้าเว็บที่คล้ายคลึงกัน (related:) ค้นหาหน้าเว็บที่ link ไป (link:) หาเว็บเพจจากไซต์ ค้นหาหน้าเว็บที่มีคำค้น

filetype: จำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด ext: จำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด (เหมือน filetype:) ทำหน้าที่เหมือนกับตัวกรอง “ชนิดของไฟล์” ในเพจ “การค้นหาโดยมีตัวเลือก” เพื่อจำกัดผลลัพธ์ของเพจที่มีชนิดของไฟล์ที่กำหนด

Search engine filetype:pdf ตัวอย่าง: Search engine filetype:pdf

allintext: แสดงเพจที่มีคำค้นหาทั้งหมดที่ปรากฏอยู่ในเนื้อหาของเพจ allintext: หุ่นยนต์ เอไอ

allintitle: แสดงเพจที่มีคำค้นหาทั้งหมดที่ปรากฏอยู่ในชื่อเรื่อง (Title) ต่างกันที่ intitle: ค้นหาหนึ่งคำจากกลุ่มคำที่กำหนดทั้งหมด แต่ allintitle: ค้นหากลุ่มคำที่กำหนดทั้งหมด

allinurl: แสดงเพจที่มีคำค้นหาที่ปรากฏอยู่ใน URL allinurl:crazy eights