INC 551 Artificial Intelligence

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
หลักการและแนวคิดการนำ สื่ออิเล็กทรอนิกส์ มาใช้ใน การเรียนการสอน ผศ. นพ. ทรงพล ศรีสุโข 30 ก. ย
Advertisements

ดร.วิภาดา เวทย์ประสิทธิ์
คำสั่ง DISPLAY รูปแบบที่ 1 DISPLAY identifier-1, identifier-2 … literal-1 literal-2 [ UPON mnemonic-name ]  ตัวอย่าง DISPLAY STUDENT-NAME. DISPLAY.
1 C Programming An Introduction. 2 Preprocessing Directives เขียนได้ 2 รูปแบบ #include คอมไพเลอร์จะทำ การค้นหาเฮดเดอร์ไฟล์ที่ระบุ จากไดเร็คทอรีที่ใช้
Set is a basic term in Mathematics. There is no precise definition for term “set”, But roughly speaking, a set is a collection of objects, Things or symbols,
Arithmetic Verb Template. ADD MOVE ZERO TO NO. ADD 1 TO NO. 0 1.
INC 551 Artificial Intelligence Lecture 2. Review Environment Action Sense, Perceive Make Decision Agent World Model Deliberative Agent.
จำนวน สถานะ NUMBER OF STATES. ประเด็นที่ สนใจ The number of distinct states the finite state machine needs in order to recognize a language is related.
INTELLECTUAL CAPITAL : IC Group 3: Tipada Subhasean Nongluk Charoeschai Nerisa Wangkarat
Graphical User Interface charturong.ee.engr.tu.ac.th/CN208
Penetration Testing – A Case Study of Khon Kaen University Networks
Lower higher quality Monthly Review on Dec,11 03/07/57.
โดย คุณครูทานตะวัน เทียมถนอม กลุ่มสาระฯภาษาต่างประเทศ ชั้นมัธยมศึกษา ปีที่ 4 โรงเรียนอุบลรัตนราชกัญญาราชวิทยาลัย กรุงเทพมหานคร.
Multilayer Feedforward Networks
VARIABLES, EXPRESSION and STATEMENTS. Values and Data Types Value เป็นสิ่งพื้นฐาน มีลักษณะเป็น ตัวอักษร หรือ ตัวเลข อาทิ 2+2 หรือ “Hello world” Value.
อาจารย์ มธ. อธิบายการใช้ โมเดลของ
GAME THEORY AND APPLICATIONS
Chapter 5: Functions of Random Variables. สมมติว่าเรารู้ joint pdf ของ X 1, X 2, …, X n --> ให้หา pdf ของ Y = u (X 1, X 2, …, X n ) 3 วิธี 1. Distribution.
Data Structures and Algorithms
ระบบการจัดเก็บในคลังสินค้า
Medical Student Education Department of Orthopaedic Surgery and Physical Medicine Faculty of Medicine Prince of Songkla University.
: Chapter 1: Introduction 1 Montri Karnjanadecha ac.th/~montri Image Processing.
Color Standards A pixel color is represented as a point in 3-D space. Axis may be labeled as independent colors such as R, G, B or may use other independent.
ออโตมาตาจำกัด FINITE AUTOMATA
REGULAR EXPRESSION การบรรยายแบบสม่ำเสมอ
We will chake the answer. จำนว น จำนวนนับจำนวน เต็ม จำนวน ตรรกยะ จำนวนอต รรกยะ Numbe rs Natural numbers Integers numbers rational numbers Irrational numbers.
Principal Facts and Ideas Objectives 1. 1.Understand principal properties of central-force problem 2. 2.Solve problems : angular momentum of a single particle.
Chapter 19 Network Layer: Logical Addressing
Inference in Propositional Logic
ผศ.(พิเศษ)น.พ.นภดล สุชาติ พ.บ. M.P.H.
Inductive, Deductive Reasoning ผศ.( พิเศษ ) น. พ. นภดล สุชาติ พ. บ. M.P.H.
Course Software Engineering SE Overview and Introduction.
December 25 th, 2013 Naresuan University Hospital, Faculty of Medicine, Naresuan University December 25 th, 2013 Naresuan University Hospital, Faculty.
Problem with Subjunctive Verbs Some verbs and noun require a subjunctive. A subjunctive is a change in the usual form of the verb. It is often a verb word.
INC 637 Artificial Intelligence Lecture 13 Reinforcement Learning (RL) (continue)
INC 551 Artificial Intelligence
INC 551 Artificial Intelligence
INC341 Steady State Error Lecture 6.
Chap 4 Complex Algebra. For application to Laplace Transform Complex Number.
Yv xv zv.
Functions Standard Library Functions User-defined Functions.
Asst.Prof. Dr.Surasak Mungsing
MAT 231: คณิตศาสตร์ไม่ต่อเนื่อง (3) Function Growth & Time-Complexity
Chapter 20 Expert System Chapter 20 Expert System Artificial Intelligence ดร. วิภาดา เวทย์ประสิทธิ์ ภาควิชาวิทยาการคอมพิวเตอร์ คณะ วิทยาศาสตร์
ปัญญาประดิษฐ์ (Artificial Intelligence)
8/3/2014The Realities of software Testing1 Software testing Realities What is the realities of software testing Why does the software testing not complete.
ดร.วิภาดา เวทย์ประสิทธิ์
By Dr Nongyao Premkamolnetr Policy Innovation Center, KMUTT 17 January 2009.
วิทยาการคอมพิวเตอร์ 1 เรื่องคัดเฉพาะทาง
Algorithm Efficiency There are often many approaches (algorithms) to solve a problem. How do we choose between them? At the heart of computer program.
Introduction to Earned Value Analysis.
Lecture on Grading. Instructor: Ajarn Neill Grant Office: Room Course Website: (NO
 Fungi reproduce using spores produced in the sporangium.  Spores contain the genetic material for growth of a new organism, protected by a tough coat.
Writing a research. Why Research?  To find whether the messages and the materials are appropriate to the target group  To modify the messages and the.
iWaLL โดย 1. นายวีกิจ สัจจะมโนรมย์
Liang, Introduction to Java Programming, Sixth Edition, (c) 2007 Pearson Education, Inc. All rights reserved Java Programming Language.
การสร้าง WebPage ด้วย Java Script Wachirawut Thamviset.
Chapter 3 Simple Supervised learning
Chapter 1/1 Arrays. Introduction Data structures are classified as either linear or nonlinear Linear structures: elements form a sequence or a linear.
21 August ดรุณี ศมาวรรตกุล 1 2. ADT List - Unsorted list ADT - list implementation - Sorted List - Circular list - Doubly linked list.
Introduction to Microprocessors II
วันที่ 28 มิถุนายน 2556 Forecasting technique การพยากรณ์
Physical Chemistry IV The Ensemble
Bitcoin Mining. Hello, I’m Pawaris and I love Bitcoin.
การค้นในปริภูมิสถานะ
 How do we improve the test?  Why do we have to improve the test?
ว เคมีพื้นฐาน พันธะเคมี
Dr.Surasak Mungsing CSE 221/ICT221 การวิเคราะห์และออกแบบขั้นตอนวิธี Lecture 05: การวิเคราะห์ความซับซ้อนของ ขั้นตอนวิธีการเรียงลำดับข้อมูล.
Forces and Laws of Motion
Extreme Programming Explained: Embrace Change
ใบสำเนางานนำเสนอ:

INC 551 Artificial Intelligence Lecture 5 Adversarial Search (Game Playing)

Game Playing Environment ประกอบด้วย “enemies” หรือ “hostile agents” Enemies are “unpredictable” To deal with the problem: Consider every possibility of reply

Types of Games

Search Technique จะสามารถทำการ search เพื่อหาทางเดินที่ดีที่สุดได้โดยคิดตาเดินจาก enemies มาเป็น branching factor ด้วย หลังจากนั้นจะใช้ minimax algorithm ในการตัดสินใจ

การแตก node ของ Game O-X ผู้เล่น 2 คน ชื่อ Max และ Min

Minimax Algorithm สมมติว่าที่ depth = 2 เป็น terminal states ทั้งหมด

Minimax Algorithm

Property of Minimax Complete: ถ้า search tree มีขนาดจำกัด Optimal: yes ถ้า opponent optimal Time Complexity: Space Complexity: (แบบ Depth-first) For a normal chess game: b=35, m=100 Time?? -> infeasible

Real Problem with Minimax จะใช้การ cut-off คือกำหนด depth มากสุดที่จะ search ลงไป และ node ที่ลึกสุดนั้นจะใช้ evaluation function (heuristic) เพื่อประมาณคะแนนของ node นั้น

Heuristics for Game Search ใน game ทั่วไป เราจะไม่สามารถแตก node ไปจนสิ้นสุดได้ (เวลาจำกัด) Heuristics จะถูกใช้ในการประมาณค่าของ state ของ game เมื่อ depth ลึกมากกว่าที่กำหนด

Heuristic in chess – material value Pawn=1, knight=3, bishop=3, rook=5, queen=9

Minimax ใน case ที่ opponent ทำพลาดบ้าง

Alpha-beta Pruning Use with minimax for eliminating the nodes that looks bad Each node will keep the lower limit and upper limit of possible score, called alpha and beta value [alpha,beta] Will follow the rules to stop expanding nodes

Rules for Terminating search on nodes Stop below any MIN node have a beta value less than or equal to alpha value of any of its MAX ancestors Stop below any MAX node have an alpha value greater than or equal to beta value of any of its MIN ancestors

Alpha-beta Pruning จะไม่ expand node ต่อถ้าพบค่าต่ำๆที่ปลาย

(3,∞) (3,3)

(3,∞) (3,3) (-∞,2)

(3,∞) (3,3) (-∞,14) (-∞,2)

(3,∞) (3,3) (-∞,5) (-∞,2)

(3,3) (3,3) (2,2) (-∞,2)

Alpha-Beta Algorithm

Property of Pruning Final result ไม่เปลี่ยนแปลง เรียงลำดับเอา Good move ขึ้นก่อน จะทำให้ pruning ดี

Deterministic Games in Practice

Games with chance Backgammon

Search Technique with Chance จะเอา chance มาเพิ่มเป็นการแตก node ด้วย เอาคะแนนคูณกับ probability เป็นคะแนนรวมทั้งหมด

Coin-flipping Game เกมส์ที่ต้องมีการโยนเหรียญและเลือกเดินคนละครั้ง เราเดิน โยนเหรียญ เขาเดิน

Alpha-Beta Pruning สามารถทำได้กับ non-deterministic problems โดยกำหนด ขอบเขตของคะแนนในแต่ละ node อย่างไรก็ตาม pruning จะได้น้อยกว่าแบบ deterministic problems

ในกรณีที่เราสามารถกำหนด bound กำหนดคะแนนในช่วง [-2,2]

Case Study (Othello)

Standard Board Size: 8x8 = 64 squares Depth: about 60 moves Branching factor: varied 0-20 Estimated search time for depth 32 = 3 days Estimated search time for depth 60 = 2,100 years

Game playing Tactic Opening (around move 1-12) Use opening book Mid game (around move 13 – 35) Use Evaluation function End game (around move 36-end) Use exhaustive search

Opening There are 3 ways of opening in Othello. Use statistic records for 100,000+ games to determine which opening win the most.

Mid Game Evaluation function use heuristics to give score to board position Don’t play on certain square Prefer corner Want great mobility Edge and corner patterns Evaluation function is the key to strong Othello program

End Game Search to the end

Breakthrough Event Year 1997 : 6 game match Takeshi Murakami (Othello world champion) vs Logistello (by Michael Buro)

Final Result Takeshi Murakami (Othello world champion) Win 0 match, get 120 discs Logistello (by Michael Buro) Win 6 matches, get 264 discs