Learning Dr.Yodthong Rodkaew
IQ test
IQ test
IQ test http://farm2.static.flickr.com/1399/1394691913_1aecd327db_o.jpg
Learning in AI 9954 9954 7799 7799 1144 ? learning with training data
Learning in AI ? ? 9954 9954 Mr.AI 7799 7799 7799 Unknown Estimation+Classification
Learning in AI Supervised Learning Unsupervised Learning
Supervised Learning Supervised Learning – การเรียนรู้แบบมีผู้สอน learning a function from training data. The training data consist of pairs of input objects (typically vectors), and desired outputs เรียนรู้ฟังก์ชั่นจากข้อมูลสอน ข้อมูลสอนประกอบด้วยกลุ่มข้อมูล (ส่วนใหญ่ในรูปแบบ เวกเตอร์) และผลที่ต้องการ The output of the function - ผลที่ได้จากฟังก์ชั่น continuous value (called regression), ค่าต่อเนื่อง (การประมาณค่าแบบย้อนกลับ) predict a class label of the input object (called classification). ทำนายประเภทของข้อมูล (เรียก การจำแนก)
Supervised Learning The task of the supervised learner to predict the value of the function for any valid input object after having seen a number of training examples (i.e. pairs of input and target output). Classification ex. 7799 7799 7799 Tranining data Classification
Supervised Learning Regression ex. Training data Next day? Regression =a^2+e*log2(t)/10+7… +sin(x) cos(y) exp (n) .. Regression ex. Training data Regression Next day?
Supervised Learning Tools: Analytical learning Naive bayes classifier Nearest Neighbor Algorithm Probably approximately correct learning (PAC) learning Ripple down rules, a knowledge acquisition methodology Symbolic machine learning algorithms Subsymbolic machine learning algorithms Support vector machines Random Forests Ensembles of Classifiers Ordinal Classification Data Pre-processing Handling imbalanced datasets Tools: Analytical learning Artificial neural network Backpropagation Boosting Bayesian statistics Case-based reasoning Decision tree learning Inductive logic programming Gaussian process regression Learning Automata Minimum message length (decision trees, decision graphs, etc.)
Supervised Learning Applications: Bioinformatics Cheminformatics Quantitative structure-activity relationship Handwriting recognition Information retrieval Object recognition in computer vision Optical character recognition Spam detection Pattern recognition Speech recognition Forecasting Fraudulent Financial Statements
Training ???? 10-20%
Training ???? 10-20% Too Much Training Overfitting Training data Test data Training Correct 99%
Unsupervised Learning The learner is given only unlabeled examples. One form of unsupervised learning is clustering – การแบ่งกลุ่ม ไม่มีการระบุผลที่ต้องการหรือประเภทไว้ก่อน การเรียนรู้แบบนี้จะพิจารณาวัตถุเป็นเซตของตัวแปรสุ่ม แล้วจึงสร้างโมเดลความหนาแน่นร่วมของชุดข้อมูล Tools: NeuronNetwork, k-means clustering, hierarchical clustering, self-organizing map (som) Applications: การบีบอัดข้อมูล
Clustering การแบ่งกลุ่มข้อมูล (data clustering) เป็นวิธีการวิเคราะห์ข้อมูล ซึ่งใช้ในการเรียนรู้ของเครื่อง การทำเหมืองข้อมูล โดยจะแบ่งชุดข้อมูล (มักจะเป็นเวกเตอร์) ออกเป็นกลุ่ม (cluster) โดยนำข้อมูลที่มีคุณลักษณะเหมือนกัน หรือคล้ายกันจัดไว้ในกลุ่มเดียวกัน http://th.wikipedia.org/wiki/การแบ่งกลุ่มข้อมูล
Clustering ขั้นตอนวิธีที่ใช้ในการแบ่งกลุ่มจะอาศัย ความเหมือน (similarity) หรือ ความใกล้ชิด (proximity) โดยคำนวณจากการวัดระยะระหว่างเวกเตอร์ของข้อมูลเข้า โดยใช้การวัดระยะแบบต่าง ๆ เช่น การวัดระยะแบบยูคลิด (Euclidean distance) การวัดระยะแบบแมนฮัตตัน (Manhattan distance) การวัดระยะแบบเชบิเชฟ (Chebychev distance) การแบ่งกลุ่มข้อมูล (clustering) จะแตกต่างจาก การจำแนกประเภทข้อมูล (classification) โดยจะแบ่งกลุ่มข้อมูลจากความคล้าย โดยไม่มีการกำหนดประเภทของข้อมูลไว้ก่อน http://th.wikipedia.org/wiki/การแบ่งกลุ่มข้อมูล
Distance การวัดระยะแบบยูคลิด (Euclidean distance) การวัดระยะแบบแมนฮัตตัน (Manhattan distance) การวัดระยะแบบเชบิเชฟ (Chebychev distance) http://th.wikipedia.org/wiki/การแบ่งกลุ่มข้อมูล
Sqr( (x1-x2)^2 + (y1-y2)^2 + (z1-z2)^2) (Euclidean distance) Sqr( (x1-x2)^2 +(y1-y2)^2) Sqr( (x1-x2)^2 + (y1-y2)^2 + (z1-z2)^2) http://en.wikipedia.org/wiki/Euclidean_distance
Taxicab Geometry (Manhattan distance) (Euclidean distance) Taxicab geometry, considered by Hermann Minkowski in the 19th century, is a form of geometry in which the usual metric of Euclidean geometry is replaced by a new metric in which the distance between two points is the sum of the (absolute) differences of their coordinates. The taxicab metric is also known as rectilinear distance, L1 distance or L1 norm (see Lp space), city block distance, Manhattan distance, or Manhattan length, with corresponding variations in the name of the geometry.[1] The last name alludes to the grid layout of most streets on the island of Manhattan, which causes the shortest path a car could take between two points in the city to have length equal to the points' distance in taxicab geometry. http://en.wikipedia.org/wiki/Manhattan_distance
(Chebyshev distance) In mathematics, Chebyshev distance (or Tchebychev distance), or L∞ metric[1] is a metric defined on a vector space where the distance between two vectors is the greatest of their differences along any coordinate dimension.[2] It is named after Pafnuty Chebyshev. It is also known as chessboard distance, since in the game of chess the minimum number of moves needed by a king to go from one square on a chessboard to another equals the Chebyshev distance between the centers of the squares, if the squares have side length one, as represented in 2-D spatial coordinates with axes aligned to the edges of the board http://en.wikipedia.org/wiki/Chebyshev_distance
Taxicab Geometry in Game OGRE battle / FF Tactics
Clustering
Clustering