Probability & Statistics 2301520 Fundamentals of AMCS
Probability Theory (ทฤษฎีความน่าจะเป็น) “ความแน่นอนคือความไม่แน่นอน” ทฤษฎีความน่าจะเป็น เป็นการนำคณิตศาสตร์มาใช้ในการอธิบายความไม่แน่นอน Sample Space the set of all outcomes of an experiment Event a subset of of the sample space ตัวอย่าง 1 ผลที่ได้จากการโยนลูกเต๋าหนึ่งลูก (discrete) ตัวอย่าง 2 ช่วงเวลาที่หลอดไฟจะใช้งานได้จนกว่าจะเสีย (continuous) ความแน่นอนคือความไม่แน่นอน -บางวันฝนตกบางวันไม่ตก -เราวัดสิ่งของอย่างเดียวกันสองครั้ง เรามักจะได้คำตอบสองคำตอบที่ต่างกัน เช่นการทดลองอย่างเดียวกัน ทำสองซ้ำ ได้ผลไม่เหมือนกัน
Probability Function ให้ S เป็น Sample space สมมุติว่าเซต B เป็นเซตของสับเซต(หรือ Event)ของ S ที่มีสมบัติต่อไปนี้ ∈B ถ้า A∈B แล้ว Ac∈B ถ้า แล้ว (เรียก B ว่าเป็น sigma algebra ของ S) ฟังก์ชันความน่าจะเป็น P คือฟังก์ชันที่มีโดเมนเป็น B และสอดคล้องกับสมบัติต่อไปนี้ P:B→ [0,1] P(S)=1 ถ้าเหตุการณ์ เป็นเหตุการณ์ไม่เกิดร่วม จะได้ว่า
Probability Function หากมีการทดลองทำซ้ำเพื่อหาผลอะไรสักอย่างเป็นระยะเวลานานๆ P(A) บอกถึงสัดส่วนของเหตุการณ์ A ที่จะเกิดขึ้นเทียบกับผลที่เกิดขึ้นทั้งหมด
Random Variables ตัวแปรสุ่ม (Random Variable) เป็นตัวแปรที่ใช้แทนค่าของเหตุการณ์ที่ เกิดขึ้น โดยต้องมีค่าเป็นตัวเลข (ซึ่งอาจเป็นตัวเลขที่เป็นผลของเหตุการณ์โดยตรง หรือ ผลของเหตุการณ์สามารถแทนความหมายด้วยตัวเลขได้) ตัวอย่าง 1 X เป็นตัวแปรสุ่มที่ใช้แทนหน้าที่เกิดจากการโยนลูกเต๋าหนึ่งลูก ตัวอย่าง 2 X เป็นตัวแปรสุ่มที่ใช้แทนหน้าที่เกิดจากการโยนเหรียญหนึ่งเหรียญ ตัวอย่าง 3 X เป็นตัวแปรสุ่มที่ใช้แทนช่วงเวลาที่หลอดไฟจะใช้งานได้จนกว่าจะ เสีย
Probability Density Function (pdf) ฟังก์ชันความหนาแน่นของความน่าจะเป็น ถ้า X เป็นตัวแปรสุ่ม discrete จะเรียกว่า probability mass function (pmf) ซึ่งหมายถึง p(x) = P(X = x) ถ้า X เป็นตัวแปรสุ่ม continuous pdf คือฟังก์ชัน f(x)≥0 ที่มีสมบัติว่า ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Cumulative Distribution Function (cdf) ฟังก์ชันการแจกแจงสะสม ถ้า X เป็นตัวแปรสุ่ม discrete และมี p(x) เป็น pdf แล้ว cdf คือ ถ้า X เป็นตัวแปรสุ่ม continuous และมี f(x) เป็น pdf แล้ว ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Expectation ค่าคาดหมาย (Expected Value) ของตัวแปรสุ่ม X แทนด้วย E[X] ถ้า X เป็นตัวแปรสุ่ม discrete และมี p(x) เป็น pdf แล้ว ถ้า X เป็นตัวแปรสุ่ม continuous และมี f(x) เป็น pdf แล้ว ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Variance ความแปรปรวน (Variance) ของตัวแปรสุ่ม X แทนด้วย Var(X) นิยาม เป็น ในทางปฏิบัติ คำนวณจากสูตรต่อไปนี้จะง่ายกว่า ตัวอย่างตัวแปรสุ่มจากหน้าที่ 5
Pmf/pdf ที่ใช้บ่อย Bernoulli: ตัวแปรสุ่ม X มีค่าสองค่าคือ 0 (Failure) และ 1(Success) parameter: p (ความน่าจะเป็น P(X=1)) pmf: ตัวอย่าง: ให้ X แทนผลลัพธ์ของการโยนเหรียญ 1 เหรียญ โดย X=1 หมายถึงออก หัว X=0หมายถึงออกก้อย ให้ความน่าจะเป็นของการออกหัวเป็น 1/3ดังนั้น เราจะ ได้ p(1) = , p(0) = , E[X]= , Var(X)=
Pmf/pdf ที่ใช้บ่อย Discrete Uniform ตัวแปรสุ่ม X คือผลจากการทดลองที่มีทั้งหมด N แบบ โดยที่มีความน่าจะเป็นใน การเกิดแต่ละแบบเท่าๆกัน parameter: N pmf: ตัวอย่าง: ให้ X แทนหน้าที่เกิดจากการโยนลูกเต๋าเที่ยงตรง 1 ลูก p(x) = , สำหรับ x=1,2,…,6
Pmf/pdf ที่ใช้บ่อย Binomial Distribution ตัวแปรสุ่ม X คือจำนวนของการทดลองที่สำเร็จจากการทำการทดลองซ้ำทั้งหมด n ครั้ง parameters: n จำนวนของการทดลองทำซ้ำทั้งหมด p ความน่าจะเป็นที่การทดลองหนึ่งครั้งสำเร็จ pmf : ตัวอย่าง: สมมุติว่าเราโยนเหรียญ 1 เหรียญทั้งหมด 10 ครั้ง ให้ X แทนจำนวนการโยนที่ ให้ผลลัพธ์เป็น"หัว“ ให้ความน่าจะเป็นของการออกหัวของเหรียญดังกล่าวเป็น 1/3 จงหา ความน่าจะเป็นที่จะออกหัว 1) 5 ครั้งพอดี 2)ไม่เกิน 2ครั้ง
Pmf/pdf ที่ใช้บ่อย Geometric Distribution ตัวแปรสุ่ม X คือจำนวนของการทดลองที่ทำซ้ำจนกว่าจะสำเร็จ parameters: p ความน่าจะเป็นที่การทดลองหนึ่งครั้งสำเร็จ pmf : ตัวอย่าง: ให้ X แทนจำนวนการโยนการโยนเหรียญ 1 เหรียญจนกระทั่งได้ผลลัพธ์ เป็น"หัว“ ให้ความน่าจะเป็นของการออกหัวของเหรียญดังกล่าวเป็น 1/3 จงหา ความน่าจะเป็นที่จะต้องโยนทั้งหมด 1) 5 ครั้งพอดี 2)ไม่เกิน 2ครั้ง
Pmf/pdf ที่ใช้บ่อย Uniform ตัวแปรสุ่ม X นิยมใช้แทนค่าจำนวนจริงที่อยู่ระหว่างช่วง [a,b] parameters: a,b ค่าขอบล่างและบนของช่วง [a,b] pdf :
Pmf/pdf ที่ใช้บ่อย Normal Distribution ตัวแปรสุ่ม X นิยมใช้อธิบายปรากฏการณ์หลายอย่างในชีวิตประจำวัน parameters: μ ค่าเฉลี่ย (mean) σ คือค่าเบี่ยงเบนมาตรฐาน (standard deviation) pdf : ถ้า μ=0, σ=1 เรียกการแจกแจงนี้ว่าเป็นการแจกแจงแบบปกติมาตรฐาน (Standard Normal Distribution) ค่า pdf มักจะใช้สัญลักษณ์ นั่นคือ และค่า cdf ใช้
Central Limit Theorem (CLT) พิจารณาลำดับของตัวแปรสุ่มที่เป็นอิสระต่อกันและมีการแจกแจงเหมือนกัน (independent and identically distributed หรือ iid) โดยการแจกแจงดังกล่าวมีค่าเฉลี่ยและความแปรปรวนเป็นค่าจำกัด ผลรวม ของตัวแปรสุ่มเหล่านั้นในจำนวนที่มากพอ จะมีการแจกแจงเข้าใกล้การแจกแจงแบบ ปกติ
Statistics Tools for organizing and analyzing data. Two branches Descriptive Statistics “describe” data, e.g. mean, mode, median, frequency Inferential Statistics make predictions or comparisons about a population using information from a smaller group (sample)
Population ให้ N แทนขนาดของประชากร และ xi แทนค่าเชิงตัวเลขของประชากรที่ i Population Mean: Population Variance:
Sample ให้ n แทนขนาดของกลุ่มตัวอย่าง และ yi แทนค่าเชิงตัวเลขของตัวอย่างที่ i Sample Mean: Sample Variance: ทั้งคู่เป็น unbiased estimators ของ mean และ variance ของ ประชากร
Confidence Interval ช่วงความเชื่อมั่น (Confidence Interval) ของ μ ที่มีระดับความ เชื่อมั่น เปอร์เซ็นต์ หมายถึงว่า ความน่าจะเป็นที่ μ จะอยู่ ในช่วงดังกล่าวคือประมาณ จาก Central Limit Theorem ถ้าขนาดของกลุ่มตัวอย่างใหญ่พอ ช่วงดังกล่าวคำนวณได้จาก