Chapter 9: Hypothesis Testing : Theory
9.1 Introduction Estimation และ Hypothesis Testing ถือเป็น Statistical Inference Stat Inference: การใช้ข้อมูลจาก sample มาสร้างเป็นข้อสรุปบาง อย่างเกี่ยวกับ population Estimation: การใช้ข้อมูลจาก sample เพื่อหา estimator of Hypothesis Testing: การใช้ข้อมูลจาก sample เพื่อเปรียบเทียบระหว่างสมมติฐาน 2 ข้อ ( กับ ) ว่าอันไหนมีโอกาสเป็นไปได้มากกว่า
Statistical Hypothesis: Hypo เกี่ยวกับdistribution of pop Simple Hypo: stat hypo ซึ่ง completely specify the dist Composite Hypo: stat hypo ซึ่งไม่ completely specify the dist Statistical Hypothesis Testing: เปรียบเทียบระหว่าง 2 hypo’s H0: Null Hypothesis H1: Alternative Hypothesis นิยมตั้ง H0 ให้เป็น Simple hypo ที่ตรงข้ามกับสิ่งที่เราต้องการพิสูจน์
Steps ในการทดสอบ Hypothesis 1. สร้าง Test statistic 2. คำนวณค่าของ Test statistic จาก random sample ที่เก็บมา 3. แบ่งค่า Test statistic ออกเป็น 2 ย่าน - ถ้า ตกอยู่ใน Acceptance Region --> ถือว่า Accept H0 - ถ้า ตกอยู่ใน Rejection Region (Critical Region) --> ถือว่า Reject H0
ในการทดสอบ hypo เราสามารถก่อให้เกิด errors ได้ 2 แบบ 1. กรณี H0 เป็นจริง แต่เรา Reject H0 <--- Type I Error 2. กรณี H1 เป็นจริง แต่เรา Accept H0 <--- Type II Error ให้ P(Type I Error) = ---> “Size of Critical Region” ---> “Level of Significance” ให้ P(Type I Error) = ---> = “Power of the Test”
9.2 The Neyman-Pearson Lemma NOTE: 1. “การเลือก Critical region ที่ดี” = “การเลือก Test statistic ที่ดี” 2. การเลือก Critical region ที่ดี: เลือกให้ มีค่าต่ำๆ --> วิธีการของ NPL: fixed แล้วเลือก Critical region (Test statistic) ซึ่ง 3. NPL พิจารณา H0 & H1 ซึ่งเป็น Simple hypo ทั้งคู่ -->
9.2 The Neyman-Pearson Lemma พิจารณา Likelihood Fn ณ จุด Th’m 1: (Neyman-Pearson Lemma ) ถ้า k เป็นค่าคงที่ และ C เป็น critical region ขนาด ซึ่งมีคุณสมบัติดังนี้ สำหรับทุกๆ จุดใน C สำหรับทุกๆ จุดนอก C จะได้ว่า C คือ most powerful critical region ขนาด สำหรับการทดสอบ เทียบกับ
9.3 The power function of a test Def 3: power function ของการทดสอบ statistical hypothesis H0 เทียบกับ alternative hypothesis H1 คือ for value of assumed under for value of assumed under = Prob of rejecting H0 สำหรับค่า parameter ค่าต่างๆ
9.4 Likelihood Ratio Tests Def 4: ถ้า และ เป็น complementary subset ของ parameter space และถ้า โดยที่ และ เป็น ค่าที่สูงที่สุดของ likelihood function สำหรับทุกค่าของ ใน และ จะได้ว่า critical region โดยที่ 0 < k < 1 จะเป็น critical region ซึ่งเป็น likelihood ratio test ของ null hypothesis เทียบกับ alternative hypothesis
Th’m 2: ในกรณีที่ n มีขนาดใหญ่ และ ภายใต้ข้อสมมติที่ค่อนข้างทั่วไปชุดหนึ่ง เราพบว่าการกระจายตัวของ จะมีลักษณะใกล้เคียง chi-square distribution ที่มีdegree of freedom เป็น 1