Chapter 8: Analysis of Variance : ANOVA

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
การวิเคราะห์ความแปรปรวน แบบหนึ่งทาง
Advertisements

สถิติที่ใช้ในการวิจัย
Classification / Criteria
Chapter 10: Hypothesis Testing: Application
สารสกัดเมล็ดสะเดาที่มีผลต่อการยับยั้งการวางไข่ ของแมลงวันผลไม้
treatment + experimental unit = observation
เอกสารประกอบคำสอนอาจารย์ ดร.ศุกรี อยู่สุข
เอกสารประกอบการสอน อาจารย์ดร.ศุกรี อยู่สุข
แผนการทดลองแบบ split-plot (Split-plot design)
แผนการทดลองแบบ split-plot (Split-plot design)
ADG SOV df SS MS F Trt ** Error Total Duncan’s Number of Means (p) LSR
Dr. Tipsuda Janjamlha 30 AUG. 08
แบบแผนการวิจัยเชิงทดลอง
การทดสอบความแปรปรวน ANOVA
มาตรฐานการให้รางวัลผลงานด้านการวิจัยและพัฒนาระบบพฤติกรรมไทย
Basic Experimental Design
การตรวจสอบข้อกำหนดของการวิเคราะห์ความแปรปรวน
Basic Statistical Tools
การวิเคราะห์ข้อมูลพหุระดับ (Multilevel Analysis) ด้วยโปรแกรม HLM
Basic Statistical Tools
Repeated Measurement Experiments
Repeated Measurement Experiments
การวิเคราะห์ข้อมูลสูญหาย และข้อมูลที่มีซ้ำไม่เท่ากัน ด้วย GLM
Facility Location Single facility –Weighted scoring (Location factor rating) –Center of gravity model –Load-distance model (cost-based model) –Break even.
การวางแผนการทดลองทางสัตว์
Page : Stability and Statdy-State Error Chapter 3 Design of Discrete-Time control systems Stability and Steady-State Error.
ผลของวิตามินอีต่อคุณภาพไข่ปลาดุกทะเล (Plotosus canius)
การวิเคราะห์ความแปรปรวนของค่าอัตราส่วนปลอดภัย
การวิจัยปฏิบัติการ ในชั้นเรียน
การจัดการและวิเคราะห์ข้อมูล
การวิจัยในชั้นเรียน Classroom action Research
การวิเคราะห์ข้อมูลทางสถิติ เพื่อการทำวิจัยอย่างง่าย
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
ทบทวนสถิติสำหรับการวิจัยทางวิทยาศาสตร์สุขภาพ
บทที่ 5 การออกแบบการวิจัย
บทที่ 9 การกำหนดขนาดของตัวอย่าง
ความรู้เบื้องต้นเกี่ยวกับ คุณภาพของเครื่องมือวัด
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
สถิติที่ใช้ในงาน การวิจัยเชิงปริมาณ
ผู้อำนวยการส่วนกฎหมายและเบียบ กรมสรรพสามิต
การอ่านและให้คุณค่าบทความวิชาการ (Journal Article Appraisal)
บทที่ 7 การสุ่มตัวอย่าง.
Single replication Experiments งานทดลองที่ทำเพียงซ้ำเดียว
การวิจัยเชิงทดลอง (Experimental Research)
ประชากร การคำนวณขนาดตัวอย่าง และการเลือกวิธีการสุ่มตัวอย่าง
การทดสอบสมมติฐาน.
วิทยาลัยเทคโนโลยีธีรภาดา จังหวัดร้อยเอ็ด
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
กลุ่มสาระสุขศึกษาและพลศึกษา โรงเรียนเซนต์ฟรังซีสเซเวียร์
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
นางสาวเพ็ญศรี ท่องวิถี นักวิชาการเกษตรชำนาญการพิเศษ
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
การเลี้ยงไก่ไข่.
Students’ Attitudes toward the Use of Internet
ระบบจำนวนและ การแปลงเลขฐาน
ระดับชั้นมัธยมศึกษาปีที่ 1 MLP รายวิชาพื้นฐาน
การวางแผนระบบการผลิต
ระดับชั้นมัธยมศึกษาปีที่ 3 MLP รายวิชาพื้นฐาน
การใช้ยา.
การเลือกใช้สถิติเพื่อการวิจัย
ระดับชั้นมัธยมศึกษาปีที่ 4 MLP รายวิชาพื้นฐาน ม.4/1 – ม.4/4
ระดับชั้นมัธยมศึกษาปีที่ 2 MLP รายวิชาพื้นฐาน
ผู้วิจัย : สุภาพร อภิพันธุ์
ระดับชั้นประถมศึกษาปีที่ 4 MLP รายวิชาพื้นฐาน
ประจำปีการศึกษา พุทธศักราช 2555
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
การสรุปผลข้อมูล และ Action Query
งานวิจัย.
การวิเคราะห์ความแปรปรวน
ใบสำเนางานนำเสนอ:

Chapter 8: Analysis of Variance : ANOVA การวิเคราะห์ความแปรปรวน

เนื้อหา: การวิเคราะห์ความแปรปรวน แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) การเปรียบเทียบเชิงซ้อน (Multiple Comparisons)

การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้น ไป การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้น ไป ????? เช่น - เปรียบเทียบปุ๋ย 4 ชนิด ที่ใช้สำหรับ ปลูกข้าวพันธุ์หนึ่งจะให้ผลผลิต แตกต่างกัน ????? - เปรียบเทียบวิธีการสอน 5 วิธี จะทำให้ ผลสัมฤทธิ์ทางการเรียนของนักเรียน แตกต่างกันหรือไม่ ?????

ถ้าทำการเปรียบเทียบทีละ 2 กลุ่ม จะทำให้เกิด ปัญหา คือ 1. เสียเวลา 2 ถ้าทำการเปรียบเทียบทีละ 2 กลุ่ม จะทำให้เกิด ปัญหา คือ 1. เสียเวลา 2. จะทำให้ α (Type I Error) สูงขึ้นจากที่กำหนด 3. ไม่ถูกต้องตามหลักสถิติ ดังนั้นเราจึงควรทำการทดสอบค่าเฉลี่ยของประชากร ทั้งหมดพร้อมๆ กัน โดยมีสมมติฐาน ดังนี้ H0 : µ1= µ2 = ... = µk H1 : มี µ1 อย่างน้อย 1 กลุ่ม ที่แตกต่าง จากกลุ่มอื่น ๆ ; i =1,2,…,k

ซึ่งเรียกวิธีการดังกล่าวว่า การวิเคราะห์ความแปรปรวน (Analysis of Variance : ANOVA) ผู้คิดวิธีดังกล่าวเป็นนักสถิติชาวอังกฤษ ชื่อ Ronald A. Fisher จุดประสงค์ของการวิเคราะห์ความแปรปรวน คือ การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป

Definition การวิเคราะห์ความแปรปรวน (Analysis of variance) คือ วิธีการที่ใช้ในการเปรียบเทียบหรือวิธีการที่ใช้ในการ ทดสอบสมมติฐานเกี่ยวกับค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป พร้อม ๆ กัน โดยในการวิเคราะห์ ความแปรปรวนนี้ ความแปรปรวนหรือความผันแปร ทั้งหมด (Total variation) ที่เกิดขึ้นในข้อมูลจะถูกแบ่ง ออกเป็นส่วนๆ ตามแหล่งกำเนิดหรือสาเหตุของการ เกิดความแปรปรวนนั้น

Technical Terms - ทรีทเมนต์ (Treatment) สิ่งหรือวิธปฏิบัติต่อวัตถุ ทดลอง เพื่อ ใช้ในการวัดผล เปรียบเทียบตามวัตถุประสงค์ของการทดลอง - วัตถุทดลอง (Experimental Material) วัตถุหรือสิ่งที่ ใช้ในการทดลอง - หน่วยทดลอง (Experimental Unit) สิ่งหนึ่งหรือกลุ่ม หนึ่งของวัตถุทดลองที่ได้รับ ทรีทเมนต์เดียวกัน - ค่าสังเกต (Observation) ค่าที่เก็บรวบรวมได้จากการ ทดลองหรือการสำรวจ ซึ่งจะเป็นข้อมูลที่นำมาวิเคราะห์เปรียบเทียบ

ตัวอย่างเช่น - การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษา คนไข้ - การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ใน การสอนนักเรียน - การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูก ข้าวพันธุ์หนึ่ง จากแต่ละตัวอย่างข้างต้น ปัจจัย (Factor) ที่สนใจ ศึกษา คืออะไร และอะไรคือ - Treatment - Experimental Material - Experimental Unit - Observations

ในการวิเคราะห์ความแปรปรวน จะต้องมีการวางแผนการ ทดลองซึ่งการวางแผน การทดลอง เป็นลักษณะของการจัด Treatment ให้กับ หน่วยทดลอง โดยสุ่ม (Randomization) ซึ่งมีอยู่หลาย design ในบทนี้ จะกล่าวเพียง 2 design เท่านั้น คือ 1. แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) 2. แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD)

แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) เป็นการวิเคราะห์ข้อมูลจากหน่วยทดลองที่ได้ จากการทดลองโดยใช้ปัจจัยที่ศึกษาเพียงปัจจัยเดียว (Single factor) แต่แบ่งเป็นหลายระดับหรือหลายชนิด ซึ่งชนิดหรือระดับของปัจจัยดังกล่าวก็คือ Treatment นั่นเอง

ตัวอย่างเช่น - การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษาคนไข้ - การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ในการสอน นักเรียน - การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูกข้าวพันธุ์ หนึ่ง

การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One – way ANOVA) แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) หลักการสำคัญของแผนการทดลองนี้ ใช้ในกรณีที่หน่วย ทดลองมีความสม่ำเสมอ หรือคล้ายคลึงกัน (Uniform ; Homogeneous) วิธีการจัด Treatment ให้แก่หน่วยทดลองจะใช้วิธีการสุ่ม ที่ทำให้หน่วยทดลองทุก ๆ หน่วยทดลอง มีโอกาสได้รับ Treatment ใด Treatment หนึ่ง เท่าๆ กัน ค่าข้อมูลที่ได้เชื่อว่าเกิด จากอิทธิพลของ Treatment เพียงอย่างเดียว การวิเคราะห์ความแปรปรวนในแผนการทดลองดังกล่าว บางครั้งจะเรียกว่า การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One – way ANOVA)

ผังข้อมูล (Layout) ผังข้อมูลสำหรับการวางแผนแบบสุ่มตลอด

ข้อตกลงเบื้องต้น (Basic Assumptions) 1. ตัวอย่างทั้ง k กลุ่ม จะต้องเป็นตัวอย่างสุ่มจาก ประชากร k กลุ่ม และการกำหนด treatment ให้กับหน่วยทดลองต้องเป็นไปอย่างสุ่ม 2. ประชากรแต่ละกลุ่มเป็นอิสระกัน 3. ประชากรแต่ละกลุ่มมีการแจกแจงปกติมีค่าเฉลี่ย เท่ากับ และมีค่าความแปรปรวนเท่ากันหมด คือ ซึ่งอาจเขียนในรูปสัญลักษณ์ได้ว่า

พิจารณาค่าสังเกตแต่ละค่าที่รวบรวมได้จากหน่วยทดลองที่ j ของทรีทเมนต์ที่ i ว่ามีความแตกต่างกัน เนื่องมาจากสาเหตุใดบ้าง ซึ่งค่า สังเกต xij จะเขียนแสดงได้ดังนี้

โดยทั่วไป μ , πi และ εij จะไม่ทราบค่า ซึ่งจะใช้ ข้อมูลจากตัวอย่างหรือ จากการทดลองมาประมาณค่าเหล่านี้ แล้วจึงทำการ ทดสอบสมมติฐานว่าอิทธิพลของ Treatment ต่าง ๆ กัน k Treatments แตกต่างกันอย่างมีนัยสำคัญ หรือไม่ ซึ่งใช้ ............... (a)

หลักการวิเคราะห์ความแปรปรวน ต้องพยายามแยกความผันแปรทั้งหมด (Total variation) ที่เกิดขึ้นในการทดลอง ออกเป็นส่วนต่าง ๆ ตามแหล่งกำเนิดหรือตามสาเหตุ ของการเกิดความผันแปรนั้น ๆ จาก (a) ใส่ผลบวกและยกกำลังสองทั้งสองข้าง จะได้ว่า

สมมติฐานเพื่อการทดสอบ เป็นดังนี้

สถิติสำหรับทดสอบสมมติฐานกรณีนี้ คือ

ตัวอย่าง 8.1 ข้อมูลต่อไปนี้แสดงผลผลิตข้าวจากการ ใช้ยาปราบแมลงต้นข้าวชนิดต่างๆ โดยใช้แผนการ ทดลองแบบ CRD จงทดสอบว่ายาปราบแมลงทั้ง 7 ชนิด มีประสิทธิภาพแตกต่างกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05

ตัวอย่าง 8.2 ในการศึกษาเปรียบเทียบวิธีการพักฟื้น 4 วิธี ว่าจะมีผลทำให้ระยะเวลาที่แผลหลังการผ่าตัด ช่องท้องปิดสนิทแตกต่างกันหรือไม่จึงทำการสุ่มผู้ป่วย มา ศึกษา 24 คน ได้ข้อมูลดังนี้ จง วิเคราะห์ข้อมูลดังกล่าวที่ระดับนัยสำคัญ 0.05

วิธีทำ ให้ μA , μB , μC , μD แทน ระยะเวลาเฉลี่ยที่ ใช้ในการพักฟื้นด้วยวิธีต่างๆ ของคนไข้ที่ ได้รับการผ่าตัดช่องท้อง

คำนวณค่าต่าง ๆ ได้ดังนี้

ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)

การเปรียบเทียบเชิงพหุหรือ การเปรียบเทียบเชิงซ้อน (Multiple comparisons) 1. Fisher's Least Significant Difference (LSD) 2. Tukey ' s Procedure 3. Scheffe ' s Test 4. Duncan ' s New Multiple Range Test (DMRT) 5. Student - Newman - Keuls ' s Test (S-N- K)

1. Fisher's Least Significant Difference (LSD) สมมติว่าเปรียบเทียบระหว่าง treatment ที่ i และ treatment ที่ j

การเปรียบเทียบ

สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาเฉลี่ยที่ใช้ในการพักฟื้น ของ คนไข้ที่ได้รับการผ่าตัดช่องท้องด้วยวิธี A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่น ๆ ไม่แตกต่างกัน

2. Tukey 's Procedure

การเปรียบเทียบ

สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B แตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน

3. Scheffe' s Test

การเปรียบเทียบ

สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B แตกต่างกันอย่างมีนัยสำคัญ ทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการ พักฟื้นคู่อื่นๆ ไม่แตกต่างกัน

4. Duncan's New Multiple Range Test (DMRT) คำนวณสถิติทดสอบ LSR (Least Significant Ranges) จากสูตร

การเปรียบเทียบ

สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน

5. Student - Newman - Keuls' s Test (S-N-K) คำนวณสถิติทดสอบ

การเปรียบเทียบ

สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน

แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD) ในการทดลองบางครั้งไม่สามารถหาหน่วยทดลองที่มี ความเหมือนกันได้จำนวนมากพอ หรือหน่วยทดลองมีความแตกต่างกัน และเราทำการ ทดลองโดยวางแผนการทดลองแบบ สุ่มตลอด (CRD) จะทำให้การทดลองดังกล่าวไม่มี ประสิทธิภาพ เนื่องจากจะมีความ คลาดเคลื่อน ระหว่างหน่วยทดลองมาก ซึ่งอาจจะทำ ให้ผลการทดลองไม่ได้เนื่องมาจาก ทรีทเมนต์ที่เราต้องการศึกษาเพราะว่ามีตัวแปรหรือความผัน แปรอื่นเข้ามาเกี่ยวข้อง

แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD) --ต่อ-- ดังนั้น เพื่อขจัดปัญหาดังกล่าวเราจึงจำเป็นต้อง ขจัดตัวแปรหรือความผันแปรบางอย่างในหน่วยทดลองออก ก่อนก่อนที่จะให้ทรีทเมนต์กับหน่วยทดลอง นั่นคือ พยายามลดความคลาดเคลื่อนของการทดลองลงนั่นเอง โดยอาจจัดความผันแปรนั้นเป็นกลุ่มหรือบล็อก โดยหน่วย ทดลองที่อยู่ในบล็อกเดียวกันจะมีลักษณะเหมือนกัน ต่างบล็อกจะมีลักษณะต่างกันจุดประสงค์ของการวาง แผนการทดลองแบบสุ่มในบล็อกก็เพื่อลดความผันแปร เนื่องจากความแตกต่างของหน่วยทดลอง และทำให้เห็น อิทธิพลของทรีทเมนต์ชัดเจนขึ้น

Definition การทดลองแบบสุ่มในบล็อก หรือการทดลองแบบบล็อกสุ่ม หมายถึงการทดลองที่จัดให้หน่วยทดลองอยู่รวมกันเป็นพวกหรือเป็นกลุ่ม ซึ่งจะเรียกว่า บล็อก (Block) โดยที่ 1. หน่วยทดลองแต่ละหน่วยที่อยู่ในบล็อกเดียวกันต้องจะมีลักษณะคล้ายคลึงกัน (Homogeneous) และหน่วยทดลองที่อยู่ต่างบล็อกกันจะมีลักษณะแตกต่างกัน (Heterogeneous) และจำนวนหน่วยทดลองในแต่ละบล็อกจะต้องเท่ากับจำนวนทรีทเมนต์ที่ต้องการทดสอบ ซึ่งลักษณะเช่นนี้เรียกว่า เป็นการทดลองแบบบล็อกสมบูรณ์ (Complete Block) 2. การจัดสรรทรีทเมนต์ให้กับหน่วยทดลองในแต่ละบล็อกจะต้องเป็นไปอย่างสุ่ม

ผังข้อมูล (Layout) ผังข้อมูลสำหรับการวางแผนการทดลองแบบสุ่มในบล็อก

1. ข้อมูลแต่ละตัวเป็นตัวอย่างสุ่มขนาด 1 หน่วย จากประชากรแต่ละกลุ่ม ซึ่งมีทั้งหมด kb กลุ่ม 2. ประชากรแต่ละกลุ่มมีการแจกแจงปกติซึ่งมีค่าเฉลี่ย µij และค่าความแปรปรวน เท่ากันหมดคือเท่ากับ σ2 3. ทรีทเมนต์และบล็อกต้องมีคุณสมบัติเชิงบวกหรืออาจ กล่าวได้อีกนัยหนึ่งว่า ทรีทเมนต์และบล็อกไม่มีการกระทำ (interaction) ร่วมกัน

    หรือ     หรือ     หรือ SSE = SST+ SSTr - SSB

ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)

สมมติฐานเพื่อการทดสอบ

สถิติที่ใช้ทดสอบสมมติฐาน คือ

ตัวอย่าง 8.3 ในการศึกษาคุณภาพของน้ำมันรถยนต์4 สูตร กับรถยนต์ที่มีขนาดกระบอกสูบเท่ากันของ 5 บริษัท คือ Ford, Honda, BMW, Nissan และ Toyota โดยใช้รถยนต์บริษัทละ 4 คัน เติมน้ำมันคันละ สูตร ๆ ละ 3 ลิตร แล้วนำไปทดลอง ด้วยความเร็ว และเส้นทางเดียวกันจนน้ำมันหมด หลังจากนั้นบันทึก ระยะทางที่รถแต่ละคันวิ่งได้ ข้อมูลปรากฏดังตาราง

ที่ระดับนัยสำคัญ 0.05 จงทดสอบว่าน้ำมันแต่ละสูตรมีผลทำให้ระยะทางที่รถแล่นได้แตกต่างกันหรือไม่และระยะทางที่รถยนต์แต่ละบริษัทแล่นได้แตกต่างกันหรือไม่