Chapter 8: Analysis of Variance : ANOVA การวิเคราะห์ความแปรปรวน
เนื้อหา: การวิเคราะห์ความแปรปรวน แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) การเปรียบเทียบเชิงซ้อน (Multiple Comparisons)
การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้น ไป การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้น ไป ????? เช่น - เปรียบเทียบปุ๋ย 4 ชนิด ที่ใช้สำหรับ ปลูกข้าวพันธุ์หนึ่งจะให้ผลผลิต แตกต่างกัน ????? - เปรียบเทียบวิธีการสอน 5 วิธี จะทำให้ ผลสัมฤทธิ์ทางการเรียนของนักเรียน แตกต่างกันหรือไม่ ?????
ถ้าทำการเปรียบเทียบทีละ 2 กลุ่ม จะทำให้เกิด ปัญหา คือ 1. เสียเวลา 2 ถ้าทำการเปรียบเทียบทีละ 2 กลุ่ม จะทำให้เกิด ปัญหา คือ 1. เสียเวลา 2. จะทำให้ α (Type I Error) สูงขึ้นจากที่กำหนด 3. ไม่ถูกต้องตามหลักสถิติ ดังนั้นเราจึงควรทำการทดสอบค่าเฉลี่ยของประชากร ทั้งหมดพร้อมๆ กัน โดยมีสมมติฐาน ดังนี้ H0 : µ1= µ2 = ... = µk H1 : มี µ1 อย่างน้อย 1 กลุ่ม ที่แตกต่าง จากกลุ่มอื่น ๆ ; i =1,2,…,k
ซึ่งเรียกวิธีการดังกล่าวว่า การวิเคราะห์ความแปรปรวน (Analysis of Variance : ANOVA) ผู้คิดวิธีดังกล่าวเป็นนักสถิติชาวอังกฤษ ชื่อ Ronald A. Fisher จุดประสงค์ของการวิเคราะห์ความแปรปรวน คือ การเปรียบเทียบค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป
Definition การวิเคราะห์ความแปรปรวน (Analysis of variance) คือ วิธีการที่ใช้ในการเปรียบเทียบหรือวิธีการที่ใช้ในการ ทดสอบสมมติฐานเกี่ยวกับค่าเฉลี่ยของประชากรตั้งแต่ 3 กลุ่ม ขึ้นไป พร้อม ๆ กัน โดยในการวิเคราะห์ ความแปรปรวนนี้ ความแปรปรวนหรือความผันแปร ทั้งหมด (Total variation) ที่เกิดขึ้นในข้อมูลจะถูกแบ่ง ออกเป็นส่วนๆ ตามแหล่งกำเนิดหรือสาเหตุของการ เกิดความแปรปรวนนั้น
Technical Terms - ทรีทเมนต์ (Treatment) สิ่งหรือวิธปฏิบัติต่อวัตถุ ทดลอง เพื่อ ใช้ในการวัดผล เปรียบเทียบตามวัตถุประสงค์ของการทดลอง - วัตถุทดลอง (Experimental Material) วัตถุหรือสิ่งที่ ใช้ในการทดลอง - หน่วยทดลอง (Experimental Unit) สิ่งหนึ่งหรือกลุ่ม หนึ่งของวัตถุทดลองที่ได้รับ ทรีทเมนต์เดียวกัน - ค่าสังเกต (Observation) ค่าที่เก็บรวบรวมได้จากการ ทดลองหรือการสำรวจ ซึ่งจะเป็นข้อมูลที่นำมาวิเคราะห์เปรียบเทียบ
ตัวอย่างเช่น - การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษา คนไข้ - การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ใน การสอนนักเรียน - การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูก ข้าวพันธุ์หนึ่ง จากแต่ละตัวอย่างข้างต้น ปัจจัย (Factor) ที่สนใจ ศึกษา คืออะไร และอะไรคือ - Treatment - Experimental Material - Experimental Unit - Observations
ในการวิเคราะห์ความแปรปรวน จะต้องมีการวางแผนการ ทดลองซึ่งการวางแผน การทดลอง เป็นลักษณะของการจัด Treatment ให้กับ หน่วยทดลอง โดยสุ่ม (Randomization) ซึ่งมีอยู่หลาย design ในบทนี้ จะกล่าวเพียง 2 design เท่านั้น คือ 1. แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) 2. แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD)
แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) เป็นการวิเคราะห์ข้อมูลจากหน่วยทดลองที่ได้ จากการทดลองโดยใช้ปัจจัยที่ศึกษาเพียงปัจจัยเดียว (Single factor) แต่แบ่งเป็นหลายระดับหรือหลายชนิด ซึ่งชนิดหรือระดับของปัจจัยดังกล่าวก็คือ Treatment นั่นเอง
ตัวอย่างเช่น - การเปรียบเทียบยา 3 ชนิด ที่ใช้ในการรักษาคนไข้ - การเปรียบเทียบวิธีการสอน 5 วิธี ที่ใช้ในการสอน นักเรียน - การเปรียบเทียบปุ๋ย 4 สูตร ที่ใช้ในการปลูกข้าวพันธุ์ หนึ่ง
การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One – way ANOVA) แผนการทดลองแบบสุ่มตลอด (Completely Randomized Design : CRD) หลักการสำคัญของแผนการทดลองนี้ ใช้ในกรณีที่หน่วย ทดลองมีความสม่ำเสมอ หรือคล้ายคลึงกัน (Uniform ; Homogeneous) วิธีการจัด Treatment ให้แก่หน่วยทดลองจะใช้วิธีการสุ่ม ที่ทำให้หน่วยทดลองทุก ๆ หน่วยทดลอง มีโอกาสได้รับ Treatment ใด Treatment หนึ่ง เท่าๆ กัน ค่าข้อมูลที่ได้เชื่อว่าเกิด จากอิทธิพลของ Treatment เพียงอย่างเดียว การวิเคราะห์ความแปรปรวนในแผนการทดลองดังกล่าว บางครั้งจะเรียกว่า การวิเคราะห์ความแปรปรวนแบบจำแนกทางเดียว (One – way ANOVA)
ผังข้อมูล (Layout) ผังข้อมูลสำหรับการวางแผนแบบสุ่มตลอด
ข้อตกลงเบื้องต้น (Basic Assumptions) 1. ตัวอย่างทั้ง k กลุ่ม จะต้องเป็นตัวอย่างสุ่มจาก ประชากร k กลุ่ม และการกำหนด treatment ให้กับหน่วยทดลองต้องเป็นไปอย่างสุ่ม 2. ประชากรแต่ละกลุ่มเป็นอิสระกัน 3. ประชากรแต่ละกลุ่มมีการแจกแจงปกติมีค่าเฉลี่ย เท่ากับ และมีค่าความแปรปรวนเท่ากันหมด คือ ซึ่งอาจเขียนในรูปสัญลักษณ์ได้ว่า
พิจารณาค่าสังเกตแต่ละค่าที่รวบรวมได้จากหน่วยทดลองที่ j ของทรีทเมนต์ที่ i ว่ามีความแตกต่างกัน เนื่องมาจากสาเหตุใดบ้าง ซึ่งค่า สังเกต xij จะเขียนแสดงได้ดังนี้
โดยทั่วไป μ , πi และ εij จะไม่ทราบค่า ซึ่งจะใช้ ข้อมูลจากตัวอย่างหรือ จากการทดลองมาประมาณค่าเหล่านี้ แล้วจึงทำการ ทดสอบสมมติฐานว่าอิทธิพลของ Treatment ต่าง ๆ กัน k Treatments แตกต่างกันอย่างมีนัยสำคัญ หรือไม่ ซึ่งใช้ ............... (a)
หลักการวิเคราะห์ความแปรปรวน ต้องพยายามแยกความผันแปรทั้งหมด (Total variation) ที่เกิดขึ้นในการทดลอง ออกเป็นส่วนต่าง ๆ ตามแหล่งกำเนิดหรือตามสาเหตุ ของการเกิดความผันแปรนั้น ๆ จาก (a) ใส่ผลบวกและยกกำลังสองทั้งสองข้าง จะได้ว่า
สมมติฐานเพื่อการทดสอบ เป็นดังนี้
สถิติสำหรับทดสอบสมมติฐานกรณีนี้ คือ
ตัวอย่าง 8.1 ข้อมูลต่อไปนี้แสดงผลผลิตข้าวจากการ ใช้ยาปราบแมลงต้นข้าวชนิดต่างๆ โดยใช้แผนการ ทดลองแบบ CRD จงทดสอบว่ายาปราบแมลงทั้ง 7 ชนิด มีประสิทธิภาพแตกต่างกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05
ตัวอย่าง 8.2 ในการศึกษาเปรียบเทียบวิธีการพักฟื้น 4 วิธี ว่าจะมีผลทำให้ระยะเวลาที่แผลหลังการผ่าตัด ช่องท้องปิดสนิทแตกต่างกันหรือไม่จึงทำการสุ่มผู้ป่วย มา ศึกษา 24 คน ได้ข้อมูลดังนี้ จง วิเคราะห์ข้อมูลดังกล่าวที่ระดับนัยสำคัญ 0.05
วิธีทำ ให้ μA , μB , μC , μD แทน ระยะเวลาเฉลี่ยที่ ใช้ในการพักฟื้นด้วยวิธีต่างๆ ของคนไข้ที่ ได้รับการผ่าตัดช่องท้อง
คำนวณค่าต่าง ๆ ได้ดังนี้
ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)
การเปรียบเทียบเชิงพหุหรือ การเปรียบเทียบเชิงซ้อน (Multiple comparisons) 1. Fisher's Least Significant Difference (LSD) 2. Tukey ' s Procedure 3. Scheffe ' s Test 4. Duncan ' s New Multiple Range Test (DMRT) 5. Student - Newman - Keuls ' s Test (S-N- K)
1. Fisher's Least Significant Difference (LSD) สมมติว่าเปรียบเทียบระหว่าง treatment ที่ i และ treatment ที่ j
การเปรียบเทียบ
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาเฉลี่ยที่ใช้ในการพักฟื้น ของ คนไข้ที่ได้รับการผ่าตัดช่องท้องด้วยวิธี A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่น ๆ ไม่แตกต่างกัน
2. Tukey 's Procedure
การเปรียบเทียบ
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B แตกต่างกัน อย่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
3. Scheffe' s Test
การเปรียบเทียบ
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B แตกต่างกันอย่างมีนัยสำคัญ ทางสถิติที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการ พักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
4. Duncan's New Multiple Range Test (DMRT) คำนวณสถิติทดสอบ LSR (Least Significant Ranges) จากสูตร
การเปรียบเทียบ
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
5. Student - Newman - Keuls' s Test (S-N-K) คำนวณสถิติทดสอบ
การเปรียบเทียบ
สร้างตารางแสดงผลต่างของค่าเฉลี่ยแต่ละคู่ โดย เรียงลำดับค่าเฉลี่ยจากน้อยไปมาก สรุปได้ว่า ระยะเวลาที่แผลจะหายสนิทด้วยวิธีพักฟื้น แบบ A กับ แบบ B และวิธีพักฟื้นแบบ A กับ แบบ C แตกต่างกันอย่างมีนัยสำคัญทางสถิติ ที่ระดับนัยสำคัญ 0.05 สำหรับวิธีการพักฟื้นคู่อื่นๆ ไม่แตกต่างกัน
แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD) ในการทดลองบางครั้งไม่สามารถหาหน่วยทดลองที่มี ความเหมือนกันได้จำนวนมากพอ หรือหน่วยทดลองมีความแตกต่างกัน และเราทำการ ทดลองโดยวางแผนการทดลองแบบ สุ่มตลอด (CRD) จะทำให้การทดลองดังกล่าวไม่มี ประสิทธิภาพ เนื่องจากจะมีความ คลาดเคลื่อน ระหว่างหน่วยทดลองมาก ซึ่งอาจจะทำ ให้ผลการทดลองไม่ได้เนื่องมาจาก ทรีทเมนต์ที่เราต้องการศึกษาเพราะว่ามีตัวแปรหรือความผัน แปรอื่นเข้ามาเกี่ยวข้อง
แผนการทดลองแบบสุ่มในบล็อก (Randomized Complete Block Design : RCBD) --ต่อ-- ดังนั้น เพื่อขจัดปัญหาดังกล่าวเราจึงจำเป็นต้อง ขจัดตัวแปรหรือความผันแปรบางอย่างในหน่วยทดลองออก ก่อนก่อนที่จะให้ทรีทเมนต์กับหน่วยทดลอง นั่นคือ พยายามลดความคลาดเคลื่อนของการทดลองลงนั่นเอง โดยอาจจัดความผันแปรนั้นเป็นกลุ่มหรือบล็อก โดยหน่วย ทดลองที่อยู่ในบล็อกเดียวกันจะมีลักษณะเหมือนกัน ต่างบล็อกจะมีลักษณะต่างกันจุดประสงค์ของการวาง แผนการทดลองแบบสุ่มในบล็อกก็เพื่อลดความผันแปร เนื่องจากความแตกต่างของหน่วยทดลอง และทำให้เห็น อิทธิพลของทรีทเมนต์ชัดเจนขึ้น
Definition การทดลองแบบสุ่มในบล็อก หรือการทดลองแบบบล็อกสุ่ม หมายถึงการทดลองที่จัดให้หน่วยทดลองอยู่รวมกันเป็นพวกหรือเป็นกลุ่ม ซึ่งจะเรียกว่า บล็อก (Block) โดยที่ 1. หน่วยทดลองแต่ละหน่วยที่อยู่ในบล็อกเดียวกันต้องจะมีลักษณะคล้ายคลึงกัน (Homogeneous) และหน่วยทดลองที่อยู่ต่างบล็อกกันจะมีลักษณะแตกต่างกัน (Heterogeneous) และจำนวนหน่วยทดลองในแต่ละบล็อกจะต้องเท่ากับจำนวนทรีทเมนต์ที่ต้องการทดสอบ ซึ่งลักษณะเช่นนี้เรียกว่า เป็นการทดลองแบบบล็อกสมบูรณ์ (Complete Block) 2. การจัดสรรทรีทเมนต์ให้กับหน่วยทดลองในแต่ละบล็อกจะต้องเป็นไปอย่างสุ่ม
ผังข้อมูล (Layout) ผังข้อมูลสำหรับการวางแผนการทดลองแบบสุ่มในบล็อก
1. ข้อมูลแต่ละตัวเป็นตัวอย่างสุ่มขนาด 1 หน่วย จากประชากรแต่ละกลุ่ม ซึ่งมีทั้งหมด kb กลุ่ม 2. ประชากรแต่ละกลุ่มมีการแจกแจงปกติซึ่งมีค่าเฉลี่ย µij และค่าความแปรปรวน เท่ากันหมดคือเท่ากับ σ2 3. ทรีทเมนต์และบล็อกต้องมีคุณสมบัติเชิงบวกหรืออาจ กล่าวได้อีกนัยหนึ่งว่า ทรีทเมนต์และบล็อกไม่มีการกระทำ (interaction) ร่วมกัน
หรือ หรือ หรือ SSE = SST+ SSTr - SSB
ตารางการวิเคราะห์ความแปรปรวน (ANOVA Table)
สมมติฐานเพื่อการทดสอบ
สถิติที่ใช้ทดสอบสมมติฐาน คือ
ตัวอย่าง 8.3 ในการศึกษาคุณภาพของน้ำมันรถยนต์4 สูตร กับรถยนต์ที่มีขนาดกระบอกสูบเท่ากันของ 5 บริษัท คือ Ford, Honda, BMW, Nissan และ Toyota โดยใช้รถยนต์บริษัทละ 4 คัน เติมน้ำมันคันละ สูตร ๆ ละ 3 ลิตร แล้วนำไปทดลอง ด้วยความเร็ว และเส้นทางเดียวกันจนน้ำมันหมด หลังจากนั้นบันทึก ระยะทางที่รถแต่ละคันวิ่งได้ ข้อมูลปรากฏดังตาราง
ที่ระดับนัยสำคัญ 0.05 จงทดสอบว่าน้ำมันแต่ละสูตรมีผลทำให้ระยะทางที่รถแล่นได้แตกต่างกันหรือไม่และระยะทางที่รถยนต์แต่ละบริษัทแล่นได้แตกต่างกันหรือไม่