Chapter 9: Chi-Square Test การทดสอบไคสแควร์
เนื้อหา: การทดสอบไคสแควร์ (Chi-Square Test) การทดสอบภาวะสารูปสนิทดี (Test for Goodness of Fit) การทดสอบความเป็นอิสระ (Test for Independence) การทดสอบความเหมือน (Test for Homogeneity)
ตัวแปรเชิงคุณภาพ (Qualitative Variable) เป็นตัวแปรที่ไม่สามารถวัดค่าข้อมูลของสิ่งที่เราสนใจ ออกมาเป็นตัวเลขได้ แต่สามารถจำแนกออกเป็น กลุ่ม พวก หรือ หมวดหมู่ได้และข้อมูลที่ได้จะ เรียกว่า ข้อมูลเชิงคุณภาพ (Qualitative Data or Categorical Data) เช่น ความคิดเห็น ชนิดของโรค กลุ่มเลือด ผลการรักษา เป็นต้น ซึ่งข้อมูลที่เก็บ รวบรวมได้จากตัวแปรเหล่านี้จะเป็นการนับจำนวนหรือ นับความถี่ของหน่วยข้อมูลที่ตกอยู่ในแต่ละกลุ่ม (Categories)
ข้อมูลที่อยู่ในรูปของความถี่ แบ่งเป็น 2 ลักษณะ 1. ข้อมูลจำแนกประเภททางเดียว (One – Dimensional Classification Data) เป็นการจัดข้อมูล ในลักษณะตารางแจกแจงความถี่แบบทางเดียว (One-Way Frequency Table) ที่ข้อมูลถูกจำแนกตาม ลักษณะใดลักษณะหนึ่งเพียงลักษณะเดียวหรือตัวแปร เดียว เช่น จำแนกข้อมูลตามตัวแปรกลุ่มเลือด
ข้อมูลที่อยู่ในรูปของความถี่ แบ่งเป็น 2 ลักษณะ (ต่อ) 2. ข้อมูลจำแนกประเภทสองทาง (Two –Dimensional Classification Data) เป็นการจัดข้อมูลในลักษณะ ตารางแจกแจงความถี่แบบสองทาง (Two-Way Frequency Table) ที่ข้อมูลถูกจำแนกตามลักษณะ 2 ลักษณะหรือ 2 ตัวแปร ซึ่งแต่ละตัวแปรจะแบ่งเป็น หลายกลุ่ม (Categories) เช่น ต้องการศึกษา ลักษณะของคนโดยจำแนกตามลักษณะสีของผมและสี ของตาจากตัวอย่างที่สุ่มมาจำนวน 500 คน ข้อมูล ดังตาราง
บทเรียนที่ผ่านมาเราทราบว่า การวิเคราะห์ข้อมูลเชิงคุณภาพหรือข้อมูลที่ไม่สามารถ วัดออกมาเป็นตัวเลขได้ สถิติพื้นฐานที่ใช้อธิบายลักษณะของข้อมูล มักใช้ - การหาค่าสัดส่วน หรือ ร้อยละของสิ่งที่สนใจ สำหรับสถิติอนุมาน จะเป็นการทดสอบสมมติฐานที่ เกี่ยวข้องกับค่าสัดส่วนของ สิ่งที่สนใจในประชากรหนึ่งกลุ่มหรือสองกลุ่ม จะใช้ สถิติทดสอบ Z โดยที่ตัวอย่าง ที่สุ่มมาศึกษามีขนาดใหญ่พอ
หรือบางครั้งมีกลุ่มเดียว แต่ถ้าเราต้องการทราบว่าการ แจกแจงความถี่ของข้อมูล นั้นเป็นแบบใดแบบหนึ่งหรือไม่หรือกรณีมีประชากร 2 กลุ่ม หรือ 2 ตัวแปร เราต้องการทราบว่าตัวแปร 2 ตัวนั้น มีความสัมพันธ์ กันหรือไม่เราไม่สามารถใช้ การทดสอบ Z ได้ วิธีที่เหมาะจะนำมาใช้ในการ ทดสอบปัญหาดังกล่าว สำหรับข้อมูลเชิงคุณภาพ คือ การทดสอบไคสแควร์
การทดสอบไคสแควร์ เป็นวิธีการทางสถิติที่ใช้ในการทดสอบสมมติฐานสำหรับ ข้อมูลที่ไม่สามารถวัดค่า ออกมาเป็นตัวเลขได้ข้อมูลที่จะนำมาวิเคราะห์จะอยู่ในรูป ความถี่ หรือข้อมูลที่ได้จาก การนับ
ในบทนี้จะกล่าวถึงการทดสอบไคสแควร์เพื่อใช้ทดสอบ สมมติฐานที่เกี่ยวกับเรื่อง ต่อไปนี้ 1. การทดสอบภาวะสารูปสนิทดี(Test for Goodness of Fit) 2. การทดสอบความเป็นอิสระ (Test for Independence) 3. การทดสอบความเหมือน (Test for Homogeneity)
การทดสอบภาวะสารูปสนิทดี Test for Goodness of Fit ข้อมูลที่ศึกษามีเพียงลักษณะเดียวหรือตัวแปรเดียว แต่ จำแนกได้หลายกลุ่ม(Categories) และเป็นการทดสอบ สมมติฐานเพื่อดูว่าความถี่ที่นับได้จากตัวอย่างในแต่ะกลุ่ม (Observed Frequency : Oi) กับความถี่ที่คาดว่าจะเป็น หรือความถี่ตามทฤษฎี (Expected Frequency : Ei) แตกต่างกันหรือไม่ซึ่งจะพิจารณา 2 ลักษณะ
การทดสอบภาวะสารูปสนิทดี 1. การทดสอบว่าลักษณะต่าง ๆ ของประชากรหรือตัว แปรที่จำแนก (Classify) เป็นไปตามอัตราส่วนที่คาดหวัง ไว้หรือไม่ (Fit Ratio)**** 2. การทดสอบว่าข้อมูลที่รวบรวมได้มีการแจกแจงของ ประชากรเป็นไปตามที่คาดหวังไว้ หรือไม่เช่น การแจกแจงปกติการแจกแจงทวินาม และ การแจกแจงปัวส์ซอง เป็นต้น
การทดสอบภาวะสารูปสนิทดี การทดสอบว่าลักษณะต่างๆ ของประชากรหรือตัวแปรที่ จำแนก (Classify) เป็นไปตาม อัตราส่วนที่คาดหวังไว้หรือไม่ (Fit Ratio)**** ตัวอย่าง 9.1 ต้องการทดสอบว่าลูกเต๋าลูกหนึ่งเป็นลูกเต๋าที่ เที่ยงตรงหรือไม่ จึงได้ทำการ ทดลอง โยนลูกเต๋าลูกนั้น 120 ครั้ง ได้ผลดังนี้ จงทดสอบว่าลูกเต๋านี้เที่ยงตรง หรือไม่ที่ระดับนัยสำคัญ 0.05
ที่ระดับนัยสำคัญ 0.05
ตัวอย่าง 9.2 จากการสำรวจคนไข้ที่มารับการรักษาที่ โรงพยาบาลแห่งหนึ่ง ในช่วงฤดูร้อน จำนวน 1,250 คน พบว่าคนไข้จะเป็นระบบทางเดินหายใจ ระบบ ทางเดิน อาหารและระบบประสาท จำนวน 175 , 365 และ 710 คนตามลำดับ จาก ข้อมูลจะสรุปได้หรือไม่ว่าอัตราส่วนของคนไข้ที่เป็นโรค ระบบทางเดินหายใจระบบทางเดินอาหาร และระบบ ประสาท เท่ากับ 2 : 3 : 6 ที่ระดับนัยสำคัญ 0.01
0.01
ตัวอย่าง 9.3 ตามทฤษฎีของเมนเดล ทราบว่าอัตรา ส่วนผสมระหว่างดอกเฟื่องฟ้าสีแดงและสีขาว เป็น 4: 1 นักวิจัยจึงทำการทดลองผสมพันธุ์ดอกเฟื่องฟ้าครั้งหนึ่งได้ ลูกผสม 120 ต้น โดยเป็นดอกเฟื่องฟ้าสีแดง 87 ต้น และสีขาว 33 ต้น ที่ระดับนัยสำคัญ 0.05 จง ทดสอบว่าการผสมพันธุ์ดอกเฟื่องฟ้าครั้งนี้เป็นไป ตาม ทฤษฎีของเมนเดลหรือไม่
การทดสอบความเป็นอิสระ (Test for Independence) เป็นการศึกษาข้อมูลของประชากรที่เกี่ยวข้องกับลักษณะที่ สนใจสองลักษณะหรือ ตัวแปรสองตัว (สมมติแทนด้วยตัวแปร X และตัวแปร Y) โดยที่ตัวแปรแต่ละตัวอาจจำแนก ได้หลายกลุ่ม (Categories) วัตถุประสงค์เพื่อศึกษา ความสัมพันธ์หรือความเป็นอิสระ ระหว่างตัวแปรสองตัวดังกล่าว สมมติว่าตัวแปร X จำแนกได้ r กลุ่ม และตัวแปร Y จำแนกได้ c กลุ่ม ข้อมูลที่ได้จะอยู่ในรูปของตารางแจก แจงความถี่สองทางซึ่งแสดง ความสัมพันธ์ระหว่างตัวแปรที่เรียกว่า ตารางการณ์จร (Contingency Table) ขนาด rxc
ตัวอย่าง 9.4 ในการศึกษาว่าจะมีความสัมพันธ์ระหว่าง พฤติกรรมการสูบบุหรี่ของผู้ชายกับการเป็นโรคความดัน โลหิตสูงหรือไม่ผู้ศึกษาได้สุ่มตัวอย่างผู้ชายมา 200 คน จำแนกข้อมูลได้ดังตาราง จงวิเคราะห์ข้อมูล ดังกล่าวที่ระดับ นัยสำคัญ 0.05
ตัวอย่าง 9.5 ในการศึกษาว่าจะมีความสัมพันธ์ระหว่าง พฤติกรรมการสูบบุหรี่กับการเป็นมะเร็งที่ปอดหรือไม่ผู้ ศึกษาได้สุ่มตัวอย่างมา 300 คน จำแนกข้อมูลได้ ดังตาราง จงวิเคราะห์ข้อมูลดังกล่าวที่ระดับนัยสำคัญ 0.01
การทดสอบความเหมือน (Test for Homogeneity) เป็นการศึกษาประชากรที่สนใจ r กลุ่ม ที่อิสระกัน (r ≥ 2) ซึ่งประชากร แต่ละกลุ่ม จะถูกจำแนกเป็นลักษณะต่างๆ c ลักษณะ (Categories) ต้องการศึกษาว่าสัดส่วนของ แต่ละลักษณะในประชากรทุกกลุ่มแตกต่างกันหรือไม่ถ้า สัดส่วนของแต่ละลักษณะที่ จำแนกของทุกประชากรไม่แตกต่างกัน แสดงว่า ประชากรนั้นมีการแจกแจงของลักษณะ ที่จำแนกเหมือนกันหรืออาจกล่าวได้ว่าประชากรเหล่านั้นมี ความเป็นเอกพันธ์หรือมีความ เหมือนกัน ดังนั้นในหัวข้อนี้จึงมีวัตถุประสงค์เพื่อศึกษา ความเหมือนของประชากรนั่นเอง เรียกการศึกษาเรื่องนี้ว่า การทดสอบความเป็นเอกพันธ์ หรือการทดสอบความ เหมือน (Test of Homogeneity)
ข้อสังเกต การคำนวณค่าความถี่ที่คาดว่าจะเป็นในแต่ละเซลและการ คำนวณค่าสถิติทดสอบ X2 ในหัวข้อการทดสอบความเหมือนจะเหมือนกับหัวข้อการ ทดสอบความเป็นอิสระของ สองตัวแปร แต่วัตถุประสงค์ในการศึกษาและการได้มาซึ่ง ข้อมูลเพื่อการวิเคราะห์จะ แตกต่างกัน ????
ตัวอย่าง 9.6 จากการทดลองโดยการนำเชื้อชนิดหนึ่ง เลี้ยงในอาหารที่มีวิตามินแตกต่างกัน 4 ชนิด คือ niacinamide(NA), folic acid(FA), p- aminobenzoicacid(Paba) และ B6 ใน ความเข้มข้น 10 g/ml ฉีดให้กับหนูที่ไม่เคยได้รับเพนนิซิ ลินมาก่อนจำนวน 40, 40, 50 และ 40 ตัว ตามลำดับปรากฏผลดังตาราง จงทดสอบสัดส่วนของหนูที่จะมีชีวิตรอดและตายที่ได้รับการ ฉีดอาหารทั้ง 4 ชนิดเท่ากันหรือไม่ที่ระดับนัยสำคัญ 0.05
ที่ระดับนัยสำคัญ 0.05