BASIC STATISTICS MEAN / MODE / MEDIAN / SD / CV
การวัดแนวโน้มสู่ส่วนกลาง เป็นการคำนวณทางสถิติที่ใช้มาก และเป็นที่นิยม ที่สุด โดยการหาค่าเฉลี่ยหรือค่ากลางของข้อมูล ซึ่ง สามารถใช้อธิบายลักษณะของข้อมูล ทำให้ทราบถึง การแจกแจงของข้อมูล เช่น ผลผลิตข้าวเฉลี่ยในภาค อีสาน เท่ากับ 350 กก.ต่อไร่ แต่วิธีที่นิยมกันมี 3 วิธี ดังนี้ ค่าเฉลี่ย (mean) มัธยฐาน (median) ฐานนิยม (mode)
HISTOGRAM 70 80 72 75 82 68 69 70 72 73 75 80 81 75 78 81 68 65 77 65 70 72 80 81 71 72 76 75 74 73 75 74 75 78 72 73 75 73 75 74 81 82 71 72 73 75 76 77 73 68 66 68 70 68 72 71 70 69 69 68
HISTOGRAM (2) Item จำนวน <66 3 66-68 6 69-70 8 71-72 10 73-74 9 75-76 11 77-78 4 >78
MODE MODE = ฐานนิยม = ค่าที่พบจำนวนมากที่สุดในชุดข้อมูล MODE = 76
จำนวนข้อมูลวิเคราะห์ = 60 ครึ่งหนึ่งของข้อมูล = 30 MEDIAN Item จำนวน สะสม 66 3 68 6 9 70 8 17 72 10 27 74 36 76 11 47 78 4 51 >78 60 จำนวนข้อมูลวิเคราะห์ = 60 ครึ่งหนึ่งของข้อมูล = 30 MEDIAN MEDIAN = มัธยฐาน = ค่าที่แบ่งข้อมูลออกเป็นสองส่วนเท่าๆกัน MEDAIN = 73
70 80 72 75 82 68 69 70 72 73 75 80 81 75 78 81 68 65 77 65 70 72 80 81 71 72 76 75 74 73 75 74 75 78 72 73 75 73 75 74 81 82 71 72 73 75 76 77 73 68 66 68 70 68 72 71 70 69 69 68 MEAN MEAN = ค่าเฉลี่ย = ค่าผลรวมหารด้วยจำนวนของข้อมูลทั้งหมด MEAN = 70 + 80 + 72 + ... + 69 + 69 +69 60 = 73.38
ค่าสถิติอธิบายข้อมูลโดยแสดงในรูปค่ากลาง 70 80 72 75 82 68 69 70 72 73 75 80 81 75 78 81 68 65 77 65 70 72 80 81 71 72 76 75 74 73 75 74 75 78 72 73 75 73 75 74 81 82 71 72 73 75 76 77 73 68 66 68 70 68 72 71 70 69 69 68 ค่าสถิติ MODE 76 MEDIAN 73 MEAN 73.38 ค่าสถิติอธิบายข้อมูลโดยแสดงในรูปค่ากลาง
ค่าสถิติอธิบายข้อมูลโดยแสดงความผันแปรหรือการกระจายของข้อมูล Standard Deviation ส่วนเบี่ยงเบนมาตรฐาน Variance ความแปรปรวน = SD2 ค่าสถิติอธิบายข้อมูลโดยแสดงความผันแปรหรือการกระจายของข้อมูล
2 2 - 3 = -1 1 3 3 - 3 = 5 5 - 3 = 4 4 - 3 = 1 - 3 = -2 Sum = 30 16 N = 10 N-1 = 9 MEAN = 3.0 Var = 1.78 SD =
การอธิบายการกระจายของข้อมูลด้วยค่า SD 68% ของข้อมูลอยู่ในช่วง mean+1SD 95% ของข้อมูลอยู่ในช่วง mean+2SD 99% ของข้อมูลอยู่ในช่วง mean+3SD การอธิบายการกระจายของข้อมูลด้วยค่า SD
น้ำหนักแรกเกิดของโคพื้นเมืองไทยมี ค่าเฉลี่ยเท่ากับ 12 กก น้ำหนักแรกเกิดของโคพื้นเมืองไทยมี ค่าเฉลี่ยเท่ากับ 12 กก. โดยมีค่าความ แปรปรวนเท่ากับ 4 กก. อธิบายได้ว่า อย่างไร หาค่า SD กำหนดความแปรปรวน = 4 ดังนั้น SD = = 2 68% ของข้อมูลอยู่ในช่วง 12+2 หรือ 10 – 14 กก. 95% ของข้อมูลอยู่ในช่วง 12+4 หรือ 8 – 16 กก. 99% ของข้อมูลอยู่ในช่วง 12+6 หรือ 6 – 18 กก.
QUIZ ขอนแก่น ร้อยเอ็ด ค่าเฉลี่ย = 85 ถัง/ไร่ ค่าเฉลี่ย = 85 ถัง/ไร่ ส่วนเบี่ยงเบนมาตรฐาน = 15 ถัง /ไร่ ค่าเฉลี่ย = 105 ถัง /ไร่ ส่วนเบี่ยงเบนมาตรฐาน = 35 ถัง /ไร่ จากผลผลิตข้าวต่อไร่ของสองจังหวัด 1. พื้นที่จังหวัดใดผลิตข้าวได้สูงกว่ากัน ? 2. พื้นที่จังหวัดใดผลิตข้าวได้สม่ำเสมอกว่ากัน ? 3. 95% ของข้อมูลที่สุ่มสำรวจในจังหวัดขอนแก่น ผลิตข้าวได้ในช่วงกี่ถังต่อไร่
Normal Non-Normal Non-Normal
2 2 - 3 = -1 1 3 3 - 3 = 5 5 - 3 = 4 4 - 3 = 1 - 3 = -2 Sum = 30 16 N = 10 N-1 = 9 MEAN = 3.0 Var = 1.78 SD =
Coefficient of Variation (CV) ค่าสัมประสิทธิ์ความผันแปร ใช้อธิบายความผันแปรของข้อมูลในรูปเปรียบเทียบกับค่าเฉลี่ย เนื่องจากตัวเลขมากน้อยของค่า SD ขึ้นอยู่กับหน่วยที่วัด ทำให้มองไม่ชัดเจนว่าข้อมูลมีการกระจายมากน้อยเพียงใด การเทียบ ในช่วง 0-100 ทำให้เห็นภาพชัดเจนขึ้น ใช้เปรียบเทียบกับค่ามาตรฐาน หรือความผันแปรระหว่างกลุ่ม
ผลผลิตข้าวต่อไร่ ขอนแก่น ร้อยเอ็ด ค่าเฉลี่ย = 85 ถัง/ไร่ ส่วนเบี่ยงเบนมาตรฐาน = 15 ถัง/ไร่ %CV = 17.65% ค่าเฉลี่ย = 105 ถัง/ไร่ ส่วนเบี่ยงเบนมาตรฐาน = 35 ถัง/ไร่ %CV = 33.33% เมื่อพิจารณาจาก %CV พื้นที่จังหวัดใดผลิตข้าวได้สม่ำเสมอกว่ากัน ?
ความสัมพันธ์ระหว่างค่ากลางทั้ง 3 ชนิด (ค่าเฉลี่ย มัธยฐาน และฐานนิยม) สำหรับการกระจายตัวแบบสมดุล การกระจายตัวของค่าเฉลี่ย มัธยฐานและฐานนิยม จะเหมือนกัน แต่ถ้าการมีการกระจายตัวไม่สมดุล ความสัมพันธ์ คือ ค่าเฉลี่ย-ฐานนิยม = 3 (ค่าเฉลี่ย – มัธยฐาน) ถ้าข้อมูลมีการแจกแจงแบบสมมาตร (Symmetry) หรือระฆังคว่ำที่สมมาตร โดยเส้นโค้งที่เกิดขึ้นทั้งสองด้านจะมีลักษณะเหมือนกัน โดยข้อมูลชุดนี้จะมีค่าเฉลี่ยเท่ากับมัธยฐาน และเท่ากับฐานนิยม
ในกรณีที่ข้อมูลมีการแจกแจงแบบไม่สมมาตร คือ มีลักษณะเบ้ข้างใดข้างหนึ่งนั้น ค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยมมีความแตกต่างกัน ดังนี้ ถ้าข้อมูลบางค่าสูงจะทำให้ค่าเฉลี่ยสูงกว่าค่ามัธยฐาน และค่าฐานนิยม ค่าเฉลี่ย>มัฐยฐาน>ฐานนิยม ถ้าข้อมูลบางค่าน้อยจะทำให้ค่าเฉลี่ยต่ำกว่าค่ามัธยฐานและค่าฐานนิยม ค่าเฉลี่ย<มัฐยฐาน<ฐานนิยม
ข้อดีและข้อเสียของมัธยฐาน 1) คำนวณง่าย เข้าใจง่าย 2) ค่ามัธยฐานไม่ถูกกระทบกระเทือนเมื่อมีข้อมูลผิดปกติ ข้อเสีย ใช้ได้กับข้อมูลเชิงปริมาณ เท่านั้น
หลักเกณฑ์ในการพิจารณาเลือกใช้ค่าเฉลี่ย มัธยฐาน และฐานนิยม ค่าเฉลี่ยควรใช้กับข้อมูลเชิงปริมาณมากกว่าเชิงคุณภาพ เนื่องจากใช้ข้อมูลทุกค่า ส่วนฐานนิยมนั้น ควรใช้กับข้อมูลเชิงคุณภาพ เท่านั้น มัธยฐานควรใช้กับข้อมูลเชิงปริมาณหรือข้อมูลเชิงคุณภาพ ที่สามารถจัดเรียงลำดับจากน้อยไปหามาก หรือมากไปหาน้อยได้ หรือใช้กับข้อมูลที่มีความแตกต่างกันอย่างเห็นได้ชัด หากเป็นข้อมูลที่ไม่ค่อยมีความแตกต่างกันมากนัก ไม่ควรใช้มัธยฐาน
หลักเกณฑ์ในการพิจารณาเลือกใช้ค่าเฉลี่ย มัธยฐาน และฐานนิยม ในกรณีศึกษานั้น มีข้อมูลที่มีการแจกแจงแบบสมมาตร การวัดค่าแนวโน้มสู่สวนกลางสามารถใช้ค่าเฉลี่ย มัธยฐาน และฐานนิยม อย่างใดอย่างหนึ่งก็ได้ เนื่องจากมีค่าเท่ากัน ถ้าข้อมูลที่มีการแจกแจงไม่เบ้มาก ยังคงใช้ค่าเฉลี่ยในการวัดได้ แต่ถ้าข้อมูลไม่ปกติหรือมีการเบ้ไปทางใดทางหนึ่งมาก ข้อมูลลักษณะนี้ ควรใช้ค่ามัธยฐาน เมื่อมีการการแจกแจงความถี่แล้ว อันตรภาคชั้นเป็นช่วงเปิด การหาแนวโน้มสู่สวนกลางโดยค่าเฉลี่ยไม่สามารถทำได้ แต่สามารถหาค่ามัธยฐานและฐานนิยมได้
Data set I Data set II Data set III 2 4 1 3 5 Mean 3.00 Min Max SD 1.15 0.47 1.94 Var. 1.33 0.22 3.78 CV 38.49 15.71 64.79
จงคำนวณหาค่าส่วนเบี่ยงเบนมาตรฐาน QUIZ ผลผลิตข้าวต่อไร่ ขอนแก่น ร้อยเอ็ด ค่าเฉลี่ย = 85 ถัง/ไร่ % CV = 17.65% ค่าเฉลี่ย = 105 ถัง /ไร่ % CV = 33.33% จงคำนวณหาค่าส่วนเบี่ยงเบนมาตรฐาน