การวัดแนวโน้มเข้าสู่ส่วนกลาง
การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of central tendency) การใช้ตัวเลขเพียงตัวเดียวหรือค่าใดค่าหนึ่งเพื่อเป็นตัวแทนและบรรยายลักษณะข้อมูลแต่ละชุด เพื่อสะดวกในการจดจำและสรุปเรื่องราวที่สำคัญของข้อมูลชุดนั้น
วิธีการวัดแนวโน้มเข้าสู่ส่วนกลาง ตัวกลางเลขคณิต (Arithmetic mean) มัธยฐาน (Median) ฐานนิยม (Mode)
ตัวกลางเลขคณิต ค่าเฉลี่ย (Mean) หรือตัวกลาง คือค่าที่ได้จากการเอาผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลทั้งหมด สัญลักษณ์คือ x (อ่านว่า เอ็กซ์-บาร์) ของกลุ่มตัวอย่าง
ค่าเฉลี่ยของข้อมูลที่ยังไม่ได้แจกแจงความถี่ X = X n X แทน ผลรวมทั้งหมดของข้อมูล N แทน จำนวนข้อมูลทั้งหมดของ กลุ่มตัวอย่าง (กรณีกลุ่มตัวอย่าง)
กรณีกลุ่มประชากร = X N X แทน ผลรวมทั้งหมดของข้อมูล N แทน จำนวนข้อมูลทั้งหมดของ ประชากร
จงหาค่าเฉลี่ยของน้ำหนักของบรรณารักษ์ 5 คน 45 50 55 60 65 (45+50+55+60+65)/5 275/5 55
ค่ากลางของข้อมูลที่มีการแจกแจงความถี่ X = fX N N= f
X 45 50 55 60 65 f 5 4 3 2 1 N=f=15 fX 225 200 165 120 65 fX=775 775/15 = 51.667
ความพึงพอใจต่อบริการสืบค้น E-Journal X f fX มากที่สุด 5 5 25 มาก 4 5 20 ปานกลาง 3 10 30 น้อย 2 15 30 น้อยที่สุด 1 20 20
f=N =5+5+10+15+20 =55 fX = 25+20+30+30+20 X =125/55 =2.273
ค่าเฉลี่ยข้อมูลที่ได้แจกแจงความถี่แบบจัดกลุ่ม ใช้สูตรเดียวกันกับข้อมูลแจกแจงความถี่แบบไม่จัดกลุ่ม คือ X = fX N N= f แต่แทนค่า X ด้วยค่ากึ่งกลางของแต่ชั้น (ขีดจำกัดล่างบวกขีดจำกัดบน หารด้วยสอง)
ประสบการณ์ทำงานของบรรณารักษ์ ช่วงปี X f fX 1-5 3 20 60 6-10 8 15 120 11-15 13 10 130 16-20 18 5 90 21-25 23 5 115
N = f = 20+15+10+5+5 = 55 fX = 60+120+130+90+115 = 515 X = 515/55 = 9.364
คุณสมบัติที่สำคัญของค่าเฉลี่ย ผลรวมของความต่างระหว่างข้อมูลแต่ละตัวจากค่าเฉลี่ยของคะแนนชุดนั้นมีค่าเท่ากับ 0 ผลรวมของความต่างกำลังสองของข้อมูลแต่ละตัวจากจำนวน M จะน้อยที่สุดเมื่อ M เท่ากับค่าเฉลี่ยของข้อมูลชุดนั้น
ค่าเฉลี่ยหรือตัวกลางของข้อมูลชุดใดๆ จะอยู่ระหว่างข้อมูลที่มีค่ามากสุดและข้อมูลที่มีค่าน้อยสุด ในกรณีที่ข้อมูลทุกตัวเพิ่มขึ้นหรือลดลงเท่าๆ กัน ค่าเฉลี่ยของข้อมูลจะเปลี่ยนไปตามค่านั้น ถ้าข้อมูลทุกตัวหารหรือคูณด้วยค่าคงที่ตัวหนึ่ง ค่าเฉลี่ยจะเปลี่ยนไปเท่ากับค่าเฉลี่ยเดิมหารหรือคูณด้วยค่าคงที่ตัวนั้นๆ
มัธยฐาน (Median/Mdn/Md) ค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลทั้งชุด เมื่อเรียงข้อมูลจากมากไปหาน้อยหรือจากน้อยไปหามาก ค่าที่แสดงให้ทราบว่ามีจำนวนข้อมูลที่มากกว่าและน้อยกว่าค่านี้อยู่ประมาณ 50 % (แบ่งข้อมูลออกเป็นสองฝ่ายเท่าๆ กัน)
55 คือค่ามัธยฐานของน้ำหนักของบรรณารักษ์ แสดงให้ทราบว่า มีบรรณารักษ์ 50 % ที่มีน้ำหนักมากกว่า 55 Kg และ มีบรรณารักษ์ 50% ที่มีน้ำหนักน้อยกว่า 55 Kg
ค่ามัธยฐานข้อมูลที่ไม่ได้แจกแจงความถี่ นำข้อมูลเรียงจากมากไปน้อย หรือน้อยไปมา มัธยฐานคือข้อมูลตัวที่อยู่กึ่งกลางของชุดนั้น 2 3 4 5 6 7 มัธยฐานคือ 4
ถ้าข้อมูลเป็นเลขคู่ มัธยฐานคือผลบวกข้อมูลสองตัวที่อยู่กึ่งกลางหารด้วยสอง 2 4 6 8 มัธยฐานคือ 4+6 / 2 คือ 5
การใช้ค่ามัธฐานแทนค่าเฉลี่ยในกรณีที่ข้อมูลทั้งชุดที่มีค่าใดค่าหนึ่งต่างจากกลุ่มมาก เช่น วันลา 2 3 4 5 6 42 ค่าเฉลี่ย = มัธยฐาน =
1 3 5 7 9 11 13 2 3 4 7 8 10 45 1 3 7 9 10 2 4 7 9 30 2 4 6 8 10 12 1 2 3 6 8 11 13 30
ฐานนิยม (Mode/Mo) คือค่าของข้อมูลตัวหนึ่งที่มีความถี่สูงที่สุด หรือ ค่าที่ปรากฏบ่อยที่สุด 1 2 2 3 3 4 4 4 4 1 2 2 3 3 3 4 4 4 1 2 3 4 5 6 7 8 9
ประสบการณ์ทำงานของบรรณารักษ์ X f 3 20 ฐานนิยม คือ 8 15 13 10 18 5 23 5
ข้อมูลที่จัดกลุ่ม ฐานข้อมูล คือค่ากลางของชั้นคะแนนที่มีความถี่สูงสุด ช่วงปี X f 1-5 3 20 ฐานนิยมคือ 6-10 8 15 11-15 13 10 16-20 18 5 21-25 23 5
ประโยชน์ของฐานนิยม ใช้วัดแนวโน้มเข้าสู่ส่วนกลางของข้อมูลที่อยู่ในมาตรานามบัญญัติ (Nominal scale) หรือข้อมูลเชิงคุณภาพ (Qualitative data) ซึ่งไม่สามารถหาค่าเฉลี่ยหรือมัธยฐานได้
ถ้าต้องการวัดแนวโน้มเข้าสู่ส่วนกลางของข้อมูลต่อไปนี้ นักศึกษา มร.ชอบพรรคการเมืองใดมากที่สุด ไทยรักเธอ 5 ประชาเบ่งบาน 4 มหาประชา 2 ชาติเธอ 3 ฐานนิยมคือ พรรคไทยรักเธอ
ข้อมูลนักแสดงหญิงคนโปรดของคนอายุ 40 ขึ้นไป จารุณี 5 หมื่น เนาวรัตน์ 4 หมื่น สุพรรณษา 3 หมื่น จินตรา 6 หมื่น ฐานนิยม คือ จินตรา
โค้งปกติ (Normal Curve) X, Mdn, Mo
โค้งเบ้ขวา Mo, Mdn, X
โค้งเบ้ซ้าย X, Mdn, Mo
แบบฝึกหัด จงหาค่าเฉลี่ย มัธยฐานและฐานนิยมของข้อมูลต่อไปนี้ 5 4 7 6 9 11 21 22 11 12 4 4 5 5 3 8 10 12 14 16 8
จงหาค่าเฉลี่ย และฐานนิยมของข้อมูลต่อไปนี้ จงหาค่าเฉลี่ย และฐานนิยมของข้อมูลต่อไปนี้ ช่วงคะแนน ความถี่ 1-3 2 4-6 3 7-9 4 10-12 2 13-15 1