การวิเคราะห์ข้อมูลโดยสถิติเชิงพรรณนา (Descriptive Statistics) เป็นสถิติเกี่ยวกับการเก็บรวบรวมข้อมูลจากตัวอย่างประชากร แล้วนำเสนอข้อมูล การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นการหาค่าเฉลี่ย เพื่อต้องการทราบว่าข้อมูลที่เก็บรวบรวมมามีค่าใดที่เป็นค่ากลาง การวัดแนวโน้มเข้าสู่ส่วนกลางของข้อมูลที่ไม่ได้แจกแจงความถี่ 1. ข้อมูลระดับนามมาตรา (Nominal scale) ใช้ฐานนิยม (Mode) 2. ข้อมูลระดับมาตรา (Ordinal scale) ใช้มัธยฐาน (Median) 3. ข้อมูลระดับช่วงมาตรา (Interval scale) และอัตราส่วน(Ratio scale) ใช้ค่าเฉลี่ย (Mean) สัญญลักษณ์ x
มัธยฐาน ( Median แทนด้วยสัญญลักษณ์ Mdn) คือ ค่าที่อยู่ตรงตำแหน่งกลางในการแจกแจงข้อมูล เมื่อข้อมูลนั้น ๆ มีการเรียงลำดับ (จากมากไปหาน้อย หรือ จากน้อยไปหามาก) เช่น ค่าคะแนนของนิสิต 1 4 2 6 8 5 9 10 7 - 1 2 4 5 6 7 8 9 10 ตำแหน่งของข้อมูลตรงกลาง n+1 = 9+1= 5 , Mdn = 6 2 2 แต่ถ้าจำนวนข้อมูลเป็นคู่ จะได้ค่า Mdn 2 ตัว ให้นำ Mdn 2 ตัวมาบวกกันแล้วหารสอง 1 5 4 3 8 9 10 6 4 10 - 1 3 4 4 5 6 8 9 10 10 ตำแหน่งข้อมูลตรงกลาง = 10+1 = 5.5 , Mdn = 5+6 = 5.5 2 2
ฐานนิยม (Mode แทนด้วยสัญญลักษณ์ Mo ) คือ ค่าของข้อมูลที่มีความถี่มากที่สุดของข้อมูลชุดหนึ่ง ๆ เช่น ค่าคะแนนของนิสิต 10 10 15 15 15 17 18 18 19 ฐานนิยม คือ 15 ข้อมูลระดับช่วงมาตรา (Interval scale) และ อัตราส่วนมาตรา (Ratio Scale) ใช้ค่ามัชฌิมเลขคณิต (Arithmetic mean) หรือ ค่าเฉลี่ย (Mean) สัญญลักษณ์x ค่าเฉลี่ย = ผลรวมของคะแนนทั้งหมด แล้วหารด้วยจำนวนข้อมูล
การวัดแนวโน้มเข้าสู่ส่วนกลางสำหรับข้อมูลที่อยู่ใน ตารางแจกแจงความถี่ (Grouped data) ข้อมูลระดับนามมาตรา (Nominal scale) ใช้ฐานนิยม (Mode,Mo)
2. ข้อมูลระดับมาตรา (Ordinal scale) ใช้มัธยฐาน (Median,Mdn) 3. ข้อมูลระดับช่วงมาตรา (Interval scale) / อัตราส่วนมาตรา (Ratio scale) ใช้ค่าเฉลี่ย(Mean,X)
การพรรณนาข้อมูลโดยการวัดการกระจาย (Measure of Variability or Dispersion) 1.การวัดการกระจายสำหรับข้อมูลที่ไม่ได้แจกแจงความถี่ ข้อมูลระดับนามมาตรา (Nominal scale) ใช้เปอร์เซ็นต์ ข้อมูลระดับ (Ordinal scale) ใช้ค่าพิสัย หรือ ส่วนเบี่ยงเบนควอไทล์ (Interquartile)
ข้อมูลระดับช่วงมาตรา (Interval scale) อัตราส่วนมาตรา (Ratio scale) -ใช้ค่าส่วนเบี่ยงเบนมาตรฐาน (standard deviation S, S.D.) -ค่าความแปรปรวน (variance หรือ S) -ค่าสัมประสิทธิ์แห่งความแปรผัน (coefficient of variation หรือ C.V)
ค่าพิสัย (Range) พิสัย เป็นค่าความแตกต่างระหว่างค่าสูงสุด กับค่าต่ำสุดของข้อมูลชุดหนึ่ง ๆ สูตร พิสัย = ค่าข้อมูลสูงสุด- ค่าข้อมูลต่ำสุด ใช้กับข้อมูลระดับช่วงมาตรา (Interval scale) ข้อจำกัด คือ ไม่สามารถเปรียบเทียบการกระจาย ของตัวแปรที่แตกต่างกัน
ค่าส่วนเบี่ยงเบนควอไทล์ (Interquartile , Q) คือ ค่าที่แสดงให้เห็นว่าข้อมูล 50% ตรงกลางของข้อมูลทั้งหมด แตกต่างกันเท่าไร ค่า Interquartile หาได้จากค่า Q3 ลบด้วย Q1 แล้วหารด้วย 2 Q1 คือ ค่าของข้อมูลที่แสดงให้ทราบว่ามี 25%หรือ1/4ของข้อมูลที่มีค่าต่ำกว่าหรือเท่ากับค่านี้ Q2 คือ ค่าของข้อมูลที่แสดงให้ทราบว่ามี50%หรือ 1/2ของข้อมูลที่มีค่าต่ำกว่าหรือเท่ากับ ค่านี้ หรือ ค่ามัธยฐาน Q3 คือ ค่าของข้อมูลที่แสดงให้ทราบว่ามี75% หรือ3/4ของข้อมูลที่ต่ำกว่าหรือเท่ากับค่านี้ Q4 คือ ค่าข้อมูลสูงสุดของการกระจาย เป็นค่าของข้อมูลที่แสดงให้ทราบว่ามี 100%ของข้อมูล ที่มีค่าต่ำกว่าหรือเท่ากับค่านี้
ค่าส่วนเบี่ยงเบนมาตรฐาน คือ ค่ารากที่สองของผลรวมของความแตกต่างระหว่าง ข้อมูลดิบกับค่าเฉลี่ยยกกำลังสอง(sum of squares ของผลต่าง) หารด้วยจำนวนทั้งหมด ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลประชากร ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลกลุ่มตัวอย่าง
ค่าความแปรปรวน (variance) คือ ค่าผลรวมของผลต่างระหว่าง คะแนนดิบกับค่าเฉลี่ยยกกำลังสอง (sum of squaresของผลต่าง) แล้วหารด้วยจำนวนข้อมูลทั้งหมด ค่าสัมประสิทธิ์แห่งความแปรผัน (Coefficient of Variation, C.V.) การเปรียบเทียบการกระจายของข้อมูลตั้งแต่สองกลุ่มขึ้นไป ที่มีหน่วยการวัดหรือ มีค่าเฉลี่ยแตกต่างกัน
ค่ามากแสดงว่าข้อมูลมีการกระจายมาก ค่าน้อยแสดงว่าข้อมูลมีการกระจายน้อย
การวัดการกระจายสำหรับข้อมูลที่อยู่ในรูปตารางแจกแจงความถี่ ข้อมูลระดับนามมาตรา (nominal scale) ใช้ดัชนีของความกระจาย (Index of dispersion,D) ข้อมูลระดับมาตรา (ordinal scale) ใช้พิสัย(range) หรือ ค่าส่วนเบี่ยงเบนควอไทล์(Interquartile) ข้อมูลระดับช่วงมาตรา (interval scale)/ อัตราส่วนมาตรา(ratio scale) ใช้ส่วนเบี่ยงเบนมาตรฐาน (standard deviation, s) ความแปรปรวน(variance, s) สัมประสิทธิ์แห่งความแปรผัน (coefficient of variation, C.V.)