Chapter 3: Measures of Central Tendency and Measure of Dispersion การวัดแนวโน้มเข้าสู่ ส่วนกลางและการวัด การกระจาย
เนื้อหา: การวิเคราะห์ข้อมูล การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดตำแหน่งข้อมูล การวัดการกระจายข้อมูล ความเบ้และความโด่ง
การวิเคราะห์ข้อมูล (Analysis of Data) การวิเคราะห์ข้อมูล หมายถึง การนำข้อมูลที่เก็บ รวบรวมได้ จากกลุ่มตัวอย่างหรือจากประชากรการ วิจัยจำนวนหนึ่ง มาจำแนกเพื่อตอบประเด็นปัญหา การวิจัย หรือทดสอบสมมุติฐานการวิจัยให้ครบทุกข้อ ถ้าข้อมูลเชิงปริมาณหรือเป็นตัวเลข ผู้วิจัยจะใช้ วิธีการทางสถิติสรุปรวมข้อมูล แต่ถ้าเป็นข้อมูลเชิงคุณภาพ ผู้วิจัยจะใช้วิธีการสรุป ความ หรือสังเคราะห์ข้อความ
Analysis of Data กรณีข้อมูลเชิงคุณภาพ การวิเคราะห์ข้อมูลกรณีนี้ มักจะพิจารณาความถี่ ของแต่ละกลุ่ม ว่าเป็นเท่าใด หรือพิจารณาเปอร์เซ็นต์ ของความถี่สัมพัทธ์แต่ละกลุ่ม คำนวณค่าความถี่สัมพัทธ์ (Relative frequency): กรณีข้อมูลเชิงคุณภาพ (Qualitative data or Categorical data)
Analysis of Data ตารางที่ 3.1 ผลการสำรวจความคิดเห็นของนิสิต เกี่ยวกับการเป็นมหาวิทยาลัยในกำกับของรัฐ ของ มหาวิทยาลัยมหาสารคาม ความคิดเห็น ความถี่ (f) ความถี่สัมพัทธ์ (rf) % rf เห็นด้วย 152 0.543 54.3 ไม่เห็นด้วย 77 0.275 27.5 ไม่มีความเห็น 51 0.182 18.2 รวม 280 1.000 100.0
กรณีข้อมูลเชิงปริมาณ (Quantitative data or Numerical data) Analysis of Data กรณีข้อมูลเชิงปริมาณ (Quantitative data or Numerical data) การวิเคราะห์ข้อมูลกรณีนี้ มักจะพิจารณา - การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency) - การวัดตำแหน่งข้อมูล (Measures of Position) - การวัดการกระจาย (Measures of Dispersion)
การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency) Analysis of Data - ค่าเฉลี่ย หรือ ค่ากลางเลขคณิต หรือ ค่ามัชฌิมเลข คณิต (Mean or Arithmetic Mean or Average) - มัธยฐาน (Median) - ฐานนิยม (Mode) - กึ่งพิสัย (Midrange) การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)
(Measures of Position) Analysis of Data - ควอไทล์(Qurtile) - เดไซล์(Decile) - เปอร์เซ็นต์ไทล์(Percentile) การวัดตำแหน่งข้อมูล (Measures of Position)
(Measures of Dispersion) Analysis of Data - พิสัย (Range) - พิสัยระหว่างควอไทล์ (Interquartile Range) - ส่วนเบี่ยงเบนควอไทล์(Quartile Deviation) - ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation) - ความแปรปรวน (Variance) - ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) - สัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) การวัดการกระจาย (Measures of Dispersion)
Analysis of Data Measures of Shape -การวัดความเบ้ (Skewness) - การวัดภาวะยอดมน (Kurtosis) Measures of Shape
การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)
Mean (Arithmetic Mean) - เป็นค่ากลางที่สำคัญ นิยมใช้มาก และนำไป ประยุกต์ในการคำนวณค่าต่าง ๆ มาก - ค่ามัชฌิมเลขคณิตเหมาะที่จะใช้กับข้อมูลที่มีการ กระจายสม่ำเสมอ - ถ้ามีข้อมูลบางตัวมีค่าสูงหรือต่ำผิดปกติไป (Extreme values) ไม่ควร วัดค่ากลางของข้อมูลด้วยค่ามัชฌิมเลขคณิต เพราะ การคำนวณค่ากลาง โดยวิธีนี้ใช้ ข้อมูลทุกตัว ซึ่งจะรวมเอาค่าที่ผิดปกติไปคำนวณด้วย การหาค่าเฉลี่ยเลขคณิตแบ่งออกเป็น 2 กรณี คือ ก) กรณีข้อมูลไม่แบ่งกลุ่ม (Ungrouped Data) ข) กรณีข้อมูลแบ่งกลุ่ม (Grouped Data)
Ungrouped Data ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลประชากร (Population mean) เขียนแทนด้วย
Ungrouped Data ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลตัวอย่าง (Sample mean) เขียนแทนด้วย
Ungrouped Data ตัวอย่าง 3.1 บริษัท สากลการไฟฟ้า จำกัด ซึ่งเป็น บริษัทจำหน่ายเครื่องใช้ไฟฟ้ามีรายได้ ระหว่างปี พ.ศ. 2557 ถึง 2561 เท่ากับ 25, 28, 19, 14 และ 24 ล้านบาท ตามลำดับ จงคำนวณหาค่าเฉลี่ยเลขคณิต ของรายได้
Ungrouped Data ตัวอย่าง 3.2 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลา เท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จง คำนวณหาค่าเฉลี่ยเลขคณิตของค่าตอบแทน ล่วงเวลาจากกลุ่มตัวอย่างคนงานโรงงานแห่งนี้
Ungrouped Data วิธีทำ จากสูตรการคำนวณหาค่าเฉลี่ย = = = 2,846
Ungrouped Data ตัวอย่าง 3.3 ข้อมูล 2 ชุดข้อมูล ข้อมูลชุดที่ 1. ข้อมูลเป็นดังนี้ 1, 3, 5, 7, 9 ข้อมูลชุดที่ 2. ข้อมูลเป็นดังนี้ 1, 3, 5, 7, 14
Grouped Data ค่าเฉลี่ยประชากร (Population mean) ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลประชากร (Population mean) เขียนแทนด้วย µ
Grouped Data ค่าเฉลี่ยตัวอย่าง (Sample mean) ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลตัวอย่าง (Sample mean) เขียนแทนด้วย
Grouped Data ตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน เป็นดังนี้ 171 157 163 170 173 168 167 164 169 178 161 165 160 166 155 174 175 172 156 158 152 177 159 Min = 152 Max = 178
Grouped Data สร้างตารางแจกแจงความถี่ โดย เรียงลำดับข้อมูลจากน้อยไปหามาก เพื่อหาค่าสูงสุด = 178 และค่าต่ำสุด = 152 หาพิสัย (Range) = 178 - 152 = 26 กำหนดจำนวนชั้น = 6 อันตรภาคชั้น = 26/6 = 4.33 ~ 5 หาขีดจำกัดล่าง 150 | 155 | 160 | 165 | 170 | 175 หาขีดจำกัดบน 154 | 159 | 164 | 169 | 174 | 179 หาจุดกึ่งกลางชั้น Mid-point (X)
Grouped Data ตารางแจกแจงความถี่ คำนวณหาค่าเฉลี่ย จากสูตร Cm. ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 1413 160-164 159.5-164.5 162 8 1296 165-169 164.5-169.5 167 13 2171 170-174 169.5-174.5 172 16 2752 175-179 174.5-179.5 177 3 531 รวม 50 8315 คำนวณหาค่าเฉลี่ย จากสูตร Cm.
Grouped Data ตัวอย่าง 3.5 ข้อมูลค่าใช้จ่ายรายวันของคนงานจำนวน 80 คน เป็นดังนี้ 65 78 66 51 32 64 48 60 68 31 36 56 45 50 55 70 46 57 44 71 79 43 75 30 59 40 49 72 54 61 47 38 39 52 37 Min = 79 Max = 30
Grouped Data คำนวณหาค่าเฉลี่ย จากสูตร ค่าใช้จ่าย ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx 28-32 27.5-32.5 30 6 180 33-37 32.5-37.5 35 2 70 38-42 37.5-42.5 40 5 200 43-47 42.5-47.5 45 9 405 48-52 47.5-52.5 50 17 850 53-57 52.5-57.5 55 13 715 58-62 57.5-62.5 60 10 600 63-67 62.5-67.5 65 7 455 68-72 67.5-72.5 8 560 73-77 72.5-77.5 75 1 78-82 77.5-82.5 80 160 รวม 4270 คำนวณหาค่าเฉลี่ย จากสูตร
ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสำหรับข้อมูลประชากร เขียนแทนด้วย คำนวณได้ดังนี้
ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสำหรับข้อมูลตัวอย่าง เขียนแทนด้วย คำนวณได้ดังนี้
ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ตัวอย่าง 3.6 ภาคเรียนที่ 1/2561 สมศักดิ์ลงทะเบียน 5 วิชา ได้เกรด ดังนี้ วิชาสถิติ จำนวน 3 นก. ได้เกรด A วิชาภาษาอังกฤษ จำนวน 3 นก. ได้เกรด C วิชาฟิสิกส์ จำนวน 4 นก. ได้เกรด C+ วิชาคอมพิวเตอร์ จำนวน 3 นก. ได้เกรด B วิชาพลศึกษา จำนวน 1 นก. ได้เกรด A ภาคเรียนนี้ สมศักดิ์ ได้เกรดเฉลี่ยเท่าใด
ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) วิชา หน่วยกิต (นน.ถ่วง) (wi) เกรด ค่าระดับคะแนน (xi) wixi สถิติ 3 A 4 12 ภาษาอังกฤษ C 2 6 ฟิสิกส์ C+ 2.5 10 คอมพิวเตอร์ B 9 พลศึกษา 1 รวม 14 41 คำนวณหาค่าเฉลี่ยจากสูตร
ค่าเฉลี่ยรวม (Combined mean)
ค่าเฉลี่ยรวม (Combined mean) ตัวอย่าง 3.7 สมมติน้ำหนักเฉลี่ยของผู้ป่วยเด็กอายุต่ำกว่า 10 ปีที่เข้ารับการรักษาที่สถานีอนามัย 3 แห่ง ของ จ.มหาสารคาม ในช่วงเดือนเมษายน เป็นดังนี้ จงหาน้ำหนักเฉลี่ยของผู้ป่วยเด็กทั้งหมด
ค่าเฉลี่ยรวม (Combined mean) วิธีทำ สถานีอนามัยที่ 1 24 15 360 2 55 25 1375 3 41 21 861 รวม 120 2596
มัธยฐาน (Median) คือ ค่าของข้อมูลที่มีตำแหน่งอยู่ตรงกลางของ ข้อมูลชุดนั้น เมื่อนำข้อมูลนั้นมาจัดเรียงลำดับแล้ว ดังนั้น จะมีจำนวนข้อมูลอยู่ครึ่งหนึ่งที่น้อยกว่า ค่ามัธยฐาน และอีกครึ่งหนึ่งมากกว่ามัธยฐานนั้น
Median เป็นค่ากลางที่มีความแกร่ง (Robust measure of central tendency) ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำ ผิดปกติไป (Not affected by extreme values)
Ungrouped data ถ้ามีข้อมูล n ตัว และเรียงลำดับค่าข้อมูลจากน้อยไป มากแล้ว ได้ข้อมูลดังนี้ X1, X2 ,....., Xn
Grouped Data
จากตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน เป็นดังนี้ 171 157 163 170 173 168 167 164 169 178 161 165 160 166 155 174 175 172 156 158 152 177 159 จงคำนวณหาค่ามัธยฐานของข้อมูลชุดนี้ จากข้อมูลข้างต้นสามารถสร้างตารางแจกแจงความถี่ ได้ดังนี้
ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50 รวม
จากตัวอย่าง 3.5 ข้อมูลค่าใช้จ่ายรายวันของคนงานจำนวน 80 คน เป็นดังนี้ 65 78 66 51 32 64 48 60 68 31 36 56 45 50 55 70 46 57 44 71 79 43 75 30 59 40 49 72 54 61 47 38 39 52 37 จงคำนวณหาค่ามัธยฐานของข้อมูลชุดนี้
จากข้อมูลข้างต้นสามารถสร้างตารางแจกแจงความถี่ ได้ดังนี้ ค่าใช้จ่าย ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 28-32 27.5-32.5 30 6 33-37 32.5-37.5 35 2 8 38-42 37.5-42.5 40 5 13 43-47 42.5-47.5 45 9 22 48-52 47.5-52.5 50 17 39 53-57 52.5-57.5 55 52 58-62 57.5-62.5 60 10 62 63-67 62.5-67.5 65 7 69 68-72 67.5-67.5 70 77 73-77 72.5-77.5 75 1 78 78-82 77.5-82.5 80 รวม
ฐานนิยม (Mode) ค่าฐานนิยมเป็นข้อมูลตัวที่มีความถี่มากที่สุดหรือ เกิดขึ้นบ่อยที่สุด (Value that occurs most often) ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำ ผิดปกติไป (Not affected by extreme values) ใช้ได้ทั้งในกรณีที่เป็นข้อมูลเชิงคุณภาพและข้อมูลเชิง ปริมาณ (Used for either numerical or categorical data) ข้อมูลบางชุดอาจไม่มีฐานนิยม หรือ บางชุดอาจมีค่า ฐานนิยมได้หลายค่า (May be no mode or several modes)
ฐานนิยม (Mode)
Ungrouped Data ข้อมูลที่มีความถี่มากที่สุด สูตร Grouped Data
ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3 ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3.4 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 160-164 160.5-164.5 162 8 165-169 165.5-169.5 167 13 170-174 169.5-174.5 172 16 175-179 174.5-179.5 177 3 รวม 50
ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3 ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) 28-32 27.5-32.5 30 6 33-37 32.5-37.5 35 2 38-42 37.5-42.5 40 5 43-47 42.5-47.5 45 9 48-52 47.5-52.5 50 17 53-57 52.5-57.5 55 13 58-62 57.5-62.5 60 10 63-67 62.5-67.5 65 7 68-72 67.5-72.5 70 8 73-77 72.5-77.5 75 1 78-82 77.5-82.5 80 รวม
ความสัมพันธ์ระหว่างค่าเฉลี่ยเลขคณิต มัธยฐาน และ ฐานนิยม สามารถอธิบายการแจกแจงหรือรูปร่างของข้อมูลได้ ว่ามีลักษณะเป็นอย่างไร -สมมาตรหรือเบ้ (Symmetric or skewed)
(Measures of Position) การวัดตำแหน่งข้อมูล (Measures of Position)
Quartile Ungrouped Data Grouped Data
จากตัวอย่างที่ 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ จงหา Q1 จงหา Q2, Q3 (แบบฝึกหัด)
ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50 รวม
Decile Ungrouped Data Grouped Data
จากตัวอย่าง 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ จงหา D2 จงหา D5, D8 (แบบฝึกหัด)
ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50 รวม
Percentile Ungrouped Data Grouped Data
จากตัวอย่างที่ 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้
ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50 รวม
(Measures of Dispersion) การวัดการกระจาย (Measures of Dispersion)
Ungrouped Data พิสัย (Range) เป็นค่าที่พิจารณาจากความแตกต่างระหว่างค่าสูงสุด และค่าต่ำสุดของข้อมูล Ungrouped Data
Grouped Data พิสัย = ขีดจำกัดบนที่แท้จริงของชั้นที่มีค่าสูงสุด - ขีดจำกัด ล่างที่แท้จริงของชั้นที่มีค่าต่ำสุด
พิสัย (Range) เนื่องจากพิสัยคำนวณโดยอาศัยค่าข้อมูลเพียงสองค่า คือ ค่าสูงสุดและค่าต่ำสุดของ ข้อมูลเท่านั้น และเป็นค่าวัดการผันแปร ของข้อมูลที่ ไม่สนใจการแจกแจงของข้อมูล จึงไม่นิยมใช้พิสัยวัดการกระจายของข้อมูล
พิสัยควอไทล์ (Interquartile Range) พิสัยระหว่างควอไทล์ เขียนย่อๆ ว่า IQR คือค่าผลต่างระหว่างควอไทล์ที่สามและควอไทล์ที่หนึ่ง หรือกล่าวอีกนัยหนึ่งพิสัยระหว่างควอไทล์เป็นค่าพิสัยของข้อมูลจำนวน 50% ตรงกลาง พิจารณาจากความแตกต่างระหว่างควอไทล์ที่ 1 และควอไทล์ที่ 3
ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำผิดปกติ (Not affected by extreme values) Data in Ordered Array: 11 12 13 16 16 17 17 18 21 ควอร์ไทล์ที่หนึ่ง (Q1) ของข้อมูลชุดนี้มีค่าเท่ากับ 12.5 ควอร์ไทล์ที่สาม (Q3) ของข้อมูลชุดนี้มีค่าเท่ากับ 17.5 IQR = Q3 – Q1 = 17.5 – 12.5 = 5 ดังนั้น พิสัยระหว่างควอร์ไทล์ของข้อมูลชุดนี้มีค่า เท่ากับ 5
ภาพที่ 3.11 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ขวา ส่วนเบี่ยงเบนควอไทล์หรือ กึ่งพิสัยควอไทล์ (Quartile Deviation or Semi-Interquartile Range) ส่วนเบี่ยงเบนควอไทล์ คือ ระยะของข้อมูลจากมัธยฐาน (Q2) ไปยัง Q1 หรือระยะของข้อมูลจากมัธยฐานไปยัง Q3 ซึ่งระยะดังกล่าวจะเท่ากัน ภาพที่ 3.11 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ขวา
ภาพที่ 3.12 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ซ้าย ภาพที่ 3.13 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงสมมาตร
ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation : MD) Ungrouped Data
ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation : MD) Ungrouped Data
Grouped Data
Grouped Data
ตัวอย่าง 3.13 จากข้อมูลคะแนนสอบวิชาสถิติธุรกิจของนิสิตทั้งหมด 50 คน จงหาค่าส่วนเบี่ยงเบนเฉลี่ยของคะแนนสอบ คะแนน ความถี่ (f) ค่ากึ่งกลางชั้น (x) fx 30 – 39 2 34.5 69 28.4 56.8 40 – 49 6 44.5 267 18.4 110.4 50 – 59 10 54.5 545 8.4 84.0 60 – 69 20 64.5 1,290 1.6 32.0 70 – 79 74.5 447 11.6 69.6 80 – 89 4 84.5 338 21.6 86.4 90 - 99 94.5 189 31.6 63.2 รวม 50 3,145 502.4
ความแปรปรวน (Variance) เป็นค่าวัดการกระจายที่สำคัญ เป็นค่าที่แสดงการกระจายของ ข้อมูลรอบค่าเฉลี่ย (mean) Ungrouped Data ความแปรปรวนของประชากร (Population variance)
ความแปรปรวน (Variance) Ungrouped Data ความแปรปรวนของตัวอย่าง (Sample variance)
สามารถกระจายสูตรให้อยู่ในรูปที่ง่ายได้ดังนี้
Grouped Data ความแปรปรวนของประชากร (Population variance) :
Grouped Data ความแปรปรวนของตัวอย่าง (Sample variance):
ความแปรปรวน (Variance) ของประชากร
ความแปรปรวน (Variance) ของตัวอย่าง
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือค่ารากที่สองของค่าความแปรปรวน เป็น การวัดการกระจายของข้อมูลว่าเบี่ยงเบนไป จากค่าเฉลี่ยเลขคณิตมากน้อยเพียงใด Population standard deviation: Sample standard deviation:
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
Grouped Data
Grouped Data
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือค่ารากที่สองของค่าความแปรปรวน เป็น การวัดการกระจายของข้อมูลว่าเบี่ยงเบนไป จากค่าเฉลี่ยเลขคณิตมากน้อยเพียงใด Population standard deviation: Sample standard deviation:
จากตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน สามารถสร้างตารางแจกแจงความถี่ได้ดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx x2 f(x2) 150-154 149.5-154.5 152 1 23104 155-159 154.5-159.5 157 9 1413 24649 221841 160-164 159.5-164.5 162 8 1296 26244 209952 165-169 164.5-169.5 167 13 2171 27889 362557 170-174 169.5-174.5 172 16 2752 29584 473344 175-179 174.5-179.5 177 3 531 31329 93987 รวม 50 8315 162799 1384785
คำนวณหาค่าความแปรปรวน ดังนั้นค่าส่วนเบี่ยงเบนมาตรฐานจะมีค่าเป็น
สัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) Measures relative variation ส่วนใหญ่จะอธิบายในรูปของเปอร์เซ็นต์ (%) แสดง ความผันแปรเทียบกับค่าเฉลี่ย (Shows variation relative to mean) เพราะว่า CV ไม่มีหน่วย จึง สามารถใช้เปรียบเทียบการกระจายของข้อมูลสอง ชุดหรือมากกว่าที่มีหน่วยข้อมูลต่างกันหรือข้อมูลมี ขนาดต่างกันได้
ตัวอย่าง 3.18 ข้อมูลอายุ: อายุเฉลี่ย เท่ากับ 50 ปี ส่วนเบี่ยงเบนมาตรฐานของอายุ เท่ากับ 10 ปี ข้อมูลส่วนสูง: ความสูงเฉลี่ย เท่ากับ 160 เซนติเมตร ส่วนเบี่ยงเบนมาตรฐานของส่วนสูง เท่ากับ 15 เซนติเมตร จงหาสัมประสิทธิ์การแปรผันของอายุและส่วนสูง
ตัวอย่าง 3.15 จงคำนวณหาค่า Comparing Coefficient of Variation จากตัวอย่างดังต่อไปนี้ หุ้น A: ราคาเฉลี่ยปีที่แล้ว = $50 ส่วนเบี่ยงเบนมาตรฐาน = $5 หุ้น B: ราคาเฉลี่ยปีที่แล้ว = $100 Coefficient of variation: หุ้น A: หุ้น B:
บางครั้ง เราอาจต้องการเปรียบเทียบค่าข้อมูลจากชุด ตัวอย่างต่าง ๆ กัน ซึ่งอาจมี หน่วยข้อมูลต่างกัน หรือ มีค่าเฉลี่ยและส่วนเบี่ยงเบน มาตรฐานต่างกัน เราสามารถ เปรียบเทียบค่าของข้อมูลต่าง ๆ ได้โดยแปลงข้อมูล นั้นให้เป็นค่ามาตรฐาน (Standardized Scores) ก่อน ดังนี้
คุณสมบัติ 1. ค่าที่ได้เป็นค่าที่ไม่มีหน่วย เพราะเป็นอัตราส่วนของ ค่าสองค่าที่มีหน่วยเดียวกัน 2. ถ้าข้อมูลชุดหนึ่งแปลงเป็นข้อมูลค่ามาตรฐานแล้ว จะ มีค่าเฉลี่ยเท่ากับ 0 ค่าความแปรปรวนเท่ากับ 1 เสมอ
ตัวอย่าง 3.16 นักศึกษาคนหนึ่งสอบปลายภาค วิชา คณิตศาสตร์และ ภาษาอังกฤษได้คะแนน 84 และ 90 คะแนนตามลำดับ ทราบว่า คะแนนวิชาคณิตศาสตร์มีค่าเฉลี่ย 76 คะแนนและมีค่าส่วนเบี่ยงเบนมาตรฐาน 10 คะแนน คะแนนวิชาภาษาอังกฤษ มีค่าเฉลี่ย 82 คะแนนและมี ค่าส่วนเบี่ยงเบนมาตรฐาน 16 คะแนนจงพิจารณา ว่านักศึกษาคนนี้ได้คะแนนสอบวิชาใดดีกว่ากัน
Measures of Shape
การวัดความเบ้
การวัดความเบ้
Symmetrical Distribution ภาพที่ 3.14 แสดงข้อมูลมีการแจกแจงสมมาตร Positively Skewed Distribution ภาพที่ 3.15 แสดงข้อมูลมีการแจกแจงเบ้ขวา Negatively Skewed Distribution ภาพที่ 3.16 แสดงข้อมูลมีการแจกแจงเบ้ซ้าย
ตัวอย่าง 3.21 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลาเท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จงคำนวณหาค่าสัมประสิทธิ์ความเบ้ของข้อมูล
การวัดภาวะยอดมน การวัดภาวะยอดมนเพื่อให้เห็นลักษณะความโด่ง หรือความเรียบแบนของการแจกแจงของข้อมูล การวัดภาวะยอดมน (Kurtosis) คำนวณได้ดังนี้
การวัดภาวะยอดมน การวัดภาวะยอดมนแบ่งตามลักษณะการแจกแจงของ ข้อมูลได้ 3 ลักษณะ คือ 1) Mesokurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะรูปร่างคล้ายการแจกแจงปกติ kurtosis จะมี ค่าเป็นศูนย์ 2) Leptokurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะผอมและโด่งมาก kurtosis จะมีค่าเป็นบวก 3) Platykurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะแบนและกว้าง kurtosis จะมีค่าเป็นลบ
ตัวอย่าง 3.22 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลาเท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จงคำนวณภาวะยอดมนของข้อมูล