Chapter 3: Measures of Central Tendency and Measure of Dispersion

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
บำรุง พ่วงเกิด Office: ME201 Homepage: 12/17/2008
Advertisements

ค่าแนวโน้มเข้าสู่ส่วนกลาง ค่าการกระจาย ค่ามาตรฐาน
안녕하세요. ( อัน-นยอง-ฮา-เซ-โย )
สถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อย
สถิติที่ใช้ในการวิจัย
Chapter 6: Sampling Distributions
Chapter 3: Expected Value of Random Variable
Chapter 8: Interval Estimation
การวิเคราะห์ข้อมูลโดยสถิติเชิงพรรณนา (Descriptive Statistics)
(Statistical Package for the Social Sciences : SPSS)
Probability & Statistics
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
การตัดสินใจเบื้องต้น : สถิติเบื้องต้น (Introduction to statistics)
สถิติ Statistics โดย น.ท.อนุรักษ์ โชติดิลก
สถิติในการวัดและประเมินผล
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology
บทที่ 9 สถิติที่ใช้ในการประเมินผล
Basic Statistical Tools
Basic Statistical Tools
Basic Statistics พีระพงษ์ แพงไพรี.
Measures of Central Tendency & Measures of Spread or Variation
งานธุรการ ให้บริการผู้บริหาร ครู และบุคลากร เกี่ยวกับงานธุรการและ เอกสารสำคัญ บริการที่มีคุณภาพ ตอบสนองด้วยความเป็น มิตร รวดเร็ว มักจะเกิดปัญหาและอุปสรรคต่าง.
การวิเคราะห์ข้อมูลทางสถิติ เพื่อการทำวิจัยอย่างง่าย
สถิติเบื้องต้นในการวัดผลและประเมินผลการศึกษา
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
การตรวจสอบข้อมูล (Data Exploratory)
Chapter 2- Fundamentals of Statistics for Quality Control
Fundamentals of Statistics for Quality Control
สถิติในชีวิตประจำวัน : Statistics in Everyday life
การวัดและประเมินผลการเรียนรู้
การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction.
สถิติและการวัดทางระบาดวิทยาที่ควรรู้
ระเบียบวิธีวิจัยทางธุรกิจโรงแรม และท่องเที่ยว
สถิติพรรณนา (Descriptive Statistics)
บทที่ 7 การสุ่มตัวอย่าง.
Fundamentals of Statistics for Quality Control
การสำรวจและอธิบายข้อมูล
บทที่ 10 สถิติเชิงบรรยาย
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
ระเบียบวิธีวิจัยทางธุรกิจโรงแรมและท่องเที่ยว
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
การวิเคราะห์อนุกรมเวลา และการพยากรณ์
ความหมายของความสัมพันธ์ (Relation)
ผู้ดำเนินการวิจัย นางสาว นิลุบล สุวลักษณ์ รหัสนักศึกษา
คะแนนและความหมายของคะแนน
การมีส่วนร่วมในระบบการประกันคุณภาพการศึกษาของบุคลากร
Chapter 3: Measures of Central Tendency and Measure of Dispersion
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล สำนักงานสภามหาวิทยาลัย
ระเบียบวิธีวิจัยทางการบัญชี
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
Chapter 2: Presentation of Data
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
การวิเคราะห์ข้อมูลเบื้องต้น
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล คณะวิทยาศาสตร์
BASIC STATISTICS MEAN / MODE / MEDIAN / SD / CV.
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
หลักการคำนวณค่าทางสถิติพื้นฐาน
การกระจายอายุของบุคลากร เวชศาสตร์เขตร้อน
การเลือกใช้สถิติเพื่อการวิจัย
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจระหว่างประเทศ
ชื่อเรื่องวิจัย ชื่อผู้วิจัย
ประจำปีการศึกษา พุทธศักราช 2555
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
งานวิจัย.
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
ใบสำเนางานนำเสนอ:

Chapter 3: Measures of Central Tendency and Measure of Dispersion การวัดแนวโน้มเข้าสู่ ส่วนกลางและการวัด การกระจาย

เนื้อหา: การวิเคราะห์ข้อมูล การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดตำแหน่งข้อมูล การวัดการกระจายข้อมูล ความเบ้และความโด่ง

การวิเคราะห์ข้อมูล (Analysis of Data) การวิเคราะห์ข้อมูล หมายถึง การนำข้อมูลที่เก็บ รวบรวมได้ จากกลุ่มตัวอย่างหรือจากประชากรการ วิจัยจำนวนหนึ่ง มาจำแนกเพื่อตอบประเด็นปัญหา การวิจัย หรือทดสอบสมมุติฐานการวิจัยให้ครบทุกข้อ ถ้าข้อมูลเชิงปริมาณหรือเป็นตัวเลข ผู้วิจัยจะใช้ วิธีการทางสถิติสรุปรวมข้อมูล แต่ถ้าเป็นข้อมูลเชิงคุณภาพ ผู้วิจัยจะใช้วิธีการสรุป ความ หรือสังเคราะห์ข้อความ

Analysis of Data กรณีข้อมูลเชิงคุณภาพ การวิเคราะห์ข้อมูลกรณีนี้ มักจะพิจารณาความถี่ ของแต่ละกลุ่ม ว่าเป็นเท่าใด หรือพิจารณาเปอร์เซ็นต์ ของความถี่สัมพัทธ์แต่ละกลุ่ม คำนวณค่าความถี่สัมพัทธ์ (Relative frequency): กรณีข้อมูลเชิงคุณภาพ (Qualitative data or Categorical data)

Analysis of Data ตารางที่ 3.1 ผลการสำรวจความคิดเห็นของนิสิต เกี่ยวกับการเป็นมหาวิทยาลัยในกำกับของรัฐ ของ มหาวิทยาลัยมหาสารคาม ความคิดเห็น ความถี่ (f) ความถี่สัมพัทธ์ (rf) % rf เห็นด้วย 152 0.543 54.3 ไม่เห็นด้วย 77 0.275 27.5 ไม่มีความเห็น 51 0.182 18.2 รวม 280 1.000 100.0

กรณีข้อมูลเชิงปริมาณ (Quantitative data or Numerical data) Analysis of Data กรณีข้อมูลเชิงปริมาณ (Quantitative data or Numerical data) การวิเคราะห์ข้อมูลกรณีนี้ มักจะพิจารณา - การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency) - การวัดตำแหน่งข้อมูล (Measures of Position) - การวัดการกระจาย (Measures of Dispersion)

การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency) Analysis of Data - ค่าเฉลี่ย หรือ ค่ากลางเลขคณิต หรือ ค่ามัชฌิมเลข คณิต (Mean or Arithmetic Mean or Average) - มัธยฐาน (Median) - ฐานนิยม (Mode) - กึ่งพิสัย (Midrange) การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)

(Measures of Position) Analysis of Data - ควอไทล์(Qurtile) - เดไซล์(Decile) - เปอร์เซ็นต์ไทล์(Percentile) การวัดตำแหน่งข้อมูล (Measures of Position)

(Measures of Dispersion) Analysis of Data - พิสัย (Range) - พิสัยระหว่างควอไทล์ (Interquartile Range) - ส่วนเบี่ยงเบนควอไทล์(Quartile Deviation) - ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation) - ความแปรปรวน (Variance) - ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) - สัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) การวัดการกระจาย (Measures of Dispersion)

Analysis of Data Measures of Shape -การวัดความเบ้ (Skewness) - การวัดภาวะยอดมน (Kurtosis) Measures of Shape

การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measures of Central Tendency)

Mean (Arithmetic Mean) - เป็นค่ากลางที่สำคัญ นิยมใช้มาก และนำไป ประยุกต์ในการคำนวณค่าต่าง ๆ มาก - ค่ามัชฌิมเลขคณิตเหมาะที่จะใช้กับข้อมูลที่มีการ กระจายสม่ำเสมอ - ถ้ามีข้อมูลบางตัวมีค่าสูงหรือต่ำผิดปกติไป (Extreme values) ไม่ควร วัดค่ากลางของข้อมูลด้วยค่ามัชฌิมเลขคณิต เพราะ การคำนวณค่ากลาง โดยวิธีนี้ใช้ ข้อมูลทุกตัว ซึ่งจะรวมเอาค่าที่ผิดปกติไปคำนวณด้วย การหาค่าเฉลี่ยเลขคณิตแบ่งออกเป็น 2 กรณี คือ ก) กรณีข้อมูลไม่แบ่งกลุ่ม (Ungrouped Data) ข) กรณีข้อมูลแบ่งกลุ่ม (Grouped Data)

Ungrouped Data ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลประชากร (Population mean) เขียนแทนด้วย

Ungrouped Data ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลตัวอย่าง (Sample mean) เขียนแทนด้วย

Ungrouped Data ตัวอย่าง 3.1 บริษัท สากลการไฟฟ้า จำกัด ซึ่งเป็น บริษัทจำหน่ายเครื่องใช้ไฟฟ้ามีรายได้ ระหว่างปี พ.ศ. 2557 ถึง 2561 เท่ากับ 25, 28, 19, 14 และ 24 ล้านบาท ตามลำดับ จงคำนวณหาค่าเฉลี่ยเลขคณิต ของรายได้

Ungrouped Data ตัวอย่าง 3.2 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลา เท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จง คำนวณหาค่าเฉลี่ยเลขคณิตของค่าตอบแทน ล่วงเวลาจากกลุ่มตัวอย่างคนงานโรงงานแห่งนี้

Ungrouped Data วิธีทำ จากสูตรการคำนวณหาค่าเฉลี่ย = = = 2,846

Ungrouped Data ตัวอย่าง 3.3 ข้อมูล 2 ชุดข้อมูล ข้อมูลชุดที่ 1. ข้อมูลเป็นดังนี้ 1, 3, 5, 7, 9 ข้อมูลชุดที่ 2. ข้อมูลเป็นดังนี้ 1, 3, 5, 7, 14

Grouped Data ค่าเฉลี่ยประชากร (Population mean) ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลประชากร (Population mean) เขียนแทนด้วย µ

Grouped Data ค่าเฉลี่ยตัวอย่าง (Sample mean) ค่าเฉลี่ยเลขคณิตสำหรับข้อมูลตัวอย่าง (Sample mean) เขียนแทนด้วย

Grouped Data ตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน เป็นดังนี้ 171 157 163 170 173 168 167 164 169 178 161 165 160 166 155 174 175 172 156 158 152 177 159 Min = 152 Max = 178

Grouped Data สร้างตารางแจกแจงความถี่ โดย เรียงลำดับข้อมูลจากน้อยไปหามาก เพื่อหาค่าสูงสุด = 178 และค่าต่ำสุด = 152 หาพิสัย (Range) = 178 - 152 = 26 กำหนดจำนวนชั้น = 6 อันตรภาคชั้น = 26/6 = 4.33 ~ 5 หาขีดจำกัดล่าง 150 | 155 | 160 | 165 | 170 | 175 หาขีดจำกัดบน 154 | 159 | 164 | 169 | 174 | 179 หาจุดกึ่งกลางชั้น Mid-point (X)

Grouped Data ตารางแจกแจงความถี่ คำนวณหาค่าเฉลี่ย จากสูตร Cm. ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 1413 160-164 159.5-164.5 162 8 1296 165-169 164.5-169.5 167 13 2171 170-174 169.5-174.5 172 16 2752 175-179 174.5-179.5 177 3 531 รวม 50 8315 คำนวณหาค่าเฉลี่ย จากสูตร Cm.

Grouped Data ตัวอย่าง 3.5 ข้อมูลค่าใช้จ่ายรายวันของคนงานจำนวน 80 คน เป็นดังนี้ 65 78 66 51 32 64 48 60 68 31 36 56 45 50 55 70 46 57 44 71 79 43 75 30 59 40 49 72 54 61 47 38 39 52 37 Min = 79 Max = 30

Grouped Data คำนวณหาค่าเฉลี่ย จากสูตร ค่าใช้จ่าย ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx 28-32 27.5-32.5 30 6 180 33-37 32.5-37.5 35 2 70 38-42 37.5-42.5 40 5 200 43-47 42.5-47.5 45 9 405 48-52 47.5-52.5 50 17 850 53-57 52.5-57.5 55 13 715 58-62 57.5-62.5 60 10 600 63-67 62.5-67.5 65 7 455 68-72 67.5-72.5 8 560 73-77 72.5-77.5 75 1 78-82 77.5-82.5 80 160 รวม 4270 คำนวณหาค่าเฉลี่ย จากสูตร

ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสำหรับข้อมูลประชากร เขียนแทนด้วย คำนวณได้ดังนี้

ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสำหรับข้อมูลตัวอย่าง เขียนแทนด้วย คำนวณได้ดังนี้

ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) ตัวอย่าง 3.6 ภาคเรียนที่ 1/2561 สมศักดิ์ลงทะเบียน 5 วิชา ได้เกรด ดังนี้ วิชาสถิติ จำนวน 3 นก. ได้เกรด A วิชาภาษาอังกฤษ จำนวน 3 นก. ได้เกรด C วิชาฟิสิกส์ จำนวน 4 นก. ได้เกรด C+ วิชาคอมพิวเตอร์ จำนวน 3 นก. ได้เกรด B วิชาพลศึกษา จำนวน 1 นก. ได้เกรด A ภาคเรียนนี้ สมศักดิ์ ได้เกรดเฉลี่ยเท่าใด

ค่าเฉลี่ยแบบถ่วงน้ำหนัก (Weighted mean) วิชา หน่วยกิต (นน.ถ่วง) (wi) เกรด ค่าระดับคะแนน (xi) wixi สถิติ 3 A 4 12 ภาษาอังกฤษ C 2 6 ฟิสิกส์ C+ 2.5 10 คอมพิวเตอร์ B 9 พลศึกษา 1 รวม 14   41 คำนวณหาค่าเฉลี่ยจากสูตร

ค่าเฉลี่ยรวม (Combined mean)

ค่าเฉลี่ยรวม (Combined mean) ตัวอย่าง 3.7 สมมติน้ำหนักเฉลี่ยของผู้ป่วยเด็กอายุต่ำกว่า 10 ปีที่เข้ารับการรักษาที่สถานีอนามัย 3 แห่ง ของ จ.มหาสารคาม ในช่วงเดือนเมษายน เป็นดังนี้ จงหาน้ำหนักเฉลี่ยของผู้ป่วยเด็กทั้งหมด

ค่าเฉลี่ยรวม (Combined mean) วิธีทำ สถานีอนามัยที่ 1 24 15 360 2 55 25 1375 3 41 21 861 รวม 120   2596

มัธยฐาน (Median) คือ ค่าของข้อมูลที่มีตำแหน่งอยู่ตรงกลางของ ข้อมูลชุดนั้น เมื่อนำข้อมูลนั้นมาจัดเรียงลำดับแล้ว ดังนั้น จะมีจำนวนข้อมูลอยู่ครึ่งหนึ่งที่น้อยกว่า ค่ามัธยฐาน และอีกครึ่งหนึ่งมากกว่ามัธยฐานนั้น

Median เป็นค่ากลางที่มีความแกร่ง (Robust measure of central tendency) ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำ ผิดปกติไป (Not affected by extreme values)

Ungrouped data ถ้ามีข้อมูล n ตัว และเรียงลำดับค่าข้อมูลจากน้อยไป มากแล้ว ได้ข้อมูลดังนี้ X1, X2 ,....., Xn

Grouped Data

จากตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน เป็นดังนี้ 171 157 163 170 173 168 167 164 169 178 161 165 160 166 155 174 175 172 156 158 152 177 159 จงคำนวณหาค่ามัธยฐานของข้อมูลชุดนี้ จากข้อมูลข้างต้นสามารถสร้างตารางแจกแจงความถี่ ได้ดังนี้

ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50 รวม  

จากตัวอย่าง 3.5 ข้อมูลค่าใช้จ่ายรายวันของคนงานจำนวน 80 คน เป็นดังนี้ 65 78 66 51 32 64 48 60 68 31 36 56 45 50 55 70 46 57 44 71 79 43 75 30 59 40 49 72 54 61 47 38 39 52 37 จงคำนวณหาค่ามัธยฐานของข้อมูลชุดนี้

จากข้อมูลข้างต้นสามารถสร้างตารางแจกแจงความถี่ ได้ดังนี้ ค่าใช้จ่าย ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 28-32 27.5-32.5 30 6 33-37 32.5-37.5 35 2 8 38-42 37.5-42.5 40 5 13 43-47 42.5-47.5 45 9 22 48-52 47.5-52.5 50 17 39 53-57 52.5-57.5 55 52 58-62 57.5-62.5 60 10 62 63-67 62.5-67.5 65 7 69 68-72 67.5-67.5 70 77 73-77 72.5-77.5 75 1 78 78-82 77.5-82.5 80 รวม  

ฐานนิยม (Mode) ค่าฐานนิยมเป็นข้อมูลตัวที่มีความถี่มากที่สุดหรือ เกิดขึ้นบ่อยที่สุด (Value that occurs most often) ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำ ผิดปกติไป (Not affected by extreme values) ใช้ได้ทั้งในกรณีที่เป็นข้อมูลเชิงคุณภาพและข้อมูลเชิง ปริมาณ (Used for either numerical or categorical data) ข้อมูลบางชุดอาจไม่มีฐานนิยม หรือ บางชุดอาจมีค่า ฐานนิยมได้หลายค่า (May be no mode or several modes)

ฐานนิยม (Mode)

Ungrouped Data ข้อมูลที่มีความถี่มากที่สุด สูตร Grouped Data

ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3 ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3.4 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 160-164 160.5-164.5 162 8 165-169 165.5-169.5 167 13 170-174 169.5-174.5 172 16 175-179 174.5-179.5 177 3 รวม 50

ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3 ตัวอย่างการคำนวณหาค่าฐานนิยม จากตัวอย่าง 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) 28-32 27.5-32.5 30 6 33-37 32.5-37.5 35 2 38-42 37.5-42.5 40 5 43-47 42.5-47.5 45 9 48-52 47.5-52.5 50 17 53-57 52.5-57.5 55 13 58-62 57.5-62.5 60 10 63-67 62.5-67.5 65 7 68-72 67.5-72.5 70 8 73-77 72.5-77.5 75 1 78-82 77.5-82.5 80 รวม

ความสัมพันธ์ระหว่างค่าเฉลี่ยเลขคณิต มัธยฐาน และ ฐานนิยม สามารถอธิบายการแจกแจงหรือรูปร่างของข้อมูลได้ ว่ามีลักษณะเป็นอย่างไร -สมมาตรหรือเบ้ (Symmetric or skewed)

(Measures of Position) การวัดตำแหน่งข้อมูล (Measures of Position)

Quartile Ungrouped Data Grouped Data

จากตัวอย่างที่ 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ จงหา Q1 จงหา Q2, Q3 (แบบฝึกหัด)

ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50   รวม

Decile Ungrouped Data Grouped Data

จากตัวอย่าง 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้ จงหา D2 จงหา D5, D8 (แบบฝึกหัด)

ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50   รวม

Percentile Ungrouped Data Grouped Data

จากตัวอย่างที่ 3.5 สามารถสร้างตารางแจกแจงความถี่เป็นดังนี้

ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) ความถี่สะสม(F) 150-154 149.5-154.5 152 1 155-159 154.5-159.5 157 9 10 160-164 159.5-164.5 162 8 18 165-169 164.5-169.5 167 13 31 170-174 169.5-174.5 172 16 47 175-179 174.5-179.5 177 3 50   รวม

(Measures of Dispersion) การวัดการกระจาย (Measures of Dispersion)

Ungrouped Data พิสัย (Range) เป็นค่าที่พิจารณาจากความแตกต่างระหว่างค่าสูงสุด และค่าต่ำสุดของข้อมูล Ungrouped Data

Grouped Data พิสัย = ขีดจำกัดบนที่แท้จริงของชั้นที่มีค่าสูงสุด - ขีดจำกัด ล่างที่แท้จริงของชั้นที่มีค่าต่ำสุด

พิสัย (Range) เนื่องจากพิสัยคำนวณโดยอาศัยค่าข้อมูลเพียงสองค่า คือ ค่าสูงสุดและค่าต่ำสุดของ ข้อมูลเท่านั้น และเป็นค่าวัดการผันแปร ของข้อมูลที่ ไม่สนใจการแจกแจงของข้อมูล จึงไม่นิยมใช้พิสัยวัดการกระจายของข้อมูล

พิสัยควอไทล์ (Interquartile Range) พิสัยระหว่างควอไทล์ เขียนย่อๆ ว่า IQR คือค่าผลต่างระหว่างควอไทล์ที่สามและควอไทล์ที่หนึ่ง หรือกล่าวอีกนัยหนึ่งพิสัยระหว่างควอไทล์เป็นค่าพิสัยของข้อมูลจำนวน 50% ตรงกลาง พิจารณาจากความแตกต่างระหว่างควอไทล์ที่ 1 และควอไทล์ที่ 3

ไม่ถูกกระทบกรณีที่ข้อมูลบางตัวมีค่าสูงหรือต่ำผิดปกติ (Not affected by extreme values)   Data in Ordered Array: 11 12 13 16 16 17 17 18 21 ควอร์ไทล์ที่หนึ่ง (Q1) ของข้อมูลชุดนี้มีค่าเท่ากับ 12.5 ควอร์ไทล์ที่สาม (Q3) ของข้อมูลชุดนี้มีค่าเท่ากับ 17.5 IQR = Q3 – Q1 = 17.5 – 12.5 = 5 ดังนั้น พิสัยระหว่างควอร์ไทล์ของข้อมูลชุดนี้มีค่า เท่ากับ 5

ภาพที่ 3.11 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ขวา ส่วนเบี่ยงเบนควอไทล์หรือ กึ่งพิสัยควอไทล์ (Quartile Deviation or Semi-Interquartile Range) ส่วนเบี่ยงเบนควอไทล์ คือ ระยะของข้อมูลจากมัธยฐาน (Q2) ไปยัง Q1 หรือระยะของข้อมูลจากมัธยฐานไปยัง Q3 ซึ่งระยะดังกล่าวจะเท่ากัน ภาพที่ 3.11 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ขวา

ภาพที่ 3.12 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงเบ้ซ้าย ภาพที่ 3.13 ส่วนเบี่ยงเบนควอไทล์กรณีที่ข้อมูลมีการแจกแจงสมมาตร

ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation : MD) Ungrouped Data

ส่วนเบี่ยงเบนเฉลี่ย (Mean Deviation : MD) Ungrouped Data

Grouped Data

Grouped Data

ตัวอย่าง 3.13 จากข้อมูลคะแนนสอบวิชาสถิติธุรกิจของนิสิตทั้งหมด 50 คน จงหาค่าส่วนเบี่ยงเบนเฉลี่ยของคะแนนสอบ คะแนน ความถี่ (f) ค่ากึ่งกลางชั้น (x) fx 30 – 39 2 34.5 69 28.4 56.8 40 – 49 6 44.5 267 18.4 110.4 50 – 59 10 54.5 545 8.4 84.0 60 – 69 20 64.5 1,290 1.6 32.0 70 – 79 74.5 447 11.6 69.6 80 – 89 4 84.5 338 21.6 86.4 90 - 99 94.5 189 31.6 63.2 รวม 50   3,145 502.4

ความแปรปรวน (Variance) เป็นค่าวัดการกระจายที่สำคัญ เป็นค่าที่แสดงการกระจายของ ข้อมูลรอบค่าเฉลี่ย (mean) Ungrouped Data ความแปรปรวนของประชากร (Population variance)

ความแปรปรวน (Variance) Ungrouped Data ความแปรปรวนของตัวอย่าง (Sample variance)

สามารถกระจายสูตรให้อยู่ในรูปที่ง่ายได้ดังนี้

Grouped Data ความแปรปรวนของประชากร (Population variance) :

Grouped Data ความแปรปรวนของตัวอย่าง (Sample variance):

ความแปรปรวน (Variance) ของประชากร

ความแปรปรวน (Variance) ของตัวอย่าง

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือค่ารากที่สองของค่าความแปรปรวน เป็น การวัดการกระจายของข้อมูลว่าเบี่ยงเบนไป จากค่าเฉลี่ยเลขคณิตมากน้อยเพียงใด Population standard deviation: Sample standard deviation:

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)

Grouped Data

Grouped Data

ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือค่ารากที่สองของค่าความแปรปรวน เป็น การวัดการกระจายของข้อมูลว่าเบี่ยงเบนไป จากค่าเฉลี่ยเลขคณิตมากน้อยเพียงใด Population standard deviation: Sample standard deviation:

จากตัวอย่าง 3.4 ข้อมูลความสูงของหญิงจำนวน 50 คน สามารถสร้างตารางแจกแจงความถี่ได้ดังนี้ ส่วนสูง ขีดจำกัดที่แท้จริง ค่ากึ่งกลางชั้น (x) ความถี่ (f) fx x2 f(x2) 150-154 149.5-154.5 152 1 23104 155-159 154.5-159.5 157 9 1413 24649 221841 160-164 159.5-164.5 162 8 1296 26244 209952 165-169 164.5-169.5 167 13 2171 27889 362557 170-174 169.5-174.5 172 16 2752 29584 473344 175-179 174.5-179.5 177 3 531 31329 93987 รวม 50 8315 162799 1384785

คำนวณหาค่าความแปรปรวน ดังนั้นค่าส่วนเบี่ยงเบนมาตรฐานจะมีค่าเป็น    

สัมประสิทธิ์ของการแปรผัน (Coefficient of Variation) Measures relative variation ส่วนใหญ่จะอธิบายในรูปของเปอร์เซ็นต์ (%) แสดง ความผันแปรเทียบกับค่าเฉลี่ย (Shows variation relative to mean) เพราะว่า CV ไม่มีหน่วย จึง สามารถใช้เปรียบเทียบการกระจายของข้อมูลสอง ชุดหรือมากกว่าที่มีหน่วยข้อมูลต่างกันหรือข้อมูลมี ขนาดต่างกันได้

ตัวอย่าง 3.18 ข้อมูลอายุ: อายุเฉลี่ย เท่ากับ 50 ปี ส่วนเบี่ยงเบนมาตรฐานของอายุ เท่ากับ 10 ปี ข้อมูลส่วนสูง: ความสูงเฉลี่ย เท่ากับ 160 เซนติเมตร ส่วนเบี่ยงเบนมาตรฐานของส่วนสูง เท่ากับ 15 เซนติเมตร จงหาสัมประสิทธิ์การแปรผันของอายุและส่วนสูง

ตัวอย่าง 3.15 จงคำนวณหาค่า Comparing Coefficient of Variation จากตัวอย่างดังต่อไปนี้ หุ้น A: ราคาเฉลี่ยปีที่แล้ว = $50 ส่วนเบี่ยงเบนมาตรฐาน = $5 หุ้น B: ราคาเฉลี่ยปีที่แล้ว = $100 Coefficient of variation: หุ้น A: หุ้น B:

บางครั้ง เราอาจต้องการเปรียบเทียบค่าข้อมูลจากชุด ตัวอย่างต่าง ๆ กัน ซึ่งอาจมี หน่วยข้อมูลต่างกัน หรือ มีค่าเฉลี่ยและส่วนเบี่ยงเบน มาตรฐานต่างกัน เราสามารถ เปรียบเทียบค่าของข้อมูลต่าง ๆ ได้โดยแปลงข้อมูล นั้นให้เป็นค่ามาตรฐาน (Standardized Scores) ก่อน ดังนี้

คุณสมบัติ 1. ค่าที่ได้เป็นค่าที่ไม่มีหน่วย เพราะเป็นอัตราส่วนของ ค่าสองค่าที่มีหน่วยเดียวกัน 2. ถ้าข้อมูลชุดหนึ่งแปลงเป็นข้อมูลค่ามาตรฐานแล้ว จะ มีค่าเฉลี่ยเท่ากับ 0 ค่าความแปรปรวนเท่ากับ 1 เสมอ

ตัวอย่าง 3.16 นักศึกษาคนหนึ่งสอบปลายภาค วิชา คณิตศาสตร์และ ภาษาอังกฤษได้คะแนน 84 และ 90 คะแนนตามลำดับ ทราบว่า คะแนนวิชาคณิตศาสตร์มีค่าเฉลี่ย 76 คะแนนและมีค่าส่วนเบี่ยงเบนมาตรฐาน 10 คะแนน คะแนนวิชาภาษาอังกฤษ มีค่าเฉลี่ย 82 คะแนนและมี ค่าส่วนเบี่ยงเบนมาตรฐาน 16 คะแนนจงพิจารณา ว่านักศึกษาคนนี้ได้คะแนนสอบวิชาใดดีกว่ากัน

Measures of Shape

การวัดความเบ้

การวัดความเบ้

Symmetrical Distribution ภาพที่ 3.14 แสดงข้อมูลมีการแจกแจงสมมาตร Positively Skewed Distribution ภาพที่ 3.15 แสดงข้อมูลมีการแจกแจงเบ้ขวา Negatively Skewed Distribution ภาพที่ 3.16 แสดงข้อมูลมีการแจกแจงเบ้ซ้าย

ตัวอย่าง 3.21 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลาเท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จงคำนวณหาค่าสัมประสิทธิ์ความเบ้ของข้อมูล

การวัดภาวะยอดมน การวัดภาวะยอดมนเพื่อให้เห็นลักษณะความโด่ง หรือความเรียบแบนของการแจกแจงของข้อมูล การวัดภาวะยอดมน (Kurtosis) คำนวณได้ดังนี้

การวัดภาวะยอดมน การวัดภาวะยอดมนแบ่งตามลักษณะการแจกแจงของ ข้อมูลได้ 3 ลักษณะ คือ 1) Mesokurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะรูปร่างคล้ายการแจกแจงปกติ kurtosis จะมี ค่าเป็นศูนย์ 2) Leptokurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะผอมและโด่งมาก kurtosis จะมีค่าเป็นบวก 3) Platykurtic เป็นการแจกแจงของข้อมูลที่มี ลักษณะแบนและกว้าง kurtosis จะมีค่าเป็นลบ

ตัวอย่าง 3.22 จากการสุ่มตัวอย่างคนงาน 10 คน จากโรงงานแห่งหนึ่ง ได้ข้อมูลค่าตอบแทนล่วงเวลาเท่ากับ 2,800 2,500 3,300 2,750 2,530 2,850 2,700 3,000 3,200 และ 2,830 บาทต่อเดือน จงคำนวณภาวะยอดมนของข้อมูล