บทที่ 10 สถิติเชิงบรรยาย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
안녕하세요. ( อัน-นยอง-ฮา-เซ-โย )
Advertisements

สถิติ และ การวิเคราะห์ข้อมูล
สถิติที่ใช้ในการวิจัย
การวิเคราะห์ข้อมูลโดยสถิติเชิงพรรณนา (Descriptive Statistics)
(Statistical Package for the Social Sciences : SPSS)
มาตรฐานการวัด คุณภาพตัวชี้วัด และ สถิติ
คณะครุศาสตร์อุตสาหกรรม สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
Menu Analyze > Correlate
การตัดสินใจเบื้องต้น : สถิติเบื้องต้น (Introduction to statistics)
สถิติ Statistics โดย น.ท.อนุรักษ์ โชติดิลก
สถิติในการวัดและประเมินผล
น.ท.หญิง วัชราพร เชยสุวรรณ วิทยาลัยพยาบาลกองทัพเรือ
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology
วิจัย (Research) คือ อะไร
บทที่ 9 สถิติที่ใช้ในการประเมินผล
การวิเคราะห์ข้อมูลทางสถิติ เพื่อการทำวิจัยอย่างง่าย
"วิธีวิเคราะห์แบบสอบถาม หรือแบบประเมิน ด้วยโปรแกรม SPSS"
สถิติเบื้องต้นในการวัดผลและประเมินผลการศึกษา
สถิติเบื้องต้นสำหรับการวิเคราะห์ข้อมูล
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
บทที่ 9 การกำหนดขนาดของตัวอย่าง
สถิติในชีวิตประจำวัน : Statistics in Everyday life
การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction.
สถิติและการวัดทางระบาดวิทยาที่ควรรู้
การวัดและประเมินผลการศึกษา
รายวิชาชีวสถิติ (Biostatistics)
ระเบียบวิธีวิจัยทางธุรกิจโรงแรม และท่องเที่ยว
การวิเคราะห์เชิงปริมาณเบื้องต้น
สถิติพรรณนา (Descriptive Statistics)
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจระหว่างประเทศ
วิจัยเชิงปริมาณ (Quantitative Research)
การใช้ทฤษฎีในงานวิจัย
ความรู้เบื้องต้นเกี่ยวกับสถิติและโปรแกรมสำเร็จรูปทางสถิติ
ปัจจัยที่เกี่ยวข้องกับความพร้อมเพื่อการจำหน่ายออกจากโรงพยาบาลของผู้ดูแลผู้ป่วยสูงอายุโรคหลอดเลือดสมอง Factors Related to Readiness for Hospital Discharge.
การสำรวจและอธิบายข้อมูล
บทที่ 1 สถิติเชิงพรรณนา สถิติเบื้องต้น โปรแกรม R เบื้องต้น
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
โดย นายไพสุข สุขศรีเพ็ง รหัสนักศึกษา
ระเบียบวิธีวิจัยทางธุรกิจโรงแรมและท่องเที่ยว
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
ข้อมูล และ เครื่องมือเก็บข้อมูลเชิงปริมาณ
การควบคุมและตรวจสอบภายใน รองผู้ว่าการตรวจเงินแผ่นดิน
ผู้ดำเนินการวิจัย นางสาว นิลุบล สุวลักษณ์ รหัสนักศึกษา
การมีส่วนร่วมในระบบการประกันคุณภาพการศึกษาของบุคลากร
Chapter 3: Measures of Central Tendency and Measure of Dispersion
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล สำนักงานสภามหาวิทยาลัย
ระเบียบวิธีวิจัยทางการบัญชี
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
ระเบียบวิธีวิจัยทางธุรกิจโรงแรมและท่องเที่ยว
การวัดและประเมินผลการเรียนรู้
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
การวัดและประเมินผลการเรียนรู้
การวิเคราะห์ข้อมูลเบื้องต้น
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล คณะวิทยาศาสตร์
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
หลักการคำนวณค่าทางสถิติพื้นฐาน
การกระจายอายุของบุคลากร เวชศาสตร์เขตร้อน
การเลือกใช้สถิติเพื่อการวิจัย
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจระหว่างประเทศ
บทที่ 4 การกำหนดกรอบแนวคิดตัวแปร และสมมติฐานของการวิจัย
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
งานวิจัย.
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
ระเบียบวิธีวิจัยพื้นฐานทางการตลาด
Chapter 3: Measures of Central Tendency and Measure of Dispersion
ใบสำเนางานนำเสนอ:

บทที่ 10 สถิติเชิงบรรยาย ดร.นันทิมา นาคาพงศ์ มหาวิทยาลัยพะเยา

เนื้อหาในบทเรียน 1.ความหมายของสถิติ 7.สัดส่วน 2.ประเภทของสถิติ 3.มาตราการวัด 4.สถิติเชิงบรรยาย 5.การแจกแจงความถี่ 6.อัตราส่วน 7.สัดส่วน 8.ร้อยละ 9.การวัดตำแหน่งเปรียบเทียบ 10.การวัดแนวโน้มเข้าสู่ส่วนกลาง 11.การวัดการกระจาย 12.การวัดความสัมพันธ์

ความหมายของสถิติ สถิติมีความหมาย 2 ประการ ดังนี้ ข้อมูลสถิติ หมายถึง ตัวเลข (numerical) ที่แทนข้อเท็จจริงต่าง ๆ เกี่ยวกับคุณสมบัติหรือลักษณะของสิ่งที่ศึกษา สถิติศาสตร์ หมายถึง วิธีการ (method) สาขาหนึ่งของคณิตศาสตร์ ที่ว่าด้วยการหาข้อเท็จจริงให้กับธรรมชาติและปรากฏการณ์ มุ่งบรรยายหรือลงสรุปข้อมูลเกี่ยวกับคุณลักษณะของประชากร หรือเรียกว่า “ระเบียบวิธีการทางสถิติ (statistical method)”

“ระเบียบวิธีการทางสถิติ (statistical method)” 1.การเก็บรวบรวมข้อมูล (Collection of data) 2.การจัดกระทำข้อมูล (Manipulation of Data) 3.การนำเสนอข้อมูล (Presentation of Data) 4.การวิเคราะห์ข้อมูล (Analysis of data) 5.การตีความหมายข้อมูล (Interpretation of data)

ประเภทของสถิติ 1. สถิติเชิงบรรยาย (Descriptive statistics) 2. สถิติเชิงอ้างอิง (Inferential statistics)

ประเภทของสถิติ สถิติ แบ่งออกเป็น 2 ประเภท ดังนี้ 1. สถิติเชิงบรรยาย (Descriptive statistics) บรรยายหรืออธิบายลักษณะต่าง ๆ ของกลุ่มตัวอย่างหรือประชากรที่ศึกษา ไม่มีการนำไปใช้อธิบายหรือสรุปอ้างอิงไปยังประชากรที่ศึกษา วิธีการทางสถิติเชิงบรรยาย ได้แก่ การแจกแจงความถี่ การจัดตำแหน่งเปรียบเทียบ การวัดแนวโน้มเข้าสู่ศูนย์กลาง การสวัดการกระจาย และการวัดความสัมพันธ์ 2. สถิติเชิงอ้างอิง (Inferential statistics) เป็นสถิติที่ศึกษาข้อมูลกับกลุ่มตัวอย่างแล้วทำการประมาณค่า (estimate) คาดคะเน (prediction) สรุปอ้างอิง (generalization) หรือนำไปสู่การตัดสินใจ (searching decision) ไปยังประชากร มีการทดสอบสมมติฐานโดยอาศัยทฤษฎีความน่าจะเป็น สถิติประเภทนี้จำเป็นต้องมีการสุ่มตัวอย่างที่มีขนาดเหมาะสมและมีความเป็นตัวแทนที่ดีของประชากร โดยเป็นการอนุมานหรือสรุปอ้างอิงจากค่าสถิติ (statistics) ของกลุ่มตัวอย่างไปยังค่าพารามิเตอร์ (parameter) ของประชากร วิธีการทางสถิติเชิงอ้างอิง ได้แก่ ทฤษฎีความน่าจะเป็นและการสุ่มตัวอย่าง การประมาณค่าของประชากร และการทดสอบสมมติฐาน

ระดับของการวัด ระดับของการวัด 1. มาตรานามบัญญัติ (Nominal scale) 2. มาตราเรียงอันดับ (Ordinal scale) 3. มาตราอันตรภาค (Interval scale) 4. มาตราอัตราส่วน (Ratio scale)

ระดับของการวัด 1. มาตรานามบัญญัติ (Nominal scale) สัญลักษณ์หรือชื่อนาม เพื่อจำแนก หรือจัดกลุ่มสิ่งที่ศึกษา โดยไม่สามารถบอกปริมาณน้อยได้ เพียงแต่แสดงให้เห็นความแตกต่าง 2. มาตราเรียงอันดับ (Ordinal scale) บอกปริมาณความมากน้อย (magnitude) หรือบอกความแตกต่างได้ และจัดอันดับของข้อมูลได้ว่า มาก - น้อย สูง - ต่ำ แต่ไม่สามารถบอกความแตกต่างหรือระยะห่างของสองสิ่งหรือหลาย ๆ สิ่งว่ามีประมาณเท่าใดได้ 3. มาตราอันตรภาค (Interval scale) ตัวเลขสามารถบอกความแตกต่าง บอกลำดับที่ และบอกช่วงห่างระหว่าง สิ่งที่วัดได้ว่า ห่างกันอยู่มากน้อยเท่าใด ไม่มีศูนย์แท้ หรือศูนย์สัมบูรณ์ (absolute zero) 4. มาตราอัตราส่วน (Ratio scale) มาตราการวัดที่สมบูรณ์ที่สุด เพราะมีศูนย์แท้ ซึ่งแปลว่าไม่มีอะไรเลย

การแจกแจงความถี่ (Frequency) การแจกแจงความถี่ หมายถึง การจัดกลุ่มของข้อมูลที่เก็บรวบรวมมาได้ สามารถตรวจนับได้ว่าในกลุ่มหนึ่ง ๆ หรือช่วงคะแนนหนึ่ง ๆ มีข้อมูลอยู่จำนวนเท่าใด การแจกแจงความถี่โดยทั่วไปแบ่งเป็น 2 วิธี คือ 1. การแจกแจงความถี่แบบไม่จัดกลุ่มข้อมูล (Ungrouped data ) 2. การแจกแจงความถี่แบบจัดกลุ่มข้อมูล (Grouped data) 2.1 หาพิสัย (range)   พิสัย = คะแนนสูงสุด – คะแนนต่ำสุด   2.2 กำหนดจำนวนชั้นคะแนนที่ต้องการ 2.3 หาช่วงความกว้างของแต่ละชั้น หรืออันตรภาคชั้น (interval) โดยใช้สูตร  

อัตราส่วน อัตราส่วน (Ratio) : การเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการย่อย สูตรการคำนวณ อัตราส่วนของพนักงานใน 3 บริษัท คือ บริษัท A : บริษัท B : บริษัท C = 60 : 20 : 40 = 3 : 1 : 2 อัตราส่วนของผู้สอบสัมภาษณ์ผ่านกับไม่ผ่าน คือ ผู้สอบผ่าน : ผู้สอบไม่ผ่าน = 120 : 50 = 12 : 5

สัดส่วน สัดส่วน (Proportion) : การเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการทั้งหมด สูตรการคำนวณ สัดส่วนของพนักงานใน 3 บริษัท A = 60, B = 20, C = 40 คือ บริษัท A = บริษัท B = บริษัท C =

ร้อยละ ร้อยละ (Percent) : การเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการทั้งหมดที่ปรับเทียบให้เป็น 100 สูตรการคำนวณ ร้อยละของพนักงานใน 3 บริษัท คือ บริษัท A = บริษัท B = บริษัท C =

การวัดตำแหน่งเปรียบเทียบ : ควอร์ไทล์ ควอร์ไทล์ (Quartile) : การแบ่งข้อมูลหรือพื้นที่ใต้โค้งออกเป็น 4 ส่วนเท่า ๆ กัน เมื่อจัดข้อมูลตามลำดับปริมาณของค่าสังเกตจากน้อยไปมากแล้ว เรียกค่าสังเกตที่ตรงกับจุดแบ่งว่า ควอร์ไทล์ที่ 1 แทนด้วย Q1 ควอร์ไทล์ที่ 2 แทนด้วย Q2 ควอร์ไทล์ที่ 3 แทนด้วย Q3

Q1 Q2 Q3 ข้อมูลที่มีค่าน้อยกว่า Q1 มีอยู่ 25%

การวัดตำแหน่งเปรียบเทียบ : เดไซล์ เดไซล์ (Decile) : การแบ่งข้อมูลหรือพื้นที่ใต้โค้งออกเป็น 10 ส่วนเท่า ๆ กัน เมื่อจัดข้อมูลตามลำดับปริมาณของค่าสังเกตจากน้อยไปมากแล้ว เรียกค่าสังเกตที่ตรงกับจุดแบ่งว่า เดไซล์ที่ 1 แทนด้วย D1 เดไซล์ที่ 2 แทนด้วย D2 เดไซล์ที่ 3 แทนด้วย D3   เดไซล์ที่ 9 แทนด้วย D9

D1 D2 D3 D4 D5 D6 D7 D8 D9 ข้อมูลที่มีค่าน้อยกว่า D1 มีอยู่ 10% ข้อมูลที่มีค่าน้อยกว่า D2 มีอยู่ 20%    ข้อมูลที่มีค่าน้อยกว่า D9 มีอยู่ 90% เช่น จำนวนหนังสือในห้องสมุดประชาชน D6 = 800 หมายถึง มีห้องสมุดประชาชน 6 ใน 10 แห่ง(หรือ 60%) ที่มีจำนวนหนังสือน้อยกว่า 800 เล่ม

การวัดตำแหน่งเปรียบเทียบ : เปอร์เซ็นไทล์ เปอร์เซ็นไทล์ (Percentile) : การแบ่งข้อมูลหรือพื้นที่ใต้โค้งออกเป็น 100 ส่วนเท่า ๆ กัน เมื่อจัดข้อมูลตามลำดับปริมาณของค่าสังเกตจากน้อย ไปมากแล้ว เรียกค่าสังเกตที่ตรงกับจุดแบ่งว่า เปอร์เซนไทล์ที่ 1 แทนด้วย P1 เปอร์เซนไทล์ที่ 2 แทนด้วย P2 เปอร์เซนไทล์ที่ 3 แทนด้วย P3    เปอร์เซนไทล์ที่ 99 แทนด้วย P99

P1P2P3 P50 P99 ข้อมูลที่มีค่าน้อยกว่า P1 มีอยู่ 1% ข้อมูลที่มีค่าน้อยกว่า P2 มีอยู่ 2%    ข้อมูลที่มีค่าน้อยกว่า P99 มีอยู่ 99% เช่น รายได้ต่อเดือนของพนักงาน P70 = 9,000 หมายถึง มีพนักงาน 70 ใน 100 ส่วน (หรือ 70%) ที่มีรายได้ต่อเดือนน้อยกว่า 9,000 บาท

ความสัมพันธ์ของควอไทล์ เดไซล์ และเปอร์เซ็นไทล์ ในโค้งปกติ ค่าน้อย ค่ามาก Q1 Q2 Q3 D2.5 D5 D7.5 P25 P50 P75

การคำนวณคลอไทล์ เดไซล์ และเปอร์เซ็นไทล์ สูตรการคำนวณหาค่าตำแหน่งควอไทล์ สูตรการคำนวณหาค่าตำแหน่งเดไซล์ สูตรการคำนวณหาค่าตำแหน่งเปอร์เซ็นไทล์

การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดแนวโน้มเข้าสู่ส่วนกลาง เป็นวิธีการทางสถิติที่คำนวณหาค่ากลาง (central value) ที่ใช้เป็นตัวแทนของชุดข้อมูลหรือกลุ่มข้อมูลที่มีหลายค่า โดยใช้ค่าใดค่าหนึ่งเพียงค่าเดียวเป็นตัวแทนของข้อมูลทั้งชุดในการบรรยายลักษณะของข้อมูลที่เก็บรวบรวมมาได้ เพื่อความสะดวกในการทำความเข้าใจของข้อมูลชุดนั้น

1. กรณีข้อมูลไม่ได้แจกแจงความถี่ 1. ค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยเลขคณิตหรือค่ากลางเลขคณิต (Arithmetic mean) หรือค่ากลาง(mean) หมายถึง ผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลในชุดนั้น สัญลักษณ์ที่ใช้ 1. กรณีข้อมูลไม่ได้แจกแจงความถี่ แทนค่าของข้อมูลสถิติที่ต้องการศึกษา จำนวน n ค่า ถ้าให้

สูตรการหาค่าเฉลี่ย หรือเขียนได้ว่า เมื่อ แทน ค่าเฉลี่ย แทน ผลรวมของข้อมูลทั้งหมด N แทน จำนวนข้อมูลในชุดนั้น

2. กรณีข้อมูลมีการแจกแจงความถี่ 1. คะแนนเรียงค่าตามลำดับที่มีช่วงอันตรภาคชั้นเท่ากับ 1 ถ้าให้ f1, f2, f3, …, fk แทนค่าความถี่ของข้อมูลที่ศึกษา คือ ซึ่งเป็นค่าของข้อมูล k จำนวนที่ไม่ซ้ำกันตามลำดับแล้ว จะได้ค่าเฉลี่ย = = สูตร

เมื่อ f แทน จำนวนความถี่ของข้อมูลที่ไม่ซ้ำกัน สูตรการหาค่าเฉลี่ย หรือเขียนได้ว่า = เมื่อ f แทน จำนวนความถี่ของข้อมูลที่ไม่ซ้ำกัน x แทน ข้อมูลที่ไม่ซ้ำกัน N แทน จำนวนข้อมูลทั้งหมด

1. กรณีข้อมูลไม่ได้แจกแจงความถี่ 2. มัธยฐาน มัธยฐาน (Median) หมายถึง ค่าที่มีตำแหน่งอยู่ตรงกลางในข้อมูล ชุดที่ได้จัดเรียงลำดับจากน้อยไปมากหรือมากไปน้อยแล้ว 1. กรณีข้อมูลไม่ได้แจกแจงความถี่ ขั้นที่ 1 เรียงข้อมูลจากน้อยไปมาก หรือจากมากไปน้อย ขั้นที่ 2 หาตำแหน่งของมัธยฐานคือ 1) ถ้าข้อมูลมีจำนวนคี่ ค่ามัธยฐานเป็นข้อมูลที่อยู่ตรงกลาง 2) ถ้าข้อมูลมีจำนวนคู่ ค่ามัธยฐานเป็นค่าเฉลี่ยของข้อมูล 2 ค่า ที่อยู่ตรงกลาง

สูตรการหามัธยฐาน เมื่อ Mdn แทน มัธยฐาน L แทน ขีดจำกัดล่างที่แท้จริงของชั้นที่มัธยฐานอยู่ i แทน ช่วงของอันตรภาคชั้น N แทน จำนวนข้อมูลทั้งหมด แทน ผลรวมความถี่ของชั้นที่ต่ำกว่าชั้นที่มัธยฐานอยู่ f แทน ความถี่ของชั้นที่มัธยฐานอยู่

1. กรณีข้อมูลไม่ได้แจกแจงความถี่ 3. ฐานนิยม ฐานนิยม (Mode) หมายถึง ข้อมูลที่มีความถี่สูงสุด หรือข้อมูลที่มีค่าซ้ำกันมากที่สุด 1. กรณีข้อมูลไม่ได้แจกแจงความถี่ ขั้นที่ 1 ดูว่ามีค่าใดที่ซ้ำกันมากที่สุด ขั้นที่ 2 ถ้าข้อมูลที่ซ้ำกันมากที่สุดมีเกิน 1 ค่า ฐานนิยมก็จะมีหลายค่า แต่ที่นิยมใช้กันจะไม่ใช้เกิน 3 ค่า

การเลือกใช้การวัดแนวโน้มเข้าสู่ส่วนกลาง ค่าเฉลี่ย ถือว่าเป็นค่ากลางที่เป็นประโยชน์ และนิยมใช้มากใน การคำนวณทางสถิติ เพราะใช้ข้อมูลทุกค่ามาคำนวณ จึงนำไปใช้ใน การวิเคราะห์ขั้นสูงได้ดี มัธยฐาน ใช้ได้กับลักษณะของข้อมูลทุกประเภทไม่ว่าจะมีลักษณะ การกระจายเป็นโค้งปกติหรือไม่ ฐานนิยม เป็นค่ากลางอีกชนิดหนึ่งเหมาะสำหรับข้อมูลที่อยู่ใน มาตรานามบัญญัติ ซึ่งสามารถบอกได้ว่าข้อมูลชุดใดซ้ำกันมากที่สุด เช่น การสำรวจความคิดเห็นของประชาชนในการเลือกตั้ง เป็นต้น

การวัดการกระจาย : 1.พิสัย พิสัย (Range) หมายถึง ค่าความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุดของข้อมูลชุดหนึ่ง ๆ เหมาะสำหรับใช้วัดการกระจายของข้อมูลที่มีจำนวนน้อย และไม่เหมาะกับข้อมูลที่มีค่าใดค่าหนึ่งแตกต่างจากข้อมูลของทั้งกลุ่มมาก 1. กรณีข้อมูลไม่แจกแจงความถี่ พิสัย = ค่าของข้อมูลที่มีค่าสูงสุด - ค่าของข้อมูลที่มีค่าต่ำสุด 2. กรณีข้อมูลแจกแจงความถี่ พิสัย = ขีดจำกัดบนที่แท้จริงของอันตรภาคชั้นสูงสุด – ขีดจำกัดล่างที่แท้จริงของอันตรภาคชั้นต่ำสุด

2. ส่วนเบี่ยงเบนควอไทล์ ส่วนเบี่ยงเบนควอร์ไทล์ (Q.D. : Quartile deviation) หมายถึง ค่าที่หาได้จากครึ่งหนึ่งของความแตกต่างระหว่าง Q3 และ Q1 มักใช้ ส่วนเบี่ยงเบนควอไทล์คู่กับค่ามัธยฐาน เพราะมีพื้นฐานการคำนวณโดยอาศัยความแตกต่างระหว่างข้อมูล 2 ค่า Q.D. แทน ค่าเบี่ยงเบนควอไทล์ Q3 แทน ค่าควอไทล์ที่ 3 Q1 แทน ค่าควอไทล์ที่ 1

3. ส่วนเบี่ยงเบนเฉลี่ย ส่วนเบี่ยงเบนเฉลี่ย (M.D. : Mean deviation หรือ A.D. : Average deviation ) หมายถึง ค่าเฉลี่ยของความแตกต่างระหว่าง ค่าของข้อมูลแต่ละตัวกับค่าเฉลี่ยของข้อมูลชุดนั้น โดยไม่คิดเครื่องหมาย ของการเบี่ยงเบน และใช้ค่าสัมบูรณ์(absolute) ทำให้ไม่นิยมใช้ แต่ถ้าใช้ ส่วนเบี่ยงเบนเฉลี่ยจะใช้คู่กับค่าเฉลี่ย

1. กรณีข้อมูลไม่แจกแจงความถี่ 3. ส่วนเบี่ยงเบนเฉลี่ย 1. กรณีข้อมูลไม่แจกแจงความถี่ ถ้า x1 , x2 , x3 , ... , xn เป็นข้อมูล n จำนวน และมีค่าเฉลี่ยเป็น แล้ว หรือ M.D. แทน ค่าเบี่ยงเบนมาตรฐาน แทน ค่าของข้อมูลแต่ละตัว แทน ค่าเฉลี่ยของข้อมูลชุดนั้น n แทน จำนวนข้อมูลทั้งหมด

2. กรณีข้อมูลแจกแจงความถี่ 3. ส่วนเบี่ยงเบนเฉลี่ย 2. กรณีข้อมูลแจกแจงความถี่ ถ้า x1 , x2 , … , xn เป็นข้อมูล n จำนวน ซึ่ง f1 , f2 , f3 , … , fn เป็นความถี่ ของข้อมูลแต่ละข้อมูล และมีค่าเฉลี่ยเป็น แล้ว หรือ M.D. แทน ค่าเบี่ยงเบนมาตรฐาน แทน ความถี่ของข้อมูลแต่ละตัว แทน ค่าของข้อมูลแต่ละตัว แทน ค่าเฉลี่ยของข้อมูลชุดนั้น n แทน จำนวนข้อมูลทั้งหมด

4. ส่วนเบี่ยงเบนมาตรฐาน ส่วนเบี่ยงเบนมาตรฐาน (S.D. : Standard deviation) หมายถึง การวัดการกระจายของข้อมูลทุกตัวในรูปของการเบี่ยงเบนออกจากค่าเฉลี่ย หรือค่าที่ใช้วัดความแตกต่างระหว่างค่าแต่ละค่าของข้อมูลชุดนั้นกับค่าเฉลี่ย ถ้าความแตกต่างโดยเฉลี่ยระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ย มีมาก แสดงว่าข้อมูลมีการกระจายมาก ความแตกต่างที่เกิดขึ้นระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ยของ ข้อมูลชุดนั้น อาจมีค่าเป็นบวกหรือลบ แล้วแต่ค่าใดจะมากกว่ากัน ดังนั้นผลรวม ของความแตกต่างระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ยจะหักร้างกันหมดไป เท่ากับ 0 เสมอ ทำให้วัดการกระจายของข้อมูลไม่ได้ เพื่อขจัดปัญหาดังกล่าวจึงต้องวัดจากรากที่สองของค่าเฉลี่ยผลรวมของความแตกต่างกำลังสองระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ยของข้อมูลชุดนั้น

4. ส่วนเบี่ยงเบนมาตรฐาน 1. กรณีข้อมูลไม่แจกแจงความถี่ 1.1 การคำนวณส่วนเบี่ยงเบนมาตรฐานจากประชากร ถ้า x1 , x2 , x3 , … , xn เป็นข้อมูล n จำนวน และมีค่าเฉลี่ยเป็น  แล้ว หรือ  แทน ส่วนเบี่ยงเบนมาตรฐาน x แทน ค่าของข้อมูลแต่ละตัว  แทน ค่าเฉลี่ยของข้อมูลชุดนั้น N แทน จำนวนข้อมูลทั้งหมดของประชากร

4. ส่วนเบี่ยงเบนมาตรฐาน 1.2 การคำนวณส่วนเบี่ยงเบนมาตรฐานจากกลุ่มตัวอย่าง ถ้า x1 , x2 , x3 , … , xn เป็นข้อมูล n จำนวน และมีค่าเฉลี่ยเป็น แล้ว หรือ หรือดัดแปลงอยู่ในรูปคะแนนดิบ

4. ส่วนเบี่ยงเบนมาตรฐาน 2. กรณีข้อมูลแจกแจงความถี่ 2.1 การคำนวณค่าเบี่ยงเบนมาตรฐานจากประชากร ถ้า x1 , x2 , x3 , … , xn เป็นข้อมูล n จำนวน ซึ่ง f1 , f2 , f3 , … , fn เป็นความถี่ของข้อมูลแต่ละข้อมูล และมีค่าเฉลี่ยเป็น  แล้ว หรือ  แทน ส่วนเบี่ยงเบนมาตรฐาน แทน ค่าความถี่ของข้อมูลแต่ละตัว แทน ค่าของข้อมูลแต่ละตัว  แทน ค่าเฉลี่ยของข้อมูลชุดนั้น N แทน จำนวนข้อมูลทั้งหมดของประชากร

4. ส่วนเบี่ยงเบนมาตรฐาน 2.2 การคำนวณค่าเบี่ยงเบนมาตรฐานจากกลุ่มตัวอย่าง ถ้า x1 , x2 , x3 , … , xn เป็นข้อมูล n จำนวน ซึ่ง f1 , f2 , f3 , … , fn เป็นความถี่ของข้อมูลแต่ละข้อมูล และมีค่าเฉลี่ยเป็น แล้ว หรือ หรือดัดแปลงอยู่ในรูปคะแนนดิบ

5. ความแปรปรวน ความแปรปรวน (S2) หมายถึง กำลังสองของค่าเบี่ยงเบนมาตรฐาน และเป็นค่าที่ใช้วัดการกระจายที่ใช้กันมากที่สุด ตัวอย่าง ข้อมูลชุดหนึ่งค่าเบี่ยงเบนมาตรฐานเท่ากับ 3 จงหาความแปรปรวน ความแปรปรวน = 32 = 9 วิธีทำ

การเลือกใช้การวัดการกระจายของข้อมูล กรณีต้องการดูการกระจายอย่างหยาบและรวดเร็วใช้ ค่าพิสัย กรณีวัดแนวโน้มเข้าสู่ส่วนกลางโดยใช้ค่ามัธยฐาน ให้ใช้ค่าเบี่ยงเบนควอร์ไทล์(Q.D.) ในการวัดการกระจาย กรณีวัดแนวโน้มเข้าสู่ส่วนกลางโดยใช้ค่าเฉลี่ย ให้ใช้ค่าเบี่ยงเบนมาตรฐาน(S) ในการวัดการกระจาย ค่าเบี่ยงเบนเฉลี่ยมักไม่นิยมนำมาใช้ เพราะเป็นการหาการเบี่ยงเบน โดยไม่นำเครื่องหมายมาพิจารณา

การวัดความสัมพันธ์ 1. สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (Pearson product-moment correlation coefficient) อธิบายความสัมพันธ์ระหว่างตัวแปร 2 ตัว หรือข้อมูล 2 ชุดที่มีข้อมูลอยู่ในมาตราอันตรภาคชั้นขึ้นไป และข้อมูลทั้ง 2 ชุดนั้นเป็นอิสระต่อกัน มีสูตรที่ใช้คำนวณดังนี้

การวัดความสัมพันธ์ : ตัวอย่าง จงหาสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างคะแนนสอบวิชาภาษาไทยและภาษาอังกฤษ ของนักเรียนจำนวน 5 คน ดังนี้ นร. คะแนนวชิา X2 Y2 XY ไทย อังกฤษ 1 7 3 49 9 21 2 10 100 70 81 4 6 5 36 25 30 16 20 รวม 37 28 291 180 222 ดังนั้น คะแนนสอบวิชาภาษาไทยและภาษาอังกฤษมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0.74

การวัดความสัมพันธ์ 2. สัมประสิทธ์สหสัมพันธ์แบบสเปียร์แมน(spearman rank order correlation coefficient) การหาความสัมพันธ์วิธีนี้ใช้กับข้อมูล 2 ชุดที่มีอยู่ในมาตราเรียงลำดับ มีสูตรที่ใช้คำนวณดังนี้

การวัดความสัมพันธ์ : ตัวอย่าง จงหาสัมประสิทธิ์สหสัมพันธ์แบบสปียร์แมนระหว่างคะแนนสอบวิชาภาษาไทยและภาษาอังกฤษ ของนักเรียนจำนวน 5 คน ดังนี้ นร. คะแนนวิชา X Y D D2 ไทย อังกฤษ 1 7 3 5 -2 4 2 10 -1 9 6 รวม 8 ดังนั้น คะแนนสอบวิชาภาษาไทยและภาษาอังกฤษมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0.60

การแปลความหมายของค่าสัมประสิทธิ์สหสัมพันธ์ มีค่าตั้งแต่ -1.00 ถึง +1.00 แปลความหมาย 3 ลักษณะ คือ 1. มีความสัมพันธ์กันหรือไม่ 2. มีความสัมพันธ์กันในขนาดมากน้อยเพียงใด 3. มีความสัมพันธ์กันในทิศทางใด

การแปลความหมายของค่าสัมประสิทธิ์สหสัมพันธ์ 1.00 มีความสัมพันธ์กันทางบวก อย่างสมบูรณ์ 0.81 - 0.99 มีความสัมพันธ์กันทางบวก สูง 0.51 - 0.80 มีความสัมพันธ์กันทางบวก ปานกลาง 0.01 - 0.50 มีความสัมพันธ์กันทางบวก ต่ำ 0.00 ไม่มีความสัมพันธ์กัน -0.01 ถึง -0.50 มีความสัมพันธ์กันทางลบ ต่ำ -0.51 ถึง -0.80 มีความสัมพันธ์กันทางลบ ปานกลาง -0.81 ถึง -0.99 มีความสัมพันธ์กันทางลบ สูง -1.00 มีความสัมพันธ์กันทางลบ อย่างสมบูรณ์

Thank you!