(Descriptive Statistics) สถิติเชิงบรรยาย (Descriptive Statistics) ดร.วิษณุ ทรัพย์สมบัติ
Descriptive statistic ประเภทของสถิติ Sampling Population Sample Descriptive statistic Parameter , 2, Statistics X, S2, r Inferential statistic - Estimation - Testing hypothesis
ประเภทของสถิติ การนำเสนอข้อมูลในรูปตาราง กราฟ แผนภูมิ การแจกแจงความถี่ การวัดแนวโน้มเข้าสู่ศูนย์กลาง การจัดตำแหน่ง การวัดการกระจาย กาหาความสัมพันธ์ของตัวแปร เป็นต้น สถิติบรรยาย(Descriptive statistic) การประมาณค่าพารามิเตอร์ (Estimation) การทดสอบสมมติฐาน (Testing hypothesis) (z-test t-test ANOVA เป็นต้น) สถิติอ้างอิง (Inferential Statistic) 3
การวัดตำแหน่งเปรียบเทียบ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย Introduction Frequency Central Tendency Dispersion สถิติบรรยาย (Descriptive Statistics) การนำเสนอข้อมูล การแจกแจงความถี่ การวัดตำแหน่งเปรียบเทียบ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย การหาความสัมพันธ์ของตัวแปร
การแจกแจงความถี่ (Frequency distribution) Introduction Frequency Central Tendency Dispersion การแจกแจงความถี่ (Frequency distribution) การนำข้อมูลที่รวบรวมได้มาจัดใหม่ให้เป็นระเบียบ เป็นหมวดหมู่ เพื่อแสดงให้ทราบว่าข้อมูลแต่ละค่า หรือข้อมูลแต่ละกลุ่ม เกิดขึ้นซ้ำๆ กันกี่ครั้ง ซึ่งเป็นการย่นย่อข้อมูลเพื่อให้แปลความหมายได้มากขึ้น ตารางแจกแจงความถี่มีส่วนประกอบที่สำคัญ 3 ส่วน คะแนน (X) รอยขีด (Tally) ความถี่ (f) การแจงแจงความถี่แบบไม่จัดเป็นกลุ่ม (Ungrouped Frequency Distribution) 2. การแจงแจงความถี่แบบจัดเป็นกลุ่ม (Grouped Frequency Distribution)
ลักษณะข้อมูลกับการแจกแจงความถี่ Introduction Frequency Central Tendency Dispersion ลักษณะข้อมูลกับการแจกแจงความถี่ ข้อมูลเชิงคุณภาพ การแจกแจงความถี่แบบไม่จัดเป็นกลุ่ม ข้อมูลเชิงปริมาณ การแจกแจงความถี่แบบจัดเป็นกลุ่ม
การแจกแจงความถี่แบบไม่จัดเป็นกลุ่ม Introduction Frequency Central Tendency Dispersion การแจกแจงความถี่แบบไม่จัดเป็นกลุ่ม ข้อมูล: อาชีพของกลุ่มตัวอย่าง 31 คน ครู ทหาร พยาบาล ครู รับจ้าง เกษตรกร ตำรวจ ค้าขาย พยาบาล ครู รับจ้าง ทหาร ตำรวจ เกษตรกร เกษตรกร ครู ครู เกษตรกร ตำรวจ รับจ้าง เกษตรกร ค้าขาย ทหาร ครู รับจ้าง รับจ้าง ค้าขาย เกษตรกร ค้าขาย พยาบาล เกษตรกร อาชีพ Tally f ครู //// / 6 ทหาร /// 3 พยาบาล รับจ้าง //// 5 เกษตรกร //// // 7 ตำรวจ ค้าขาย 4 รวม 31
ข้อมูล: คะแนนผลการสอบวิชาภาษาอังกฤษของนักเรียน 40 คน Introduction Frequency Central Tendency Dispersion ข้อมูล: คะแนนผลการสอบวิชาภาษาอังกฤษของนักเรียน 40 คน 26 9 20 23 15 30 12 19 12 24 13 21 18 21 14 23 20 13 16 20 19 20 17 21 8 25 19 9 21 17 25 15 15 20 18 14 27 21 20 17 อาชีพ Tally f 30 / 1 29 - 28 27 ... … 9 // 2 8 รวม 40
การแจกแจงความถี่แบบจัดเป็นกลุ่ม Introduction Frequency Central Tendency Dispersion การแจกแจงความถี่แบบจัดเป็นกลุ่ม ขั้นตอน 1. หาพิสัยของคะแนน (พิสัย (R) = คะแนนสูงสุด – คะแนนต่ำสุด) 2. กำหนดจำนวนชั้น (ประมาณ 10 – 20 ชั้น) 3. คำนวณหาความกว้างของชั้นหรืออันตรภาคชั้น (Class interval) สูตร อันตรภาคชั้น = พิสัย/จำนวนชั้น 4. เขียนขีดจำกัดชั้นของคะแนนแต่ละชั้นลงในช่องคะแนน (จะเริ่มจาก คะแนนสูงสุดหรือต่ำสุดก็ได้) 5. ขีดรอยคะแนน (Tally) 6. นับจำนวนรอยคะแนนของข้อมูล(ความถี่) แล้วใส่ในช่องความถี่
ข้อมูล: คะแนนผลการสอบวิชาภาษาอังกฤษของนักเรียน 40 คน Introduction Frequency Central Tendency Dispersion ข้อมูล: คะแนนผลการสอบวิชาภาษาอังกฤษของนักเรียน 40 คน 26 9 20 23 15 30 12 19 12 24 13 21 18 21 14 23 20 13 16 20 19 20 17 21 8 25 19 9 21 17 25 15 15 20 18 14 27 21 20 17 1. หาพิสัยของคะแนน , พิสัย = 30 – 8, เท่ากับ 22 2. กำหนดจำนวนชั้น (เท่ากับ 8 ชั้น) 3. หาอันตรภาคชั้น (สูตร อันตรภาคชั้น = พิสัย/จำนวนชั้น) อันตรภาคชั้น = 22/8, เท่ากับ 2.5 ประมาณ 3 4. เขียนขีดจำกัดชั้นของคะแนนแต่ละชั้นลงในช่องคะแนน (เริ่มจาก 30 คะแนน) 5. ขีดรอยคะแนน (Tally) 6. นับจำนวนรอยคะแนนของข้อมูล(ความถี่) แล้วใส่ในช่องความถี่
ขีดจำกัดชั้นที่แท้จริง Introduction Frequency Central Tendency Dispersion ขีดจำกัดบน ชั้นคะแนน Tally f 28 – 30 //// / / //// /// //// // //// //// // 1 4 12 6 40 7 3 25 – 27 ขีดจำกัดล่าง 22 – 24 19 – 21 16 – 18 จุดกึ่งกลางชั้น (15+13)/2 =14 13 – 15 10 – 12 ขีดจำกัดชั้นที่แท้จริง บน = (9+10)/2 =9.5 ล่าง = (7+6)/2=6.5 7 – 9 รวม ขีดจำกัดบน หมายถึง คะแนนสูงสุดของคะแนนแต่ละชั้น ขีดจำกัดล่าง หมายถึง คะแนนต่ำสุดของคะแนนแต่ละชั้น จุดกึ่งกลางชั้น หมายถึง คะแนนที่อยู่ระหว่างขีดจำกัดบนและขีดจำกัดล่าง ขีดจำกัดชั้นที่แท้จริง หมายถึง คะแนนที่แต่ละชั้นคะแนนมีค่าต่อเนื่องกัน หาได้จาก (ขีดจำกัดบนของชั้นนั้น+ขีดจำกัดล่างของชั้นถัดไป)/2
Introduction Frequency Central Tendency Dispersion ชั้นคะแนน 28 – 30 25 – 27 22 – 24 19 – 21 16 – 18 รวม 13 – 15 10 – 12 7 – 9 ความถี่ ความถี่สะสม ความถี่สัมพัทธ์ 1/40=0.025 0.100 0.300 0.150 0.175 0.075 1 ร้อยละ 2.5 10.0 30.0 15.0 17.5 7.5 100.0 1 40 39 35 31 19 13 6 3 4 4 12 6 7 3 3 40
การวัดตำแหน่งเปรียบเทียบ Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ 1. อัตราส่วน (Ratio) เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับรายการย่อยของตัวแปร ตัวอย่างเช่น อัตราส่วนของนักเรียนชายกับนักเรียนหญิง 30:20 = 3:2 อัตราส่วนของโรงเรียนขนาดใหญ่ กลาง เล็ก 70:20:25 = 15:4:1 2. สัดส่วน (Proportion) เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนทั้งหมดของตัวแปรนั้น ตัวอย่างเช่น สัดส่วนของผู้สอบผ่าน/ไม่ผ่าน (จำนวน 50 คน) สัดส่วนของผู้สอบผ่าน 30/50 = 0.60 สัดส่วนของผู้สอบไม่ผ่าน 20/50 = 0.40 13
การวัดตำแหน่งเปรียบเทียบ Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ 3. ร้อยละ (Percent) เป็นการเปรียบเทียบความถี่ระหว่างรายการย่อยกับจำนวนความถี่ทั้งหมดที่ปรับเทียบให้เป็น 100 คำนวณเหมือนค่าสัดส่วนและปรับฐานให้เป็น 100 ตัวอย่างเช่น ร้อยละของผู้สอบผ่าน/ไม่ผ่าน (จำนวน 50 คน) ร้อยละของผู้สอบผ่าน 30 X 100 = 60 หรือ 60% 50 ร้อยละของผู้สอบไม่ผ่าน 20 X 100 = 40 หรือ 40% 14
การวัดตำแหน่งเปรียบเทียบ Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ 4. ควอร์ไทล์ (Quartile) เดไซล์ (Decile) และเปอร์เซ็นไทล์ (Percentile) ควอร์ไทล์ (Quartile) เป็นค่าที่แบ่งข้อมูลซึ่งเรียงลำดับตามขนาดออกเป็น 4 ส่วน เดไซล์ (Decile) เป็นค่าที่แบ่งข้อมูลซึ่งเรียงลำดับตามขนาดออกเป็น 10 ส่วน เปอร์เซ็นไทล์ (Percentile) เป็นค่าที่แบ่งข้อมูลซึ่งเรียงลำดับตามขนาดออกเป็น 100 ส่วน เป็นการเปรียบเทียบตำแหน่งของคะแนนใดคะแนนหนึ่งกับคะแนนที่เหลือทั้งหมดของชุดนั้น โดยถือว่าจำนวนคะแนนทั้งหมดมี 100 ส่วน P จึงบอกตำแหน่งของคะแนน (X) นั้นว่ามีค่าสูงกว่าคะแนนอื่นอยู่กี่เปอร์เซ็นต์ 15
ค่าน้อย ค่ามาก Q2 Q1 Q3 D2 D3 D1 D4 D5 D6 D7 D8 D9 P1 P10 P20 P99 Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ ค่าน้อย ค่ามาก Q2 Q1 Q3 D2 D3 D1 D4 D5 D6 D7 D8 D9 P1 P10 P20 P99 P………………………………………….. Px = 100r N + 1 Dx = 10r N + 1 Qx = 4r N + 1 Qx,Dx,Qx ตำแหน่ง P ที่ X D ที่ X และ Q ที่ X r คือ ตำแหน่งของข้อมูลที่ต้องการหา P,D,Q เมื่อเรียงข้อมูลจากน้อยไปหามาก N คือ จำนวนข้อมูลทั้งหมด 16
การวัดตำแหน่งเปรียบเทียบ Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ การหาตำแหน่งของข้อมูล จากข้อมูลผลการสอบวิชาสถิติของผู้สอบ 7 คน พบว่าได้คะแนนดังนี้ 13, 15, 24, 17, 22, 16, 25 จงหา P ของผู้สอบที่ได้คะแนนเท่ากับ 17 วิธีคิด 1. เรียงข้อมูลจากน้อยไปมาก 13, 15, 16, 17, 22, 24, 25 2. หาตำแหน่งของ 17 คือ ตำแหน่งที่ 4 3. หา P = 100 X 4/7 + 1 = 50 P50 = 17 คะแนน หมายความว่า มีผู้สอบที่ได้คะแนนต่ำกว่า 17 คะแนน หรือเท่ากับ 17 คะแนน อยู่ 50 คนจาก ผู้สอบ 100 คน 17
การวัดตำแหน่งเปรียบเทียบ Introduction Frequency Central Tendency Dispersion การวัดตำแหน่งเปรียบเทียบ การหาค่าของข้อมูล ณ ตำแหน่งที่ต้องการ P=(n+1)r n คือ จำนวนข้อมูลทั้งหมด 100 จากข้อมูลการสอบสถิติพบว่าได้คะแนนดังนี้ 13, 15, 24, 17, 22, 16 จงหา P ที่ 30 วิธีคิด 1. เรียงข้อมูลจากน้อยไปมาก 13, 15, 16, 17, 22, 24 2. หา P30 = (6+1)30 = 2.1 3. หาค่าของ P30 พบว่ามีค่าระหว่าง 15 กับ 16 เทียบบัญญัติไตรยางศ์หาค่าได้ดังนี้ ตำแหน่งห่างกัน 1 ตำแหน่ง ค่าของข้อมูลห่างกัน = 1 ตำแหน่งห่างกัน .1 ตำแหน่งค่าของข้อมูลห่างกัน 1X.1/100 = .1 ดังนั้น P30 = 15+.1 = 15.1 18
ค่ากลางที่นิยมใช้ในงานวิจัย ระดับการวัดของข้อมูล Introduction Frequency Central Tendency Dispersion การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measure of Central Tendency) การหาค่ากลางหรือค่าที่เป็นตัวแทนของข้อมูลแต่ละชุด ค่ากลางที่นิยมใช้ในงานวิจัย ระดับการวัดของข้อมูล ค่าเฉลี่ย (Mean) “ X ” ตัวกลางเลขคณิต อัตราส่วน อันตรภาค 2. มัธยฐาน (Median) “Mdn” ข้อมูลที่มีตำแหน่งอยู่กึ่งกลางเมื่อเรียงลำดับแล้ว เรียงอันดับ นามบัญญัติ 3. ฐานนิยม (Mode) “Mo” ข้อมูลที่มีความถี่สูงสุดเมื่อเปรียบเทียบกับ ข้อมูลอื่นในชุดเดียวกัน นามบัญญัติ
Introduction Frequency Central Tendency Dispersion ค่าเฉลี่ย (Mean) ค่าที่ได้จากการเอาผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนข้อมูลทั้งหมด
คุณสมบัติที่สำคัญของค่าเฉลี่ย Introduction Frequency Central Tendency Dispersion คุณสมบัติที่สำคัญของค่าเฉลี่ย ผลรวมของความแตกต่างระหว่างคะแนนแต่ละตัวจากค่าเฉลี่ยของคะแนน ชุดนั้นมีค่าเท่ากับ 0 2. ผลรวมของความแตกต่างกำลังสองของคะแนนแต่ละตัวจากจำนวน M ใดๆ จะน้อยที่สุดเมื่อ M เท่ากับค่าเฉลี่ยของคะแนนชุดนั้น มีค่าน้อยที่สุด เมื่อ M เท่ากับค่าเฉลี่ยของคะแนนชุดนั้น 3. ค่าเฉลี่ยของข้อมูลชุดใดๆ จะต้องอยู่ระหว่างคะแนนที่มีค่าน้อยที่สุด และ คะแนนตัวที่มีค่ามากที่สุด
คุณสมบัติที่สำคัญของค่าเฉลี่ย (ต่อ) Introduction Frequency Central Tendency Dispersion คุณสมบัติที่สำคัญของค่าเฉลี่ย (ต่อ) 4. ในกรณีที่คะแนนทุกตัวของข้อมูลชุดหนึ่งเพิ่มขึ้น (หรือลดลง) เท่าๆ กัน ค่าเฉลี่ยของข้อมูลชุดนั้นจะเปลี่ยนแปลงไปในปริมาณที่เท่ากัน 5. ถ้าคะแนนทุกตัวของข้อมูลชุดหนึ่งคูณหรือหารด้วยค่าคงที่ค่าหนึ่ง ค่าเฉลี่ย ของข้อมูลชุดนั้นจะมีค่าเท่ากับค่าเฉลี่ยค่าเดิมคูณหรือหารค่าค่าคงที่นั้น
สถิติบรรยาย มัธยฐาน (median: Mdn) ค่าที่อยู่กึ่งกลางหรือตรงกลางของตัวเลขที่เรียงลำดับ 20 22 23 25 25 26 28 29 29 29 30 30 31 32 32 33 33 33 34 35 36 40 41 41 42 43 46 52 58 59 สูตร 0 1 2 3 4 5 6 7 8 9 10 Median = 5
มัธยฐาน (Median) มัธยฐาน อยู่ตรงตำแหน่งที่ 4 มีค่าเท่ากับ 6 Introduction Frequency Central Tendency Dispersion มัธยฐาน (Median) ค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลทั้งชุด เมื่อได้เรียงลำดับ ข้อมูลจากน้อยที่สุดไปหามากที่สุด หรือจากมากที่สุดไปหาน้อยที่สุด ข้อมูล: 5, 1, 3, 10, 9, 6, 7, เรียงลำดับข้อมูล: 1, 3, 5, 6, 7, 9, 10 มัธยฐาน อยู่ตรงตำแหน่งที่ 4 มีค่าเท่ากับ 6
Introduction Frequency Central Tendency Dispersion มัธยฐาน (Median) ค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลทั้งชุด เมื่อได้เรียงลำดับ ข้อมูลจากน้อยที่สุดไปหามากที่สุด หรือจากมากที่สุดไปหาน้อยที่สุด ข้อมูล: 2, 5, 1, 3, 10, 9, 6, 7, เรียงลำดับข้อมูล: 1, 2, 3, 5, 6, 7, 9, 10 มัธยฐาน อยู่ระหว่างตำแหน่งที่ 4 กับ 5 มีค่าเท่ากับค่าเฉลี่ยของข้อมูลสองค่านั้น มัธยฐาน = (5+6) / 2 = 5.5
ฐานนิยม (Mode) ค่าของข้อมูลตัวหนึ่งซึ่งเป็นข้อมูลตัวที่มีความถี่สูงสุด Introduction Frequency Central Tendency Dispersion ฐานนิยม (Mode) ค่าของข้อมูลตัวหนึ่งซึ่งเป็นข้อมูลตัวที่มีความถี่สูงสุด ข้อมูล: แดง เขียว น้ำเงิน ขาว แดง เหลือง เขียว แดง ฟ้า ขาว ฐานนิยม คือ แดง ข้อมูล: แดง เขียว น้ำเงิน ขาว แดง เหลือง เขียว แดง ฟ้า เขียว ฐานนิยม คือ แดง เขียว ข้อมูล: อาทิตย์, จันทร์, อังคาร, พุธ, พฤหัส, ศุกร์, เสาร์ ฐานนิยม คือ ไม่มี
เบ้ซ้าย, เบ้ลบ เบ้ขวา, เบ้บวก Introduction Frequency Central Tendency Dispersion ความสัมพันธ์ระหว่างค่าเฉลี่ย มัธยฐาน และฐานนิยม Mean Mdn Mo Mo Mdn Mean เบ้ซ้าย, เบ้ลบ Mo Mdn Mean ข้อสังเกต ค่ามัธยฐานจะอยู่ตรงกลางเสมอ ถ้าค่ามัธยฐานมากกว่าค่าเฉลี่ย จะเป็นโค้งทางลบ ถ้าค่ามัธยฐานน้อยกว่าค่าเฉลี่ย จะเป็นโค้งทางบวก เบ้ขวา, เบ้บวก
จงพิจารณาข้อความว่าเป็นสถิติเชิงบรรยายหรือสถิติเชิงอ้างอิง แพทย์ต้องการทดสอบว่าระยะเวลาในการออกฤทธิ์ยาชนิดใหม่เป็นไปตามที่เขาคิดหรือไม่ ครูภาษาไทยหาคะแนนเฉลี่ยของนักเรียนที่สอบ ฝ่ายวิชาการแสดงข้อมูลนักเรียนที่จบในปี 50-51 ฝ่ายแผนงานฯ ประมาณจำนวนนักเรียนด้อยโอกาสในเขตจังหวัดชัยภูมิ ผอ.วินัยทดลองการบริหารงานแบบ SBM กับโรงเรียนประเภทที่ 1 นายสมชาติประมาณดูว่าเขาจะสอบวิชาสถิติปลายภาคได้กี่คะแนน