งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology"— ใบสำเนางานนำเสนอ:

1 สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology
นายแพทย์ชนินันท์ สนธิไชย พบ., FETP, สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา กองควบคุมโรคติดต่อ สำนักอนามัย

2 สถิติ เก็บรวบรวมข้อมูล เรียบเรียง การวิเคราะห์ การแปลผล การนำเสนอ

3 การอธิบายลักษณะข้อมูล
อัตราส่วน (Ratio) สัดส่วน (Proportion) อัตรา (Rate)

4 อัตราส่วน (Ratio) ค่าเปรียบเทียบระหว่างตัวเลข 2 จำนวน
เศษไม่ได้เป็นส่วนหนึ่งของส่วน X:Y อัตราส่วนของชายต่อหญิง คือ 2:3

5 สัดส่วน (Proportion) การเปรียบเทียบจำนวนย่อยกับจำนวนรวม
เศษเป็นส่วนหนึ่งของส่วน ผลรวมของสัดส่วน เป็น 1 หรือร้อยละ 100 เสมอ X/Y หรือ X/Y x 100 สัดส่วนของประชากรชาย คือ 0.4 หรือ ร้อยละ 40

6 อัตรา (Rate) การวัดโอกาสของการเกิดเหตุการณ์หรือจำนวนความถี่ในกลุ่มประชากรที่ศึกษา มีเวลาเข้ามาเกี่ยวข้อง อัตราเกิด อัตราตาย

7 ลักษณะของตัวแปร แบ่งตามลักษณะของตัวแปร แบ่งตามมาตรการวัดตัวแปร
เชิงคุณภาพ เชิงปริมาณ แบ่งตามมาตรการวัดตัวแปร Nominal Ordinal Interval Ratio

8 ลักษณะของตัวแปร ตัวแปรเชิงคุณภาพ (Qualitative Variable)
มีคุณสมบัติแตกต่างกันในแง่ของชนิดหรือประเภทหรือคุณลักษณะ เช่น เพศ อาชีพ ภูมิลำเนา ตัวแปรเชิงปริมาณ (Quantitative Variable) มีความแตกต่างกันตามความถี่ จำนวน หรือปริมาณมากน้อย สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อยกว่าอีกนามหนึ่ง เช่น อายุ น้ำหนัก ส่วนสูง คะแนนสอบ

9 มาตรการวัดตัวแปร มาตรนามบัญญัติ (Nominal Scale)
เป็นการจำแนกข้อมูลโดยใช้นามเป็นเกณฑ์ ไม่สามารถเปรียบเทียบได้ว่านามหนึ่งดีกว่านามหนึ่ง เช่น เพศ อาชีพ มาตรอันดับ (Ordinal Scale) สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อยกว่าอีกนามหนึ่ง เช่น ระดับการศึกษา ระดับความนิยม มาตรอันตรภาค (Interval Scale) เป็นการจำแนกข้อมูลโดยใช้นามและลำดับ สามารถวัดปริมาณความแตกต่างของนามได้ ไม่มี “0” ที่แท้จริง เช่น อุณหภูมิ ไอคิว มาตรอัตราส่วน (Ratio Scale) สามารถเปรียบเทียบอัตราส่วนระหว่างปริมาณได้ มี “0” ที่แท้จริง เช่น รายได้ อายุ น้ำหนัก

10 ประเภทของสถิติในงานระบาดวิทยา
ชีวสถิติ Biostatistics สถิติเชิงพรรณนา Descriptive Statistics สถิติเชิงอนุมาน Inferential Statistics การคาดประมาณ Parameter Estimation การทดสอบสมมติฐาน Hypothesis Testing การคาดประมาณเฉพาะค่า Point Estimation การคาดประมาณเป็นช่วง Interval Estimation

11 องค์ประกอบของสถิติ พารามิเตอร์ (Parameter) สถิติ (Statistics) ประชากร
Population ค่าเฉลี่ยเลขคณิต μ ค่าเบี่ยงเบนมาตรฐาน δ ค่าสัดส่วน π สถิติ (Statistics) กลุ่มตัวอย่าง Sample ค่าเฉลี่ยเลขคณิต x ค่าเบี่ยงเบนมาตรฐาน s ค่าสัดส่วน p

12 ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย
ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย ประชากรประเทศไทย 63,525,062 คน พารามิเตอร์ น้ำหนักตัวเฉลี่ย (μ) = ?? kg สถิติเชิงอนุมาน กลุ่มตัวอย่าง 1,000 คน สถิติ น้ำหนักตัวเฉลี่ย (x) = 50 kg

13 สถิติเชิงพรรณนา (Descriptive Statistics)
ใช้เพื่ออธิบายลักษณะของข้อมูลที่เก็บรวบรวมมาได้ สัดส่วน อัตรา อัตราส่วน (Proportion, Rate, Ratio) ค่ากลาง (Mean, Median, Mode) ค่าการกระจาย (Variance, SD, Range, Interquartile Range)

14 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจาย (Measures of Central Location and Dispersion)

15 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measure of Central Location)
เพื่อหาค่าที่เป็นตัวแทนที่ดีที่สุดของกลุ่มประชากร การวัดการกระจาย (Measure of dispersion) เพื่อดูว่าประชากรแต่ละคนมีความแตกต่างกันมากน้อยเพียงใด เพื่อดูความแตกต่างของประชากรแต่ละคนจากค่ากลาง

16 การวัดแนวโน้มเข้าสู่ส่วนกลาง Measure of Central Location
Mean (Arithmetic Mean) ค่าเฉลี่ยเลขคณิต Median มัธยฐาน Mode ฐานนิยม 16

17 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)
ค่าเฉลี่ย (Mean หรือ Average) ผลรวมของข้อมูลหารด้วยจำนวนข้อมูล สัญลักษณ์

18 ตัวอย่าง จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน
9 = 225 9 = = 25 kg ค่าเฉลี่ย คือ 25 kg

19 ตัวอย่าง จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน
9 = 284 9 = = 31.6 kg ค่าเฉลี่ย คือ 31.6 kg

20 คุณสมบัติของค่าเฉลี่ย
คำนวณโดยอาศัยข้อมูลทุกค่า มีความไวในกรณีที่มีข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ หากข้อมูลมีลักษณะเบ้ ค่าเฉลี่ยจะไม่สามารถเป็นตัวแทนของกลุ่มข้อมูลที่ดีได้

21 มัธยฐาน (Median) ค่าข้อมูลที่อยู่ตำแหน่งตรงกลางของชุดข้อมูลที่เรียงลำดับ จำนวนข้อมูลที่มีค่ามากกว่ามัธยฐาน เท่ากับจำนวนข้อมูลที่มีค่าน้อยกว่ามัธยฐาน วิธีการหาค่ามัธยฐาน จัดเรียงลำดับข้อมูลจากน้อยไปหามาก หาข้อมูลที่อยู่ในตำแหน่งตรงกลางจากสูตร กรณีจำนวนข้อมูลเป็นเลขคี่ ค่ามัธยฐานคือข้อมูลตำแหน่งกลาง กรณีจำนวนข้อมูลเป็นเลขคู่ ค่ามัธยฐานจะอยู่ระหว่างข้อมูล 2 ตำแหน่งกลาง และเท่ากับค่าเฉลี่ยของข้อมูล 2 ตำแหน่งนั้น

22 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน
จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ 25 kg

23 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน
จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ 25 kg

24 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 10 คน
จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ = 26 kg

25 คุณสมบัติของค่ามัธยฐาน
ข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ ไม่มีผลต่อค่ามัธยฐาน นิยมใช้ในกรณีที่ข้อมูลมีลักษณะเบ้

26 ฐานนิยม (Mode) ค่าที่มีความถี่สูงที่สุด หรือค่าที่ซ้ำกันมากที่สุด
มักใช้กับตัวแปรเชิงคุณภาพ

27 ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน
ค่าฐานนิยม คือ 27 kg

28 ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน
ค่าฐานนิยม คือ 22 และ 27 kg

29 การวัดการกระจาย Measure of Dispersion
Variance (ความแปรปรวน) Standard Deviation: SD (ค่าเบี่ยงเบนมาตรฐาน) Range (พิสัย) Percentile (เปอร์เซ็นไทล์) Quartile (ควอไทล์) Interquartile (อินเตอร์ควอไทล์) 29

30 ตัวอย่าง จงคำนวณค่าเฉลี่ยคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน
Mean = 80 คะแนน Mean = 80 คะแนน Mean = 80 คะแนน

31 จงคำนวณค่ามัธยฐานคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน
ตัวอย่าง จงคำนวณค่ามัธยฐานคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน Median = 80 คะแนน Median = 80 คะแนน Median = 80 คะแนน

32 ความแปรปรวน (Variance) และค่าเบี่ยงเบนมาตรฐาน (SD)
SD = s = = ใช้ประกอบกับค่าเฉลี่ย

33 Degree of freedom ประชากร 9 คน 24 28 17 32 27 25 22 19 31 สุ่มตัวอย่าง
ค่าเฉลี่ย คือ 25 kg สุ่มตัวอย่าง กลุ่มตัวอย่าง 3 คน ??? Degree of freedom = n-1

34 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Mean และ Standard Deviation

35 การกระจายแบบเบ้ขวา (Skew to the right หรือ Positive skew)

36 การกระจายแบบเบ้ซ้าย (Skew to the left หรือ Negative skew)

37 การกระจายแบบเบ้ซ้าย การกระจายแบบเบ้ขวา

38 พิสัย (Range) ความแตกต่างระหว่างค่าน้อยที่สุดกับค่ามากที่สุดในชุดข้อมูล ค่ามากที่สุด - ค่าน้อยที่สุด ทางสถิติ พิสัย... ทางระบาดวิทยา ตั้งแต่... ถึง... ใช้ประกอบกับค่ามัธยฐาน

39 ค่ามัธยฐานและพิสัยของคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน
ตัวอย่าง ค่ามัธยฐานและพิสัยของคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน Median = 80 คะแนน Range คะแนน Median = 80 คะแนน Range คะแนน Median = 80 คะแนน Range คะแนน

40 Percentiles เกิดจากการแบ่งข้อมูลเป็น 100 ส่วนเท่าๆ กัน เมื่อข้อมูลถูกเรียงจากน้อยไปหามาก มีค่าอยู่ระหว่าง 0-100 Percentiles ที่ P หมายถึง ค่าที่มีจำนวนข้อมูลน้อยกว่าร้อยละ P ของชุดข้อมูลทั้งหมด 10% 90% 10th Percentile 33% 67% 33rd Percentile

41 Quartiles เกิดจากการแบ่งข้อมูลเป็น 4 ส่วนเท่าๆ กัน เมื่อข้อมูลถูกเรียงจากน้อยไปหามาก แบ่งเป็น Quartile ที่ 1, 2, 3 และ 4 Q1 คือ ค่า ณ ตำแหน่งที่ Q3 คือ ค่า ณ ตำแหน่งที่ 1st Quartile 2nd Quartile 3rd Quartile 4th Quartile 25th Percentile 50th Percentile 75th Percentile 100th Percentile Median

42 Interquartile Range เป็นการวัดการกระจายที่นิยมใช้ประกอบกับค่ามัธยฐาน
เป็นตัวแทนของข้อมูลครึ่งหนึ่งที่อยู่ในช่วงกลางของชุดข้อมูลระหว่าง P25-P75 1st Quartile 2nd Quartile 3rd Quartile 4th Quartile 25th Percentile 50th Percentile 75th Percentile 100th Percentile Interquartile Range

43 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Median, Percentile, Quartile และ Interquartile Range

44 การเลือกวิธีการวัดแนวโน้มเข้าสู่ส่วนกลาง และวิธีการวัดการกระจาย
การกระจายแบบปกติ การกระจายแบบเบ้ ขึ้นอยู่กับรูปแบบการกระจายของข้อมูล ข้อมูลมีการกระจายแบบปกติ (Normal Distribution) ควรใช้ Mean และ SD ข้อมูลมีการกระจายแบบเบ้ (Skew Distribution) ควรใช้ Median และ Range หรือ Interquartile Range

45 การวัดแนวโน้มเข้าสู่ส่วนกลาง
สรุปแนวทางการเลือกใช้วิธีการวัดแนวโน้มเข้าสู่ส่วนกลางและวิธีการวัดการกระจาย รูปแบบการกระจาย การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย การกระจายแบบปกติ (Normal Distribution) ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) การกระจายแบบเบ้ (Skew Distribution) ค่ามัธยฐาน (Median) พิสัย (Range) หรือ Interquartile Range การกระจายแบบ Exponential หรือ Logarithmic ค่าเฉลี่ยเรขาคณิต (Geometric Mean) Geometric Standard Deviation

46 ตัวอย่างการใช้สถิติเชิงพรรณนา
ค่ามัธยฐานของอายุผู้ป่วยเท่ากับ 29 ปี (พิสัย ปี) ระยะฟักตัวของโรคเฉลี่ยเท่ากับ 15 วัน (SD 3.6 วัน) อัตราส่วนผู้ป่วยเพศชายต่อเพศหญิงคือ 3:2 อัตราป่วยโรคไข้เลือดออกในเดือนมกราคม 47 รายต่อประชากรแสนคน อัตราป่วยรายร้อยละ 3 ผู้ป่วยส่วนใหญ่เป็นนักเรียน/นักศึกษาร้อยละ 67 46

47 สถิติเชิงอนุมาน (Inferential Statistics)
ใช้เพื่อนำผลสรุปของข้อมูลที่คำนวณได้จากข้อมูลตัวอย่างไปอ้างอิงถึงค่าพารามิเตอร์ การประมาณค่าพารามิเตอร์ (Parameter Estimation) การทดสอบสมมติฐาน (Hypothesis Testing)

48 ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย
ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย ประชากรประเทศไทย 63,525,062 คน μ = 50 kg / 48 kg / kg กลุ่มตัวอย่าง 1,000 คน (x) = 50 kg (x) = 48 kg (x) = 55 kg

49 42 kg 58 kg 48 kg 50 kg 55 kg 95% CI = kg

50 ช่วงความเชื่อมั่น (Confidence Interval)
หากทำการศึกษาแบบเดียวกัน 100 ครั้ง จะได้ช่วงความเชื่อมั่น 100 ช่วง ซึ่งจะมี 95 ช่วง ที่ครอบคลุมค่าพารามิเตอร์ที่ต้องการหา ค่าที่บ่งบอกว่าผลการศึกษาครั้งนี้ คาดว่าจะมีค่าผิดพลาดไม่เกินช่วงที่กำหนด 90% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 10% 95% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 5% 99% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 1% 50

51 Confidence limits และ Confidence Interval
ต่ำสุดที่ยอมรับได้ เรียกว่า ขีดจำกัดล่าง ค่าสูงสุดที่ยอมรับได้ เรียกว่า ขีดจำกัดบน ช่วงเชื่อมั่น (Confidence interval) บอกความเที่ยง (Reliability) ของผลการศึกษา หรืออีกนัยหนึ่งว่ามีระดับของความคลาดเคลื่อนมากน้อยเพียงใด ขึ้นกับจำนวนตัวอย่างที่ศึกษา 51

52 ตัวอย่าง จากการศึกษาเพื่อหาน้ำหนักตัวเฉลี่ยของประชากรไทย โดยการสุ่มตัวอย่างจำนวน 1,000 คน พบว่า ประชากรไทยมีน้ำหนักเฉลี่ย 50 kg (95% CI 42-58) ถ้าทำการศึกษาซ้ำกัน 100 ครั้ง จะมี 95 ครั้ง ที่ได้น้ำหนักเฉลี่ยอยู่ระหว่าง 42 kg ถึง 58 kg แต่ในทางปฏิบัติ ผู้ศึกษาจะทำการศึกษาครั้งเดียว ดังนั้น ช่วงความเชื่อมั่นจึงคำนวณได้จากสูตร (ทราบค่า Variance) (ไม่ทราบค่า Variance)

53 การทดสอบสมมติฐาน (Hypothesis testing)
น้ำหนักเฉลี่ยของประชากรจังหวัด ก มีความแตกต่างจากจังหวัด ข หรือไม่ µ ก ??? µ ข ประชากรจังหวัด ก 1,316,293 คน ประชากรจังหวัด ข 1,767,601 คน กลุ่มตัวอย่าง 100 คน กลุ่มตัวอย่าง 100 คน x ก = 46 kg x ข = 49 kg

54 สรุป ประเภทของสถิติ สถิติเชิงพรรณนา การใช้ Excel เบื้องต้น

55 ขอบคุณครับ


ดาวน์โหลด ppt สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology

งานนำเสนอที่คล้ายกัน


Ads by Google