งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology นายแพทย์ชนินันท์ สนธิไชย พบ., FETP, สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology นายแพทย์ชนินันท์ สนธิไชย พบ., FETP, สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา."— ใบสำเนางานนำเสนอ:

1 สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology นายแพทย์ชนินันท์ สนธิไชย พบ., FETP, สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา กองควบคุมโรคติดต่อ สำนักอนามัย

2 สถิติ เก็บรวบรวมข้อมูล เรียบเรียง การวิเคราะห์ การแปลผล การนำเสนอ

3 การอธิบายลักษณะข้อมูล อัตราส่วน (Ratio) สัดส่วน (Proportion) อัตรา (Rate)

4 อัตราส่วน (Ratio) ค่าเปรียบเทียบระหว่างตัวเลข 2 จำนวน เศษไม่ได้เป็นส่วนหนึ่งของส่วน X:Y อัตราส่วนของชายต่อหญิง คือ 2:3

5 สัดส่วน (Proportion) การเปรียบเทียบจำนวนย่อยกับจำนวนรวม เศษเป็นส่วนหนึ่งของส่วน ผลรวมของสัดส่วน เป็น 1 หรือร้อยละ 100 เสมอ X/Y หรือ X/Y x 100 สัดส่วนของประชากรชาย คือ 0.4 หรือ ร้อยละ 40

6 อัตรา (Rate) การวัดโอกาสของการเกิดเหตุการณ์หรือจำนวนความถี่ในกลุ่ม ประชากรที่ศึกษา มีเวลาเข้ามาเกี่ยวข้อง อัตราเกิด อัตราตาย

7 ลักษณะของตัวแปร แบ่งตามลักษณะของตัวแปร –เชิงคุณภาพ –เชิงปริมาณ แบ่งตามมาตรการวัดตัวแปร –Nominal –Ordinal –Interval –Ratio

8 ลักษณะของตัวแปร ตัวแปรเชิงคุณภาพ (Qualitative Variable) มีคุณสมบัติแตกต่างกันในแง่ของชนิดหรือประเภทหรือ คุณลักษณะ เช่น เพศ อาชีพ ภูมิลำเนา ตัวแปรเชิงปริมาณ (Quantitative Variable) มีความแตกต่างกันตามความถี่ จำนวน หรือปริมาณมาก น้อย สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อย กว่าอีกนามหนึ่ง เช่น อายุ น้ำหนัก ส่วนสูง คะแนนสอบ

9 มาตรการวัดตัวแปร มาตรนามบัญญัติ (Nominal Scale) เป็นการจำแนกข้อมูลโดยใช้นามเป็นเกณฑ์ ไม่สามารถเปรียบเทียบได้ว่านามหนึ่งดีกว่านามหนึ่ง เช่น เพศ อาชีพ มาตรอันดับ (Ordinal Scale) เป็นการจำแนกข้อมูลโดยใช้นามเป็นเกณฑ์ สามารถเรียงลำดับเปรียบเทียบได้ว่านามใดดีกว่าหรือด้อยกว่าอีกนามหนึ่ง เช่น ระดับการศึกษา ระดับความนิยม มาตรอันตรภาค (Interval Scale) เป็นการจำแนกข้อมูลโดยใช้นามและลำดับ สามารถวัดปริมาณความแตกต่างของนามได้ ไม่มี “0” ที่แท้จริง เช่น อุณหภูมิ ไอคิว มาตรอัตราส่วน (Ratio Scale) สามารถเปรียบเทียบอัตราส่วนระหว่างปริมาณได้ มี “0” ที่แท้จริง เช่น รายได้ อายุ น้ำหนัก

10 ประเภทของสถิติในงานระบาดวิทยา ชีวสถิติ Biostatistics สถิติเชิงพรรณนา Descriptive Statistics สถิติเชิงอนุมาน Inferential Statistics การคาดประมาณ Parameter Estimation การทดสอบสมมติฐาน Hypothesis Testing การคาดประมาณเฉพาะค่า Point Estimation การคาดประมาณเป็นช่วง Interval Estimation

11 องค์ประกอบของสถิติ ประชากร Population กลุ่มตัวอย่าง Sample พารามิเตอร์ (Parameter) สถิติ (Statistics) ค่าเฉลี่ยเลขคณิต μ ค่าเบี่ยงเบนมาตรฐาน δ ค่าสัดส่วน π ค่าเฉลี่ยเลขคณิต x ค่าเบี่ยงเบนมาตรฐาน s ค่าสัดส่วน p

12 ประชากรประเทศไทย 63,525,062 คน กลุ่มตัวอย่าง 1,000 คน น้ำหนักตัวเฉลี่ย (x) = 50 kg น้ำหนักตัวเฉลี่ย (μ) = ?? kg พารามิเตอร์ สถิติ ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย สถิติเชิงอนุมาน

13 สถิติเชิงพรรณนา (Descriptive Statistics) ใช้เพื่ออธิบายลักษณะของข้อมูลที่เก็บรวบรวมมาได้ –สัดส่วน อัตรา อัตราส่วน (Proportion, Rate, Ratio) –ค่ากลาง (Mean, Median, Mode) –ค่าการกระจาย (Variance, SD, Range, Interquartile Range)

14 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจาย (Measures of Central Location and Dispersion)

15 การวัดแนวโน้มเข้าสู่ส่วนกลาง (Measure of Central Location) –เพื่อหาค่าที่เป็นตัวแทนที่ดีที่สุดของกลุ่มประชากร การวัดการกระจาย (Measure of dispersion) –เพื่อดูว่าประชากรแต่ละคนมีความแตกต่างกันมากน้อย เพียงใด –เพื่อดูความแตกต่างของประชากรแต่ละคนจากค่ากลาง

16 16 การวัดแนวโน้มเข้าสู่ส่วนกลาง Measure of Central Location Mean (Arithmetic Mean) ค่าเฉลี่ยเลขคณิต Median มัธยฐาน Mode ฐานนิยม

17 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเฉลี่ย (Mean หรือ Average) ผลรวมของข้อมูลหารด้วยจำนวนข้อมูล สัญลักษณ์

18 kg ตัวอย่าง จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน = == ค่าเฉลี่ย คือ 25 kg

19 kg ตัวอย่าง จงคำนวณค่าเฉลี่ยน้ำหนักตัวของนักเรียน 9 คน = == ค่าเฉลี่ย คือ 31.6 kg

20 คุณสมบัติของค่าเฉลี่ย คำนวณโดยอาศัยข้อมูลทุกค่า มีความไวในกรณีที่มีข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ หากข้อมูลมีลักษณะเบ้ ค่าเฉลี่ยจะไม่สามารถเป็นตัวแทนของ กลุ่มข้อมูลที่ดีได้

21 มัธยฐาน (Median) ค่าข้อมูลที่อยู่ตำแหน่งตรงกลางของชุดข้อมูลที่เรียงลำดับ จำนวนข้อมูลที่มีค่ามากกว่ามัธยฐาน เท่ากับจำนวนข้อมูลที่มีค่า น้อยกว่ามัธยฐาน วิธีการหาค่ามัธยฐาน –จัดเรียงลำดับข้อมูลจากน้อยไปหามาก –หาข้อมูลที่อยู่ในตำแหน่งตรงกลางจากสูตร –กรณีจำนวนข้อมูลเป็นเลขคี่ ค่ามัธยฐานคือข้อมูลตำแหน่งกลาง –กรณีจำนวนข้อมูลเป็นเลขคู่ ค่ามัธยฐานจะอยู่ระหว่างข้อมูล 2 ตำแหน่ง กลาง และเท่ากับค่าเฉลี่ยของข้อมูล 2 ตำแหน่งนั้น

22 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ 25 kg

23 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 9 คน จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ 25 kg

24 ตัวอย่าง จงคำนวณค่ามัธยฐานน้ำหนักตัวของนักเรียน 10 คน จัดลำดับข้อมูลจากน้อยไปหามาก ค่ามัธยฐาน คือ = 26 kg

25 คุณสมบัติของค่ามัธยฐาน ข้อมูลที่มีค่าต่างไปจากกลุ่มมากๆ ไม่มีผลต่อค่ามัธยฐาน นิยมใช้ในกรณีที่ข้อมูลมีลักษณะเบ้

26 ฐานนิยม (Mode) ค่าที่มีความถี่สูงที่สุด หรือค่าที่ซ้ำกันมากที่สุด มักใช้กับตัวแปรเชิงคุณภาพ

27 ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน ค่าฐานนิยม คือ 27 kg

28 ตัวอย่าง จงคำนวณค่าฐานนิยมของน้ำหนักตัวของนักเรียน 9 คน ค่าฐานนิยม คือ 22 และ 27 kg

29 29 การวัดการกระจาย Measure of Dispersion Variance (ความแปรปรวน) Standard Deviation: SD (ค่าเบี่ยงเบนมาตรฐาน) Range (พิสัย) Percentile (เปอร์เซ็นไทล์) Quartile (ควอไทล์) Interquartile (อินเตอร์ควอไทล์)

30 ตัวอย่าง จงคำนวณค่าเฉลี่ยคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน Mean = 80 คะแนน Mean = 80 คะแนน Mean = 80 คะแนน

31 Median = 80 คะแนน ตัวอย่าง จงคำนวณค่ามัธยฐานคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน

32 ความแปรปรวน (Variance) และค่าเบี่ยงเบนมาตรฐาน (SD) Variance = s 2 = = SD = s = = ใช้ประกอบกับค่าเฉลี่ย

33 Degree of freedom ค่าเฉลี่ย คือ 25 kg สุ่มตัวอย่าง ประชากร 9 คน กลุ่มตัวอย่าง 3 คน ??? Degree of freedom = n-1

34 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Mean และ Standard Deviation

35 การกระจายแบบเบ้ขวา (Skew to the right หรือ Positive skew)

36 การกระจายแบบเบ้ซ้าย (Skew to the left หรือ Negative skew)

37 การกระจายแบบเบ้ซ้ายการกระจายแบบเบ้ขวา

38 พิสัย (Range) ความแตกต่างระหว่างค่าน้อยที่สุดกับค่ามากที่สุดในชุดข้อมูล ค่ามากที่สุด - ค่าน้อยที่สุด –ทางสถิติ พิสัย... –ทางระบาดวิทยา ตั้งแต่... ถึง... ใช้ประกอบกับค่ามัธยฐาน

39 Median = 80 คะแนน ตัวอย่าง ค่ามัธยฐานและพิสัยของคะแนนสอบของนักเรียน 5 คน ในแต่ละห้องเรียน Range คะแนน Range คะแนน Range คะแนน

40 Percentiles เกิดจากการแบ่งข้อมูลเป็น 100 ส่วนเท่าๆ กัน เมื่อข้อมูลถูก เรียงจากน้อยไปหามาก มีค่าอยู่ระหว่าง Percentiles ที่ P หมายถึง ค่าที่มีจำนวนข้อมูลน้อยกว่าร้อยละ P ของชุดข้อมูลทั้งหมด 10 th Percentile 33 rd Percentile 10% 33% 90% 67%

41 Quartiles เกิดจากการแบ่งข้อมูลเป็น 4 ส่วนเท่าๆ กัน เมื่อข้อมูลถูกเรียง จากน้อยไปหามาก แบ่งเป็น Quartile ที่ 1, 2, 3 และ 4 Q1 คือ ค่า ณ ตำแหน่งที่ Q3 คือ ค่า ณ ตำแหน่งที่ 1 st Quartile2 nd Quartile3 rd Quartile4 th Quartile 25 th Percentile 50 th Percentile75 th Percentile100 th Percentile Median

42 Interquartile Range เป็นการวัดการกระจายที่นิยมใช้ประกอบกับค่ามัธยฐาน เป็นตัวแทนของข้อมูลครึ่งหนึ่งที่อยู่ในช่วงกลางของชุดข้อมูล ระหว่าง P25-P75 1 st Quartile2 nd Quartile3 rd Quartile4 th Quartile 25 th Percentile 50 th Percentile75 th Percentile100 th Percentile Interquartile Range

43 การวัดแนวโน้มเข้าสู่ส่วนกลางและการวัดการกระจายโดยใช้ Median, Percentile, Quartile และ Interquartile Range

44 การเลือกวิธีการวัดแนวโน้มเข้าสู่ส่วนกลาง และวิธีการวัดการกระจาย ขึ้นอยู่กับรูปแบบการกระจายของข้อมูล ข้อมูลมีการกระจายแบบปกติ (Normal Distribution) ควรใช้ Mean และ SD ข้อมูลมีการกระจายแบบเบ้ (Skew Distribution) ควรใช้ Median และ Range หรือ Interquartile Range การกระจายแบบปกติการกระจายแบบเบ้

45 สรุปแนวทางการเลือกใช้วิธีการวัดแนวโน้มเข้าสู่ ส่วนกลางและวิธีการวัดการกระจาย รูปแบบการกระจายการวัดแนวโน้มเข้าสู่ ส่วนกลาง การวัดการกระจาย การกระจายแบบปกติ (Normal Distribution) ค่าเฉลี่ยเลขคณิต (Arithmetic Mean) ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) การกระจายแบบเบ้ (Skew Distribution) ค่ามัธยฐาน (Median)พิสัย (Range) หรือ Interquartile Range การกระจายแบบ Exponential หรือ Logarithmic ค่าเฉลี่ยเรขาคณิต (Geometric Mean) Geometric Standard Deviation

46 ตัวอย่างการใช้สถิติเชิงพรรณนา ค่ามัธยฐานของอายุผู้ป่วยเท่ากับ 29 ปี (พิสัย ปี) ระยะฟักตัวของโรคเฉลี่ยเท่ากับ 15 วัน (SD 3.6 วัน) อัตราส่วนผู้ป่วยเพศชายต่อเพศหญิงคือ 3:2 อัตราป่วยโรคไข้เลือดออกในเดือนมกราคม 47 รายต่อประชากร แสนคน อัตราป่วยรายร้อยละ 3 ผู้ป่วยส่วนใหญ่เป็นนักเรียน/นักศึกษาร้อยละ 67 46

47 สถิติเชิงอนุมาน (Inferential Statistics) ใช้เพื่อนำผลสรุปของข้อมูลที่คำนวณได้จากข้อมูล ตัวอย่างไปอ้างอิงถึงค่าพารามิเตอร์ –การประมาณค่าพารามิเตอร์ (Parameter Estimation) –การทดสอบสมมติฐาน (Hypothesis Testing)

48 ประชากรประเทศไทย 63,525,062 คน กลุ่มตัวอย่าง 1,000 คน (x) = 50 kg μ = 50 kg / 48 kg / 55 kg ตัวอย่าง ต้องการทราบน้ำหนักตัวเฉลี่ยของประชากรไทย (x) = 48 kg (x) = 55 kg

49 50 kg48 kg55 kg 95% CI = kg 42 kg58 kg

50 50 ช่วงความเชื่อมั่น (Confidence Interval) หากทำการศึกษาแบบเดียวกัน 100 ครั้ง จะได้ช่วงความ เชื่อมั่น 100 ช่วง ซึ่งจะมี 95 ช่วง ที่ครอบคลุม ค่าพารามิเตอร์ที่ต้องการหา ค่าที่บ่งบอกว่าผลการศึกษาครั้งนี้ คาดว่าจะมีค่าผิดพลาด ไม่เกินช่วงที่กำหนด –90% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 10% –95% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 5% –99% CI หมายความว่า จะมีค่าที่ผิดพลาดจากการคำนวณ 1%

51 51 Confidence limits และ Confidence Interval ขีดจำกัดของช่วงเชื่อมั่น (Confidence limits) –ต่ำสุดที่ยอมรับได้ เรียกว่า ขีดจำกัดล่าง –ค่าสูงสุดที่ยอมรับได้ เรียกว่า ขีดจำกัดบน ช่วงเชื่อมั่น (Confidence interval) –บอกความเที่ยง (Reliability) ของผลการศึกษา หรืออีกนัยหนึ่ง ว่ามีระดับของความคลาดเคลื่อนมากน้อยเพียงใด –ขึ้นกับจำนวนตัวอย่างที่ศึกษา

52 ตัวอย่าง จากการศึกษาเพื่อหาน้ำหนักตัวเฉลี่ยของประชากรไทย โดยการสุ่มตัวอย่าง จำนวน 1,000 คน พบว่า ประชากรไทยมีน้ำหนักเฉลี่ย 50 kg (95% CI 42-58) ถ้าทำการศึกษาซ้ำกัน 100 ครั้ง จะมี 95 ครั้ง ที่ได้น้ำหนักเฉลี่ยอยู่ระหว่าง 42 kg ถึง 58 kg แต่ในทางปฏิบัติ ผู้ศึกษาจะทำการศึกษาครั้งเดียว ดังนั้น ช่วงความเชื่อมั่นจึง คำนวณได้จากสูตร (ทราบค่า Variance) (ไม่ทราบค่า Variance)

53 การทดสอบสมมติฐาน (Hypothesis testing) น้ำหนักเฉลี่ยของประชากรจังหวัด ก มีความแตกต่างจากจังหวัด ข หรือไม่ ประชากรจังหวัด ก 1,316,293 คน ประชากรจังหวัด ข 1,767,601 คน กลุ่มตัวอย่าง 100 คน กลุ่มตัวอย่าง 100 คน x ก = 46 kg x ข = 49 kg ≠ µ ก ??? µ ข

54 สรุป ประเภทของสถิติ สถิติเชิงพรรณนา การใช้ Excel เบื้องต้น

55 ขอบคุณครับ


ดาวน์โหลด ppt สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology นายแพทย์ชนินันท์ สนธิไชย พบ., FETP, สม., วว.เวชศาสตร์ป้องกัน แขนงระบาดวิทยา กลุ่มงานระบาดวิทยา.

งานนำเสนอที่คล้ายกัน


Ads by Google