งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย"— ใบสำเนางานนำเสนอ:

1 การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
สถาบันวิจัยและพัฒนาสุขภาพภาคใต้ (วพส.) หน่วยระบาดวิทยา คณะเเพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์

2 การวัด (Measurement) การวัดทางระบาดวิทยา แบ่งออกได้เป็น 3 ชนิด คือ
การวัดขนาดของโรค การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค

3 การวัดขนาดของโรค การวัดขนาดของโรค (Measurement of magnitude or frequency of disease occurrence) คือ การวัดจำนวนหรือความมากน้อยของการเกิดโรค การวัดขนาดความชุกของโรค (Prevalence) การวัดอุบัติการณ์ของโรค (Incidence)

4 การวัดขนาดความชุกของโรค
การวัดขนาดความชุกของโรค (Prevalence) คือ จำนวนของโรคที่มีอยู่ในขณะที่ทำการศึกษา แบ่งเป็น 2 ลักษณะ Point Prevalence คือ จำนวนของโรคที่มีอยู่ ณ จุดเวลาใดเวลาหนึ่ง เช่น จำนวนผู้ป่วยโรคเบาหวานในจังหวัดสงขลา ณ วันที่ 31 ธันวาคม 2553 Period Prevalence คือ จำนวนของโรคที่มีอยู่ในช่วงเวลาใดเวลาหนึ่ง เช่น จำนวนผู้ป่วยโรคเบาหวานในจังหวัดสงขลาในช่วงปี 2550 ถึง 2553

5 การวัดอุบัติการณ์ของโรค
การวัดอุบัติการณ์ของโรค (Incidence) คือ การวัดจำนวนการเกิดขึ้นใหม่ของโรค (Occurrence of disease) มี 2 ลักษณะ คือ การวัดความเสี่ยง การวัดอัตรา

6 การวัดความเสี่ยง การวัดความเสี่ยง (Risk) หรือ โอกาส (Chance) ต่อการเกิดโรค ได้แก่ Risk หรือ Cumulative incidence คือ โอกาสหรือความเสี่ยงต่อการเกิดโรคในช่วงเวลาที่ทำการศึกษา เช่น ในหมู่บ้านหนึ่งมีประชากร 1,000 คน มีคนเป็นวัณโรครายใหม่ 10 คนในปีนี้ ดังนั้นความเสี่ยงต่อการเกิดวัณโรคในหมู่บ้านนี้เท่ากับ 10/1,000 หรือ 1% ต่อปี

7 การวัดความเสี่ยง (ต่อ)
Case fatality (CF) เป็นการวัดความรุนแรงของโรคจากสัดส่วนการตายจากโรค เช่น จากเหตุการณ์ความรุนแรงในพื้นที่จังหวัดชายแดนใต้เดือนเมษายน มีจำนวนผู้บาดเจ็บ 100 คน มีจำนวนผู้เสียชีวิต 8 คน สามารถคำนวณโดยใช้สูตร CF = A ÷ D ดังนั้น CF = 8/100 = 0.08 = 8%

8 การวัดอัตรา การวัดอัตรา (Rate) ของการเกิดโรค หรือ Person-time incidence หรือ Incidence density เป็นการวัดว่าการเกิดโรคในกลุ่มคนที่ยังไม่ได้มีโรคนั้น เกิดขึ้นเร็วหรือช้าเพียงใด โดยใช้ระยะเวลาของการเสี่ยงต่อการเกิดโรค (Person-time at risk: PT) ของทุก ๆ คน ที่อยู่ในการศึกษาเป็นฐานของการคำนวณ Rate = D ÷ PT เช่น การเฝ้าสังเกตการเกิดโรคชนิดหนึ่ง ในคน 6 คน ตั้งแต่ปี 1981 ถึง 1988 โดยระยะเวลาของการเสี่ยงต่อการเกิดโรคของแต่ละคน ได้แก่ 1, 7, 8, 3, 5 และ 8 ปี ตามลำดับ ซึ่งปรากฏว่าเป็นโรคไป 4 คน ดังนั้น Rate = 4 / 32 Person-years = 12.5%

9 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค (Measurement of association) มีหลายลักษณะ เช่น วัดในลักษณะของ Ratio scale ได้แก่ Cumulative incidence ratio หรือ Risk ratio Incidence density ratio หรือ Rate ratio Odds ratio Prevalence ratio วัดในลักษณะของ Difference scale ได้แก่ Cumulative incidence difference หรือ Risk difference Incidence density difference หรือ Rate difference

10 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
ตัวอย่าง การศึกษาความสัมพันธ์ระหว่าง Thymus radiation และ childhood cancer ในแบบ Cohort Studies Childhood Cancer เป็น ไม่เป็น รวม Radiation ได้รับ 17 1,705 1,722 ไม่ได้รับ 5 1,790 1,795

11 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
Childhood Cancer เป็น ไม่เป็น รวม Radiation ได้รับ 17 1,705 1,722 ไม่ได้รับ 5 1,790 1,795 จากข้อมูลตัวเลขในตาราง จะสามารถคำนวณ Cumulative incidence (Risk) ของ Childhood cancer ในกลุ่มที่ได้รับการฉายรังสี = 17 ÷ 1,722 = 9.87 ต่อพัน Cumulative incidence (Risk) ของ Childhood cancer ในกลุ่มที่ไม่ได้รับการฉายรังสี = 5 ÷ 1,795 = 2.79 ต่อพัน

12 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
Cumulative incidence ratio หรือ “Risk ratio” = 9.87 ÷ 2.79 = 3.54 ซึ่งมีความหมายว่า โอกาสเกิด Childhood cancer ในเด็กที่ได้รับการฉายรังสีเป็น 3.54 “เท่า” เมื่อเทียบกับเด็กที่ไม่ได้รับการฉายรังสี Cumulative incidence difference หรือ “Risk difference” = (9.87 ต่อพัน) – (2.79 ต่อพัน) = 7.09 ต่อพัน ซึ่งมีความหมายว่า โอกาสเกิด Childhood cancer ในเด็กที่ได้รับการฉายรังสี “มากกว่า” เด็กที่ไม่ได้รับการฉายรังสี 7.09 ต่อพัน

13 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
ตัวอย่าง การศึกษาความสัมพันธ์ระหว่างการได้รับ Estrogen hormone และการเกิด Endometrial cancer โดยใช้ข้อมูลจาก Case และ Control กลุ่มละ 317 คน (Smith DC. N Engl J Med 1975.) ดังตารางข้างล่าง

14 การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค
จากข้อมูลตัวเลขในตาราง จะสามารถคำนวณ Odds ของการใช้ Estrogen hormone ใน Case = 152 ÷ 165 = 0.92 Odds ของการใช้ Estrogen hormone ใน Control = 54 ÷ 263 = 0.21 Odds ratio = 0.92 ÷ 0.21 = 4.49 ซึ่งมีความหมายว่า โอกาสการเกิด Endometrial cancer ในผู้ใช้ Estrogen hormone เป็น 4.49 “เท่า” เมื่อเทียบกับผู้ที่ไม่ได้ใช้

15 การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค
การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค (Measurement of impact) มี 2 ลักษณะ คือ การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรคในกลุ่มผู้ที่มีปัจจัยนั้นๆ Attributable fraction among the exposed (AFe) = le = Incidence ในผู้ที่มีปัจจัย lu = Incidence ในผู้ที่ไม่มีปัจจัย การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรคในประชากรทั้งหมด Attributable fraction among in the whole population (AFp) = lp = Incidence ทั้งหมด

16 การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค
AFe = = 0.75 = 75% AFp = = 0.60 = 60%

17 สถิติเชิงพรรณนา (Descriptive statistics)
สมสวัสดิ์ มาลาทอง หน่วยระบาดวิทยา คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์

18 ค่ากลาง ค่ากลางที่นิยมใช้กันในปัจจุบันมีดังต่อไปนี้ ค่าเฉลี่ย (Mean)
ค่ามัธยฐาน (Median) ค่าฐานนิยม (Mode)

19 ค่าเฉลี่ย (Mean) ค่าเฉลี่ย (Mean) ใช้กับข้อมูลต่อเนื่อง (Continuous variable) ที่มีการกระจายแบบปกติ (Normal distribution) โดยการนำเอาค่าของข้อมูลแต่ละตัวมารวมกันแล้วหารด้วยจำนวนข้อมูลทั้งหมด

20 ค่ามัธยฐาน (Median) ค่ามัธยฐาน (Median) ใช้กับข้อมูลที่มีการกระจายแบบไม่ปกติ (Not normal distribution) เป็นค่าของข้อมูลที่อยู่กึ่งกลางของข้อมูลทั้งหมดหลังจากเรียงลำดับข้อมูลจากน้อยไปมากหรือจากมากไปน้อย ตัวอย่าง 1 จงหาค่ามัธยฐานของข้อมูล 3, 7, 19, 25, 12, 18, 10 วิธีทำ เรียงข้อมูลจากน้อยไปมากได้ 3, 7, 10, 12, 18, 19, 25 ข้อมูลมีทั้งหมด 7 ตัว เมื่อเรียงลำดับข้อมูลแล้วตัวเลขที่อยู่ตำแหน่งตรงกลาง คือ ตัวเลขตำแหน่งที่ 4 = (จำนวนข้อมูลทั้งหมด + 1)/2) ดังนั้นมัธยฐานจึงมีค่าเท่ากับ 12

21 ค่ามัธยฐาน (Median) ตัวอย่าง 2 จงหาค่ามัธยฐานของข้อมูล 4, 8, 19, 12, 18, 11 วิธีทำ เรียงข้อมูลจากน้อยไปมากได้ 4, 8, 11, 12, 18, 19 ข้อมูลมีทั้งหมด 6 ตัว เมื่อเรียงลำดับข้อมูลแล้วตัวเลขที่อยู่ตำแหน่งตรงกลาง คือ ตัวเลขตำแหน่งที่ 3.5 = (จำนวนข้อมูลทั้งหมด + 1)/2) ดังนั้นมัธยฐานจึงมีค่าเท่ากับ (11+12)/2 = 11.5

22 ค่าฐานนิยม (Mode) ค่าฐานนิยม (Mode) เป็นค่าของข้อมูลที่มีความถี่สูงสุดในชุดข้อมูลนั้น ค่าฐานนิยมใช้เป็นค่ากลางได้กับข้อมูลทุกประเภท ตัวอย่าง 1 จงหาฐานนิยมของข้อมูลชุดนี้ 3, 2, 5, 3, 3, 3, 3, 3, 3, 3, 5 วิธีทำ ข้อมูลมี 2 จำนวน 1 ค่า มี 3 จำนวน 8 ค่า มี 5 จำนวน 2 ค่า ดังนั้น ฐานนิยมของข้อมูล คือ 3

23 ค่าฐานนิยม (Mode) ตัวอย่าง 2 จงหาฐานนิยมของข้อมูลชุดนี้ 3, 2, 2, 3, 5, 3, 2, 4, 4, 6, 5 วิธีทำ ข้อมูลมี 2 จำนวน 3 ค่า มี 3 จำนวน 3 ค่า มี 4 จำนวน 2 ค่า มี 5 จำนวน 2 ค่า และมี 6 จำนวน 1 ค่า ดังนั้น ฐานนิยมของข้อมูล คือ 2,3

24 การกระจาย ค่าที่นิยมบ่งบอกถึงการกระจายของข้อมูลมีดังต่อไปนี้
ค่าเบี่ยงเบนมาตรฐาน พิสัย (range) ค่าพิสัยระหว่างควอไทล์ (interquartile range, IQR) เปอร์เซ็นไทล์ (percentile) กับ ควอไทล์ (Quartile) ควรจะไปอยู่ตรงไหน

25 ค่าเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐาน เป็นการดูการกระจายของข้อมูลต่อเนื่อง

26 พิสัย (range) พิสัย (range) เป็นการวัดการกระจายที่ง่ายที่สุดใช้แสดงลักษณะการกระจายของข้อมูลอย่างหยาบ ๆ โดยหาความแตกต่างของข้อมูลสูงสุดและต่ำสุดของกลุ่ม ตัวอย่าง มีข้อมูลคือ 10, 12, 15, 18 และ 20 วิธีทำ พิสัย = = 10

27 พิสัย (range) ข้อมูลที่มีพิสัยกว้างแสดงว่ามีการกระจายของข้อมูลมาก ค่าพิสัยที่คำนวณจากข้อมูลที่มีค่าสูงหรือต่ำผิดปกติอยู่ในชุดข้อมูลจะทำให้พิสัยไม่สามารถสะท้อนการกระจายที่แท้จริง พิสัยใช้ได้กับทั้งข้อมูลลำดับและข้อมูลต่อเนื่อง และเหมาะสมสำหรับการวัดการกระจายของข้อมูลจำนวนน้อย ๆ เพราะง่ายต่อการคำนวณและสามารถบอกการกระจายของข้อมูลแต่ละกลุ่มว่าแตกต่างกันหรือไม่

28 เปอร์เซ็นไทล์ (percentile)
เปอร์เซ็นไทล์ (percentile) เป็นการแบ่งข้อมูลออกเป็น 100 ส่วนเท่า ๆ กัน โดยตำแหน่งที่แบ่งมี 99 ค่า คือ P1 P2 P P99 โดยมัธยฐาน = P50 Pi =i = ตำแหน่งของเปอร์เซ็นไทล์ n = จำนวนข้อมูลทั้งหมด

29 ควอไทล์ (Quartile) ควอไทล์ (Quartile) เป็นการแบ่งข้อมูลออกเป็น 4 ส่วนเท่า ๆ กัน โดยตำแหน่งที่แบ่งมี 3 ค่าคือ Q1 Q2 Q3 ควอไทล์ที่ 1 (Q1) คือ จำนวนที่แบ่งข้อมูลออกเป็น 25% ที่มีค่าน้อยกว่าและ 75% ที่มีค่ามากกว่า (P25) ควอไทล์ที่ 2 (Q2) คือ ค่ามัธยฐาน ควอไทล์ที่ 3 (Q3) คือ จำนวนที่แบ่งข้อมูลเป็น 75% ที่มีค่าน้อยกว่า และ 25% ที่มีค่ามากกว่า (P75) i = ตำแหน่งของควอไทล์ n = จำนวนข้อมูลทั้งหมด

30 ค่าพิสัยระหว่างควอไทล์
ค่าพิสัยระหว่างควอไทล์ (interquartile range, IQR) เป็นวัดการกระจายของข้อมูลด้วยผลต่างระหว่างควอไทล์ที่ 3 และควอไทล์ที่ 1 ตัวอย่าง อายุ วิธีทำ ค่าพิสัยระหว่างควอไทล์ (IQR) = Q3-Q1 = = 25 ค่าพิสัยระหว่างควอไทล์ใช้พรรณนาข้อมูลลำดับและข้อมูลต่อเนื่อง ซึ่งจะแสดงให้เห็นว่า ร้อยละ 50 ของข้อมูลที่อยู่ตรงกลางมีช่วงห่างเท่าใด

31


ดาวน์โหลด ppt การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย

งานนำเสนอที่คล้ายกัน


Ads by Google