การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
สถิติที่ใช้ในการวิจัย
Advertisements

การวิเคราะห์ข้อมูลโดยสถิติเชิงพรรณนา (Descriptive Statistics)
(Statistical Package for the Social Sciences : SPSS)
Probability & Statistics
ผ.ศ(พิเศษ).น.พ.นภดล สุชาติ พ.บ. M.P.H.
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
การตัดสินใจเบื้องต้น : สถิติเบื้องต้น (Introduction to statistics)
Practical Epidemiology
สถิติในการวัดและประเมินผล
การทดสอบความแปรปรวน ANOVA
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology
การวัดทางระบาดวิทยา น.ส.วิภาวี ธรรมจำรัส.
การวัดการเกิดโรค พ.ท. ผศ.ราม รังสินธุ์ พ.บ. ส.ม. DrPH
ระบาดวิทยาเชิงวิเคราะห์
Model development of TB active case finding in people with diabetes.
Measures of Association and Impact for HTA
Measures of Central Tendency & Measures of Spread or Variation
การวิจัยปฏิบัติการ ในชั้นเรียน
การวิเคราะห์ข้อมูลทางสถิติ เพื่อการทำวิจัยอย่างง่าย
"วิธีวิเคราะห์แบบสอบถาม หรือแบบประเมิน ด้วยโปรแกรม SPSS"
สถิติเบื้องต้นในการวัดผลและประเมินผลการศึกษา
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
ทบทวนสถิติสำหรับการวิจัยทางวิทยาศาสตร์สุขภาพ
การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
การแสดงผลการวิเคราะห์ข้อมูล
สถิติในชีวิตประจำวัน : Statistics in Everyday life
การวัดและประเมินผลการเรียนรู้
สถิติและการวัดทางระบาดวิทยาที่ควรรู้
การสำรวจและอธิบายข้อมูล
Burden of disease measurement
รายวิชาชีวสถิติ (Biostatistics)
โครงการพัฒนาทีมจัดการระบบ การจัดการโรคเรื้อรัง ในระดับจังหวัดปี 2554
ระเบียบวิธีวิจัยทางธุรกิจโรงแรม และท่องเที่ยว
การควบคุมคุณภาพเชิงสถิติ คือ ขั้นตอนทางสถิติโดยใช้ผังควบคุมช่วยเพื่อดูว่าส่วนใดส่วนหนึ่งของกระบวนการผลิตทำงานไม่ถูกต้องและเป็นสาเหตุทำให้สินค้าไม่มีคุณภาพ.
การอ่านและให้คุณค่าบทความวิชาการ (Journal Article Appraisal)
ผู้ช่วยศาสตราจารย์ ดร. สุคนธา ศิริ คณะสาธารณสุขศาสตร์ มหาวิทยาลัยมหิดล
นพ.เฉวตสรร นามวาท กรมควบคุมโรค
ความรู้เบื้องต้นเกี่ยวกับสถิติและโปรแกรมสำเร็จรูปทางสถิติ
การสำรวจและอธิบายข้อมูล
บทที่ 10 สถิติเชิงบรรยาย
การสอบสวนทางระบาดวิทยา (Epidemiological investigation)
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
การวัดทางระบาดและดัชนีอนามัย
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
อ.จงกล โพธิ์แดง ภาควิชาระบาดวิทยา คณะสาธารณสุขศาสตร์ ม.มหิดล 2559
ผู้ดำเนินการวิจัย นางสาว นิลุบล สุวลักษณ์ รหัสนักศึกษา
คะแนนและความหมายของคะแนน
การกระจายของโรคในชุมชน
รูปแบบการศึกษา ทางระบาดวิทยา
การวัดทางระบาดวิทยา ( Measurement in Epidemiology)
การตรวจคัดกรองมะเร็งเต้านม
การสอบสวนโรค เฉพาะราย
สถิติกับดัชนีการวัด... ในงานระบาดวิทยา
ระบบข้อมูลของโครงการสืบสานพระราชปณิธานต้านมะเร็งเต้านม
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล สำนักงานสภามหาวิทยาลัย
ดร.นพ.วรสิทธิ์ ศรศรีวิชัย มูลนิธิสุขภาพภาคใต้
การวิเคราะห์ข้อมูลเบื้องต้น
หลักการคำนวณค่าทางสถิติพื้นฐาน
การเลือกใช้สถิติเพื่อการวิจัย
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจระหว่างประเทศ
CPE 332 Computer Engineering Mathematics II
ชื่อเรื่องวิจัย ชื่อผู้วิจัย
ทบทวนกฎหมายรัฐธรรมนูญ บทบัญญัติที่สำคัญซี่งมีมิติในเชิงคดี
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
งานวิจัย.
การประชุมคณะทำงานการจัดการพลังงาน อาคาร บก. ทท
ขอชื่นชมอาจารย์ วิทยาลัยพยาบาลพระปกเกล้า จันทบุรี ที่มีผลงานวิชาการ นำเสนอในเวทีระดับชาติ และตีพิมพ์ในวารสาร TCI ประจำปี พ.ศ
Chapter 3: Measures of Central Tendency and Measure of Dispersion
ใบสำเนางานนำเสนอ:

การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย สถาบันวิจัยและพัฒนาสุขภาพภาคใต้ (วพส.) หน่วยระบาดวิทยา คณะเเพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์

การวัด (Measurement) การวัดทางระบาดวิทยา แบ่งออกได้เป็น 3 ชนิด คือ การวัดขนาดของโรค การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค

การวัดขนาดของโรค การวัดขนาดของโรค (Measurement of magnitude or frequency of disease occurrence) คือ การวัดจำนวนหรือความมากน้อยของการเกิดโรค การวัดขนาดความชุกของโรค (Prevalence) การวัดอุบัติการณ์ของโรค (Incidence)

การวัดขนาดความชุกของโรค การวัดขนาดความชุกของโรค (Prevalence) คือ จำนวนของโรคที่มีอยู่ในขณะที่ทำการศึกษา แบ่งเป็น 2 ลักษณะ Point Prevalence คือ จำนวนของโรคที่มีอยู่ ณ จุดเวลาใดเวลาหนึ่ง เช่น จำนวนผู้ป่วยโรคเบาหวานในจังหวัดสงขลา ณ วันที่ 31 ธันวาคม 2553 Period Prevalence คือ จำนวนของโรคที่มีอยู่ในช่วงเวลาใดเวลาหนึ่ง เช่น จำนวนผู้ป่วยโรคเบาหวานในจังหวัดสงขลาในช่วงปี 2550 ถึง 2553

การวัดอุบัติการณ์ของโรค การวัดอุบัติการณ์ของโรค (Incidence) คือ การวัดจำนวนการเกิดขึ้นใหม่ของโรค (Occurrence of disease) มี 2 ลักษณะ คือ การวัดความเสี่ยง การวัดอัตรา

การวัดความเสี่ยง การวัดความเสี่ยง (Risk) หรือ โอกาส (Chance) ต่อการเกิดโรค ได้แก่ Risk หรือ Cumulative incidence คือ โอกาสหรือความเสี่ยงต่อการเกิดโรคในช่วงเวลาที่ทำการศึกษา เช่น ในหมู่บ้านหนึ่งมีประชากร 1,000 คน มีคนเป็นวัณโรครายใหม่ 10 คนในปีนี้ ดังนั้นความเสี่ยงต่อการเกิดวัณโรคในหมู่บ้านนี้เท่ากับ 10/1,000 หรือ 1% ต่อปี

การวัดความเสี่ยง (ต่อ) Case fatality (CF) เป็นการวัดความรุนแรงของโรคจากสัดส่วนการตายจากโรค เช่น จากเหตุการณ์ความรุนแรงในพื้นที่จังหวัดชายแดนใต้เดือนเมษายน มีจำนวนผู้บาดเจ็บ 100 คน มีจำนวนผู้เสียชีวิต 8 คน สามารถคำนวณโดยใช้สูตร CF = A ÷ D ดังนั้น CF = 8/100 = 0.08 = 8%

การวัดอัตรา การวัดอัตรา (Rate) ของการเกิดโรค หรือ Person-time incidence หรือ Incidence density เป็นการวัดว่าการเกิดโรคในกลุ่มคนที่ยังไม่ได้มีโรคนั้น เกิดขึ้นเร็วหรือช้าเพียงใด โดยใช้ระยะเวลาของการเสี่ยงต่อการเกิดโรค (Person-time at risk: PT) ของทุก ๆ คน ที่อยู่ในการศึกษาเป็นฐานของการคำนวณ Rate = D ÷ PT เช่น การเฝ้าสังเกตการเกิดโรคชนิดหนึ่ง ในคน 6 คน ตั้งแต่ปี 1981 ถึง 1988 โดยระยะเวลาของการเสี่ยงต่อการเกิดโรคของแต่ละคน ได้แก่ 1, 7, 8, 3, 5 และ 8 ปี ตามลำดับ ซึ่งปรากฏว่าเป็นโรคไป 4 คน ดังนั้น Rate = 4 / 32 Person-years = 12.5%

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค (Measurement of association) มีหลายลักษณะ เช่น วัดในลักษณะของ Ratio scale ได้แก่ Cumulative incidence ratio หรือ Risk ratio Incidence density ratio หรือ Rate ratio Odds ratio Prevalence ratio วัดในลักษณะของ Difference scale ได้แก่ Cumulative incidence difference หรือ Risk difference Incidence density difference หรือ Rate difference

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค ตัวอย่าง การศึกษาความสัมพันธ์ระหว่าง Thymus radiation และ childhood cancer ในแบบ Cohort Studies Childhood Cancer เป็น ไม่เป็น รวม Radiation ได้รับ 17 1,705 1,722 ไม่ได้รับ 5 1,790 1,795

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค Childhood Cancer เป็น ไม่เป็น รวม Radiation ได้รับ 17 1,705 1,722 ไม่ได้รับ 5 1,790 1,795 จากข้อมูลตัวเลขในตาราง จะสามารถคำนวณ Cumulative incidence (Risk) ของ Childhood cancer ในกลุ่มที่ได้รับการฉายรังสี = 17 ÷ 1,722 = 9.87 ต่อพัน Cumulative incidence (Risk) ของ Childhood cancer ในกลุ่มที่ไม่ได้รับการฉายรังสี = 5 ÷ 1,795 = 2.79 ต่อพัน

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค Cumulative incidence ratio หรือ “Risk ratio” = 9.87 ÷ 2.79 = 3.54 ซึ่งมีความหมายว่า โอกาสเกิด Childhood cancer ในเด็กที่ได้รับการฉายรังสีเป็น 3.54 “เท่า” เมื่อเทียบกับเด็กที่ไม่ได้รับการฉายรังสี Cumulative incidence difference หรือ “Risk difference” = (9.87 ต่อพัน) – (2.79 ต่อพัน) = 7.09 ต่อพัน ซึ่งมีความหมายว่า โอกาสเกิด Childhood cancer ในเด็กที่ได้รับการฉายรังสี “มากกว่า” เด็กที่ไม่ได้รับการฉายรังสี 7.09 ต่อพัน

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค ตัวอย่าง การศึกษาความสัมพันธ์ระหว่างการได้รับ Estrogen hormone และการเกิด Endometrial cancer โดยใช้ข้อมูลจาก Case และ Control กลุ่มละ 317 คน (Smith DC. N Engl J Med 1975.) ดังตารางข้างล่าง

การวัดความสัมพันธ์ระหว่างปัจจัยที่ศึกษากับการเกิดโรค จากข้อมูลตัวเลขในตาราง จะสามารถคำนวณ Odds ของการใช้ Estrogen hormone ใน Case = 152 ÷ 165 = 0.92 Odds ของการใช้ Estrogen hormone ใน Control = 54 ÷ 263 = 0.21 Odds ratio = 0.92 ÷ 0.21 = 4.49 ซึ่งมีความหมายว่า โอกาสการเกิด Endometrial cancer ในผู้ใช้ Estrogen hormone เป็น 4.49 “เท่า” เมื่อเทียบกับผู้ที่ไม่ได้ใช้

การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค (Measurement of impact) มี 2 ลักษณะ คือ การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรคในกลุ่มผู้ที่มีปัจจัยนั้นๆ Attributable fraction among the exposed (AFe) = le = Incidence ในผู้ที่มีปัจจัย lu = Incidence ในผู้ที่ไม่มีปัจจัย การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรคในประชากรทั้งหมด Attributable fraction among in the whole population (AFp) = lp = Incidence ทั้งหมด

การวัดผลกระทบของปัจจัยที่ศึกษาต่อการเกิดโรค AFe = = 0.75 = 75% AFp = = 0.60 = 60%

สถิติเชิงพรรณนา (Descriptive statistics) สมสวัสดิ์ มาลาทอง หน่วยระบาดวิทยา คณะแพทยศาสตร์ มหาวิทยาลัยสงขลานครินทร์

ค่ากลาง ค่ากลางที่นิยมใช้กันในปัจจุบันมีดังต่อไปนี้ ค่าเฉลี่ย (Mean) ค่ามัธยฐาน (Median) ค่าฐานนิยม (Mode)

ค่าเฉลี่ย (Mean) ค่าเฉลี่ย (Mean) ใช้กับข้อมูลต่อเนื่อง (Continuous variable) ที่มีการกระจายแบบปกติ (Normal distribution) โดยการนำเอาค่าของข้อมูลแต่ละตัวมารวมกันแล้วหารด้วยจำนวนข้อมูลทั้งหมด

ค่ามัธยฐาน (Median) ค่ามัธยฐาน (Median) ใช้กับข้อมูลที่มีการกระจายแบบไม่ปกติ (Not normal distribution) เป็นค่าของข้อมูลที่อยู่กึ่งกลางของข้อมูลทั้งหมดหลังจากเรียงลำดับข้อมูลจากน้อยไปมากหรือจากมากไปน้อย ตัวอย่าง 1 จงหาค่ามัธยฐานของข้อมูล 3, 7, 19, 25, 12, 18, 10 วิธีทำ เรียงข้อมูลจากน้อยไปมากได้ 3, 7, 10, 12, 18, 19, 25 ข้อมูลมีทั้งหมด 7 ตัว เมื่อเรียงลำดับข้อมูลแล้วตัวเลขที่อยู่ตำแหน่งตรงกลาง คือ ตัวเลขตำแหน่งที่ 4 = (จำนวนข้อมูลทั้งหมด + 1)/2) ดังนั้นมัธยฐานจึงมีค่าเท่ากับ 12

ค่ามัธยฐาน (Median) ตัวอย่าง 2 จงหาค่ามัธยฐานของข้อมูล 4, 8, 19, 12, 18, 11 วิธีทำ เรียงข้อมูลจากน้อยไปมากได้ 4, 8, 11, 12, 18, 19 ข้อมูลมีทั้งหมด 6 ตัว เมื่อเรียงลำดับข้อมูลแล้วตัวเลขที่อยู่ตำแหน่งตรงกลาง คือ ตัวเลขตำแหน่งที่ 3.5 = (จำนวนข้อมูลทั้งหมด + 1)/2) ดังนั้นมัธยฐานจึงมีค่าเท่ากับ (11+12)/2 = 11.5

ค่าฐานนิยม (Mode) ค่าฐานนิยม (Mode) เป็นค่าของข้อมูลที่มีความถี่สูงสุดในชุดข้อมูลนั้น ค่าฐานนิยมใช้เป็นค่ากลางได้กับข้อมูลทุกประเภท ตัวอย่าง 1 จงหาฐานนิยมของข้อมูลชุดนี้ 3, 2, 5, 3, 3, 3, 3, 3, 3, 3, 5 วิธีทำ ข้อมูลมี 2 จำนวน 1 ค่า มี 3 จำนวน 8 ค่า มี 5 จำนวน 2 ค่า ดังนั้น ฐานนิยมของข้อมูล คือ 3

ค่าฐานนิยม (Mode) ตัวอย่าง 2 จงหาฐานนิยมของข้อมูลชุดนี้ 3, 2, 2, 3, 5, 3, 2, 4, 4, 6, 5 วิธีทำ ข้อมูลมี 2 จำนวน 3 ค่า มี 3 จำนวน 3 ค่า มี 4 จำนวน 2 ค่า มี 5 จำนวน 2 ค่า และมี 6 จำนวน 1 ค่า ดังนั้น ฐานนิยมของข้อมูล คือ 2,3

การกระจาย ค่าที่นิยมบ่งบอกถึงการกระจายของข้อมูลมีดังต่อไปนี้ ค่าเบี่ยงเบนมาตรฐาน พิสัย (range) ค่าพิสัยระหว่างควอไทล์ (interquartile range, IQR) เปอร์เซ็นไทล์ (percentile) กับ ควอไทล์ (Quartile) ควรจะไปอยู่ตรงไหน

ค่าเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐาน เป็นการดูการกระจายของข้อมูลต่อเนื่อง

พิสัย (range) พิสัย (range) เป็นการวัดการกระจายที่ง่ายที่สุดใช้แสดงลักษณะการกระจายของข้อมูลอย่างหยาบ ๆ โดยหาความแตกต่างของข้อมูลสูงสุดและต่ำสุดของกลุ่ม ตัวอย่าง มีข้อมูลคือ 10, 12, 15, 18 และ 20 วิธีทำ พิสัย = 20 - 10 = 10

พิสัย (range) ข้อมูลที่มีพิสัยกว้างแสดงว่ามีการกระจายของข้อมูลมาก ค่าพิสัยที่คำนวณจากข้อมูลที่มีค่าสูงหรือต่ำผิดปกติอยู่ในชุดข้อมูลจะทำให้พิสัยไม่สามารถสะท้อนการกระจายที่แท้จริง พิสัยใช้ได้กับทั้งข้อมูลลำดับและข้อมูลต่อเนื่อง และเหมาะสมสำหรับการวัดการกระจายของข้อมูลจำนวนน้อย ๆ เพราะง่ายต่อการคำนวณและสามารถบอกการกระจายของข้อมูลแต่ละกลุ่มว่าแตกต่างกันหรือไม่

เปอร์เซ็นไทล์ (percentile) เปอร์เซ็นไทล์ (percentile) เป็นการแบ่งข้อมูลออกเป็น 100 ส่วนเท่า ๆ กัน โดยตำแหน่งที่แบ่งมี 99 ค่า คือ P1 P2 P3 ... P99 โดยมัธยฐาน = P50 Pi =i = ตำแหน่งของเปอร์เซ็นไทล์ n = จำนวนข้อมูลทั้งหมด

ควอไทล์ (Quartile) ควอไทล์ (Quartile) เป็นการแบ่งข้อมูลออกเป็น 4 ส่วนเท่า ๆ กัน โดยตำแหน่งที่แบ่งมี 3 ค่าคือ Q1 Q2 Q3 ควอไทล์ที่ 1 (Q1) คือ จำนวนที่แบ่งข้อมูลออกเป็น 25% ที่มีค่าน้อยกว่าและ 75% ที่มีค่ามากกว่า (P25) ควอไทล์ที่ 2 (Q2) คือ ค่ามัธยฐาน ควอไทล์ที่ 3 (Q3) คือ จำนวนที่แบ่งข้อมูลเป็น 75% ที่มีค่าน้อยกว่า และ 25% ที่มีค่ามากกว่า (P75) i = ตำแหน่งของควอไทล์ n = จำนวนข้อมูลทั้งหมด

ค่าพิสัยระหว่างควอไทล์ ค่าพิสัยระหว่างควอไทล์ (interquartile range, IQR) เป็นวัดการกระจายของข้อมูลด้วยผลต่างระหว่างควอไทล์ที่ 3 และควอไทล์ที่ 1 ตัวอย่าง อายุ 16 37 92 25 61 21 51 51 07 38 42 54 27 47 48 33 84 42 30 50 38 13 09 16 36 31 วิธีทำ ค่าพิสัยระหว่างควอไทล์ (IQR) = Q3-Q1 = 50-25 = 25 ค่าพิสัยระหว่างควอไทล์ใช้พรรณนาข้อมูลลำดับและข้อมูลต่อเนื่อง ซึ่งจะแสดงให้เห็นว่า ร้อยละ 50 ของข้อมูลที่อยู่ตรงกลางมีช่วงห่างเท่าใด