ทบทวนสถิติสำหรับการวิจัยทางวิทยาศาสตร์สุขภาพ ปราณี นิลกรณ์ 16/11/61
หัวข้อ ทบทวนรูปแบบการวิจัยทางวิทยาศาสตร์สุขภาพ Risk Ratio(Relative Risk) Odds Ratio Survival Analysis 16/11/61
รูปแบบการวิจัย การวิจัยเชิงการสังเกต(observational studies) versus การ วิจัยเชิงการทดลอง(experimental studies) การวิจัยแบบไปข้างหน้า(prospective studies) versus การวิจัย แบบย้อนหลัง(retrospective studies) การวิจัยแบบช่วงเวลา(longitudinal studies) versus การศึกษา ณ จุดเวลา หรือ แบบภาคตัดขวาง(cross-sectional studies) 16/11/61
การวิจัยเชิงการสังเกต Case-series -รายงานผู้ป่วย Cross-section studies- สำรวจสถานการณ์ ณ จุดเวลาใดเวลา หนึ่ง เก็บข้อมูลแค่ครั้งเดียว Cohort studies( from here to eternity จากเวลานี้ถึง กาลปวสาน) เลือกตัวอย่างจากประชากรเดียวกันที่สนใจทั่วไปมา 2 กลุ่มอย่างสุ่ม โดยกลุ่มหนึ่งเป็นกลุ่มที่ ได้รับปัจจัยเสี่ยง( exposure) และอีกกลุ่มไม่ได้รับปัจจัยเสี่ยง(unexposure) ติดตามผู้เป็นตัวอย่างทั้ง 2 กลุ่มไประยะเวลาหนึ่ง (follow-up, prospective, longitudinal) สิ้นสุดระยะเวลาการติดตาม ดูผลและเปรียบเทียบผลว่า 2 กลุ่ม มี outcome ต่างกัน อย่างไรหรือไม่ (ดู RISK RATIO, RELATIVE RISK, RR) 16/11/61
การวิจัยเชิงการสังเกต(ต่อ) Case-control studies( back to the future ย้อนอดีต ดูเหตุจากผลปัจจุบัน) เลือกตัวอย่างมา 2 กลุ่ม โดยกลุ่มหนึ่งเป็นกลุ่มที่เกิด outcome(cases) และอีก กลุ่มเป็นกลุ่มที่ไม่เกิด outcome(control, noncases) ย้อนกลับไปดูว่าตัวอย่างทั้ง 2 กลุ่มนั้น มีใครได้รับปัจจัยเสี่ยงบ้าง (retrospective, longitudinal) เปรียบเทียบ 2 กลุ่มจากปัจจัยเสี่ยงที่ได้รับ( ดู ODDS RATIO) 16/11/61
Experimental Studies Randomized Control Trials(RCT) มีกลุ่มควบคุม(control) และกลุ่มทดลอง(experimental group) การกำหนด subject เข้ากลุ่มไหน ทำอย่างสุ่ม(Randomization) Matched-pairs Independent sample การเลือกใช้สถิติ ขึ้นอยู่กับแผนแบบการทดลองและ outcome variables เช่น t-test แบบจับคู่ , Wilcoxon signed rank test t-test แบบ independent samples, Wilcoxon rank sum test (หรือ Mann-Whitney test) 16/11/61
Experimental Studies(ต่อ) Randomized Block Design(RBD) Completely Randomized Design(CRD) Cross-over Randomized Control Trials(Cross- over design) Blinding, Double blinding 16/11/61
Risk Ratio, Odds Ratio 16/11/61
เหตุการณ์(Event) เหตุการณ์คืออะไร เหตุการณ์ คือ การเกิดของผลลัพธ์(outcome)ที่เราสนใจ เช่น การเกิด การตาย การรักษาหาย ฯลฯ 16/11/61
Risk Ratio(Relative Risk) ใช้เมื่อใด ใช้ในการศึกษาแบบ cohort (prospective studies)ที่เฝ้าติดตามกลุ่มคน เป็นระยะเวลาหนึ่งเพื่อดูผลของทรีตเมนต์ หรือ ดูปัจจัยเสี่ยง(risk factor) ความหมาย Risk คือ ความน่าจะเป็นที่จะเกิดเหตุการณ์ ซึ่งคำนวณจาก Risk = จำนวนการเกิดเหตุการณ์/จำนวนผู้มีความเสี่ยงทั้งหมด (เหมือนความน่าจะป็นของการเกิดเหตุการณ์ p) Risk Ratio = Risk ของกลุ่มทดลอง(หรือ exposed group)/Risk ของกลุ่มควบคุม(หรือ unexposed group) 1 ใน 6 รายงานการวิจัยจะพบ 16/11/61
Risk Ratio(ต่อ) ความหมาย ปกติจะให้มาพร้อมกับช่วงความเชื่อมั่น และนิยมนำเสนอในรูปร้อยละ 16/11/61
Risk Ratio(ต่อ) ตัวอย่าง ในการศึกษาแบบ cohort ที่ติดตามผู้ที่เล่นอเมริกันฟุตบอลเป็นประจำจำนวน 1000 คน และผู้ที่ไม่ได้เล่นอเมริกันฟุตบอล 1000 คน เพื่อดูว่าการเล่นอเมริกันฟุตบอลทำให้ผู้เล่น บาดเจ็บอย่างมีนัยสำคัญหรือไม่ หลังจากติดตามครบ 1 ปี พบว่า มีผู้ขาหักในกลุ่มผู้เล่น 12 คน ในกลุ่มผู้ไม่เล่น 4 คน ดังนั้น Risk(กลุ่มผู้เล่น) = 12/1000 = 0.012 Risk(กลุ่มผู้ไม่เล่น)= 4/1000 = 0.004 Risk Ratio = 0.012/0.002 = 3 95 %CI คือ (0.97, 9.41) กลุ่มผู้เล่นมีความเสี่ยงที่จะบาดเจ็บมากกว่ากลุ่มผู้ไม่เล่น 3 เท่า แต่เนื่องจาก CI ครอบคลุมค่า 1 อาจสรุปว่าความเสี่ยงของสองกลุ่มไม่แตกต่างกันที่ระดับ นัยสำคัญทางสถิติ 0.05 16/11/61
ODDS ให้ p เป็นความน่าจะเป็นของการเกิดเหตุการณ์ที่สนใจ นิยาม ODDS ของเหตุการณ์เป็น p/(1-p) เช่น เหตุการณ์ที่สนใจคือ การเป็นเบาหวาน ในคน 100 คน มีคนเป็นเบาหวาน 15 คน p=15/100=.15 1-p=.85 ODDS ของการเป็นเบาหวานจึงคือ .15/.85=0.18 16/11/61
ความสัมพันธ์ระหว่าง Risk และ Odds p = odds/(1+odds) p/(1-p) 0.9 9 0.8 4 0.5 1 0.4 0.667 0.2 0.25 0.1 0.111 16/11/61
ODDS RATIO ODDS RATIO คือ อัตราส่วนของ ODDS เช่น กลุ่มผู้เป็นเบาหวาน 100 คน เป็นไตวาย 15 คน ไม่เป็น 85 คน odds= 15/85 =0.18 กลุ่มผู้ไม่เป็นเบาหวาน 100 คน เป็นไตวาย 3 คน ไม่เป็น 97 คน odds= 3/97=.031 Odds ratio = .18/.031 =5.8 ความหมาย: ผู้ป่วยเบาหวาน มีความเสี่ยงที่จะเป็นโรคไตวายมากกว่าคนปกติ เกือบ 6 เท่า 16/11/61
Odds Ratio ใน case-control studies ในการศึกษาแบบ case-control studies เพื่อศึกษาปัจจัยที่เป็น อันตรายหรือเป็นสาเหตุ โดยศึกษาเปรียบเทียบระหว่างกลุ่มคนไข้ที่ป่วยด้วยโรคใด โรคหนึ่ง(cases) กับกลุ่มที่ไม่ป่วย(control) นั้น เราไม่สามารถใช้ Risk Ratio ได้ เนื่องจากรูปแบบการวิจัยที่เป็นแบบเริ่มด้วยกลุ่มผู้ป่วยและ กลุ่มผู้ไม่ป่วยและตรวจสอบข้อมูลย้อนหลังไป ส่วน risk มองในแง่ของกลุ่มที่ expose แล้วจึงไปดูว่าเกิดอุบัติการณ์เท่าใด ดังนั้น จึงมองในแง่ของ odds ratio แทน risk ratio ความหมายในแง่ของ case-control studies Odds Ratio = อัตราส่วนระหว่าง odds ของ exposure ในกลุ่มผู้ป่วย (cases) กับ odds ของ exposure ในกลุ่มที่ไม่ป่วย(control) 16/11/61
Odds Ratio(ต่อ) ความหมาย ถ้า odds ratio=1 แสดงว่าอัตรา(rate)ของการได้รับ expose ของกลุ่ม ผู้ป่วยและของกลุ่มควบคุม ไม่แตกต่างกัน ถ้า odds ratio > 1 แสดงว่า อัตรา(rate)ของการได้รับ exposure ใน กลุ่มผู้ป่วยมากกว่าอัตราการได้รับ exposure ในกลุ่มควบคุม (exposure สัมพันธ์กับการเกิดโรคมากขึ้น: risk factor) ถ้า odds ratio < 1 แสดงว่า อัตรา(rate)ของการได้รับ exposure ใน กลุ่มผู้ป่วยน้อยกว่าอัตราการได้รับ exposure ในกลุ่มควบคุม (exposure สัมพันธ์กับการเกิดโรคน้อยลง:protective factor) ปกติจะให้มาพร้อมกับช่วงความเชื่อมั่น (ของ log odds) 16/11/61
ตัวอย่าง 16/11/61
Risk Reduction Relative Risk Reduction(RRR) vs Absolute Risk Reduction(ARR) ใช้เมื่อต้องการทราบว่า ทรีตเมนต์ใช้ได้ผลแค่ไหน ความหมาย ARR เป็นผลต่างระหว่าง Risk ของการเกิดเหตุการณ์ของกลุ่มทดลองและ Risk ของ การเกิดเหตุการณ์ของกลุ่มควบคุม RRR คือ สัดส่วน(proportion)ที่การ intervene ช่วยลดอัตราการเกิด เหตุการณ์ 16/11/61
ตัวอย่าง ในการทดลองที่ให้คนไข้ที่เป็นโรคเชื้อราในช่องคลอดจำนวน 100 คนทานยาเพื่อ รักษาโรค และคนไข้อีก 100 คนทาน Placebo หลังจากนั้น 3 วันก็นำ ผลการรักษามาดู ได้ผลดังนี้ AAR = อัตราการดีขึ้นในกลุ่มทดลอง – อัตราการดีขึ้นในกลุ่มควบคุม AAR = 80%-60%=20% ได้รับยา ได้รับ Placebo ดีขึ้น ไม่ดีขึ้น 80 20 60 40 16/11/61
ตัวอย่าง(ต่อ) จำนวนผู้ที่อาการไม่ดีขึ้นในกลุ่มผู้รับ placebo คือ 40% ได้รับยา ได้รับ Placebo ดีขึ้น ไม่ดีขึ้น 80 20 60 40 RRR = สัดส่วนที่การ intervene ช่วยลดอัตราการเกิดเหตุการณ์ จำนวนผู้ที่อาการไม่ดีขึ้นในกลุ่มผู้รับ placebo คือ 40% ในกลุ่มผู้ได้รับยาจำนวนที่อาการไม่ดีขึ้น 20% หรือ หรือจำนวนผู้ที่อาการไม่ดีขึ้น ลดลงไปเนื่องจากได้รับยา = 40-20 = 20 นั้นคือ RRR= 20%/40% = 50% 16/11/61
Survival Analysis Survival analysis เกี่ยวข้องกับเวลาของการเกิดเหตุการณ์ที่สำคัญบาง เหตุการณ์ เช่น การตาย การโตของก้อนเนื้อร้าย การถูกออกจากงาน การหย่า ร้าง ชิ้นส่วนเสีย เวลาตั้งแต่เริ่มสังเกตหน่วยสังเกตจนกระทั่งถึงการเกิดเหตุการณ์ เรียก survival time บางทีเรียก time until event 16/11/61
Survival data Study period 1 เดือน หยุดการศึกษา เรื่มต้นศึกษา 16/11/61
ตัวอย่างการใช้ การทดลองทางคลินิก เช่น Recovery Time หลังการผ่าตัดหัวใจ การศึกษาแบบ Cohort เช่น เปรียบเทียบเวลาที่คนไข้เสียชีวิตสำหรับกลุ่มทดลอง และกลุ่มควบคุม ประกันชีวิต เช่น เวลาที่เคลมประกัน 16/11/61
การวิเคราะห์ข้อมูล survival ทางสถิติ Life Table นำข้อมูล survival times มาจัดกลุ่มตามช่วงเวลาเท่าๆกันที่เหมาะสม เช่น วินาที วัน เดือน หรือปี เพื่อหาความน่าจะเป็นของการมีชิวิตรอดในช่วงเวลาใดๆ ใช้ในกรณีที่มี ตัวอย่างขนาดใหญ่ Kaplan-Myer survival curve ใช้กรณีที่มีตัวอย่างขนาดเล็กและไม่สามารถจัดกลุ่ม survival time ตามช่วงเวลา เท่าๆกันที่มีความหมายได้ หรือ เมื่อทราบ survival time ที่แท้จริงทุกค่า 16/11/61
ตัวอย่างข้อมูล survival time Survival time(months) over a 12 month study period of 12 patients diagnosed with brain tumour. Patient Month of entry to study(0 indicates present at the beginning of study) Time after studying start date to death or censoring(months) Outcomes:Died(D), Survived(S) or left study prematurely(P) Survival time 1 12 S 2 3 11 D 4 8 … 16/11/61
ตัวอย่างคำถามวิจัยที่ใช้ survival Analysis Biostatistics in Public Health ตัวอย่างคำถามวิจัยที่ใช้ survival Analysis Y = survival time(หน่วยเป็นปี) ตั้งแต่ตรวจพบมะเร็ง X1 = treatment (1=new, 0=standard) X2 = เพศ (1=หญิง, 0=ชาย) X3 = อายุ(ปี), X4 = เชื้อชาติ(ให้รหัส) X5 = ขนาดของเนื้องอก คำถามวิจัย: เมื่อนำตัวแปรร่วมต่างๆมาร่วมพิจารณาด้วยแล้ว วิธีการรักษาใหม่มี ประสิทธิผลหรือไม่? Dr. Afifi (presented by Dr. Cumberland), 7 November 2007
Life Table ตัวแปร คือ survival time เป็นตัวแปรต่อเนื่อง มีข้อสมมติว่า ความน่าจะเป็นของการเกิดเหตุการณ์ขึ้นอยู่กับเวลาเท่านั้น case เข้ามาตอนไหนของเวลา ก็มีพฤติกรรมเหมือนๆกัน 16/11/61
ตัวอย่าง ไฟล์ช้อมูล Talco.sav ซึ่งเป็นไฟล์ตัวอย่างของ SPSS เป็นข้อมูลเกี่ยวกับ เวลาที่ลูกค้าจะวนกลับมาใช้บริการต่ออีกครั้งแยกตามประเภทลูกค้า ตัวแปรประกอบด้วย Time variable: tenure(หน่วยเป็นเดือน) Status variable: churn(1=churn, 0= not churn) Factor: custcat(4 กลุ่ม) 16/11/61
การวิเคราะห์ด้วย SPSS Analyze>Survival>Lifetable จะปรากฏ dialog box ดังนี้ 16/11/61
การวเคราะห์ด้วย SPSS Survival: แสดงฟังก์ชันการรอดชีวิตสะสม(cumulative survival function) Hazard: แสดงฟังก์ชันhazard สะสม 16/11/61
ตัวอย่าง Life Table จาก SPSS 16/11/61
SPSS outputs: life table −Interval Start Time คือเวลาเริ่มต้นสำหรับแต่ละช่วงเวลา แต่ละ ช่วงเวลาเริ่มจากเวลาเริ่มต้นของช่วงถึงเวลาเริ่มต้นของช่วงถัดไป −Number Withdrawing during Interval: จำนวนคนที่ ถอนตัวในช่วงเวลานั้น หรือ censored data ลูกค้าพวกนี้ยังคงเป็น ลูกค้าอยู่ แต่เฉพาะช่วงเวลาที่สังเกตนี้ ลูกค้าพวกนี้ยังไม่มีกิจกรรมอะไร −Number Exposed to Risk จำนวนลูกค้าที่ยัง survive อยู่ ลบด้วยครึ่งหนึ่งของจำนวนที่ถูก censored ไป ทั้งนี้เพื่อนำผลของ censored cases มาพิจารณาด้วย 16/11/61
Life tables Number of Terminal Events จำนวน cases ที่เกิด เหตุการณ์ในช่วงเวลานี้ (ในที่นี้คือลูกค้าที่ churn = 1) −Proportion Terminating จำนวนที่เกิดเหตุการณ์หารด้วย จำนวนผู้มีความเสี่ยงทั้งหมด (10/264.5=0.0378) −Proportion Surviving 1- proportion terminating 16/11/61
16/11/61
ผลลัพธ์ SPSS −Cumulative Proportion Surviving at End of Interval สัดส่วนของผู้ที่ survive นับตั้งแต่แถวเริ่มต้นของตารางจนถึงจบ ช่วงเวลาที่กำลังพิจารณา เช่น ถ้าพิจารณาแถวที่ 2 คำนวณจาก (266- 10-17)/266=0.8984 −Probability Density ค่าประมาณของความน่าจะเป็นที่จะเกิดเหคุ การณ์ในช่วงเวลานั้น −Hazard Rate ค่าประมาณความน่าจะเป็นที่จะเกิดเหตุการณ์ในช่วงเวลา นั้นถ้ามีชีวิครอดมาถึงเวลาเริ่มต้นของช่วงเวลานั้น 16/11/61
สัดส่วนของเหตุการณ์เกิดมากสุดในช่วงปีแรก แสดงว่าควรเอาใจใส่ลูกค้าอย่าง ใกล้ชิดในปีแรกเพื่อลูกค้าจะได้พึงพอใจในการบริการของบริษัท 16/11/61
แกนตั้งแทนความน่าจะเป็นที่จะอยู่รอด แกนนอนแทนเวลาอยู่รอด จะเห็นว่าลูกค้าประเภท total service และ basic service มีความน่าจะเป็นในการอยู่รอดต่ำสุด 16/11/61
การเปรียบเทียบรายคู่พบว่าทุกคู่กลุ่มแตกต่างกัน Wilcoxon test ใช้เปรียบเทียบ survival distribution ของแต่ละกลุ่ม โดยใช้ผลต่างระหว่างคะแนนเฉลี่ยเวลารอดชีวิตระหว่างกลุ่ม เนื่องจากผลการทดสอบมีนัยสำคัญที่ระดับ0.05 จึงสรุปว่า survival curves ของกลุ่มต่างๆแตกต่างกัน การเปรียบเทียบรายคู่พบว่าทุกคู่กลุ่มแตกต่างกัน 16/11/61
Kaplan-Meier chart การนำ Cumulative probability of surviving มาพล็อต กับเวลา จะได้ Kaplan-Meier chart 16/11/61
Kaplan-Meier Procedure ข้อสมมติเบื้องต้น ความน่าจะเป็นของการเกิดเหตุการณ์ที่สนใจขึ้นอยู่กับเวลาเท่านั้น ไม่ได้ขึ้นกับตัวแปรอื่น Cases ที่เข้ามาในการศึกษาที่เวลาต่างกันน่าจะมีพฤติกรรมเหมือนๆกัน (เช่น คนไข้ที่เข้า มารับการรักษาด้วยเวลาเรื่มต้นต่างกัน) คนที่ออกไปจากการศึกษาหรือคนที่ยังคงอยู่จนเกิดเหตุการณ์ถือว่ามีพฤติกรรมเหมือนๆกัน แต่ ถ้าคนที่ออกไปจากการศึกษาเป็นผู้ป่วยอาการหนักกว่าพวกที่ยังอยู่ ผลการศึกษาอาจเกิดการ bias ได้ 16/11/61
ตัวอย่าง ไฟล์ข้อมูล : pain_medication.sav ซึ่งเป็นไฟล์ตัวอย่างของ SPSS เป็นข้อมูลเกี่ยวกับการพัฒนายา anti-inflammatory medication สำหรับรักษา chronic arthritic pain ของ บริษัทยาแห่งหนึ่ง โดยนักวิจัยสนใจเวลาที่ใช้จนกว่ายาจะได้ผลและต้องการเทียบ กับยาที่มีใช้อยู่แล้วด้วย ระยะเวลาที่สั้นกว่าถือว่าดีกว่า เหตุการณ์: ยาใช้ได้ผล วิเคราะห์โดยใช้ Kaplan-Meier procedure 16/11/61
Kaplan-Meier procedure ตัวแปร Time variable: ต้องเป็นตัวแปรต่อเนื่อง Status variable: ตัวแปรเชิงกลุ่มหรือต่อเนื่องแทนเหตุการณ์ที่สนใจ (เช่น ยาใช้ ได้ผล/ไม่ได้ผล) Factor variable: ตัวแปรเชิงกลุ่ม แทน ปัจจัยอิสระที่มีผลต่อเวลา (เช่น ทรีตเมนต์ ต่างๆ) 16/11/61
ตัวอย่าง ข้อมูลชุด pain_medication Factor variable: Treatment (0 = New drug, 1 = old drug), Status variable: status ( 0 = censored, 1 = take effect), Time variable: time ต้องการเปรียบเทียบผลของยาใหม่และยาเก่าว่าเวลาที่ใช้กว่าจะได้ผล ต่างกันไหม สมมติฐานว่าง: survival function ของยาใหม่และยาเก่าเหมือนกัน 16/11/61
การวิเคราะห์ด้วย SPSS Analyze>Survival>Kaplan-Meier 16/11/61
การวิเคราะห์ด้วย SPSS 16/11/61
การวิเคราะห์ด้วย SPSS Click compare factor Log rank: ทดสอบการเท่ากันของ survival functions โดย การให้น้ำหนักทุกจุดเวลาเท่ากัน Breslow: ทดสอบการเท่ากันของ survival functions โดยการ ให้น้ำหนักทุกจุดเวลาด้วยจำนวนผู้ได้รับความเสี่ยงที่แต่ละจุดเวลา Tarone-Ware: ทดสอบการเท่ากันของ survival functions โดยการให้น้ำหนักทุกจุดเวลาด้วยรากที่สองของจำนวนผู้ได้รับความเสี่ยงที่แต่ละจุด เวลา 16/11/61
การวิเคราะห์ด้วย SPSS การเปรียบเทียบ factor Pooled over strata: คำนวณสถิติทดสอบค่าเดียวสำหรับทุก factor levels และใช้ ทดสอบการเท่ากันของ survival function สำหรับทุกระดับของ factor variable. Pairwise over strata: จะคำนวณสถิติทดสอบแยกเฉพาะสำหรับแต่ละคู่ที่เปรียบเทียบตาม ระดับของ factor variable เมื่อผลการทดสอบแบบ pooled test ชี้ว่ามีบางฟังก์ชันไม่ เท่ากัน For each stratum: จะคำนวณสถิติทดสอบแยกสำหรับกลุ่มที่เกิดจากตัวแปรแบ่งชั้นภูมิ( stratification variable) Pairwise for each stratum: จะคำนวณสถิติทดสอบแยกเฉพาะสำหรับแต่ละคู่ที่ เปรียบเทียบตามระดับของ factor variable สำหรับแต่ละชั้นภูมิของตัวแปรแบ่งชั้นภูมิ 16/11/61
การวิเคราะห์ด้วย SPSS สำหรับ options ถ้าคลิ้ก จะปรากฏ dialog box ดังนี้ 16/11/61
ผลลัพธ์ 16/11/61
ผลลัพธ์ Mean survival time ของยาใหม่คือ 4.867 น้อยกว่าของยาเก่าซึ่งคือ 5.165 แต่เมือทดสอบการเท่ากันด้วย Log Rank Test แล้ว พบว่าไม่แตกต่างกันที่ระดับ 0.05 16/11/61
Survival curve ถ้าดูจาก survival curve ของทั้งยาใหม่และยาเก่า พบว่าเส้นโค้งของยาใหม่ต่ำกว่าของยาเดิมเล็กน้อย 16/11/61