แนวทางการนำเสนอข้อมูลจากการวิเคราะห์ โดยใช้ Logistic Regression

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
คณิตคิดเร็วโดยใช้นิ้วมือ
Advertisements

งานกลุ่มส่งเสริมและพัฒนาการบริหารการจัดการฯ
Analyze → Compare Means → Paired-Sample T test…
การใช้โปรแกรม SPSS ในการตรวจสอบการแจกแจงของข้อมูล
การวิเคราะห์ความแปรปรวน แบบหนึ่งทาง
การวิเคราะห์ข้อมูลเบื้องต้น
ยินดีต้อน เข้าสู่ โครงงาน.

การทดสอบสมมติฐาน (Hypothesis Testing)
ไม่อิงพารามิเตอร์เบื้องต้น
พลังงานในกระบวนการทางความร้อน : กฎข้อที่หนึ่งของอุณหพลศาสตร์
สถิติ และ การวิเคราะห์ข้อมูล
บทที่ 12 การวิเคราะห์การถดถอย
การวิเคราะห์ค่าเฉลี่ยของประชากร
บทที่ 12 การวิเคราะห์การถดถอย (ต่อ)
การเตรียมความพร้อมข้อมูลก่อนการวิเคราะห์
การถดถอยเชิงเดียว (simple regression)
การทดสอบที (t) หัวข้อที่จะศึกษามีดังนี้
ความน่าจะเป็น (Probability)
การประมาณค่า (Estimation)
เปรียบเทียบจำนวนประชากรทั้งหมดจากฐาน DBPop Original กับจำนวนประชากรทั้งหมดที่จังหวัดถือเป็นเป้าหมาย จำนวน (คน) 98.08% % จังหวัด.
แนวทางการยกระดับผลสัมฤทธิ์ทางการเรียน ผลการทดสอบระดับชาติ (o – net) ปีการศึกษา 2554 โรงเรียนสรวงสุทธาวิทยา สำนักงานเขตพื้นที่การศึกษามัธยมศึกษา เขต.
จำนวนเต็ม จำนวนเต็ม  ประกอบด้วย                   1. จำนวนเต็มบวก    ได้แก่  1 , 2 , 3 , 4, 5 , ....                   2.  จำนวนเต็มลบ      ได้แก่  -1.
การเลื่อนเงินเดือนข้าราชการ
สถิติ.
การประมาณค่าทางสถิติ
ผ.ศ(พิเศษ).น.พ.นภดล สุชาติ พ.บ. M.P.H.
ปัจจัยที่มีความสัมพันธ์กับการติดเชื้อของแผลผ่าตัดในผู้ป่วยที่มาใช้บริการโดยการผ่าตัด ที่ห้องผ่าตัดใหญ่ รพ. พุทธชินราช โดย นสพ. ณัฐกานต์ ตาบุตรวงศ์
งานวิจัยเรื่อง ระยะเวลาและอัตราการติดเชื้อในระบบทางเดินปัสสาวะในผู้ป่วยที่คาสายสวนปัสสาวะของโรงพยาบาลพุทธชินราช.
จำนวนนับใดๆ ที่หารจำนวนนับที่กำหนดให้ได้ลงตัว เรียกว่า ตัวประกอบของจำนวนนับ จำนวนนับ สามารถเรียกอีกอย่างว่า จำนวนเต็มบวก หรือจำนวนธรรมชาติ ซึ่งเราสามารถนำจำนวนนับเหล่านี้มา.
ความคลาดเคลื่อนมาตรฐานในการพยากรณ์ (Standard Error of Estimate: SEE)
ตัวอย่างงานวิจัย องค์ประกอบที่มีความสัมพันธ์กับการใช้ห้องสมุดของนักเรียนมัธยมศึกษา ตารางที่ 4-7 ตารางที่
2-test.
สถิติเชิงสรุปอ้างอิง(Inferential or Inductive Statistics)
การดำเนินงานอาชีวเวชศาสตร์: แพทย์ที่ผ่านการอบรม
การบริหารงบ PP ปี 52 งบ PP เขต จว./อำเภอ Non-UC สธ. Non-UC สปสช.
Practical Epidemiology
การทดสอบสมมติฐาน
การประเมินภาวะโภชนาการ ในผู้ที่เป็นเบาหวาน
สำนักงานสถิติแห่งชาติ กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ กองทุนหมู่บ้านและชุมชนเมือง พ.ศ สำนักงานสถิติแห่งชาติกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร สิงหาคม.
ข้อมูลเศรษฐกิจการค้า
การวัดการกระจาย (Measures of Dispersion)
อาชีพ เชื้อชาติ เพศ เบอร์ของนักฟุตบอล ศาสนา
ข้อ 1 โจทย์ ชาย อายุ 59 ปี มีไข้ ตรวจชีพจร และฟังได้หัวใจเต้นไม่ส่ำเสมอ ทำ ECG ดังแสดง จงอ่าน ECG นี้โดยละเอียด.
การดำเนินงานตามแผนปฏิบัติการ โครงการที่ได้รับ
น.ท.หญิง วัชราพร เชยสุวรรณ วิทยาลัยพยาบาลกองทัพเรือ
สถิติเบื้องต้นสำหรับงานระบาดวิทยา Statistics for Epidemiology
การแจกแจงปกติ.
การวัดทางระบาดวิทยา น.ส.วิภาวี ธรรมจำรัส.
สรุปสถิติ ค่ากลาง ค่าเฉลี่ยเลขคณิต เรียงข้อมูล ตำแหน่งกลาง มัธยฐาน
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
การทดสอบค่าเฉลี่ยประชากร
Risk Management Strategy
สำนักงานเขตพื้นที่การศึกษาประถมศึกษานนทบุรี เขต 1
วิทยาลัยเทคโนโลยีภูเก็ต อำเภอเมือง จังหวัด ภูเก็ต
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ การป้องกันและปราบปรามยาเสพติด (ก่อนและหลัง การประกาศสงครามขั้นแตกหักเพื่อเอาชนะยาเสพติด) พ.ศ สำนักงานสถิติแห่งชาติ
Risk Management Asst.Prof. Dr.Ravi.
Chi-Square Test การทดสอบไคสแควร์ 12.
Confidence Interval Estimation (การประมาณช่วงความเชื่อมั่น)
คะแนนมาตรฐาน และ โค้งปกติ
ชื่อผลงานวิจัย ความพึงพอใจของครูผู้สอน ต่อการบริหารสถานศึกษาของวิทยาลัยเทคโนโลยีสยามบริหารธุรกิจ นนทบุรี ชื่อผู้วิจัย นางกุสุมา หาญกล้า.
บทที่ 7 การทดสอบค่าเฉลี่ยของ ประชากร. การทดสอบค่าเฉลี่ย 1 ประชากร ไม่ทราบค่าความแปรปรวนของประชากร ( ) สถิติที่ใช้ในการทดสอบ คือ t = d.f = n-1.
การทดสอบค่าเฉลี่ยประชากร 2 ประชากร
คณิตศาสตร์ (ค33101) ชั้นมัธยมศึกษาปีที่ 3 หน่วยการเรียนรู้ที่ 7
โครงสร้างข้อมูลแบบ สแตก (stack)
E D E,C 1 D E,C 1,C 2,C 3 D ตัวแปรต้น ตัวแปร ตาม ตัวแปรอิสระ แทนด้วย X X 1, X 2,... X k D ตัวอย่าง : X 1 = E X 4 = E*C 1 X 2 = C 1 X 5 = C 1 *C 2 X 3 =
ผลการประเมิน คุณภาพการศึกษาขั้นพื้นฐาน ปีการศึกษา
ผลสัมฤทธิ์ของนักศึกษาอาชีวศึกษา ระดับ ประกาศนียบัตรวิชาชีพชั้นสูง สาขาการ บัญชี วิชาการบัญชีเบื้องต้น ด้วยวิธีการจัดการเรียนรู้แบบสร้าง สถานการณ์จำลอง.
ใบสำเนางานนำเสนอ:

แนวทางการนำเสนอข้อมูลจากการวิเคราะห์ โดยใช้ Logistic Regression (ตัวอย่าง Case-control study กรณีมีวัตถุประสงค์เพื่อหาปัจจัยเสี่ยง) นำเสนอข้อมูล Measure of association (มิใช่ค่า Coefficient) ดังตารางหุ่นต่อไปนี้ ปัจจัย Case Control OR (95%CI) 1. 2. 3. ... (n=....) (Adjusted) (Unadjusted) % %

การนำเสนอข้อมูลจากการวิเคราะห์โดยใช้ Logistic Regression ตัวอย่าง การนำเสนอข้อมูลจากการวิเคราะห์โดยใช้ Logistic Regression “...สมการการถดถอยลอจีสติค แสดงความสัมพันธ์ระหว่างการสูบบุหรี่ กับ การป่วย ด้วยโรคหัวใจโคโรนารี่ โดยควบคุมผลของอายุ และ เพศ เป็น ดังนี้ Logit P(X) = 1.421 + 1.609SMK + 0.095SEX + 0.301AGE ผู้สูบบุหรี่ มีความเสี่ยงต่อการป่วยด้วยโรคหัวใจโคโรนารี่เป็น 5 เท่าของผู้ไม่สูบบุหรี่(95%CI.OR: 2.1 ถึง 11.7) พบว่า เพศ และ อายุ มีความสัมพันธ์กับ การป่วยด้วยโรคหัวใจโคโรนารี่ โดย ... (ตารางที่ 1)” ตารางที่ 1 Adjusted Odds Ratio แสดงความสัมพันธ์ระหว่างการสูบบุหรี่ กับ การป่วย ด้วยโรคหัวใจโคโรนารี่ ปัจจัย Case Control OR(95%CI) 1. การสูบบุหรี่ - สูบ 80.7% 30.0% 9.7(5.5 ถึง 17.3) 5(2.1 ถึง 11.7) - ไม่สูบ 19.3% 70.0% 2. เพศ - ชาย 73.3% 63.3% 1.6(1.0 ถึง 2.7) 1.1(0.8 ถึง 3.7) - หญิง 36.7% 33.7% ... ... ... ... ... (n = 150) (n = 150) (Unadjusted) (Adjusted)

95% Confidence Interval (95% CI. OR.) บอก Precision ของ OR และ บอกว่าปัจจัยนั้นเป็น Significant risk factor หรือไม่ ตัวอย่าง Lower Limit Estimated OR. Upper Limit การศึกษา ก. การศึกษา ข. การศึกษา ค. 0 1 +a ค่าความไม่แตกต่าง (Null value) แปลความหมาย: แม้ทุกการศึกษา จะได้ค่า OR เท่ากัน การศึกษา ข. มี Precision มากที่สุดน่าเชื่อถือ มากที่สุด ทั้ง ก. และ ข. บ่งชี้ว่าปัจจัยที่ศึกษามีความสัมพันธ์กับตัวแปรตามอย่างมีนัยสำคัญทางสถิติ การศึกษา ค. มี Precision ต่ำสุด และยังได้ข้อสรุปว่า ปัจจัยที่ศึกษามีความสัมพันธ์กับตัวแปรตาม อย่างไม่มีนัยสำคัญทางสถิติ และยังทราบว่า การศึกษาครั้งนี้มีขนาดตัวอย่าง (Sample Size) ไม่เพียงพอ

สูตรทั่วไป L หามาได้จากการหาค่า OR. ดังนี้:- ดังนั้น OR. = EXP(L) ค่าความคลาดเคลื่อน การประมาณค่า ค่าที่ใช้คำนวณ OR. กล่าวคือ EXP(L) = OR. ค่าคะแนนมาตรฐาน จากการแจกแจงปกติ Standard error ของ L เมื่อกำหนดให้ a = 0.05 เขียนสูตรได้ดังนี้:- L หามาได้จากการหาค่า OR. ดังนี้:- จาก OR. = EXP[ bi(X1i - X0i)] แทนค่า [ bi(X1i - X0i)] = L ดังนั้น OR. = EXP(L)

การประมาณค่าช่วงเชื่อมั่น กรณีไม่มี Interaction term ด้วย OR = EXP (b) ดังนั้น 95% CI OR = ตัวอย่าง :- ผลจาก Computer print out ได้ดังนี้ Variable1 Coefficient SE Chisq p Constant -6.7727 1.1401 35.29 0.0000 SMK 0.5976 0.3520 2.88 0.0896 ECG 0.0322 0.0152 4.51 0.0337 CHL 0.0087 0.0033 7.17 0.0074 HPT 0.3695 0.2936 1.58 0.2083 } ได้จาก Computer Print out ORSMK = e0.5976 = 1.82 95% CI ORSMK = e[0.5976+1.96(0.3520)] = e(-0.09,1.29) = 0.91, 3.63

ช่วงความเชื่อมั่นคร่อมค่า 1 Non Significant (ค่า p-value มากกว่า 0.05) ORSMK = 1.82 95% CI. ORSMK = 0.91, 3.63 Lower Limit Estimated OR. Upper Limit ช่วงความเชื่อมั่นคร่อมค่า 1 Non Significant (ค่า p-value มากกว่า 0.05) ใน print out ได้ค่า p-value = 0.0896 ควรเขียนในรายงานเป็น p-value = 0.09 1 2 3 4 Null value

การประมาณค่าช่วงความเชื่อมั่น กรณีมี Interaction Variable Coefficient SE Chisq p SMK 2.6809 3.1042 16.69 0.0000 ECG 0.0349 0.0161 4.69 0.0303 CHL -0.0065 0.3278 1.25 0.2635 HPT 1.0468 0.3316 9.96 0.0016 SMK*CHL 0.0029 0.7422 9.85 0.0417 Constant -4.0474 1.2549 10.40 0.0013 Logistic Regression Model ผลจากคอมพิวเตอร์ ขั้นที่ 1. คำนวณค่า OR. จากสูตรทั่วไป OR = eL และ L = bSMK + bSMK*CHLCHL (ในที่นี้ สนใจศึกษาเฉพาะผู้ที่มีระดับโคเลสเตอร์รอล 200 มล. จึงระบุค่าของ CHL = 200) OR. = EXP[2.6809 + (0.0029 x200)] = EXP(3.2609) = 26.1 เมื่อ CHL = 200 , ORSMK = 26.1 OR.ที่ปรับค่าผลกระทบจากผลECG และ HPT เรียบร้อยแล้ว

ขั้นที่ 2. คำนวณช่วงความเชื่อมั่น ของ OR. SMK ECG CHL HPT SMKxCHL Constant SMK 1.7619 ECG 0.2849 9.5361 CHL -0.0140 -0.3278 0.0003 HPT 0.1468 0.3316 0.9631 0.1075 SMKxCHL -11.014 -0.7422 1.9878 -0.6717 0.1101 Constant 0.4474 0.2549 0.4056 0.8673 0.9104 1.3570 Variance-Covariace Matrix ผลจากคอมพิวเตอร์ Var(L) = var (bSMK) + 2(200)cov(bSMK ,bSMKxCHL)+(200)2var(bSMKxCHL) = 1.7619 + 2(200)(-11.014) + (200)2(0.1101) = 0.1619 95% CI ORSMK = EXP(3.2609 1.96 ( ) = 11.85 , 57.37 เมื่อ CHL = 200 , ORSMK = 26.1 (95%CI.OR ; 11.85 ถึง 57.37)

ตัวอย่างสูตรสำหรับคำนวณค่า Var(L ) ในแต่ละ Model กรณี X1เป็น Dichotomous (1,0) Model: Logit P(X) = a + b1X1 + b2X2 + b3X1X2 เมื่อ L = b1X1 + b3(X1X2) Var (L) = Var(b1) + (X2)2var(b3) + 2(X2)cov(b1,b3) Model: Logit P(X) = a + b1X1 + b2X2 + b3X3 + b4X1X2 + b5X1X3 เมื่อ L = b1 X1 + b4X1X2 + b5X1X3 Var (L) = Var(b1) + (X2)2var(b4) + (X3)2var(b5) + 2X2cov(b1,b4) + 2X3cov(b1,b5) + 2X2X3Cov (b4,b5) (ศึกษารายละเอียดใน Kleinbaum, 1994. หน้า 141 - 144)