การวิเคราะห์ข้อมูลสูญหาย และข้อมูลที่มีซ้ำไม่เท่ากัน ด้วย GLM พีระพงษ์ แพงไพรี
ข้อมูลสูญหาย (missing data)
Unbalanced data Missing data Random effect Field experiment
การวิเคราะห์งานทดลองที่มีข้อมูลสูญหาย ประเมินค่าสูญหาย ใช้ general linear model (GLM)
การวิเคราะห์โดยการประเมินค่าสูญหาย แทนค่าสูญหาย ANOVA ประเมินค่า SS(bias) ปรับค่า SS(trt) หา F trt
สูตรการประเมินค่าสูญหายใน RCBD M = k1i + k2j – k3 M = ค่าสูญหายจากทรีทเมนต์ที่ j บล็อกที่ I = ค่าเฉลี่ย i = ค่าเฉลี่ยของบล็อกที่ i j = ค่าเฉลี่ยของทรีทเมนต์ที่ j k1 = t/(t-1) k2 = r/(r-1) k3 = (tr-1)/(t-1)(r-1)
= (4/3)(32.67) + (5/4)(21.5) – (19/(4*3))(24.0) = 31.5 block Trt 1 2 3 4 5 mean 21 . 25 18 22 21.5 26 38 27 17 26.8 16 20.4 28 35 20 24 22.75 32.67 25.25 18.25 23.25 24.0 31.5 23.5 32.375 24.375 M = k1i + k2j – k3 = (4/3)(32.67) + (5/4)(21.5) – (19/(4*3))(24.0) = 31.5
การวิเคราะห์โดยการประเมินค่าสูญหาย แทนค่าสูญหาย ANOVA ประเมินค่า SS(bias) ปรับค่า SS(trt) หา F trt
SOV df SS MS Fcal Pr > F Block 4 424.7500 106.1875 16.98 0.0001 Treatment 3 141.6375 47.2125 7.55 0.0042 Error 12 75.0500 6.2542 Total 19 641.4375
การวิเคราะห์โดยการประเมินค่าสูญหาย แทนค่าสูญหาย ANOVA ประเมินค่า SS(bias) ปรับค่า SS(trt) หา F trt
สูตรการประเมินค่า SS(bias) ใน RCBD SS(bias) = [(t-1)i – (t-1)M]2 / t(t-1) SS(bias) = [(3x32.67) – (3x31.5)]2 / 4(3) = 1.02 block Trt 1 2 3 4 5 mean 21 . 25 18 22 21.5 26 38 27 17 26.8 16 20.4 28 35 20 24 22.75 32.67 25.25 18.25 23.25 24.0 31.5
การวิเคราะห์โดยการประเมินค่าสูญหาย แทนค่าสูญหาย ANOVA ประเมินค่า SS(bias) ปรับค่า SS(trt) หา F trt
141.6375 – 1.02 = 140.4375 SOV df SS MS Fcal Block 4 424.7500 106.1875 16.98 Treatment 3 141.6375 47.2125 7.55 Error 12 75.0500 6.2542 Total 19 641.4375 141.6375 – 1.02 = 140.4375 SOV df SS MS Fcal Block 4 424.7500 106.1875 16.98 Treatment 3 140.4375 46.87 6.87 Error 11 75.0500 6.82 Total 18 641.4375
การวิเคราะห์โดยใช้ GLM block Trt 1 2 3 4 5 mean 21 . 25 18 22 21.5 26 38 27 17 26.8 16 20.4 28 35 20 24 22.75 32.67 25.25 18.25 23.25 24.0
Sum of Square Type I, II, III, IV Effect Type I Type II Type III, IV A A | B A | B, AB B B | A B | A, AB AB AB | A, B
Dummy-Variable Model Yij = + i + ij กำหนดให้ผู้วิจัยมี 3 ทรีทเมนต์ ดังนั้น general linear model Yij = + 1 + 2 + 3 + ij กำหนดให้ผู้วิจัยมี 2 ซ้ำ ดังนั้น dummy-variable model 1 2 3 ij Y11 = 1 + 1 + 0 + 0 + 11 Y12 = 1 + 1 + 0 + 0 + 12
Dummy-Variable Model 1 2 3 ij Y11 = 1 + 1 + 0 + 0 + 11 Y12 = 1 + 1 + 0 + 0 + 12 Y21 = 1 + 0 + 1 + 0 + 21 Y22 = 1 + 0 + 1 + 0 + 22 Y31 = 1 + 0 + 0 + 1 + 31 Y32 = 1 + 0 + 0 + 1 + 32
Y X
Y = X + X’Y = X’X = (X’X)-1X’Y
X’Y = X’X = (X’X)-1X’Y = (X’X)- X’Y
REP TRT Intensity 1 2 3 a1 b1 28 29 b2 32 34 31 a2 33 36
X’X X’Y Y’X Y’Y (X’X)- ’ SSE
ค่าเฉลี่ย least square ค่าเฉลี่ย least square หมายถึง ค่าเฉลี่ยที่ได้จากโมเดลของการทดลองโดยการประเมินค่าของอิทธิพลต่างๆ โดยวิธี minimize error sum square หรือ ordinary least square (OLS) Balance data ค่า mean กับ ls mean จะมีค่าเท่ากัน
Model : Yijk = + i + j + ij + ijk
a1b1 = + 1 + 1 + 11 = 34.5 – 2.17 – 5.0 + 1.0 = 28.33
a1b2 = + 1 + 2 + 12 = 34.5 – 2.17 + 0.0 + 0.0 = 32.33
a2b1 = + 2 + 1 + 21 = 34.5 + 0.0 – 5.0 + 0.0 = 29.5
a2b2 = + 2 + 2 + 22 = 34.5 + 0.0 + 0.0 + 0.0 = 34.5
a1b1 = 28.33 a1b2 = 32.33 a2b1 = 29.5 a2b2 = 34.5 a1 = ½ (a1b1 + a1b2) = ½ (28.33 + 32.33) = 30.33 b1 = ½ (a1b1 + a2b1) = ½ (28.33 + 29.5) = 28.915 a2 = ½ (a2b1 + a2b2) = ½ (29.5 + 34.5) = 32.0 a2 = ½ (a1b2 + a2b2) = ½ (32.33 + 34.5) = 33.415
a1 = 30.33 a2 = 32.00 b1 = 28.915 b2 = 33.415 a1b1 = 28.33 a1b2 = 32.33 a2b1 = 29.50 a2b2 = 34.50
พักเที่ยงจ้า