การใช้โปรแกรมคอมพิวเตอร์ช่วยในการวิเคราะห์ข้อมูล อ. วีระ ปิยธีรวงศ์
Overview (I) โปรแกรมขนาดใหญ่ SPSS (Statistical Package for the Social Science) SAS (Statistical Analysis System) โปรแกรมขนาดเล็ก (งานวิเคราะห์ที่ไม่ซับซ้อนมาก) Excel, Statistix, Minitab, Design Expert, etc.
การเลือกใช้โปรแกรมคอมพิวเตอร์ สามารถใช้ได้กับเครื่องคอมพิวเตอร์ทั่ว ๆ ไปได้ (เช่น PC หรือ notebook) สามารถวิเคราะห์ข้อมูลได้ไม่น้อยกว่า 100 ชุด และแต่ละชุดไม่ควรต่ำกว่า 50 ตัวแปร สามารถอ่านข้อมูลที่บันทึกอยู่บนสื่อได้หลายประเภท รวมทั้งสามารถป้อนข้อมูลได้แป้นพิมพ์ สามารถอ่านข้อมูลจากข้อมูลแบบมาตรฐาน ที่เรียกว่า ASCII ได้
การเลือกใช้โปรแกรมคอมพิวเตอร์ สามารถสร้างแฟ้มข้อมูล (data file) หรือไฟล์ข้อมูลเองได้ และสามารถสร้างเป็นรหัสมาตรฐานได้ เพื่อให้สามารถนำกลับไปใช้กับโปรแกรมอื่นได้ สามารถจัดเก็บข้อมูลในลักษณะต่างๆ ได้ เช่น การเปลี่ยนรูปข้อมูล, การจัดค่าใหม่ หรือการจัดกลุ่มตัวแปรใหม่, การคัดเลือกข้อมูลบางส่วนมาทำการวิเคราะห์ได้
การเลือกใช้โปรแกรมคอมพิวเตอร์ สามารถวิเคราะห์ข้อมูลทางสถิติได้หลายระดับ การคำนวนค่าสถิติพื้นฐาน เช่น ค่าเฉลี่ย, ค่าฐานนิยม, ความแปรปรวน เป็นต้น การสร้างตารางแจกแจงความถึ่แบบทางเดียว และหลายทาง การเขียนกราฟในลักษณะต่าง ๆ การหาความสัมพันธ์ระหว่างตัวแปร การวิเคราะห์การถดถอย และความแปรปรวน
การวิเคราะห์ข้อมูลโดยโปรแกรม SPSS โปรแกรม SPSS เป็น software ที่ผลิตโดยบริษัท SPSS Inc. เป็นโปรแกรมสำเร็จรูปที่นิยมใช้วิเคราะห์ข้อมูลทางสถิติอีกโปรแกรมหนึ่ง (ปัจจุบัน SPSS v. 16) ใช้ระบบปฏิบัติการ Windows XP ขึ้นไป หน่วยประมวลผลกลาง Intel หรือ AMD ความเร็วตั้งแต่ 1 GHz โดยมีหน่วยความจำตั้งแต่ 512 MB
การเริ่มต้นเข้าสู่โปรแกรม การเริ่มต้นเข้าสู่โปรแกรม เมื่อคลิกที่โปรแกรม SPSS จะเข้าสู่โปรแกรมดังรูป ซึ่งถ้าหากมีแฟ้มข้อมูลเดิม จะสามารถเลือกได้จากหน้าต่างนี้ หากต้องการเริ่มต้นใหม่ให้คลิก Cancel เพื่อเข้าสู่ส่วนตารางการทำงาน หรือเรียกว่า Data Editor ดังรูป
การเริ่มต้นเข้าสู่โปรแกรม
ข้อกำหนดทั่วไปของโปรแกรม Data View เป็นส่วนสำหรับใส่ข้อมูล ซึ่งจะแสดงชื่อตัวแปร Var ทุกคอลัมน์เมื่อทำการป้อนข้อมูล จะเปลี่ยนเป็น Var 00001 Var 00002 … หากต้องการกำหนดค่าตัวแปรเป็นอย่างอื่น ให้เลือกที่ Variable View จาก Sheet Tab ซึ่งเป็นส่วนที่กำหนดลักษณะเฉพาะต่าง ๆ ของตัวแปร ได้แก่ ชื่อตัวแปร จำนวนทศนิยม ความกว้างของ column etc.
การนำข้อมูลเข้าสู่ data editor เปิดจากไฟล์ของ database ประเภทต่าง ๆ ได้แก่ Excel, Lotus, Dbase หรือ SAS etc. ป้อนข้อมูลโดยตรง หรือสามารถ copy & paste จาก spread sheet ในการวิเคราะห์ผลจะใช้เมนู Analyze โดยจะมีเมนูย่อยที่ใช้ในการวิเคราะห์ เช่น descriptive statistics, compare means, general linear model etc.
การวิเคราะห์ผลทางสถิติ การวิเคราะห์ผลแบบ t-test การวิเคราะห์ความแปรปรวน (ANOVA) การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD) การทดลองแบบสุ่มบล็อคสมบูรณ์ (RCBD) การทดลองแบบ factorial
การวิเคราะห์ผลแบบ t-test One sample t-test ต้องการทราบ ตัวอย่างเย็นของอาหารแข็งชนิดหนึ่ง ระบุในฉลากว่ามีพลังงาน 200 cal จริงหรือไม่? โดยทำการส่มตัวอย่างอาหารชนิดนี้ นำมาวัดพลังงานได้ดังนี้ 198, 203, 223, 196, 202, 189, 208, 215, 218, 207 cal นำผลที่ได้มาวิเคราะห์ทางสถิติ
One sample t-test ป้อนข้อมูลใน data editor และป้อนชื่อตัวแปรใน variable sheet วิเคราะห์ผลโดยเลือกเมนู Analyze\ Compare means\ One sample t-test เลือกตัวแปรที่ต้องการ และค่าที่ต้องการทดสอบ (null hypothesis)
One sample t-test
One sample t-test
One sample t-test ในการทดสอบอาหารคบเคี้ยวชนิดหนึ่ง ผู้ทดลองต้องการทราบว่า ตัวอย่างอาหารมีรสหวาน และความกรอบแตกต่างจากค่าสัดส่วนในอุดมคติ = 1 หรือไม่ โดยนำตัวอย่างไปทดสอบทางประสาทสัมผัสได้ค่าคะแนนสัดส่วนในอุดมคติของรสหวาน และความกรอบดังนี้ 0.86, 1.16, 1.07, 0.95, 0.99, 1.04, 1.11, 1.13, 1.07, 0.95, 0.92, 1.18 และ 1.12, 0.95, 1.08, 1.09, 1.16, 0.89, 0.96, 1.14, 0.98, 1.06, 1.06, 1.22 ตามลำดับ
Pair sample t-test ในการศึกษาผลการเตรียมไวรัส 2 วิธีต่อปริมาณการเกิดแผลในใบยาสูบ ในการทดลองโดยสุ่มใบยาสูบจำนวน 8 ใบ แต่ละใบแบ่งเป็นสองส่วนตามจำนวนวิธีเตรียม ผลการเกิดแผลบนใบยาสูบดังนี้ ใบที่ 1: 31, 18; ใบที่ 2: 20, 17; ใบที่ 3: 18, 14; ใบที่ 4: 17, 11; ใบที่ 5: 9, 10; ใบที่ 6: 8, 7; ใบที่ 7: 10, 5; ใบที่ 8: 7, 6 วิเคราะห์ผลโดยเลือกเมนู Analyze\ Compare means\ Pair sample t-test
Pair sample t-test
Pair sample t-test
Pair sample t-test การทดสอบผลิตภัณฑ์อาหาร 2 ชนิด เกี่ยวกับความชอบของผู้ทดสอบชิมจำนวน 10 คน โดยให้แต่ละคนทำการทดสอบผลิตภัณฑ์อาหาร 2 ชนิด (ทีละชนิด) ได้คะแนนความชอบ ดั้งนี้คะแนนความชอบเรียงจากคนที่ 1 ถึง 10 ตามลำดับ โดยอาหารชนิดที่ 1 มีคะแนน 5, 6, 5, 7, 6, 4, 6, 5, 6, 6 ส่วนชนิดที่ 2 มีคะแนน 4, 6, 6, 6, 5, 5, 6, 4, 5, 6
Two sample t-test ในการศึกษาเปรียบเทียบวิธีการหาความเข้มข้นของสารชนิดหนึ่ง โดยวิธีแรกเป็นวิธีมาตรฐาน แต่ใช้เวลาการวิเคราะห์นาน ส่วนอีกวิธีหนึ่ง จะใช้สารเคมีช่วยวิเคราะห์ จึงใช้เวลาสั้นกว่า ซึ่งอาจมีความแม่นยำน้อยกว่า อยากทราบว่า วิธีการทั้งสองมีความแตกต่างในการวิเคราะห์หาความเข้มข้น หรือไม่
Two sample t-test
Two sample t-test
การวิเคราะห์ความแปรปรวน การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD) การศึกษาผลการบ่ม โดยฉีดเอนไซม์เพื่อช่วยให้เนื้อวัวนุ่ม โดยใช้สิ่งทดลอง 4 สิ่งทดลอง 5 ซ้ำ แล้ววัดความนุ่มโดยใช้เครื่องวัดแบบ Warner-Bratzler เพื่อวัดความนุ่มในรูปของแรงเฉือน (psi) วิเคราะห์ผลโดยเลือกเมนู Analyze\ General linear\ Univariate
การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD)
การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD)
การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD)
การทดลองแบบสุ่มอย่างสมบูรณ์ (CRD) ค่าเฉลี่ย สิ่งทดลอง 1 สิ่งทดลอง 2 สิ่งทดลอง 3 สิ่งทดลอง 4
การทดลองแบบสุ่มบล็อคสมบูรณ์ (RCBD) หากหน่วยทดลองไม่สม่ำเสมอ เช่นจากการทดลองที่แล้ว ชิ้นเนื้อมีขนาดไม่เท่ากัน ซึ่งอาจใช้แผนการทดลองแบบสุ่มบล็อค เพื่อช่วยแก้ปัญหาดังกล่าว จัดให้ทุกสิ่งทดลองมีโอกาสได้รับหน่วยทดลองที่เหมือนกันในแต่ละบล็อค การวิเคราะห์เช่นเดียวกับ CRD โดยเพิ่มการวิเคราะห์ตัวแปร Rep ด้วย
การทดลองแบบสุ่มบล็อคสมบูรณ์ (RCBD)
การทดลองแบบสุ่มบล็อคสมบูรณ์ (RCBD)
การทดลองแบบ factorial การศึกษาผลของแหล่งที่มาของเนื้อ และชนิดของสารเจือปนต่อคุณภาพผลิตภัณฑ์ของบริษัทหนึ่ง โดยปัจจัย A เป็นสารเจือปนมีสองชนิด (a1, a2) และปัจจัย B แหล่งของเนื้อสองแหล่ง (b1, b2) ทำการทดลองสองซ้ำแบบสุ่มสมบูรณ์ (CRD) วิเคราะห์ผลโดยเลือกเมนู Analyze\ General linear\ Univariate
การทดลองแบบ factorial
การทดลองแบบ factorial
การทดลองแบบ factorial
การทดลองแบบ factorial การหาค่าเฉลี่ยของแต่ละปัจจัยในแต่ละระดับ โดยเลือก Analyze\ Compare mean\ Means
การทดลองแบบ factorial
การทดลองแบบ factorial RCBD
การทดลองแบบ factorial
การทดลองแบบ split-plot การทดลองประเมินคุณภาพเบียรจำนวน 5 สูตร ที่ผลิตโดยบริษัทแห่งหนึ่ง โดยผันแปรปริมาณ hop ในสูตรต่าง ๆ (3 ซ้ำ) ให้ผู้ทดสอบชิมจำนวน 20 คน ประเมินรสชาดของ hop โดยให้คะแนน 0 – 9 จากรสชาดที่เข้มข้นน้อยถึงเข้มข้นมาก ซึ่งใช้แผนการทดลองแบบ RCBD