การวิจัยและสถิติ ปราณี นิลกรณ์
การวิจัย และ สถิติ การวิจัยและสถิติมีความสัมพันธ์กันในเกือบทุกขั้นตอน ของการวิจัย โดยเฉพาะอย่างยิ่ง การวิจัยเชิงปริมาณ การวิจัยจะมีความเชื่อถือได้ ดำเนินไปอย่างมี ประสิทธิภาพ และสรุปผลได้ถูกต้อง จำเป็นต้องเลือกใช้ สถิติให้เหมาะสม นักวิจัยจึงควรทราบวิธีการใช้สถิติที่เหมาะสมและ สอดคล้องกับงานวิจัย
การวิจัย และ สถิติ ความตรง(Validity) วิธีการศึกษานี้(การวัดค่าตัวแปร) ช่วยตอบคำถามการวิจัยหรือไม่ หรือตรงกับวัตถุประสงค์การวิจัยหรือไม่? ความเชื่อมั่นของแบบทดสอบ/แบบสอบถาม(Reliability) เครื่องมือที่ใช้ เมื่อนำมาวัดซ้ำ ได้คำตอบเหมือนเดิมหรือไม่ การวิเคราะห์ (Analysis) ควรจะวิเคราะห์ข้อมูลอย่างไร ตีความผลการวิเคราะห์อย่างไร รายงานผลอย่างไรจึงจะตอบคำถามการวิจัยและผลการวิจัยเป็นที่น่าเชื่อถือ ประสิทธิภาพ(Efficiency) ควรวางแผนการวิจัยอย่างไร จึงจะมีประสิทธิภาพ (วางแผนการทดลองแบบไหน? เลือกตัวอย่างอย่างไร ขนาดตัวอย่างควรเป็นเท่าไร?)
การนิยามปฏิบัติการ (Operationalization) ในทางพฤติกรรมศาสตร์ เราต้องชัดเจนว่าเรา ต้องการวัดอะไร นิยามปฏิบัติการ Operational Definition คือนิยาม แนวคิด(concept)ในเทอมของการดำเนินการ (operations) ที่ใช้วัดแนวคิดนั้น นิยามตัวแปรใหม่ในเทอมของขั้นตอนทางกายภาพ ให้ความหมายของแนวคิดโดยการชี้ให้เห็นว่า มี operation อะไรบ้างที่ต้องทำให้สำเร็จจึงจะถือว่า เราวัด concept นั้นออกมา
การนิยามปฏิบัติการ “ความจำ” operationalized โดยจำนวนคำที่ แต่ละคนจำได้จากเรื่องที่อ่านให้ฟัง “ความไม่ไว้ใจมนุษย์”(misanthropy) วัดโดย ใช้แบบสอบถามที่พัฒนาขึ้นเกียวกับความไม่ ไว้วางใจคน
Operational Definition Theory or idea Self-esteem Operational definition I feel good about myself... Reality 1 2 3 4 5 SD D N A SA
Validity วัดในสิ่งที่ต้องการวัด Content Validity ผู้ทรงคุณวุฒิตรวจสอบเครื่องมือ Construct Validity เครื่องมือมีโครงสร้างตามแนวคิด ทฤษฎีที่เป็น ฐานการวิจัยหรือไม่ Confirmatory Factor Analysis(CFA) ฯลฯ
Reliability ความเชื่อมั่น/ความเที่ยง Cronbach’s Alpha (Kuder Richardson กรณี 0,1)
Validity and reliability
ประชากร และ ตัวอย่าง สถิติอนุมาน ใช้ข้อมูลที่ได้จากตัวอย่าง ประชากร และ ตัวอย่าง สถิติอนุมาน ใช้ข้อมูลที่ได้จากตัวอย่าง ไปสรุปประชากร ประชากร - พารามิเตอร์ ตัวอย่าง-ค่าสถิติ
ระเบียบวิธีทางสถิติ (Statistical Methods) สถิติพรรณนา(Descriptive statistics) เก็บรวบรวมข้อมูลและอธิบายข้อมูล เฉพาะส่วนที่เก็บมา สถิติอนุมาน(Inferential statistics) สรุปหรือตัดสินใจเกี่ยวกับลักษณะของประชากรโดยใช้ข้อมูลจากตัวอย่าง การประมาณค่า แบบจุด แบบช่วง(confidence interval, credible interval) การทดสอบสมมติฐาน การจำแนก การจัดกลุ่ม(classification, clustering)
การสุ่มตัวอย่าง เป้าหมาย ขั้นตอน เพื่อให้ได้ตัวแทนที่ดีของประชากร กำหนดประชากรเป้าหมาย กำหนดกรอบตัวอย่าง(ถ้าทำได้) กำหนดขนาดตัวอย่าง เข้าใจธรรมชาติของประชากรเพื่อเลือกวิธีสุ่มตัวอย่าง สุ่มตัวอย่าง
กำหนดประชากรเป้าหมาย(target population) หน่วยวิเคราะห์,หน่วยตัวอย่าง(unit of analysis, sampling unit) ความครอบคลุม เช่น เขตภูมิศาสตร์ ขอบเขตด้านคุณลักษณะของตัวอย่าง เช่นอายุ เพศ ฯลฯ วัตถุประสงค์การวิจัย ขอบเขตการวิจัย วิธีดำเนินการวิจัย
การกำหนดประชากรเป้าหมาย(ต่อ) ขอบเขตทางภูมิศาสตร์ เช่น ภาค จังหวัด ขอบเขตด้านคุณลักษณะของหน่วยตัวอย่าง เช่น อายุ เพศ เช่น เยาวชนในจังหวัดเชียงราย (อายุระหว่าง ----- ปี) รวมต่างด้าว?
กำหนดกรอบตัวอย่าง กรอบตัวอย่าง: รายการที่สมบูรณ์ของสมาชิกในประชากร เป้าหมายเพื่อนำมาใช้เลือกตัวอย่าง รายการที่อยู่ในกรอบตัวอย่างต้องสอดคล้องกับประชากร เป้าหมาย รายการที่กำหนดขึ้น ต้องสามารถนำมาใช้เลือกตัวอย่าง ในการปฏิบัติจริงได้
กำหนดขนาดตัวอย่าง ปัจจัยที่มีผลต่อขนาดตัวอย่าง(n) ขนาดของประชากร (N) ความแปรปรวนของประชากร(Variability of the population) (s2) ระดับความถูกต้องที่ต้องการ(accuracy )(ยอมให้คลาดเคลื่อนจาก ค่าจริงเท่าไร ) ระดับความเชื่อมั่นที่ต้องการ(Level of confidence (1-a)) (การประมาณค่า จะใช้ระดับความเชื่อมั่นเท่าใด)
กำหนดขนาดตัวอย่าง นอกจากนั้น อาจมีปัจจัยด้านการจัดการที่มีผลต่อการกำหนดขนาด ตัวอย่างอีก เช่น ระยะเวลา งบประมาณ จำนวนบุคลากรในการเก็บรวบรวมข้อมูล ลักษณะของปัญหาและวัตถุประสงค์ของการวิจัย
Relative accuracy, sample size and population size For larger population sizes it is not necessary to increase sample size A sample size of 500 guarantees an error below 5% for any population size Above a size of 500, it is better to consider spending money on reducing non-sampling errors Ref.:Mazzocchi(2008) Statistics for Marketing and consumer Research, Sage Plubications.
การกำหนดขนาดตัวอย่าง เปิดตาราง YAMANE คำนวณจากสูตร คำนวณเอง โปรแกรม(เช่น PASS WEB) เจาะสำหรับแต่ ละกรณี เช่น เปรียบเทียบค่าเฉลี่ย เปรียบเทียบ สัดส่วน
Non-Probability Samples วิธีการสุ่มตัวอย่าง (สุ่มตัวอย่างแบบ Non-Prabability Sampling มีปัญหาในแง่การอนุมาน) ตัวอย่าง Probability Samples Non-Probability Samples Simple Random Stratified Judgement convenient Cluster Systematic Quota
การสุ่มตัวอย่างอย่างง่าย VS การสุ่มตัวอย่างแบบชั้นภูมิ ลักษณะของประชากรคล้ายคลึงมากน้อยแค่ไหน มีกรอบตัวอย่างหรือไม่ ตัวแปรที่จะใช้ในการแบ่งชั้นภูมิ(stratification)มีอยู่ในกรอบตัวอย่าง หรือไม่ ( เช่น แบ่งตามรายได้ครัวเรือน) SRS หน่วยตัวอย่างในประชากรมีลักษณะคล้ายคลึงกัน Stratified หน่วยตัวอย่างของประชากรในแต่ละชั้นภูมิ(กลุ่ม) คล้ายคลึงกัน และที่อยู่ในต่างชั้นภูมิ(กลุ่ม)แตกต่างกัน โดยเฉพาะ ในตัวแปรที่ต้องการศึกษา
สุ่มอย่างง่าย (Simple random sampling:SRS) ทุกหน่วยมีความน่าจะเป็นที่จะถูกเลือกเท่ากัน
สุ่มแบบแบ่งชั้นภูมิ (Stratified random sampling) แบ่งหน่วยตัวอย่างเป็นกลุ่มที่ประชากรในกลุ่มมีลักษณะ คล้ายคลึงกันตามลักษณะใดลักษณะหนึ่ง สุ่มตัวอย่างจากแต่ละกลุ่มให้ครบทุกกลุ่ม โดยจำนวน ตัวอย่างที่สุ่มจากแต่ละกลุ่มนิยมใช้ให้ผันแปรตรงกับขนาด ประชากรในกลุ่ม(proportional allocation) ตัวอย่างเช่น ถ้าต้องศึกษากระบวนการตัดสินใจของผู้บริหาร อาจต้องแยกประชากรเป็น 2 กลุ่ม คือ ชาย และ หญิง เนื่องจากการตัดสินใจของผู้บริหารชายและหญิงไม่ เหมือนกัน ถ้าไม่แบ่ง อาจได้แต่ผู้บริหารชายมา ทำให้ได้ ตัวแทนที่ไม่ดีของประชากร
การสุ่มตัวอย่างแบบกลุ่ม (Cluster Random Sampling) แบ่งประชากรออกเป็นกลุ่ม ๆ ตามพื้นที่ทางภูมิศาสตร์ ตามสถาบัน หน่วยงาน ฯลฯ เลือกมาเพียงบางกลุ่ม -ประชากรที่อยู่ในกลุ่มเดียวกันครอบคลุมทุกลักษณะของประชากร -แต่ละกลุ่มมีลักษณะคล้ายคลึงกัน สุ่มบางกลุ่มมาเป็นตัวแทนของทุกกลุ่ม ประชากรในกลุ่มที่สุ่มมาได้อาจนำมาใช้เป็นตัวอย่างทั้งหมดหรืออาจเลือกจากในกลุ่มอีกทีก็ได้ ตัวอย่างเช่น แบ่งประชากรเป็นภาค และเป็นรายจังหวัด ในแต่ละภาค สุ่มจังหวัดมา 3 จังหวัด Silpchai Nilkorn Sampling
การวัด การกำหนดค่าให้แก่ตัวแปร เช่น ตัวแปร เพศ ค่า ชาย หญิง ตัวแปร เพศ ค่า ชาย หญิง ตัวแปร ความสูง ค่า 150 ซ.ม. ตัวแปร อุณหภูมิ ค่า 100 องศาเซลเซียส
ระดับการวัด 4 ระดับ (NOIR) Nominal: (“categorical”) วัดหยาบสุด แบ่งกลุ่มตามลักษณะที่ เหมือนกัน Ordinal: กลุ่มต่าง + เรียงอันดับกลุ่มได้( เช่น จากน้อยไปมาก) Interval: มีคุณสมบัติ (1+2) + มีหน่วยมาตรฐานบอกความแตกต่าง ระหว่างกลุ่ม Ratio: มีคุณสมบัติ (1+2+3) + มีศูนย์แท้
ระดับการวัด และ สถิติ ระดับการวัดเป็นปัจจัยสำคัญปัจจัยหนึ่งในกำหนดวิธีการ ทางสถิติที่ใช้ในการวิเคราะห์ข้อมูล สถิติพรรณนา ข้อมูลเชิงคุณภาพ (NO) ความถี่ ร้อยละ ข้อมูลเชิงปริมาณ (IR) ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน
ระดับการวัดและสถิติ เชิงคุณภาพ เชิงปริมาณ ผสม ตัวแปรตาม ตัวแปรต้น เชิงคุณภาพ เชิงปริมาณ ผสม ตัวแปรตาม ตารางความถี่ 2ทาง ฯลฯ ไคสแควร์ การวิเคราะห์จำแนก(Discriminant Analysis) Logistic regression T-test Anova Regression Pearson Correlation Regression with dummy variables ACOVA
วัตถุประสงค์การวิจัย ตัวอย่าง 1 คำถามวิจัย การให้บริการรูปแบบ A และรูปแบบ B มีประสิทธิภาพแตกต่างกันหรือไม่? วัตถุประสงค์การวิจัย เพื่อเปรียบเทียบประสิทธิภาพของรูปแบบการให้บริการแบบ A และแบบ B แผนแบบการทดลอง สองประชากร? อิสระ? จับคู่? การวัด ระยะเวลา ? งบประมาณ?
การตีความผลการวิเคราะห์ ตัวอย่าง 1 (ต่อ) การวิเคราะห์ t-test อิสระ/จับคู่ ? ไคสแควร์ ? การตีความผลการวิเคราะห์ มีนัยสำคัญ/ไม่มีนัยสำคัญทางสถิติ มีนัยสำคัญ/ไม่มีนัยสำคัญในทางปฏิบัติ สรุปผลการวิจัย รูปแบบการให้บริการแบบ A มีประสิทธิภาพดีกว่ารูปแบบการให้บริการแบบ B?
วัตถุประสงค์การวิจัย ตัวอย่าง 2 คำถามวิจัย ปัจจัยใดบ้างที่มีผลต่อการใช้อินเตอร์เน็ตของผู้บริหาร? วัตถุประสงค์การวิจัย เพื่อศึกษาปัจจัยที่มีผลต่อการใช้อินเตอร์เน็ตของผู้บริหาร วิธีการวิจัย การวิจัยเชิงสำรวจ
ตัวอย่าง 2 (ต่อ) การวัด ปัจจัยส่วนบุคคล -เพศ อายุ การศึกษา ฯลฯ ปัจจัยส่วนบุคคล -เพศ อายุ การศึกษา ฯลฯ ปัจจัยด้านระบบ - ความพร้อมของอุปกรณ์ เครื่องมือ ระบบฐานข้อมูล ฯลฯ การวิเคราะห์ข้อมูล การวิเคราะห์การถดถอย? การทดสอบไคสแควร์ การตีความ/การสรุปผล ปัจจัยที่มีนัยสำคัญ/ไม่มีนัยสำคัญ
วัตถุประสงค์การวิจัย ตัวอย่าง 3 การประเมินภาวะผู้นำ คุณภาพIT และประโยชน์ที่ประชาชนได้รับจากระบบ e-government คำถามวิจัย ภาวะผู้นำส่งผลต่อคุณภาพเทคโนโลยีสารสนเทศและการให้บริการประชาชนด้วยระบบ e-government หรือไม่ คุณภาพเทคโนโลยีสารสนเทศส่งผลต่อการให้บริการประชาชนด้วยระบบ e-government หรือไม่ วัตถุประสงค์การวิจัย เพื่อศึกษาผลกระทบของภาวะผู้นำต่อคุณภาพเทคโนโลยีสารสนเทศและการให้บริการประชาชนด้วยระบบ e-government เพื่อศึกษาผลกระทบของคุณภาพเทคโนโลยีสารสนเทศและการให้บริการประชาชนด้วยระบบ e-government
ตัวอย่าง 3 (ต่อ) การเก็บรวบรวมข้อมูล เก็บข้อมูลด้วยแบบสอบถามจากเมือง …… โดยเก็บจาก เจ้าหน้าที่ของรัฐ และ ประชาชนผู้ใช้บริการ การวิเตราะห์ข้อมูล Path analysis Regression Analysis Correlation Analysis สรุปผล รูปแบบจากข้อมูลเชิงประจักษ์สอดคล้องกับรูปแบบตามสมมติฐาน?
Regression X1 Y X2 X3 Observed Variables Y เชิงปริมาณ, Normal X4
Path Model X1 Y X2 X3 Observed Variables X4
Factor Analysis Model Y X1 X2 X3 Latent Variables X4 Observed Variables X3 Latent Variables X4
SEM Model structural equation modeling Observed Variables Latent Variable Z1 X1 X2 Z2 Z X X3 Z3 X4 Z4 Y1 Y Y2 Y3 Factor Models +Path Models Y4
Discriminant Analysis, Logistic Regression,Clustering ปัจจัยด้านการบริหาร(X1, X2, X3,…,Xk) ที่มีผลต่อความสำเร็จของ องค์กร(y สำเร็จ/ไม่สำเร็จ) X1 Y 0/1 X2 X3 X4