การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสมมติฐาน ตัวแปร ข้อมูล และสถิติ ผู้ช่วยศาสตราจารย์ ดร. เรวัต แสงสุริยงค์ URL: http://www.huso.buu.ac.th/rewat e-mail: rewat@buu.ac.th
ขั้นตอนของวิธีการทางวิทยาศาสตร์ (Stages of the Scientific Method) กำหนดปัญหา (Question Identified) ขั้นตอนภายในกระบวนการวิจัย(Steps within the research process) สร้างสมมติฐาน (Hypothesis Formed) วางแผนการวิจัย (Research Plan) รวบรวมข้อมูล (Data Collected) วิเคราะห์ผล (Results Analyzed) สรุป (Conclusions)
ประเภทของคำถามการวิจัย (Types of Research Questions) คำถามเชิงพรรณนา (Descriptive question) คำถามเชิงความสัมพันธ์ (Relationship question) คำถามเชิงเปรียบเทียบ (Difference question)
สมมติฐาน คือ อะไร #1 (What is a Hypothesis?) สมมติฐาน คือ การตอบปัญหาวิจัยล่วงหน้า โดยใช้การคาดคะเนจากความรู้ทางด้านทฤษฎีและประสบการณ์ที่มีอยู่ โดยเขียนเป็นลายลักษณ์อักษรด้วยภาษาและความหมายที่ชัดแจ้งไม่คลุมเครือ ทางที่ดี ควรตั้งสมมติฐานต่อปัญหาทุกข้อที่ได้กำหนดไว้ สมมติฐานเป็นคำกล่าวที่ระบุถึงความสัมพันธ์ระหว่างตัวแปรตั้งแต่สองตัวแปรขึ้นไป
สมมติฐาน คือ อะไร #2 (What is a Hypothesis?) ฉันขอสันนิษฐานไว้ก่อนว่า (assume) รายได้เฉลี่ยของประชาชนในชุมชนนี้ ต่ำกว่า 2,000 บาท สมมติฐาน คือ ข้อสันนิษฐาน (assumption) เกี่ยวกับพารามิเตอร์ของประชากร (population parameter) พารามิเตอร์ (parameter) คือ ลักษณะของประชากร เช่น ค่าเฉลี่ย (mean) หรือ ค่าความแปรปรวน (variance) ค่าพารามิเตอร์ต้องกำหนดก่อนการวิเคราะห์
การทดสอบสมมติฐาน (Hypothesis Testing) การทดสอบสมมติฐาน (Hypothesis testing) คือ วิธีการหนึ่งในการตัดสินใจ (determining) จากความน่าจะเป็น (probability) ด้วยค่าสถิติ (statistic) ที่ได้จากกลุ่มตัวอย่าง (sample) หรือค่าพารามิเตอร์ (parameter) จากประชากรเป้าหมาย (hypothetical population) สมมติฐานการวิจัย (Research Hypothesis) การทำนาย (predicted) ผล (outcome) ที่ได้จากการศึกษา สมติฐานหลัก (Null Hypothesis) คือ การกำหนดข้อสันนิฐานในรูปแบบที่ไม่มีความสัมพันธ์ (no relationship) กับประชากร สมติฐานรอง (Alternative Hypothesis) คือ การกำหนดข้อสันนิฐานในรูปแบบที่มีความสัมพันธ์ (relationship) กับประชากร
มีนัยสำคัญทางปฏิบัติกับการมีนัยสำคัญทางสถิติ (Practical vs มีนัยสำคัญทางปฏิบัติกับการมีนัยสำคัญทางสถิติ (Practical vs. Statistical Significance) คำว่า ระดับนัยสำคัญ (significance level or level of significance) เป็นการอ้างถึง (refers) ความเป็นไปได้ (probability) ที่เกิดขึ้นในทางสถิติของกลุ่มตัวอย่าง (a sample) ที่เป็นผลมาจากความผิดพลาดในการสุ่มตัวอย่าง (sampling error) ระดับนัยสำคัญที่ใช้ในการวิจัยคือ ระดับ .05 และ .01 นัยสำคัญทางสถิติ (Statistical significance) และนัยสำคัญทางปฏิบัติ (Practical significance) ไม่จำเป็นต้องเหมือนกัน ผลของนัยสำคัญทางสถิติไม่ได้หมายความว่า มีนัยสำคัญทางปฏิบัติ
สมมติฐาน (Hypotheses Practice) X Y สังคม-ประชากร (Socio-demographics): อาชีพ (occupation) สถานะภาพสมรส (martial status) จำนวนบุตร (number of children) การนับถือศาสนา (religious affiliation) สมาชิกพรรคการเมือง (political party affiliation) อายุ (age) เชื้อชาติ (race/ethnicity) การศึกษา (education) เพศ (gender) ถิ่นฐาน (region) ความคิดเห็นต่อ (Opinion toward): การควบคุมอาวุธปืน (gun control) การป้องกันสิ่งแวดล้อม (environmental protection) การทำแท้ง (abortion) การแต่งงานข้ามเชื้อชาติ (interracial marriage) การออกกฎหมายยาเสพติด (legalization of drugs) การขอให้แพทย์ช่วยให้ตายอย่างรวดเร็ว (doctor-assisted suicide) เด็กที่แสดงพฤติกรรมผิดปกติ (spanking children) การสอนเพศศึกษาในโรงเรียน (teaching sex education in the public schools)
ตัวอย่างสมมติฐาน สมมติฐานหลัก (Null Hypothesis) Ho = เพศไม่มีความสัมพันธ์กับความคิดเห็นต่อการควบคุมอาวุธปืน สมมติฐานรอง (Alternative Hypothesis) Ha=เพศมีความสัมพันธ์กับความคิดเห็นต่อการควบคุมอาวุธปืน สมมติฐานหลัก (Null Hypothesis) Ho = การเป็นสมาชิกพรรคการเมืองไม่มีความสัมพันธ์กับความคิดในการต่อต้านการทำแท้ง สมมติฐานรอง (Alternative Hypothesis) Ha= การเป็นสมาชิกพรรคการเมืองมีความสัมพันธ์กับความคิดเห็นในการต่อต้านการทำแท้ง
สมมติฐานและความสัมพันธ์ระหว่างตัวแปร (Hypothesized Relationships Between Variables) ความสัมพันธ์เชิงสาเหตุ (Causal Relationship)
ตัวอย่างสมมติฐาน สมมติฐานหลัก (Null Hypothesis) Ho = ความเครียดไม่มีความสัมพันธ์กับอัตราการฆ่าตัวตาย สมมติฐานรอง (Alternative Hypothesis) Ha = ความเครียดมีความสัมพันธ์กับอัตราการฆ่าตัวตาย
สมมติฐานและความสัมพันธ์ระหว่างตัวแปร (Hypothesized Relationships Between Variables) ความสัมพันธ์เชิงสาเหตุในทิศทางตรงข้าม (Inverse Causal Relationship)
ตัวอย่างสมมติฐาน สมมติฐานหลัก (Null Hypothesis) Ho = ความผูกพันกับสังคมไม่ใช่สาเหตุของการฆ่าตัวตาย สมมติฐานรอง (Alternative Hypothesis) Ha = ความผูกพันกับสังคมเป็นสาเหตุของการฆ่าตัวตาย
สมมติฐานและความสัมพันธ์ระหว่างตัวแปร (Hypothesized Relationships Between Variables) การอธิบายจากหลายสาเหตุ (Multiple-cause Explanation)
ตัวอย่างสมมติฐาน สมมติฐานหลัก (Null Hypothesis) Ho = การเปลี่ยนทางสังคม ความยากจน และความเลื่อมใสในศาสนา ไม่เป็นสาเหตุของการฆ่าตัวตาย สมมติฐานรอง (Alternative Hypothesis) Ha = การเปลี่ยนทางสังคม ความยากจน และความเลื่อมใสในศาสนา เป็นสาเหตุของการฆ่าตัวตาย
ตัวแปร (Variable) ลักษณะ คุณสมบัติ หรืออาการกิริยาของหน่วยต่าง ๆ (มนุษย์ สัตว์ พืช สังคม ครอบครัว กลุ่ม) ซึ่งอาจจะทำให้สมาชิก (Element) ภายในหน่วยนั้นแตกต่างระหว่างกัน ตัวอย่าง มนุษย์ มีค่าตัวแปรของ อายุ สีผิว น้ำหนัก รายได้ อาชีพ ระดับการศึกษา ส่วนสูง เชื้อชาติ แตกต่างกัน ครอบครัว มีค่าตัวแปรของ ลักษณะ ขนาด ฐานะ พื้นฐาน แตกต่างกัน สังคม มีค่าตัวแปรของ ประชากร โครงสร้าง ปัญหาสังคม แตกต่างกัน
ตัวแปรมาจากไหน ปัญหาการวิจัย - ค่าบริการกับคุณภาพการให้บริการมีความสัมพันธ์กันหรือไม่ ตัวแปร - ค่าบริการ, คุณภาพการให้บริการ สมมติฐานการวิจัย – ค่าบริการมีความสัมพันธ์กับคุณภาพการให้บริการ ตัวแปร - ค่าบริการ, คุณภาพให้การบริการ ปัญหาการวิจัย – ประเภทของหน่วยงานมีความสัมพันธ์กับคุณภาพการให้บริการ ตัวแปร - ประเภทของหน่วยงาน, คุณภาพการให้บริการ สมมติฐานการวิจัย – หน่วยงานเอกชนให้บริการมีคุณภาพมากกว่าหน่วยงานรัฐ ตัวแปร - ประเภทของหน่วยงาน, คุณภาพให้การบริการ
ประเภทตัวแปร แบ่งตามลักษณะการวัด ตัวแปรไม่ต่อเนื่อง ( Discontinuous Variable) หมายถึง ตัวแปรที่มีค่าเป็นจำนวนเต็มหน่วย และแบ่งกลุ่มพวกแยกออกจากกันโดยเด็ดขาด แบ่งเป็นตัวแปร “สองประเภท” หรือ “ตัวแปรคู่” (dichotomous variable) เช่น เพศ แบ่งเป็นหญิงและชาย และ “ตัวแปรหลายประเภท” (polytomous variable) เช่น สถานภาพสมรส แบ่งเป็น โสด สมรส ม่าย หย่า แยก จัดเป็นระดับตัวแปรแบ่งกลุ่มและอันดับ ตัวอย่าง เช่น เพศ ระดับ การ ศึกษา อาชีพ อันดับการสอบไล่ เป็นต้น ตัวแปรต่อเนื่อง (Continuous Variable) หมายถึง ตัวแปรที่มีค่าอยู่ในช่วงที่กำหนด จัดเป็นระดับตัวแปรระดับช่วงและอัตราส่วน ตัวอย่างเช่น อายุ น้ำหนัก อุณหภูมิ คะแนนสอบไล่ เป็นต้น
ประเภทตัวแปร แบ่งตามระดับของการวัด - ตัวแปรเชิงปริมาณ (Quantitative Variables) - ตัวแปรเชิงคุณภาพ (Qualitative Variables) แบ่งตามหน้าที่ - ตัวแปรอิสระ (Independent Variables) - ตัวแปรตาม (Dependent Variables) - ตัวแปรแทรก (Intervening Variables) - ตัวแปรคุม (Control Variables)
การแบ่งกลุ่มการวัดของตัวแปร กลุ่มตัวแปรระดับมาตราวัด (Scale Measurement) ตัวแปรที่เป็นตัวเลข (Numeric Variables) กลุ่มตัวแปรระดับอันดับมาตรา (Ordinal Measurement) ตัวแปรที่เป็นตัวอักษรและตัวเลข (String and Numeric Variables) กลุ่มตัวแปรระดับนามมาตรา (Nominal Measurement) ตัวแปรที่เป็นตัวอักษร (String (alphanumeric) Variables)
ประเภทตัวแปร ตัวแปรเชิงคุณภาพ (Qualitative/Categorical) นามมาตรา (Nominal) – number is just a symbol that identifies a quality 0 = ชาย, 1 = หญิง 1 = เขียว, 2 = น้ำเงิน, 3 = แดง, 4 = ขาว อันดับมาตรา (Ordinal) – rank order 1 = น้อย, 2 = ปานกลาง, 3 = มาก ตัวแปรเชิงปริมาณ (Quantitative/Continuous and Discrete) ช่วงมาตรา (Interval) – units are of identical size (i.e. Years) 1 = ต่ำกว่า 5,000 บาท 2 = 5,000 – 10,000 บาท 3 = มากกว่า 10,000 บาท A = มากกว่า 80 B = 79 - 70 C = 69 - 60 D = 59 - 50 F = ต่ำกว่า 49 อัตราส่วนมาตรา (Ratio) – distance from an absolute zero (i.e. Age, reaction time) อายุ 0 - 120 ปี
ระดับการวัดของตัวแปร 1. การวัดระดับนามมาตรา (Nominal Scale) 2. การวัดระดับอันดับมาตรา (Ordinal Scale) 3. การวัดระดับช่วงมาตรา (Interval Scale) 4. การวัดระดับอัตราส่วนมาตรา (Ratio Scale)
การวัดระดับแบ่งกลุ่ม การวัดระดับนามมาตรา (Nominal Scale) เป็นระดับต่ำสุดของตัวแปร ซึ่งจัดแบ่งเป็นประเภทหรือกลุ่มโดย ระบุความ แตกต่างเป็นชื่อหรือสัญลักษณ์เท่านั้น มิได้บ่งชี้ถึงความแตกต่างในคุณค่า หรือคุณภาพใดๆ ไม่สามารถจัดเรียงลำดับก่อนหลัง หรือสูงต่ำได้ แต่ละหน่วยมีความเป็นอิสระจากกันอย่าง เด็ดขาด อาจใช้ตัวเลขแทนได้ (เพศชาย 1 เพศหญิง 2) ตัวอย่าง ศาสนา : พุทธ อิสลาม คริสต์ อาชีพ : ข้าราชการ รัฐวิสาหกิจ รับจ้าง อาชีพส่วนตัว
การวัดระดับอันดับ การวัดระดับอันดับมาตรา (Ordinal Scale) เป็นระดับที่สูงกว่าระดับแบ่งกลุ่มมาตราหรือนามมาตรา ระบุความแตกต่างโดยให้เป็นชื่อหรือสัญลักษณ์ สามารถจัดลำดับที่และแสดงความมากน้อย แต่ไม่สามารถนำผลมา บวก ลบ คูณหารกันได้ ตัวอย่าง ชนชั้น : ชั้นสูง ชั้นกลาง ชั้นต่ำ ความสวย : สวย พอใช้ ขี้เหร่ ทัศนคติ : เห็นด้วย เฉยๆ ไม่เห็นด้วย ฐานะ : ร่ำรวย ปานกลาง ยากจน
การวัดระดับช่วง การวัดระดับช่วงมาตรา (Interval Scale) เป็นระดับที่สูงกว่าระดับแบ่งกลุ่มมาตราและอันดับมาตรา แสดงความแตกต่างของหน่วย และลำดับชั้นสูงต่ำมากน้อย รวมถึงความแตกต่างระหว่างหน่วยว่ามีเท่าใด (แต่ละช่วง ความ แตกต่างเท่ากัน) สามารถนำมาบวก ลบ คูณ หารได้ แต่ไม่มีจุดศูนย์แท้ (หรือศูนย์สมมติ) ตัวอย่าง กลุ่มสังคม : A B C DE (กลุ่ม DE ไม่ได้หมายความว่าไม่มีรายได้เลย) A = รายได้ครอบครัว > 50,000 บาท B = รายได้ครอบครัว 40,000 - 49,999 บาท C = รายได้ครอบครัว > 20,000 - 39,999 บาท DE = รายได้ครอบครัว < 20,00 บาท อุณหภูมิ : 0o C 50o C (อุณหภูมิ 0o C ไม่ได้หมายความว่าไม่มีความร้อนเลย) อากาศหนาว = < 30.0 o C อากาศอุ่น = 30.0 -34.9 o C อากาศร้อน = 35.0 o C และมากกว่า
การวัดระดับอัตราส่วน การวัดระดับอัตราส่วนมาตรา (Ratio Scale) เป็นระดับสูงสุดของการวัดตัวแปร แสดงความแตกต่างของตัวแปรระดับแบ่งกลุ่มมาตรา ระดับอันดับมาตรา และระดับช่วงมาตรา โดยมีจุดศูนย์แท้ (Absolute Zero) หรือค่าศูนย์ ตามธรรมชาติ (Natural Zero) คือความไม่มีลักษณะนั้นๆ เลย ตัวอย่าง อายุ ความยาว น้ำหนัก จำนวนบุตร
ความสัมพันธ์ระหว่างกลุ่มตัวแปรกับระดับการวัดของตัวแปร (Variables) การวัดแบบคำนาม (Nominal Measurement) การวัดแบบจัดอันดับ (Ordinal Measurement) การวัดแบบมาตรวัด (Scale Measurement) กลุ่มหรือนามมาตรา (Nominal Scale) / อันดับมาตรา (Ordinal Scale) ช่วงมาตรา (Interval Scale) อัตราส่วนมาตรา (Ratio Scale)
การจำแนกตัวแปรเชิงคุณภาพและเชิงปริมาณ (Variables) การวัดแบบนามมาตรา (Nominal) การวัดแบบอันดับมาตรา (Ordinal) การวัดแบบช่วงมาตรา (Interval) การวัดแบบอัตราส่วนมาตรา (Ratio) คุณภาพ (Qualitative) / ปริมาณ (Quantitative) ตัวแปรระดับที่สูงกว่าจะสามารถแปลงระดับการวัดเป็นตัวแปรระดับที่ต่ำกว่าได้ แต่ตัวแปรระดับที่ต่ำกว่าจะแปลงระดับการวัดเป็นตัวแปรระดับสูงกว่าไม่ได้ การจำแนกระดับของตัวแปรจะมีผลต่อการเลือกวิธีการทางสถิติที่จะนำมาใช้สรุป และวิเคราะห์ข้อมูล
อะไรคือ ข้อมูล (What is data?) ราชบัณฑิตยสถาน (2542) ข้อมูล คือ ข้อเท็จจริง หรือสิ่งที่ถือหรือยอมรับว่าเป็นข้อเท็จจริง สําหรับ ใช้เป็นหลักอนุมานหาความจริงหรือการคํานวณ. Fraenkel & Wallen (2000) ข้อมูล คือ สารสนเทศประเภทต่างๆ (kinds of information) ที่นักวิจัยได้มาจากประชากรในการวิจัย ??? ข้อมูล คือ สิ่งที่รวบรวมได้จากการสังเกต (observation) สิ่งที่ได้จากการสังเกตอาจเป็น อายุ ส่วนสูง รายได้ เพศ จังหวัดที่อยู่ ความเข้าใจผิดเกี่ยวกับข้อมูล Data = numbers? Data = numbers + written words? The experts adapted the definition of data from Fraenkl & Wallen. Data is information. In the case of this presidential election, people try to find out whether different gender, age, race, religion - this demographic information - would affect the way they vote. This information after being collected becomes data. To understand the data, a person first must understand the research types, and what kinds of data one can collect. (Next slide: Where is data found?) ที่มา: http://rirs3.royin.go.th/dictionary.asp; http://bps.papua.go.id/wahyu/ebook/Statistik_Non_parametrik/index.php
ที่มา: http://tsl.tsu.ac.th/courseware/math2/lesson1/less1_4.htm ประเภทของข้อมูล #1 จำแนกตามลักษณะการเก็บข้อมูล ข้อมูลที่ได้จากการนับ (Counting Data) ข้อมูลที่ได้จาการวัด (Measurement Data) ข้อมูลที่ได้จากการสังเกต (Observation Data) ข้อมูลที่ได้จากการสัมภาษณ์ ( Interview Data) จำแนกตามลักษณะข้อมูล ข้อมูลเชิงปริมาณ (Quantitative Data) ข้อมูลแบบไม่ต่อเนื่อง (Discrete Data) ข้อมูลแบบต่อเนื่อง ( Continuous Data) ข้อมูลเชิงคุณภาพ (Qualitative Data) ที่มา: http://tsl.tsu.ac.th/courseware/math2/lesson1/less1_4.htm
ที่มา: http://tsl.tsu.ac.th/courseware/math2/lesson1/less1_4.htm ประเภทของข้อมูล #2 จำแนกตามแหล่งที่มาของข้อมูล ข้อมูลปฐมภูมิ (Primary Data) ข้อมูลทุติภูมิ (Secondary Data) แบ่งตามมาตรของการวัด มาตรวัดแบบนามบัญญัติ (Nominal Scale) มาตรวัดแบบอันดับ (Ordinal Scale) มาตรวัดแบบช่วง (Interval Scale) มาตรวัดแบบอัตราส่วน (Ratio Scale) แบ่งตามเวลาของการเก็บรวบรวมข้อมูล ข้อมูลอนุกรมเวลา ( Time-series Data) ข้อมูลภาคตัดขวาง ( Cross-sectional Data ) ที่มา: http://tsl.tsu.ac.th/courseware/math2/lesson1/less1_4.htm
ประเภทข้อมูลและแหล่งข้อมูล (Data Types and Sources) ข้อมูลปฐมภูมิ (Primary Data) ข้อมูลทุติยภูมิ (Secondary Data) ข้อมูลเชิงคุณภาพ (Qualitative) - สนทนากลุ่ม (Focus group) - สัมภาษณ์เจาะลึก (Depth interview) - การคาดการณ์ (Projective technique) ข้อมูลภายใน (Internal) - พร้อมใช้ (Ready to use) - อยู่ระหว่างการดำเนินการ (To be processed) ข้อมูลเชิงปริมาณ (Quantitative) - สำรวจ (Survey) - สังเกต (Observation) - ทดลอง (Experiment) ข้อมูลภายนอก (External) - สิ่งพิมพ์ (Published) - หน่วยงานต่าง ๆ (Syndicated) - ฐานข้อมูล (Databases)
ประเภทของข้อมูล ข้อมูล (Data) ไม่ต่อเนื่อง (Discontinuous) แบ่งกลุ่ม (Categorical) เชิงคุณภาพ (Qualitative) ตัวเลข (Numerical) เชิงปริมาณ (Quantitative) นามบัญญัติ (Nominal) จัดอันดับ (Ordinal) ไม่ต่อเนื่อง (Discrete) ต่อเนื่อง (Continuous)
ไม่ต่อเนื่อง (Discontinuous) ไม่ต่อเนื่อง (Discrete) ข้อมูลไม่ต่อเนื่อง ไม่ต่อเนื่อง (Discontinuous) ไม่ต่อเนื่อง (Discrete) เพศ 0 = ชาย 1 = หญิง คำตอบ 1 = ไม่ใช่ 2 = ใช่ พื้นที่อยู่อาศัย 0 = ชนบท 1 = ชานเมือง 2 = เมือง เพศ 0 = ไม่ใช่หญิง 1 = หญิง คำตอบ 0 = ไม่ใช่ 1 = ใช่ พื้นที่อยู่อาศัย 0 = ไม่ใช่เมือง 1 = เมือง
ความสัมพันธ์ระหว่างตัวแปรกับข้อมูล (Relationships between Variables) ปริมาณ (Quantity) แบ่งกลุ่ม (Category) ต่อเนื่อง (Continuous) (measuring) ไม่ต่อเนื่อง (Discrete) (counting) อันดับมาตรา (Ordinal) นามมาตรา (Nominal) จัดอันดับกลุ่ม (Ordered categories) ช่วง (Ranks) (Source. Rowntree 2000: 33)
ความสัมพันธ์ระหว่างข้อมูล สารสนเทศ และสถิติ ข้อมูล (Data) สารสนเทศ (Information) สถิติ (Statistics) 20 กิโลกรัม, 25 กิโลกรัม คน 5 คน มีน้ำหนักอยู่ระหว่าง 20-25 กิโลกรัม น้ำหนักเฉลี่ย = 22.5 กิโลกรัม 28 กิโลกรัม, 30 กิโลกรัม คน 15 คน มีน้ำหนักอยู่ระหว่าง 26-30 กิโลกรัม น้ำหนักเฉลี่ย = 28 กิโลกรัม