สถิติพรรณนา (Descriptive Statistics) การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) สถิติพรรณนา (Descriptive Statistics) ผู้ช่วยศาสตราจารย์ ดร. เรวัต แสงสุริยงค์ URL: http://www.huso.buu.ac.th/rewat e-mail: rewat@buu.ac.th
สถิติพรรณนา Statistics Data Information การจัดเรียง (arranging) การสรุป (summarizing) และการนำเสนอ (presenting) ข้อมูลชุดหนึ่ง (a set of data) เพื่อนำไปใช้ประโยชน์ในรูปของสารสนเทศ (information) การสรุปข้อมูล (summarize data) ในรูปของตาราง (tabular) กราฟ (graphical) และตัวเลข (numerical) Statistics Data Information
การสรุปด้วยตาราง (Tabular Summary) อายุ จำนวน ร้อยละ 2 13 16 7 5 50 4 26 32 14 10 100 19 และต่ำกว่า 20-29 30-39 40-49 50-59 60 และมากกว่า
การสรุปด้วยกราฟ (Graphical Summary) กราฟภาพสัญลักษณ์ (Pictograph) กราฟกล่องและหนวด (Box - and -Whisker Plot) กราฟวงกลม (Circle/Pie Graph) กราฟแผนที่ (Map) ประเภทของกราฟ (Types of Graphs) กราฟแท่ง (Bar Graphs) กราฟเส้น (Line Graphs) กราฟแบบลงจุด (Plots) แท่งความถี่หรือฮีสโทแกรม (Histogram) ลำต้นและใบ (Stem & Leaf) เส้นเดียว (Single) เส้น (Line) แท่งเดียว (Single) เส้นซ้อน (Double) กระจาย (Scatter) แท่งซ้อน (Double)
กราฟกล่องและหนวด (Box - and -Whisker Plot) จำนวนชั่วโมงการทำการบ้าน 8 7 6 5 4 3 9 6.3 7.75 5.25 6.9 ใช้ตรวจสอบ 25th, 50th (median), 75th percentiles และ Outliers
กราฟภาพสัญลักษณ์ (Pictograph)
กราฟแผนที่ (Map)
กราฟวงกลม (Circle/Pie Graph)
กราฟเส้น (Line Graphs)
กราฟแท่ง (Bar Graphs)
เวลาเรียนกับผลการเรียน กราฟแบบลงจุด (Plots) สีที่ชอบ X X X X X X X X X X X X X แดง น้ำเงิน เขียว เหลือง ม่วง ความสูงของนิสิต ดัชนี: 12| 7 = 127 ซม. 12 7 8 8 9 1 2 4 4 4 6 6 0 0 2 3 3 4 7 15 1 1 Dot Plot Stem and Leaf เวลาเรียนกับผลการเรียน 20 40 60 80 100 1 2 3 4 ชั่วโมงเรียน ผลการเรียน * 5 Scatter Plot
ข้อเสนอแนะก่อนการทำกราฟนำเสนอข้อมูล (Before Preparing Charts) ใครคือ กลุ่มเป้าหมาย (Who is the target audience?) ระดับความเข้าใจ (What is their level of understanding) ความสนใจ (What are their interests) บทบาทของกราฟในการสื่อความหมายของข้อมูล (Role of charts in conveying your message) แนวโน้ม (Trends) เปรียบเทียบ (Contrast) ความก้าวหน้าและผลสัมฤทธิ์ (Achievement, way forwards) ความสัมพันธ์ (Absolute, relative) จำนวนมากน้อย และร้อยละ (Magnitude, percentage) นำเสนอกราฟอย่างไร (How will the charts be presented?) สี หรือขาวดำ (In colour, B&W) แผ่นใส่หรือโปรแกรมคอมพิวเตอร์ (In a publication, as a presentation using overhead projector) อะไรคือ กราฟที่ดีสุด (What chart is the best?) กราฟแท่ง กราฟวงกลม แผนที่ (Bar, Pie, Maps?????) เปรียบเทียบหลายๆ แบบ (Compare various styles) ที่มา: AIMS, UNESCO. 2006. Analysis of Indicators Using Visual Presentations. http://www.unescobkk.org/fileadmin/user_upload/efa/EFA_MDA/SEA_MDA_workshop_Nov06/Day4_Use_of_charts.ppt
ข้อควรพิจารณาหลังทำกราฟนำเสนอข้อมูล (After Making Charts) ความยากง่ายในการเข้าใจ (Is it easy to understand?) ความสวยงาม ความไม่น่าสนใจ มากไป น้อยไป (Too fancy, too dull, too much, too little) เนื้อหา (message) ที่ต้องการถ่ายทอด/สื่อสาร (convey) อะไรคือ คำถามก่อนที่จะนำเสนอเป็นกราฟ (What is my question before doing this graph) ความผิดพลาดในการตีความ (Can this chart be misinterpreted?) Am I giving the wrong message? ความสมบูรณ์ของส่วนประกอบของกราฟ (Is it self-contained?) ชื่อเรื่อง (Title) คำอธิบาย (Legend) ชื่อแกน x, y ของกราฟ (Axis title) มาตรบอกระดับ/ขนาดข้อมูล (Scale) แหล่งข้อมูล (Sources) สิ่งที่เกี่ยวข้องกับข้อมูล (Other relevant information) ความเหมาะสมของกราฟ (Is the chart in right place?) ที่มา: AIMS, UNESCO. 2006. Analysis of Indicators Using Visual Presentations. http://www.unescobkk.org/fileadmin/user_upload/efa/EFA_MDA/SEA_MDA_workshop_Nov06/Day4_Use_of_charts.ppt
ข้อสรุปการใช้กราฟในการนำเสนอข้อมูล (Conclusion) เป้าหมายสำคัญของการนำเสนอข้อมูลด้วยกราฟคือ นำเสนอข้อมูลด้วยภาพ (visually impart) แทนการนำเสนอข้อมูลด้วยตาราง (data table) ที่อ่านแล้วเข้าใจได้ยาก การนำเสนอข้อมูลด้วยกราฟ ควรนำเสนอเฉพาะข้อมูลที่จำเป็น (information essential) ที่เป็นประเด็นสำคัญ (highlighting) ที่เกี่ยวกับเรื่องที่นำเสนอ เช่น แนวโน้ม (trends) ความแตกต่าง (contrasts) ไม่ใช่รายละเอียดปลีกย่อย (minute details) นำเสนอเฉพาะผลรวมสุดท้าย (net results) แทนการให้รายละเอียดด้วยตาราง เน้นการเปรียบเทียบหรือจำนวนที่แตกต่าง (Highlights the magnitude of differences๗ ระหว่างกลุ่มของแต่ละตัวแปร ออกแบบการเปรียบเทียบให้เหมาะสมกับวัตถุประสงค์ของการวิเคราะห์ (objective of the analysis) คัดเลือกตัวแปรและกลุ่มสำหรับวิเคราะห์ตามลำดับความหรือความจำเป็น (analytical variables and group the order) ที่มา: AIMS, UNESCO. 2006. Analysis of Indicators Using Visual Presentations. http://www.unescobkk.org/fileadmin/user_upload/efa/EFA_MDA/SEA_MDA_workshop_Nov06/Day4_Use_of_charts.ppt
อะไรคือ การพรรณนา (What to describe?) การบอกตำแหน่งที่ตั้ง (location) หรือ ศูนย์กลาง (center) ของข้อมูล (data) การวัดตำแหน่งที่ตั้ง (measures of location) การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Measures of central tendency) การวัดตำแหน่ง (Measures of position) การบอกความแตกต่าง (vary) ของข้อมูล การวัดการกระจาย (measures of variability) การวัดช่วงห่าง (Measures of rang) การวัดการแพร่กระจาย (Measures of dispersion) การบอกความสัมพันธ์ (relation) ของข้อมูล การวัดความสัมพันธ์ (measures of relationship) การวัดขนาดของความสัมพันธ์ (Measures of strength or magnitude) การวัดทิศทางของความสัมพันธ์ (Measures of direction)
การวัดตำแหน่งที่ตั้ง (Measures of Location) การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Measures of central tendency) ค่าเฉลี่ยเลขคณิตหรือค่าเฉลี่ย (Arithmetic Mean or Mean) - ค่ากลางของข้อมูลที่ได้จากการบวกค่าของข้อมูลทั้งหมด แล้วหารด้วยจำนวนข้อมูลทั้งหมด มัธยฐาน (Median) -ค่าที่อยู่ตำแหน่งกึ่งกลางของข้อมูลชุดหนึ่งที่ได้มีการจัดเรียงลำดับเรียบร้อยแล้ว ฐานนิยม (Mode) - ค่าที่มีจำนวนนับมากที่สุดในข้อมูลชุดหนึ่ง ตัวกลางเรขาคณิต (Geometric Mean) - ค่ากลางของข้อมูลชุดหนึ่งได้จากการถอดรากที่ n ของผลคูณของข้อมูล n ค่า ค่าเฉลี่ยฮาร์โมนิก (Harmonic Mean) - ค่ากลางของข้อมูลชุดหนึ่ง ที่ได้จากการหารจำนวนข้อมูลทั้งหมดด้วยผลบวกของส่วนกลับของข้อมูลชุดนั้น ค่าสัดส่วน (Proportion) - ค่าเปรียบเทียบของส่วนหนึ่งต่อจำนวนรวมทั้งหมด การวัดตำแหน่ง (Measures of position) ควอไทล์ (Quartiles) - ค่าที่บอกตำแหน่ง 1 ใน 4 ของค่ารวมทั้งหมด เปอร์เซ็นต์ไทล์ (Percentiles) - ค่าที่บอกตำแหน่ง 1 ใน 100 ของค่ารวมทั้งหมด
การวัดการกระจาย (Measures of Variability) การวัดการกระจาย คือ การวัดขนาด (extent) ของความแตกต่าง (difference) ของข้อมูล มี 4 ประเภท คือ การวัดช่วงห่าง พิสัย (Range) – วัดความแตกต่างระหว่างค่าต่ำสุดกับค่าสูงสุดของข้อมูล พิสัยระหว่างควอไทล์ (Interquartile Range) – วัดความแตกต่างระหว่างเปอร์เซ็นต์ไทล์ที่ 75 กับเปอร์เซ็นต์ไทล์ที่ 25 ของข้อมูล การวัดการกระจาย ความแปรปรวน (Variance) – วัดระดับการกระจาย (spread) ภายใต้การแจกแจง (distribution) ของข้อมูล ความเบี่ยงเบน (Deviation) – วัดความเบี่ยงเบน (deviate) หรือการกระจาย (spread) ที่ห่างไปจากค่าเฉลี่ย (mean)
ประเภทตัวแปรและสถิติพรรณนา ตัวแปรระดับนามบัญญัติ (Nominal Scale) และตัวแปรระดับอันดับมาตรา (Ordinal Scale) ฐานนิยม (Mode) ความถี่สัมพัทธ์ ( Relative Frequency ) และค่าร้อยละ (Percentage) ตัวแปรระดับอันดับมาตรา (Ordinal Scale) ค่ามัธยฐาน (Median) ค่าเบี่ยงเบนควอไทล์ ความถี่สัมพัทธ์ ( Relative Frequency ) และค่าร้อยละ (Percentage) ตัวแปรระดับช่วงมาตรา (Interval Scale) และตัวแปรระดับสัดส่วนมาตรา (Ratio Scale) ค่าเฉลี่ย (Mean) มัธยฐาน ฐานนิยม พิสัย ความแปรปรวน ความเบ้ ความโด่ง ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) และสัมประสิทธิ์การกระจาย (Coefficient of Variation)
อธิบายความสัมพันธ์ระหว่างตัวแปร ความสัมพันธ์ระหว่างตัวแปร 2 ตัว ตัวแปรไม่ต่อเนื่อง (Discontinuous Variable) กับตัวแปรไม่ต่อเนื่อง (Discontinuous Variable) ใช้ตารางไขว้ (Crosstabs) ตัวแปรอิสระ (Independence Variable) ตัวแปรตาม (Dependence Variable) นามมาตรา นามมาตรา นามมาตรา อันดับมาตรา อันดับมาตรา นามมาตรา อันดับมาตรา อันดับมาตรา
อธิบายความสัมพันธ์ระหว่างตัวแปร (ต่อ) ความสัมพันธ์ระหว่างตัวแปร 2 ตัว ตัวแปรไม่ต่อเนื่อง (Discontinuous Variable) กับตัวแปรต่อเนื่อง (Continuous Variable) ใช้การเปรียบเทียบค่าเฉลี่ย (Compare Means) ตัวแปรอิสระ (Independence Variable) ตัวแปรตาม (Dependence Variable) นามมาตรา ช่วงมาตรา นามมาตรา สัดส่วนมาตรา อันดับมาตรา ช่วงมาตรา อันดับมาตรา สัดส่วนมาตรา
การวิเคราะห์สถิติพรรณนา-ข้อมูลทั่วไป (Descriptive Statistics-General Data) การประมวลผล Analyze -> Descriptive Statistics -> Frequencies เลือกตัวแปรใส่ในกล่องด้านขวา คลิก Statistics … หรือ Charts … ตัวเลือกสำหรับตัวแปรแบ่งกลุ่ม (Categorical Variables): Frequency Tables Pie Charts, Bar Charts ตัวเลือกสำหรับตัวแปรต่อเนื่อง/ตัวเลข (Numeric Variables) Frequency Tables (Useful for discrete data) Measures of Central Tendency, Dispersion, Percentiles Pie Charts, Histograms Analyze -> Descriptive Statistics -> Descriptives … คลิก Options … เลือกสถิติสำหรับสรุปข้อมูล หรือตรวจรูปแบบข้อมูล
ฝึกปฏิบัติการวิเคราะห์ข้อมูล เปิดแฟ้มข้อมูล demo.sav วิเคราะห์ข้อมูลแบ่งกลุ่ม เลือกตัวแปรแบ่งกลุ่ม 2 ตัวแปร วิเคราะห์ข้อมูลด้วยคำสั่ง Frequencies แสดงผลการวิเคราะห์เป็นค่าร้อยละ ค่าฐานนิยม และกราฟวงกลม วิเคราะห์ข้อมูลต่อเนื่อง เลือกตัวแปรต่อเนื่อง 2 ตัวแปร วิเคราะห์ข้อมูลด้วยคำสั่ง Descriptive แสดงผลการวิเคราะห์เป็นค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน ค่าต่ำสุด ค่าสูงสุด ค่าความเบ้ และค่าความโด่ง
การวิเคราะห์สถิติพรรณนา-ตารางไขว้ (Descriptive Statistics-Contingency Table) การประมวลผล Analyze -> Descriptive Statistics -> Crosstabs … เลือกตัวแปรอิสระ (Independent Variable) ใส่ใน Row (s) เลือกตัวแปรตาม (Dependent Variable) ใส่ใน Column (s) คลิก Cells … เลือกการแสดงค่าร้อยละเป็น Row Analyze -> Compare Means -> Means … เลือกตัวแปรตาม (Dependent Variable) ใส่ใน Dependent List เลือกตัวแปรอิสระ (Independent Variable) ใส่ใน Independent Linst คลิก Options … เลือกค่าสถิติเพิ่มเติม
ฝึกปฏิบัติการวิเคราะห์ข้อมูล เปิดแฟ้มข้อมูล demo.sav วิเคราะห์ข้อมูลตารางไขว้ เลือกตัวแปรแบ่งกลุ่ม 2 ตัวแปร วิเคราะห์ข้อมูลด้วยคำสั่ง Crosstab แสดงผลการวิเคราะห์เป็นค่าร้อยละในรูปของตารางไขว้ ตัวแปรอิสระอยู่ในแนวนอน ตัวแปรตามอยู่ในแนวตั้ง วิเคราะห์ข้อมูลต่อเนื่อง เลือกตัวแปรแบ่งกลุ่ม 1 ตัว และต่อเนื่อง 1 ตัวแปร วิเคราะห์ข้อมูลด้วยคำสั่ง Compare Mean แสดงผลการวิเคราะห์เปรียบเทียบด้วยค่าเฉลี่ย และค่าเบี่ยงเบนมาตรฐาน
การวิเคราะห์ตัวแปรหลายคำตอบ #1 (Multiple Response Questionnaire) ตัวแปรหลายคำตอบ เป็นตัวแปรที่ได้มาจากคำถามแบบเลือกตอบได้มากกว่า 1 ข้อ เช่น การมีและการใช้เทคโนโลยีสารสนเทศและการสื่อสาร การจัดอันดับความชอบในการใช้อุปกรณ์เคลื่อนที่ ตัวอย่างคำถาม 1. เทคโนโลยีสารสนเทศและการสื่อสารที่ท่านมีใช้ (ตอบได้มากกว่า 1 ข้อ) (1) คอมพิวเตอร์ตั้งโต๊ะ (2) คอมพิวเตอร์เคลื่อนที่ (3) โทรศัพท์เคลื่อนที่ (5) สมาร์ทโฟน (6) แฟบเล็ต (7) แท็บเล็ต ตัวอย่างข้อมูล PC NB MP SP PL TL 1 PC NB MP SP PL TL 1 2 3 4 6 5
การวิเคราะห์ตัวแปรหลายคำตอบ #2 (Multiple Response Questionnaire) การประมวลผล Analyze -> Multiple Response -> Define Variable Sets เลือกตัวแปรในช่อง Set Definition ใส่ใน Variables in Set กำหนดรหัสตัวแปรใน Variables Are Code As Dichotomies Categories กำหนดชื่อตัวแปรในช่อง Name และกดปุ่ม Add เพื่อใส่ตัวแปรใหม่ลงไปใน Multiple Response Sets Analyze -> Multiple Response -> Frequencies… Analyze -> Multiple Response -> Crosstabs…
การวิเคราะห์ข้อมูลด้วยกราฟแท่งแนวตั้ง (Vertical Bar Charts) การประมวลผล Graphs -> Legacy Dialogs -> Bar … เลือก Simple (Summaries for Groups of Cases) คลิก Define เลือก Slices Represent เป็น N of Cases หรือ % of Cases เลือกตัวแปรใส่ในช่อง Category Axis
การวิเคราะห์ข้อมูลด้วยกราฟแท่งเชิงเปรียบเทียบ (Side-by-Side Bar Charts) การประมวลผล Graphs -> Legacy Dialogs -> Bar … เลือก Clustered (Summaries for Groups of Cases) คลิก Define เลือก Bars Represent เป็น N of Cases หรือ % of Cases เลือกตัวแปรอิสระ (ที่เป็นกลุ่มต้องการเปรียบเทียบ) ใส่ใน Category Axis เลือกตัวแปรตาม (ที่เป็นผลลัพธ์) ใส่ใน Define Clusters By
การวิเคราะห์ข้อมูลด้วยกราฟแท่ง (Pie Charts) การประมวลผล Graphs -> Legacy Dialogs -> Pie … เลือก Summaries for Groups of Cases คลิก Define เลือก Slices Represent เป็น N of Cases หรือ % of Cases เลือกตัวแปรใส่ใน Define Slices By
การวิเคราะห์ข้อมูลด้วยกราฟแท่งความถี่หรือฮีสโทแกรม (Histograms) การประมวลผล Graphs -> Legacy Dialogs -> Histogram … เลือกตัวแปรใส่ในช่อง Variable เลือก Display normal curve ถ้าต้องการแสดงเส้นโค้งการแจกแจงข้อมูล
การวิเคราะห์ข้อมูลด้วยกราฟกระจาย (Scatterplots) การประมวลผล Graphs -> Legacy Dialogs -> Scatter/Dot เลือก Simple Scatter คลิก Define เลือกตัวแปรตาม (Dependent/Response Variable) ใส่ใน Y-Axis เลือกตัวแปรอิสระ (Independent/Explanatory Variable) ใส่ใน X-Axis
การวิเคราะห์ข้อมูลด้วยกราฟกระจายกับ 2 ตัวแปรอิสระ (Scatterplots with 2 Independent Variables) การประมวลผล Graphs -> Legacy Dialogs -> Scatter/Dot เลือก Simple คลิก Define เลือกตัวแปรตาม (Dependent/Response Variable) ใส่ใน Y-Axis เลือกตัวแปรอิสระที่มีระดับข้อมูลมากที่สุด (Independent/Explanatory Variable with the most levels) ใส่ใน X-Axis เลือกตัวแปรอิสระที่มีระดับข้อมูลน้อยที่สุด (Independent/Explanatory Variable with the fewest levels) ใส่ใน Set Markers by
สรุป ระดับการวัด ตัวแปร ข้อมูลระดับนามมาตรา (Nominal Data) ข้อมูลระดับช่วงมาตรา (Interval Data) ข้อมูล 1 ตัวแปร (Single Set of Data) Frequency and Relative Frequency Tables, Bar and Pie Charts Histogram, Ogive, or Stem-and-Leaf Display ความสัมพันธ์ระหว่าง 2 ตัวแปร (Relationship Between Two Variables) Contingency Table, Bar Charts Scatter Diagram ระดับการวัด ตัวแปร