การแสดงผลการวิเคราะห์ข้อมูล การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) การแสดงผลการวิเคราะห์ข้อมูล ผู้ช่วยศาสตราจารย์ ดร. เรวัต แสงสุริยงค์ URL: http://www.huso.buu.ac.th/rewat e-mail: rewat@buu.ac.th
การนำเสนอข้อมูลด้วยกราฟและตาราง (Tabular and Graphical Procedures) ข้อมูล (Data) ข้อมูลเชิงคุณภาพ (Qualitative Data) ข้อมูลเชิงปริมาณ (Quantitative Data) การนำเสนอด้วยตาราง ( Tabular Methods) การนำเสนอด้วยกราฟ (Graphical Methods) การนำเสนอด้วยตาราง ( Tabular Methods) การนำเสนอด้วยกราฟ (Graphical Methods) การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution) การแจกแจงความถี่ร้อยละ (Percent Frequency Distribution) ตารางไขว้ (Crosstabulation) กราฟแท่ง (Bar Graph) กราฟวงกลม (Pie Chart) การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution) การแจกแจงความถี่ร้อยละ (Percent Frequency Distribution) การแจกแจงความถี่สะสม (Cumulative Frequency Distribution) การแจกแจงความถี่สัมพัทธ์สะสม (Cumulative Relative Frequency Distribution) การแจกแจงความถี่ร้อยละสะสม (Cumulative Percent Frequency Distribution) ตารางไขว้ (Crosstabulation) กราฟจุด (Dot Plot) กราฟฮิสโตแกรม (Histogram) กราฟเส้นโค้งความถี่สะสม (Ogive) กราฟลำต้นและใบ (Stem-and-Leaf Display) กราฟการกระจาย (Scatter Diagram)
ความสัมพันธ์ระหว่างระดับการวัดกับกราฟ ระดับการวัด (Measure) ประเภทกราฟ (Type of Graph) นามมาตรา (Nominal) - กราฟแท่ง (Bar Chart) อันดับมาตรา (Ordinal) ความถี่ (Frequency) - ความถี่สะสม (Cumulative frequency) ช่วงมาตรา/สัดส่วนมาตรา (Interval, Ratio) – เวลา - กราฟเส้น (Line Graph) (Interval, Ratio) –ไม่ใช่เวลา -กราฟแท่งความถี่หรือฮีสโตแกรม (Histogram)
การสรุปข้อมูลเชิงคุณภาพ (Summarizing Qualitative Data) การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่สัมพัทธ์ (Relative Frequency) การแจกแจงความถี่ร้อยละ (Percent Frequency Distribution) กราฟแท่ง (Bar Graph) กราฟวงกลม (Pie Chart)
การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่ คือ การนำเสนอข้อมูลในรูปของตารางสรุปข้อมูลความถี่เป็นจำนวนนับ (count) ตามกลุ่มข้อมูล (item) การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … PSPP: Analyze -> Descriptive Statistics -> Frequencies … R: Statistics -> Summaries -> Frequency distributions… ตำแหน่ง ความถี่ (Frequency) พนักงาน 363 หัวหน้างาน 27 ผู้จัดการ 84 รวม 474
การแจกแจงความถี่สัมพัทธ์ (Relative Frequency Distribution) การแจกแจงความถี่สัมพันธ์ คือ การนำเสนอข้อมูลในรูปของตารางสรุปข้อมูลความถี่ของแต่ละกลุ่มข้อมูลเป็นสัดส่วน (fraction or proportion) ของจำนวนรวมทั้งหมด (total) โดยมีค่าเต็มคือ 1.00 ตำแหน่ง ความถี่ (Frequency) ความถี่สัมพันธ์ (Relative Frequency) พนักงาน 363 0.76 หัวหน้างาน 27 0.06 ผู้จัดการ 84 0.18 รวม 474 1.00
การแจกแจงความถี่ร้อยละ (Percent Frequency Distribution) การแจกแจงความถี่ร้อยละ คือ การนำเสนอข้อมูลในรูปของตารางสรุปข้อมูลความถี่ของแต่ละกลุ่มข้อมูลด้วยค่าความถี่สัมพันธ์คูณร้อย (x100) หรือที่เรียกกันว่าค่าร้อยละ การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … PSPP: Analyze -> Descriptive Statistics -> Frequencies … R: Statistics -> Summaries -> Frequency distributions… ตำแหน่ง ความถี่ (Frequency) ความถี่สัมพันธ์ (Relative Frequency) ความถี่ร้อยละ (Percent Frequency) พนักงาน 363 0.76 76.00 หัวหน้างาน 27 0.06 6.00 ผู้จัดการ 84 0.18 18.00 รวม 474 1.00 100.00
ตารางไขว้ (Crosstabulation)#1 ตารางไขว้ คือ การนำเสนอข้อมูลในรูปของตารางเพื่อสรุปข้อมูลที่เกิดจากความสัมพันธ์ของตัวแปร 2 ตัวแปร ลักษณะของตัวแปรสำหรับใช้สร้างตารางไขว้ ตัวแปรหนึ่งเป็นตัวแปรเชิงคุณภาพ และอีกตัวแปรหนึ่งเป็นตัวแปรเชิงปริมาณ ตัวแปรทั้งสองตัวแปรเป็นตัวแปรเชิงคุณภาพ ตัวแปรทั้งสองตัวแปรเป็นตัวแปรเชิงปริมาณ การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Crosstabs … PSSP: Analyze -> Descriptive Statistics -> Crosstabs … R: Statistics -> Contingency tables-> two-way.. (Data, Statistics) เพศ ตำแหน่งงาน พนักงาน หัวหน้างาน ผู้จัดการ รวม หญิง 206 10 216 ชาย 157 27 74 258 363 84 474
ตารางไขว้ (Crosstabulation)#2 ตารางไขว้ คือ การนำเสนอข้อมูลในรูปของตารางเพื่อสรุปข้อมูลที่เกิดจากความสัมพันธ์ของตัวแปร 2 ตัวแปร ลักษณะของตัวแปรสำหรับใช้สร้างตารางไขว้ ตัวแปรหนึ่งเป็นตัวแปรเชิงคุณภาพ และอีกตัวแปรหนึ่งเป็นตัวแปรเชิงปริมาณ ตัวแปรทั้งสองตัวแปรเป็นตัวแปรเชิงคุณภาพ ตัวแปรทั้งสองตัวแปรเป็นตัวแปรเชิงปริมาณ การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Crosstabs … Cells…-> Percentages = Row PSSP: Analyze -> Descriptive Statistics -> Crosstabs … Cells…-> Percentages = Row R: Statistics -> Contingency tables-> Two-way table.. ->Statistics=Row percentages เพศ ตำแหน่งงาน พนักงาน หัวหน้างาน ผู้จัดการ รวม หญิง 206 (95.4) 0 (0.0) 10 (4.6) 216 (100.0) ชาย 157 (60.9) 27 (10.5) 74 (28.7) 258 (100.0) 363 (76.6) 27 (5.7) 84 (17.7) 474 (100.0)
ตารางไขว้ (Crosstabulation)#3 ตารางไขว้ คือ วิธีการสรุปข้อมูลจากความสัมพันธ์ระหว่างตัวแปร 2 ตัวแปรหรือมากกว่า ในรูปของตาราง 2x2 หรือมากกว่า การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Crosstabs …-> Cells…-> Percentages = Row PSSP: Analyze -> Descriptive Statistics -> Crosstabs …-> Cells... -> Cell Display = Row R: Statistics -> Contingency tables-> Multi-way table…-> Compute Percentages=Row percentages กลุ่มชน เพศ ตำแหน่งงาน พนักงาน หัวหน้างาน ผู้จัดการ รวม ผิวชาว หญิง 166 (94.3) 0 (0.0) 10 (5.7) 176 (100.0) ชาย 110 (56.7) 14 (7.2) 70 (36.1) 194 (100.00) ผิวสี 40 (100.0) 0 (0.00) 47 (73.4) 13 (20.3) 4 (6.3) 64 (100.0) 363 (76.6) 27 (5.7) 84 (17.7) 474 (100.0)
กราฟแท่ง (Bar Graph) กราฟแท่ง คือ เครื่องมือในการอธิบายเพื่อเปรียบเทียบ (compare) ข้อมูลเชิงคุณภาพ โดยใช้แกนนอน (horizontal axis) แสดงค่าของแต่ละกลุ่ม (classes) และใช้แกนตั้ง (vertical axis) แสดงค่าความถี่ (frequency) ความถี่สัมพัทธ์ (relative frequency) และความถี่ร้อยละ (percent frequency) แต่ละแท่งกราฟจะมีความกว้างคงที่ (fixed width) เท่ากัน และแยกออกจากกันตามประเภทของข้อมูล ส่วนความสูงจะมีขนาดผันแปรไปตามความถี่ของข้อมูล การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … -> Charts… -> Bar Charts SPSS: Graphs -> Legacy Dialogs -> Bar… -> Simple -> Define R: Graphs -> Bar graph… 1 2 3 4 5 6 7 8 9 น้อยมาก น้อย ปานกลาง มาก มากที่สุด ความถี่ ระดับ
กราฟวงกลม (Pie Chart) กราฟวงกลม คือ เครื่องมือในการสรุปข้อมูลด้วยการนำเสนอข้อมูลเชิงคุณภาพ ในรูปของวงกลม โดยแบ่งวงกลมออกเป็นส่วนๆ ตามขนาดของการแจกแจงความถี่สัมพัทธ์ (relative frequency distributions) ของข้อมูล กล่าวคือ หากการแจกแจงความถี่สัมพัทธ์ = .25 กลุ่มของข้อมูลจะมีพื้นที่เท่ากับ .25*360 = 90 องศา การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … -> Charts… -> Pie Charts SPSS: Graphs -> Legacy Dialogs -> Pie…-> Define PSPP: Analyze -> Descriptive Statistics -> Frequencies … -> Charts… -> Pie… R: Graphs -> Pine chart…
การปรับแต่งกราฟในโปรแกรม SPSS การทำชื่อกราฟ (Title) ดับเบิลคลิกที่ชื่อกราฟ ลบและพิมพ์ชื่อกราฟ การแสดงข้อมูลค่ากราฟ (Data value label) ดับเบิลคลิกที่ตัวกราฟ Chart Editor Elements -> Show Data Labels Properties Label Position เลือก Automatic หรือ Manual หรือ Custom การแก้ไขชื่อกลุ่มข้อมูล ดับเบิลคลิกที่ชื่อกลุ่มข้อมูล ลบและพิมพ์ชื่อกลุ่มข้อมูล
การสรุปข้อมูลเชิงปริมาณ (Summarizing Quantitative Data) การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่สัมพัทธ์ (Relative Frequency) และการแจกแจงความถี่ร้อยละ (Percent Frequency Distribution) กราฟจุด (Dot Plot) กราฟแท่งความถี่หรือฮีสโทแกรม (Histogram) การแจกแจงความถี่สะสม (Cumulative Distributions) กราฟเส้นโค้งความถี่สะสม (Ogive)
การแจกแจงความถี่ (Frequency Distribution) การแจกแจงความถี่ข้อมูลเชิงปริมาณ เป็นการนำเสนอข้อมูลในรูปของตารางสรุปข้อมูล เหมือนกับการแจกแจงความถี่ข้อมูลเชิงคุณภาพ แต่มีความแตกต่างกันที่ตัวแปรที่นำมาใช้แจกแจงข้อมูล กล่าวคือ ข้อมูลเชิงคุณภาพมีการแบ่งกลุ่มข้อมูลไว้แล้ว ส่วนข้อมูลเชิงปริมาณยังไม่มีการแบ่งกลุ่มข้อมูล ต้องทำการแบ่งกลุ่มข้อมูลก่อนการแจกแจงความถี่ แนวทางการแบ่งกลุ่มข้อมูล กำหนดให้อยู่ระหว่าง 5 - 20 กลุ่ม (classes) ชุดข้อมูล (data set) ขนาดใหญ่ ควรแบ่งกลุ่มข้อมูลให้มีช่วงข้อมูลกว้างกว่าชุดข้อมูลที่มีขนาดเล็กกว่า คำนวณช่วงกว้างของกลุ่มข้อมูล ดังนี้ แบ่งกลุ่มตามวัย (เด็ก วัยรุ่น ผู้ใหญ่ ชรา) ระดับการศึกษา (ต่ำกว่าปริญญาตรี ปริญญาตรี สูงกว่าปริญญาตรี) รายได้ (จน รวย) ค่าสูงสุด (Largest Data Value) – ค่าต่ำสุด (Smallest Data Value) จำนวนกลุ่มข้อมูล (Number of Classes)
การแจกแจงความถี่และความถี่ร้อยละ (Frequency and Percent Frequency Distribution) การประมวลผล คำนวณหาช่วงกว้างของกลุ่มข้อมูล จัดกลุ่มข้อมูล SPSS: Transform -> Recode into Different Variable … PSPP: Transform -> Recode into Different Variable … R: Data -> Manage variables in active data set -> Recode variables… SPSS: Analyze -> Descriptive Statistics -> Frequencies … PSPP: Analyze -> Descriptive Statistics -> Frequencies … R: Statistics -> Summaries -> Frequency distributions… การศึกษา (ปี) ความถี่ (Frequency) ความถี่ร้อยละ (Percent Frequency ) 12 ปี และน้อยกว่า 243 51.3 13 – 16 ปี 181 38.2 มากกว่า 16 ปี 50 10.5 รวม 474 100.0
การแจกแจงความถี่สะสม (Cumulative Distributions) การแจกแจงความถี่สะสม คือ ผลรวมของความถี่ของค่านั้น กับความถี่ของค่าที่ต่ำกว่าทั้งหมดหรือสูงกว่าทั้งหมดอย่างใดอย่างหนึ่ง การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … PSPP: Analyze -> Descriptive Statistics -> Frequencies … การศึกษา (ปี) ความถี่ (Frequency) ความถี่ร้อยละ (Percent Frequency ) ความถี่สะสม (Cumulative Distributions) 12 ปี และน้อยกว่า 243 51.3 13 – 16 ปี 181 38.2 89.5 มากกว่า 16 ปี 50 10.5 100.0 รวม 474
กราฟจุด (Dot Plot) กราฟจุด คือ แผนภูมิที่มีแกนนอน (horizontal axis) เพียงแกนเดียว แสดงการสรุปข้อมูลโดยแสดงค่าของข้อมูลเป็นช่วงๆ บนแกนของกราฟ ปริมาณของข้อมูลแต่ละค่าจะแสดงเป็นจุด (dot) เหนือค่าที่วางเรียงรายไปตามแกนนอนของกราฟ การประมวลผล SPSS: Graphs -> Legacy Dialogs -> Scatter/Dot…-> Simple Dot -> Define . . .. . . . 20 30 40 50 60 70 80 . . . ..... .......... .. . .. . . ... . .. . . .. .. .. .. . . อายุ (ปี)
กราฟแท่งความถี่หรือฮีสโทแกรม (Histogram) กราฟแท่งความถี่หรือฮีสโทแกรม คือ แผนภูมิที่ใช้แท่งสี่เหลี่ยมผืนผ้า (rectangle) แสดงความถี่ของข้อมูลแต่ละช่วงชั้น (class interval) โดยความสูงของแท่งความถี่จะผันแปรไปตามความถี่ (frequency) ความถี่สัมพัทธ์ (relative frequency) หรือความถี่ร้อยละ (percernt frequency) ของแต่ละช่วงชั้นข้อมูล กราฟแท่งความถี่หรือฮีสโทแกรม จะแตกต่างไปจากกราฟแท่ง (bar graph) คือ กราฟอิสโทแกรมจะไม่มีช่องว่างแบ่งแท่งความถี่ของแต่ละช่วงข้อมูล การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Frequencies … -> Charts… -> Histograms SPSS: Graphs -> Legacy Dialogs -> Histogram … PSPP: Analyze -> Descriptive Statistics -> Frequencies … -> Charts… -> Histograms R: Graphs -> Histogram… อายุ (ปี) 2 4 6 8 10 12 14 16 18 ความถี่ 20 30 40 50 60 70 80
กราฟเส้นโค้งความถี่สะสม (Ogive) กราฟเส้นโค้งความถี่สะสม คือ แผนภูมิสำหรับนำเสนอข้อมูลในรูปของการแจกแจงความถี่สะสม (cumulative distribution) โดยแสดงค่าของข้อมูลบนแกนนอน และแสดงความถี่ (frequencies) ค่าความถี่สัมพัทธ์ (relative frequencies) และค่าร้อยละ (percent frequencies) บนแกนตั้ง แต่ละค่าความถี่ของแต่ละกลุ่มข้อมูลจะแสดงในกราฟด้วยจุด 1 จุด และแต่ละจุดจะเชื่อมต่อกันด้วยเส้นตรง การประมวลผล SPSS: Graphs -> Legacy Dialogs -> Line…-> Simple -> Define -> Cum. N หรือ Cum. % อายุ (ปี) 20 40 60 80 100 ความถี่ร้อยละสะสม 20 30 40 50 60 70 80
กราฟลำต้นและใบ #1 (Stem-and-Leaf Plot) กราฟลำต้นและใบ คือ แผนภูมิแสดงข้อมูลทั้งในรูปการจัดอันดับ (rank order) และรูปของการแจกแจง (shape of the distribution) ข้อมูล กราฟลำต้นและใบ แสดงข้อมูลคล้ายกับกราฟฮีสโทแกรม แต่ให้รายละเอียดเกี่ยวกับค่าของข้อมูล (actual data values) มากกว่า กล่าวคือ ข้อมูลถูกจัดเรียงตามลำดับจากน้อยไปหากมาก เรียงจากด้านบนลงมาด้านล่าง และแบ่งออกเป็น 2 ส่วนด้วยเส้นแนวตั้ง เพื่อแบ่งขนาดของตัวเลขดังนี้ ตัวเลขด้านซ้ายของเส้นในแต่ละแถวบอกค่าของข้อมูลแต่ละชุดมีหน่วยตามดัชนีที่กราฟแสดงไว้ เช่น หลักสิบหรือหลักร้อย เป็นต้น ตัวเลขด้านขวาของเส้นในแต่ละแถวบอกค่าตำแหน่งสุดท้ายของข้อมูลแต่ละชุด
กราฟลำต้นและใบ #2 (Stem-and-Leaf Plot) การประมวลผล SPSS: Analyze -> Descriptive Statistics -> Explore … -> Plots… -> Stem-and-Leaf R: Graphs -> Stem-and-leaf display… ความสูงของนิสิต ดัชนี: 12| 7 = 127 ซม. 12 7 8 8 9 1 2 4 4 4 6 6 0 0 2 3 3 4 7 15 1 1 leaf unit: 0.1 n: 474 53 8* | 00000000000000000000000000000000000000000000000000000 9* | 8. | 9. | 10* | 10. | 11. | 11* | 243 12* | 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 12. | 13* | 231 14* | 000000 13. | 14. | 225 15* | 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 15. | 16. | 109 16* | 00000000000000000000000000000000000000000000000000000000000 50 17* | 00000000000 17. | 39 18* | 000000000 18. | 30 19* | 000000000000000000000000000 HI: 20 20 21
กราฟการกระจาย (Scatter Plot) กราฟการกระจาย คือ แผนภูมิแสดงข้อมูลในรูปของความสัมพันธ์ระหว่างตัวแปรเชิงปริมาณ 2 ตัว บนแกนนอนและแกนตั้งอย่างละตัวแปร การประมวลผล SPSS: Graphs -> Legacy Dialogs -> Scatter/Dot…-> Simple Scatter -> Define R: Graphs -> Scatterplot… ความสัมพันธ์ระหว่างเวลาเรียนกับผลการเรียน 20 40 60 80 100 1 2 3 4 ชั่วโมงเรียน ผลการเรียน * 5
เปิดแฟ้มข้อมูลส่วนตัว แล้วประมวลผลข้อมูล ดังนี้ แบบฝึกหัด เปิดแฟ้มข้อมูลส่วนตัว แล้วประมวลผลข้อมูล ดังนี้ ข้อมูลแบ่งกลุ่ม ข้อมูลต่อเนื่อง แสดงตารางความถี่ของตัวแปร 1 ตัวแปร แสดงกราฟแท่งของตัวแปร 1 ตัวแปร แสดงกราฟวงกลมของตัวแปร 1 ตัวแปร แสดงตารางไขว้ระหว่างตัวแปร 2 ตัวแปร เลือกตัวแปรต่อเนื่อง 1 ตัวแปร มาแบ่งกลุ่มข้อมูล และให้เหตุผลประกอบการแบ่งกลุ่มข้อมูล แสดงตารางความถี่ของตัวแปร 1 ตัวแปร เลือกตัวแปรต่อเนื่องแสดงผลเป็นกราฟ ดังนี้ กราฟจุด กราฟแท่งความถี่สะสมหรือฮีสโทแกรม กราฟเส้นโค้งความถี่สะสม กราฟลำต้นและใบ
แหล่งอ้างอิง Anderson, David R. and Others. 2003. Statistics for Business and Economics. 3rd ed. Thomson Learning, London.