สถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อย เอกสาร หน้า 1 สถิติพื้นฐานที่มีโอกาสนำไปใช้บ่อย มาจากคำสั่งต่อไปนี้ สถิติพื้นฐาน Frequencies, Percents Mean, Median, Mode Variance, Standard Deviation ภาพ Chart, Histogram Stem-and-Leaf Plot, Box Plot คำสั่ง 1. FREQUENCIES 2. CROSSTABS 3. DESCRIPTIVES 4. EXPLORE
1. FREQUENCIES ค่าสูญหาย คำสั่ง FREQUENCIES เอกสาร หน้า 1-2 ค่าร้อยละของผู้ชายเมื่อหัก ค่าสูญหาย ออกแล้วคือ = = 40.4% คำสั่ง FREQUENCIES VARIABLES = sex /BARCHART FREQ /ORDER = ANALYSIS . ผู้ชายคิดเป็นร้อยละคือ = = 38.0% ผู้ชายมีจำนวน 19 คน หัก ค่าสูญหาย ออกแล้ว ค่าสูญหาย
เอกสาร หน้า 3-4 แผนภูมิ
เมื่อนำตัวแปร SEX และ I4NEW มาอยู่ในตารางเดียวกัน จะได้ เอกสาร หน้า 2,4 เมื่อนำตัวแปร SEX และ I4NEW มาอยู่ในตารางเดียวกัน จะได้ Contingency table หรือ Crosstabulation ดังหัวข้อ CROSSTABS ต่อไปนี้ เมื่อนำตารางแจกแจงความถี่ 2 ตาราง มารวมกันเป็น 1 ตาราง จะมีชื่อว่า Contingency table หรือ Crosstabulation ตารางที่ 1 ตัวแปร SEX ตารางที่ 2 ตัวแปร I4NEW
2. CROSSTABS COUNT คือ จำนวน หรือ ความถี่ หัวตารางหลัก หัวตารางรอง เอกสารหน้า 4-6 คำสั่ง CROSSTABS /TABLES=sex BY i4new /FORMAT= AVALUE TABLES /CELLS= COUNT /BARCHART . COUNT คือ จำนวน หรือ ความถี่ หัวตารางหลัก หัวตารางรอง ตัวแปรตัวที่ 2 I4NEW ตัวแปรตัวที่ 1 SEX
คำสั่งย่อย /CELLS= COUNT EXPECTED. เอกสาร หน้า 6-8 แถวตั้งที่ 1 เรียก Cell(2, 1) แถวนอนที่ 2 Cell(i, j) = EXPECTED Cell(2, 1) = Cell(4, 1) =
ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT ROW . เอกสารหน้า 8 ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT ROW . ค่าร้อยละของ Cell(2, 1) = % within SEX หรือ ROW ค่าร้อยละของ Cell(4, 1) =
ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT COLUMN . เอกสารหน้า 9 ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT COLUMN . ค่าร้อยละของ Cell(2, 1) = % within I4NEW หรือ COLUMN ค่าร้อยละของ Cell(4, 1) =
ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT TOTAL . เอกสารหน้า 10 ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT TOTAL . เมื่อรวมทั้ง 5 ตาราง ที่ผ่านมาแล้ว จะได้ตารางรวมทั้งหมด ดังจอภาพต่อไป ค่าร้อยละของ Cell(2, 1) = % of Total ค่าร้อยละของ Cell(4, 1) =
ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT EXPECTED ROW COLUMN TOTAL . เอกสารหน้า 11 ผลลัพธ์จากคำสั่งย่อย /CELLS= COUNT EXPECTED ROW COLUMN TOTAL . ผลการคำนวณ ที่ผ่านมา
ตาราง 3 มิติ (ตัวแปร 3 ตัว) เช่น /TABLES=sex BY i4new BY edu. เอกสารหน้า 12 ตาราง 3 มิติ (ตัวแปร 3 ตัว) เช่น /TABLES=sex BY i4new BY edu. คุมโดย EDU
3. DESCRIPTIVES จากคำสั่งนี้จะได้ผลลัพธ์ภาพต่อไป เอกสารหน้า 12 VARIABLES=i4 /STATISTICS=MEAN SUM STDDEV VARIANCE RANGE MIN MAX SEMEAN KURTOSIS SKEWNESS . จากคำสั่งนี้จะได้ผลลัพธ์ภาพต่อไป
ผลลัพธ์ของคำสั่ง DESCRIPTIVES เอกสารหน้า 13-14 N = 50 Range คือ Max - Min = 4 - 2 = 2 Sum คือ 144 Mean คือ 2.88 Std. Error 8.40E-02 หรือ 0.084 Std. Deviation คือ .59 Variance คือ .353 Skewness คือ .031 Kurtosis คือ -.106
ถ้า Skewness = 0 แล้ว เส้นโค้งจะไม่มีความเบ้ เอกสารหน้า 15-16 เบ้ซ้าย เบ้ขวา ถ้า Skewness = 0 แล้ว เส้นโค้งจะไม่มีความเบ้
ถ้า Kurtosis = 0 แล้ว เส้นโค้งจะมีความเป็นปกติหรือโด่งปกติ เอกสารหน้า 17 ความโด่ง(Kurtosis) โด่งมาก โด่งน้อย ถ้า Kurtosis = 0 แล้ว เส้นโค้งจะมีความเป็นปกติหรือโด่งปกติ
4. EXPLORE เอกสารหน้า 20-21 คำสั่ง COMPUTE satisf = i1+i2+i3+i3+i4+i5+i6+i7 . EXAMINE VARIABLES=satisf /PLOT BOXPLOT STEMLEAF /COMPARE GROUP /STATISTICS DESCRIPTIVES.
ฮิสโทแกรม (Histogram) เอกสารหน้า 22-23 ฮิสโทแกรม (Histogram) ข้อมูลส่วนใหญ่ ในที่นี้อยู่ในชั้นที่ 5 โดยจุดกึ่งกลางคือ 24 ค่าต่ำสุดคือ 16 อยู่ในชั้นแรก ค่าสูงสุดคือ 32 อยู่ในชั้นสุดท้าย
Stem-and-Leaf Plot บรรทัดแรกมีความถี่เท่ากับ 8 เอกสารหน้า 24-25 บรรทัดแรกมีความถี่เท่ากับ 8 ประกอบด้วยข้อมูลต่อไปนี้คือ 16, 17, 17, 17, 18, 18, 19, 19 Stem width: 10 SATISF Stem-and-Leaf Plot Frequency Stem & Leaf 8.00 1 . 67778899 28.00 2 . 0000111222222333333444444444 10.00 2 . 5555667889 2.00 3 . 00 1.00 Extremes (>=32) Stem width: 10.00 Each leaf: 1 case(s) ภาพ 4.4 ต้นและใบของตัวแปร satisf บรรทัดที่สองมีความถี่เท่ากับ 28 บรรทัดที่สามมีความถี่เท่ากับ 10 บรรทัดที่สี่มีความถี่เท่ากับ 2 ประกอบด้วยข้อมูลต่อไปนี้คือ 30, 30 ข้อมูลสุดขีดมีหนึ่งรายการคือ 32
Box Plot 1 Outlier ภาพกล่องของตัวแปร satisf เอกสารหน้า 26 คำสั่ง EXAMINE VARIABLES = satisf. เส้นหนวด แสดงค่าสูงสุดของข้อมูล ที่ยังไม่สูงผิดปกติ = Q3+1.5(IQR) Outlier ด้านบนคือ Q3 เส้น Median ด้านล่างคือ Q1 ภาพกล่องของตัวแปร satisf
Box Plot 2 ต่อไปดู การเปรียบเทียบ ความเบ้ 3 แบบ เอกสารหน้า 27 คำสั่ง EXAMINE VARIABLES = satisf BY edu. ต่อไปดู การเปรียบเทียบ ความเบ้ 3 แบบ ผู้มีการศึกษาระดับปริญญาตรี มีความเห็น แตกต่างกันมากที่สุด (กล่องใหญ่ที่สุด) ปริญญาโทและเอก มีมัธยฐานเท่ากัน ภาพกล่องของตัวแปร satisf เมื่อแบ่งตามระดับการศึกษา
แบบที่ 1 มัธยฐานชิดขอบบนของกล่อง ข้อมูลส่วนใหญ่มีค่าสูง เอกสารหน้า 27 แบบที่ 1 เบ้ซ้าย เบ้ซ้าย มัธยฐานชิดขอบบนของกล่อง ข้อมูลส่วนใหญ่มีค่าสูง 2 ภาพนี้มาจากข้อมูลชุดเดียวกัน (แจกแจงเหมือนกัน)
มัธยฐานอยู่ตรงกึ่งกลางของกล่อง เอกสารหน้า 28 แบบที่ 2 สมมาตร สมมาตร ข้อมูลแจกแจงปกติ มัธยฐานอยู่ตรงกึ่งกลางของกล่อง 2 ภาพนี้มาจากข้อมูลชุดเดียวกัน (แจกแจงเหมือนกัน)
ข้อมูลส่วนใหญ่มีค่าต่ำ มัธยฐานชิดขอบล่างของกล่อง เอกสารหน้า 28 แบบที่ 3 เบ้ขวา เบ้ขวา ข้อมูลส่วนใหญ่มีค่าต่ำ มัธยฐานชิดขอบล่างของกล่อง 2 ภาพนี้มาจากข้อมูลชุดเดียวกัน (แจกแจงเหมือนกัน)