งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction.

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction."— ใบสำเนางานนำเสนอ:

1 การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction to Statistics) ผู้ช่วยศาสตราจารย์ ดร. เรวัต แสงสุริยงค์ URL:

2 ความหมายของสถิติ ค่าสรุปรวมที่คำนวณมาจากกลุ่มตัวอย่าง เพื่อบรรยาย (describe) คุณลักษณะ (characteristic) ของตัวอย่าง ข้อมูลตัวเลข (numerical data) เช่น สถิติปริมาณนิสิต สถิติจำนวนนิสิตที่มีผลการเรียนต่ำ สถิติปริมาณนิสิตที่ไม่จบการศึกษา ค่าสถิติ (statistic) เช่น ค่าเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน คณิตศาสตร์ประยุกต์ (applied mathematics) การวิจัย การวางแผน การประเมินผล วิชาสถิติ (statistics) สถิติพรรณนา (descriptive statistics) สถิติอนุมาน (inference statistics) ระเบียบวิธีทางสถิติ การเก็บและรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล การแปลความข้อมูล และสรุปผลการวิเคราะห์ข้อมูล

3 นิยามศัพท์ที่เกี่ยวสถิติ
ประชากร (population) คือ สิ่งต่างๆ (things) ทั้งหมดที่ต้องการศึกษา ตัวอย่าง (sample) คือ ส่วนหนึ่ง (portion) ของประชากรที่เลือกมา (selected) เพื่อทำการวิเคราะห์ (analysis) สำมะโน (census) คือ การรวบรวมข้อมูลจากประชากร (collecting data for a population) การสำรวจโดยการสุ่มตัวอย่าง (sample survey) คือ การรวบรวมข้อมูลจากกลุ่มตัวอย่าง (collecting data for a sample) พารามิเตอร์ (parameter) คือ ค่าสรุปรวมที่คำนวณมาจากประชากร เพื่อบรรยาย (describe) คุณลักษณะ (characteristic) ของประชากร สถิติ (statistic) คือ ค่าสรุปรวมที่คำนวณมาจากตัวอย่าง เพื่อบรรยาย (describe) คุณลักษณะ (characteristic) ของตัวอย่าง

4 ประชากรและกลุ่มตัวอย่าง (Population and Sample)
ใช้สถิติสรุปคุณลักษณะ (Use statistics to summarize features) ใช้พารามิเตอร์สรุปคุณลักษณะ (Use parameters to summarize features) อ้างอิงถึงประชากรจากกลุ่มตัวอย่าง (Inference on the population from the sample)

5 ประชากรและกลุ่มตัวอย่าง (Population and Sample)
พารามิเตอร์ของ ประชากร (Population parameter) ประชากร (Population) ช่วงความเชื่อมั่นสำหรับ พารามิเตอร์ของประชากร (Confidence Interval for population parameter) การสุ่มตัวอย่างแบบสุ่มหรือแบบตามสะดวก (Sampling mechanism: random sample or convenience sample) กลุ่มตัวอย่าง (Sample) ประมาณค่าตัวอย่างด้วย พารามิเตอร์ของประชากร (Sample estimate of population parameter)

6 ประชากรและตัวแปร ประชากร (Population) หน่วยวิเคราะห์
(Unit of Analysis) ตัวแปร (Variables) นักศึกษาทั้งหมดในมหาวิทยาลัย นักศึกษา คะแนนเฉลี่ย จำนวนหน่วยกิต หนังสือทั้งหมดในห้องสมุด หนังสือ ค่าใช้จ่ายในการซ่อมแซม

7 การใช้สถิติ (Uses of Statistics)
การพรรณาข้อมูล (Describing Data) อ้างอิงข้อมูลจากกลุ่มตัวอย่าง (Making Inferences from Samples) แสดงเป็นแผนภาพ (Visual Displays) สรุปเป็นตัวเลข (Numerical Summaries) ประมาณการด้วยพารามิเตอร์ (Estimating Parameters) ทดสอบสมติฐาน (Testing Hypotheses)

8 ประเภทของการวิเคราะห์ทางสถิติ (Types of statistical analysis)
สถิติ (Statistics) การวิเคราะห์ (Analysis) พรรณนา (Descriptive) อะไรคือ ลักษณะคำตอบของผู้ตอบ (What are the characteristics of the respondents?) อ้างอิง/อนุมาน (Inferential) อะไรคือ ลักษณะของประชากร (What are the characteristics of the population?) ความแตกต่าง (Differences) กลุ่มสองกลุ่มหรือมากกว่า มีความเหมือนหรือแตกต่างกันหรือไม่ (Are two or more groups the same or different?) ความสัมพันธ์ (Associative) ตัวแปร 2 ตัวหรือมากกว่า มีความสัมพันธ์กันหรือไม่ (Are two or more variables related in a systematic way?) การทำนาย (Predictive) เราสามารถทำนายตัวแปรใดตัวแปรหนึ่งจากตัวแปรตัวใดตัวหนึ่งหรือมากกว่าหรือไม่ (Can we predict one variable if we know one or more other variables?)

9 อ้างอิง/อนุมาน (Inferential)
สถิติ (Statistics) พรรณนา (Descriptive) อ้างอิง/อนุมาน (Inferential) สหสัมพันธ์ (Correlational) การจัดการ การสรุป และการพรรณนาข้อมูล(Organizing, summarizing & describing data) การสรุป (Generalizing) ความสัมพันธ์ (Relationships) นัยสำคัญ (Significance)

10 ประเภทของสถิติ สถิติพรรณนา (Descriptive Statistics) คือ สถิติที่ใช้ในการอธิบาย หรือบรรยายลักษณะของข้อมูล เป็นการบรรยายลักษณะเฉพาะกลุ่มที่เก็บรวบรวมข้อมูลมา ไม่สามารถนำผลไปอ้างอิง หรือพยากรณ์ค่าของกลุ่มอื่น ๆ ได้ ตัวอย่าง จากการศึกษารายจ่ายรายเดือนของนิสิตมหาวิทยาลัยบูรพา พบว่า จากนิสิตที่สุ่มมาทั้งหมด 100 คน มีรายจ่ายรายเดือนเฉลี่ยคนละ 3,500 บาท สถิติอนุมาน (Inferential Statistics) คือ สถิติที่ได้มาจากข้อมูลของกลุ่มตัวอย่าง (sample) แล้วนำไปอธิบายหรือสรุปผลลักษณะของประชากร (population) ตัวอย่าง จากรายจ่ายโดยเฉลี่ยรายเดือนของนิสิต 3,500 บาท ดังกล่าวมาแล้ว และโดยอาศัยทฤษฎีความน่าจะเป็น ทำการประมาณรายจ่ายโดยเฉลี่ยรายเดือนของนิสิตทั้งหมดในมหาวิทยาลัยบูรพาได้เป็นระหว่าง 3,300 และ 3,700 บาท

11 ประเภทของสถิติ (A Taxonomy of Statistics)
วิธีการทางสถิติ (Statistical Methods) การพรรณนา (Descriptive Methods) ตัวแปรเดี่ยว (Univariate) รูปร่าง (Shape) ศูนย์กลาง (Center) การกระจาย (Spread) ตำแหน่ง (Relative Position) ตัวแปรคู่ (Bivariate) สหสัมพันธ์ (Correlation) การถดถอยแบบง่าย (Simple Regression) ตัวแปรหลายตัว/พหุ (Multivariate) การถดถอยแบบพหุ (Multiple Regression) การอ้างอิง/อนุมาน (Inferential Methods) ค่าเฉลี่ย (Applied to Mean) เปรียบเทียบ 2 กลุ่ม ที่เป็นอิสระ (2 Sample t-test) เปรียบเทียบ 2 กลุ่ม ที่ไม่เป็นอิสระ (Paired t-test) ANOVA สถิติประเภทอื่นๆ (Other Statistics)

12 สถิติพรรณนา การนำเสนอข้อมูล (Presentation) เช่น บทความ ตารางร้อยละ กราฟ หรือรูปภาพ การแจกแจงความถี่ (Frequency) เช่น หาค่าร้อยละแบบทางเดียว และแบบหลายทาง การวัดแนวโน้มเข้าสู่ส่วนกลาง (Central of Tendency) เช่น ค่าเฉลี่ย (Mean) ค่าฐานนิยม (Mode) หาตำแหน่งของข้อมูล เช่น มัธยฐาน (Median) ควอไทล์ (Quartiles) เดไซล์ (Decile) เปอร์เซ็นไทล์ (Percentiles) N-ไทล์ (N-tiles) การวัดการกระจาย (Dispersion) เช่น พิสัย (range) ส่วนเบี่ยงเบนควอไทล์ (quartile deviation) ส่วนเบี่ยงเบนเฉลี่ย (mean or average deviation) ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ค่าแปรปรวน (variance) สัมประสิทธิ์ของการกระจาย (coefficient of variation) ความโค้งปกติ เช่น ความเบ้ (skewness) และความโด่ง (kurtosis)

13 สถิติพื้นฐานในการบรรยายข้อมูล (Summary Measures)
แนวโน้มเข้าสู่ศูนย์กลาง (Central Tendency) ควอไทล์ (Quartile) การกระจาย (Variation) ค่าเฉลี่ย (Mean) ฐานนิยม(Mode) มัธยฐาน (Median) พิสัย (Range) สัมประสิทธิ์ความแปรปรวน Coefficient of Variation) ความแปรปรวน (Variance) ส่วน เบี่ยง เบน มาตร ฐาน (Standard Deviation)

14 การวัดแนวโน้มเข้าสู่ศูนย์กลาง (Measures of Central Tendency)
เฉลี่ย (Mean) มัธยฐาน (Median) ฐานนิยม (Mode)

15 ความแตกต่างของคำว่า “ส่วนมาก/คิดเฉลี่ย” (Three types of “The Average”)
เฉลี่ย (The mean) - Bill Gates walks into a coffee shop and “the average” person in the shop is rich! มัธยฐาน (The median) - Half of all people are taller than me and half are shorter. I am of “the average” height. ฐานนิยม (The mode) - The largest number of golfers shoot an 88.

16 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)
ค่าเฉลี่ยเลขคณิต คือ การวัดแนวโน้มเข้าศูนย์กลางที่นิยมใช้กันมาก แต่ได้รับผลกระทบจากค่าที่สูงหรือต่ำมาก (extreme values) หรือค่าสุดโต่ง ค่าเฉลี่ย = 5 ค่าเฉลี่ย = 6 Sample Size Population Size ค่าเฉลี่ยของตัวอย่าง (Sample mean) ค่าเฉลี่ยของประชากร (Population mean)

17 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)
รวมค่า (Add values) จำนวนข้อมูล (Number of cases) คำนวณค่าเฉลี่ย (Calculate mean)

18 ค่าเฉลี่ยเลขคณิต (Arithmetic Mean)
เราใช้ค่าเฉลี่ยเมื่อ: ข้อมูลเป็นตัวเลข (numeric) ข้อมูลไม่มีค่าผิดปกติ (outliers) ข้อมูลเป็นค่าเดียว (uni-modal) และไม่เบ้ (skewed) เราไม่ใช้ค่าเฉลี่ยเมื่อ: ข้อมูลเป็นข้อมูลแบ่งกลุ่มหรืออัตราส่วน (ratio) มีการกระจายที่มีความเบ้มาก (badly skewed) From Raj Jain, “The art of computer system performance analysis”, pp The mean (in combination with the standard deviation) is probably the single most commonly used statistic. It is also liable to mis-use in a wide variety of ways.

19 มัธยฐาน (Median) มัธยฐาน คือ ค่าขนาดกลางของข้อมูลจากตัวแปรเชิงปริมาณ เป็นการวัดเข้าสู่ศูนย์กลางที่ไม่ได้รับผลกระทบจากค่าที่สูงหรือต่ำมาก (extreme values) เช่นกัน การหาค่ามัธยฐาน หากจำนวนข้อมูลที่นำมาจัดเรียงตามลำดับ เป็นเลขคี่ มัธยฐาน คือ ตัวเลขที่อยู่กึ่งกลาง แต่หากเป็นเลขคู่ มัธยฐาน คือ ค่าเฉลี่ยของตัวเลข 2 ตัวที่อยู่กึ่งกลาง มัธยฐาน = 5 From Raj Jain, “The art of computer system performance analysis”, pp The median is known as a robust estimator of the “central tendency” of a variable. เราใช้มัธยฐานเมื่อ: ข้อมูลเป็นตัวเลข ข้อมูลมีความเบ้ (skewed) หรือ มีข้อมูลโต่ง (outliers) จำนวนมาก ข้อมูลมีค่าเดียว (uni-modal) เราไม่ใช้มัธยฐานเมื่อ: If the total value is also of interest

20 มัธยฐาน (Median)

21 ฐานนิยม (Mode) ฐานนิยมคือ ค่าของข้อมูลที่มีจำนวนมากที่สุด ซึ่งไม่ได้รับผลกระทบจากค่าที่สูงหรือต่ำมาก (extreme values) สามารถใช้ได้ทั้งข้อมูลแบ่งกลุ่มและตัวเลข ฐานนิยมอาจมีมากกว่า 1 ฐานนิยม หรืออาจไม่มีฐานนิยมเลยก็ได้ ฐานนิยม = 9 ไม่มีฐานนิยม From Raj Jain, “The art of computer system performance analysis”, pp เราจะใช้ฐานนิยมเมื่อ: ข้อมูลเป็นข้อมูลแบบแบ่งกลุ่ม (categorical) หรือ ข้อมูลเป็นตัวเลข (numeric) และ ข้อมูลมีมากกว่า 2 ค่า (multi-modal) เราจะไม่ใช้ฐานนิยมเมื่อ: ข้อมูลเป็นตัวเลขและมีค่าเดียว (uni-modal)

22 ฐานนิยม (Mode) mode = 32

23 ตัวกลางเรขาคณิต (Geometric Mean)
ค่ากลางของข้อมูลชุดหนึ่งได้จากการถอดรากที่ n ของผลคูณของข้อมูล n ค่า or

24 ค่าเฉลี่ยฮาร์โมนิก (Harmonic Mean)
ค่ากลางของข้อมูลชุดหนึ่ง ที่ได้จากการหารจำนวนข้อมูลทั้งหมดด้วยผลบวกของส่วนกลับของข้อมูลชุดนั้น

25 ค่าสัดส่วน (Proportion: P)
ค่าเปรียบเทียบของส่วนหนึ่งต่อจำนวนรวมทั้งหมด เช่น คนจำนวน 125 คน มีคนสูบบุหรี่ 15 คน สามารถหาค่าสัดส่วนได้ดังนี้ P =

26 ควอไทล์ (Quartiles) 25% 25% 25% 25%
แบ่งข้อมูลที่มีการจัดเรียงไว้เป็น 4 ส่วน (Quarters) 25% 25% 25% 25% ตำแหน่งของที่ควอไทล์ (i-th Quartile) ข้อมูลที่จัดเรียงตามลำดับ (Data in Ordered Array): ค่า 3 ค่าที่แบ่งข้อมูลออกเป็น 4 ส่วนเท่า ๆ กัน เรียกค่าทั้ง 3 ว่า ควอร์ไทล์ที่ 1  (Q1)  ควอร์ไทล์ที่ 2  (Q2) (หรือค่ามัธยฐาน)  และควอร์ไทล์ที่ 3  (Q3) และ เป็นการวัดตำแหน่งที่ไม่ใช่จุดกลาง (Noncentral Location) = มัธยฐาน (Median) เป็นการวัดแนวโน้มเข้าศูนย์กลาง

27 พิสัยระหว่างควอไทล์ (Interquartile Range)
Interquartile range = 3rd quartile – 1st quartile = Q3 – Q1 มัธยฐาน (Median) (Q2) Q1 Q3 ค่าสูงสุด (maximum) ค่าต่ำสุด (minimum) 25% % % % Interquartile range = 65 – 35 = 30 อายุ

28 พิสัยกึ่งระหว่างควอไทล์ (Semi-Interquartile Range: SIQR)
ใช้วัดแทนความเบี่ยงเบนมาตรฐาน (standart deviation) เมื่อการแจกแจงข้อมูล (distribution) ไม่ปกติ (non-symmetric) SIQR= (Q3 – Q1)/2

29 เปอร์เซ็นต์ไทล์ (Percentiles)
50th เปอร์เซ็นต์ไทล์ หรือเรียกกันว่า ค่ามัธยฐาน (median) – ค่าของข้อมูลที่อยู่กึ่งกลางเมื่อมีการจัดเรียงจากน้อยไปหามาก 25th และ 75th เปอร์เซ็นต์ไทล์ หรือเรียกกันว่า ควอไทล์ที่ 1 (Q1) และควอไทล์ที่ 3 (Q3) – ค่าของข้อมูลที่อยู่กึ่งกลางของแต่ละครึ่ง

30 การวัดการกระจาย (Measures of Variation)
พิสัย (Range) ความแปรปรวน (Variance) ความเบี่ยงเบนมาตรฐาน (Standard Deviation) สัมประสิทธิ์ความแปรปรวน (Coefficient of Variation) ความแปรปรวนของกลุ่มประชากร (Population Variance) ความเบี่ยงเบนมาตรฐานของกลุ่มประชากร (Population Standard Deviation) ความแปรปรวนของกลุ่มตัวอย่าง (Sample Variance) ความเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง (Sample Standard Deviation) พิสัยระหว่างควอร์ไทล์ (Interquartile Range)

31 พิสัย (Range) พิสัย คือ ค่าที่ใช้วัดการกระจายอย่างง่าย จากผลต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูล โดยไม่สนใจว่าข้อมูลจะมีการกระจายในรูปแบบใดหรือไม่ พิสัย = = 5 พิสัย = = 5

32 พิสัย (Range) range = 60 – 32 = 28

33 พิสัยระหว่างควอไทล์ (Interquartile Range)
วัดการกระจาย หรือเรียกว่า ค่าการกระจายส่วนกลาง (midspread) ค่าการกระจายในส่วนกลาง คือ 50% ผลต่างระหว่างควอไทล์ที่ 1 หรือเปอร์เซ็นไทล์ที่ 25 และควอไทล์ที่ 3 หรือเปอร์เซ็นไทล์ที่ 75 ไม่ได้รับผลกระทบจากค่าค่าที่สูงหรือต่ำมาก (extreme values) Data in Ordered Array:

34 พิสัยระหว่างควอไทล์ (Interquartile Range)

35 ความแปรปรวน (Variance)
มีความสำคัญในการวัดการกระจาย แสดงการกระจายของค่าเฉลี่ย ความแปรปรวนของกลุ่มตัวอย่าง (Sample variance) ความแปรปรวนของกลุ่มประชากร (Population variance) ส่วนเบี่ยงเบนมาตรฐานยกกำลังสอง

36 ความเบี่ยงเบนมาตรฐาน (Standard Deviation)
มีความสำคัญมากที่สุดในการวัดการกระจาย แสดงการกระจายของค่าเฉลี่ย มีหน่วยเหมือนข้อมูลเดิม (original data) ความเบี่ยงเบนของกลุ่มตัวอย่าง (Sample standard deviation) ความเบี่ยงเบนของกลุ่มประชากร (Population standard deviation) รากที่สองของค่าเฉลี่ยของกำลังสองของส่วนเบี่ยงเบนจากค่าเฉลี่ยเลขคณิต ใช้วัดการกระจายของข้อมูล เขียนแทนด้วยสัญลักษณ์ s

37 เปรียบเทียบค่าเบี่ยงเบนมาตรฐาน#1
ข้อมูลชุด A Mean = 15.5 s = 3.338 ข้อมูลชุด B Mean = 15.5 s = .9258 ข้อมูลชุด C Mean = 15.5 s = 4.57

38 เปรียบเทียบค่าเบี่ยงเบนมาตรฐาน#2
Small Standard Deviation Large Standard Deviation Same Means Different Standard Deviations Different Means Different Standard Deviations Different Means Same Standard Deviations

39 เปรียบเทียบค่าเบี่ยงเบนมาตรฐาน#3

40 สัมประสิทธิ์การกระจาย (Coefficient of variation)
สัมประสิทธิ์ความแปรปรวน (Coefficient of variation) หรืออาจเรียกว่า สัมประสิทธิ์การกระจาย (Coefficient of dispersion) วัดการกระจายสัมพัทธ์ (Measure of relative variation) คือ การวัดการกระจายของข้อมูลแต่ละชุด เพื่อนำไปใช้ในการเปรียบเทียบการกระจายกับข้อมูลชุดอื่น ๆ หรือ

41 ระดับการกระจาย ช่วงของการกระจาย 10.00% ต่ำมาก 20.00% ต่ำ 30.00%
ปานกลางค่อนข้างต่ำ 40.00% ปานกลาง 50.00% 60.00% ปานกลางค่อนข้างสูง 70.00% ค่อนข้างสูง 80.00% สูง 90.00% สูงมาก % ต่ำมาก 26.00%-49.00% ต่ำ 50.00%-69.00% ปานกลาง 70.00%-0.89 สูง 90.00%-100% สูงมาก % ต่ำ 50.00% % ปานกลาง 70.00% - 100% สูง

42 รูปแบบการแจกแจงความถี่ (Frequency Distribution: Different Distribution shapes)
This slide shows some examples of different shapes that D can take. The top left = ND which I’ve already described: majority of scores fall around a mid point with fewer and fewer as the scores get more or less extreme. The top right D shows another type of distribution shape: here the majority of scores fall around two values. The bottom two graphs show D shapes that again cluster around a central value: but unlike the top two graphs they are not symmetrical ( =can draw vertical line through middle and one side is mirror image of each other). Lets describe these D in terms of what they mean for actual score. Lets imagine that these are all graphs of exam results for different exams, so as the x axis goes along the higher the exam results. The TL graph shows an exam where most people got results around the mid point: v few got v low and v few got v high scores. The TR graph shows 2 peaks, so lots of people got exam results either at one particular lower level (left peak) or a higher level (right peak), with less getting v low, v high or scores in the middle. The BL graph shows that most people got very low scores as the peak of the curve is near the beginning of the x axis, with very few getting high scores (v hard exam). The BR graph is the opposite with the peak of scores near the end of the x axis: so most people scored highly on this exam. D where scores pile at one end or another while the tail of the scores taper off to the other end are called skewed D. So the BL is an example of + skew, so called because the tail of scores tapers off towards the + end of the x axis (looks like p facing upwards), - skew so called because tail tapers off towards – end of x axis. This kind of information is clear from looking at a D.

43 การแจกแจงแบบเบ้ (Skewed Distribution)
ข้อมูลมีการแจกแจงแบบเบ้ขวา ค่า Skewness เป็น + หมายถึง ข้อมูลส่วนใหญ่มีค่าต่ำ Mode < Median < Mean Right-Skewed Normal or Symentric ข้อมูลมีการแจกแจงแบบเบ้ซ้าย ค่า Skewness เป็น – หมายถึง ข้อมูลส่วนใหญ่มีค่าสูง Mean < Median < Mode Left-Skewed Mode = Median = Mean ข้อมูลมีการแจกแจงแบบปกติ ค่า Skewness เป็น 0 หมายถึง ข้อมูลส่วนใหญ่มีค่าปานกลาง

44 การแจกแจงแบบโด่ง (Kurtosis Distribution)
ข้อมูลมีการแจกแจงแบบยอดแบน (Platykurtic Distribution) ค่า Kurtosis เป็น – หมายถึง ข้อมูลกระจายมาก หรือ มีความแปรปรวนมาก ข้อมูลมีการแจกแจงแบบยอดปานกลาง (Mesokurtic distribution) ค่า Kurtosis เป็น 0 หมายถึง ข้อมูลกระจายปานกลาง หรือ มีความแปรปรวนปานกลาง ข้อมูลมีการแจกแจงแบบยอดสูง (Leptokurtic distribution) ค่า Kurtosis เป็น + หมายถึง ข้อมูลกระจายน้อย หรือ มีความแปรปรวนน้อย

45 สถิติอนุมาน แบบมีพารามิเตอร์ (Parametric) เป็นการนำค่าที่ได้จากตัวอย่าง ซึ่งจะเรียกว่า ค่าสถิติ (statistics) ไปอธิบายคุณลักษณะประชากร ซึ่งจะเรียกว่า ค่าพารามิเตอร์ (parameter) แบบไม่มีพารามิเตอร์ (Nonparametric) เป็นการอนุมานข้อมูลจากตัวอย่างไปอธิบายลักษณะของประชากรในกรณีที่ไม่ทราบค่าของข้อมูลจากประชากรที่สนใจ ไม่ทราบการแจกแจงแบบใด ค่าของข้อมูลที่ได้มาจากตัวอย่างอยู่ในระดับนามมาตรา หรืออันดับมาตรา และกลุ่มตัวอย่างที่เลือกมามีขนาดเล็ก หรือจำนวนน้อย

46 ตัวอย่างสถิติพรรณนาและสถิติอนุมาน (Examples of Descriptive and Inferential Statistics)
กราฟ (Graphical) จัดแสดงข้อมูลในรูปของตาราง (Arranging data in tables) กราฟแท่งและกราฟวงกลม (Bar graphs and pie charts) ตัวเลข (Numerically) ค่าร้อยละ (Percentages) ค่าเฉลี่ย (Averages) ค่าพิสัย (Range) ความสัมพันธ์ (Relationships) ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation coefficient) การวิเคราะห์ถดถอย (Regression analysis) สถิติอนุมาน ช่วงความเชื่อมั่น (Confidence interval) ความคาดเคลื่อน (Margin of error) เปรียบเทียบค่าเฉลี่ยสองกลุ่ม (Compare means of two samples) Pre/post scores t Test เปรียบเทียบค่าเฉลี่ยสามกลุ่ม (Compare means from three samples) Pre/post and follow-up ANOVA = analysis of variance

47 ประเภทตัวแปรและการวิเคราะห์#1
ตัวแปรนามมาตรา จำนวนกลุ่มตัวอย่าง ประเภทตัวแปร สถิติ 1 กลุ่ม np and n(1-p) ≥ 5 z-approximation np or n(1-p) < 5 binominal 2 กลุ่ม Independent np < 5 fisher exact test np ≥ 5 chi-square test Paired McNemar or Kappa 3 กลุ่มหรือมากกว่า collapse categories for chi-square test Dependent Cochran´s Q ที่มา:

48 ประเภทตัวแปรและการวิเคราะห์#2
ตัวแปรอันดับมาตรา ช่วงมาตรา และสัดส่วนมาตรา จำนวนกลุ่มตัวอย่าง ประเภทตัวแปร การแจงข้อมูล สถิติ 1 กลุ่ม N ≥ 30 ปกติ One-sample t-test N < 30 ไม่ปกติ Sign test 2 กลุ่ม Independent t-test Mann-Whitney U or Wilcoxon signed-rank test Paired paired t-test Wilcoxon signed-rank test ที่มา:

49 ประเภทตัวแปรและการวิเคราะห์#3
ตัวแปรอันดับมาตรา ช่วงมาตรา และสัดส่วนมาตรา จำนวนกลุ่มตัวอย่าง ประเภทตัวแปร การแจกแจงข้อมูล จำนวนปัจจัย สถิติ 3 กลุ่มและมากกว่า Independent ปกติ 1 factor One way anova ≥ 2 factors two or other anova ไม่ปกติ Kruskal-Wallis one-way analysis of variance by ranks Dependent Repeated measures anova Friedman two-way analysis of variance by ranks ที่มา:

50 ตารางสรุปสถิติทดสอบ รูปแบบการวิเคราะห์ (Design)
ไม่มีพารามิเตอร์ (Nonparametric) มีพารามิเตอร์ (Parametric) นามมาตรา (nominal) อันดับมาตรา (ordinal) ช่วงมาตรา/สัดส่วนมาตรา(Interval/ratio) One sample c2 goodness of fit 1 sample z (s known) or t (s unknown) test 2 independent samples c2 test of independence Mann-Whitney U test 2 independent sample t test 2 dependent samples McNemar test for significant change Wilcoxon matched-pair signed-rank test 2 dependent samples t test k independent samples Kruskal-Wallis H test 1-way ANOVA k dependent samples Repeated measures ANOVA 2 or more variables 2-way or Factorial ANOVA Correlation Spearman rs Pearson r Prediction Regression ที่มา: Poole, Heather. Non-parametric statistics.

51 รูปแบบ สถิติเชิงพรรณนา สถิติเชิงอ้างอิง ตัวแปรแบ่งกลุ่ม ตัวแปรต่อเนื่อง มีพารามิเตอร์ ไม่มีพารามิเตอร์ ตัวเลข -Frequency -Contingency table Location -Mean (Arithmetic, Geometric, Harmonic) -Median  -Mode Dispersion -Range  -Standard deviation  -Coefficient of variation  -Percentile Moments -Variance  -Semivariance  -Skewness  -Kurtosis -t-test -ANOVA -ANCOVA -Factor Analysis -Pearson’s Nominal -Chi Square -Median Test -Sign Test Ordinal - Spearman - Mann-Whitney แผนภาพ Pie chart Bar chart Bipolt -Histogram -Line chart -Bi plot -Dot plot -Box plot -Q-Q plot  -Scatter plot -Stem plot

52 การทดสอบสมมติฐาน (Hypothesis Testing)
ประเภทของข้อมูล (Type of data) ตัวแปรอิสระ (DV) Qualitative (categorical) 1 independent variable 2 independent variables Quantitative (measurement) Relationships Differences 2 groups Multiple groups Nonparametric Parametric 2 dependent variables Goodness of fit x 2 Independence test x 2 1 predictor Multiple predictors Continuous measurement Ranks Multiple regression Spearman rs Primary interest Degree of relationship Form of relationship Pearson r Regression independent dependent 2-sample t Mann-Whitney U Related sample t Wilcoxon T 1 IV Multiple IVs One-way ANOVA Kruskal-Wallis H Factorial ANOVA Repeated measures ANOVA Friedman McNemar test การทดสอบสมมติฐาน (Hypothesis Testing) ที่มา: Poole, Heather. Non-parametric statistics.

53 สถิติที่ใช้กันมาก สถิติที่เหมาะสม ระดับการวัดข้อมูล Binomial test
กลุ่มตัวอย่าง 1 กลุ่ม กลุ่มตัวอย่าง 2 กลุ่ม กลุ่มตัวอย่างมากกว่า 2 กลุ่ม นามมาตรา Binomial test 2 – test Mcnemar test 2 - test Cocharn Q-test อันดับมาตรา Komogorovsminov test Runs test Sign test U - test Friedman two-way Analysis of variance Kruskal –wallis one –way Analysis of variance ช่วงมาตรา และ อัตราส่วนมาตรา t –test Z – test T – test F - test Analysis of variance (ANOVA) Analysis of covariance (ANCOVA) MANOVA

54 การทดสอบแบบมีพารามิเตอร์ (Parametric Tests)
การอ้างอิง/อนุมาน/สรุปบนฐานของฐานคติ/ข้อสันนิฐานเกี่ยวกับธรรมชาติของการกระจายของประชากร (Inferences based on assumptions about the nature of the population distribution) ปกติ (usually): การกระจายตัวของประชากรเป็นแบบปกติ (population is normal) ประเภทของการทดสอบ (Types of tests) z-test หรือ t-test การเปรียบเทียบค่าเฉลี่ยหรือสัดส่วนของประชากร 2 กลุ่ม (Comparing two population means or proportions) การทดสอบค่าของค่าเฉลี่ยหรือสัดส่วนของประชากร (Testing value of population mean or proportion) ANOVA การทดสอบความเท่ากันของค่าเฉลี่ยของประชากรหลายกลุ่ม (Testing equality of several population means)

55 การทดสอบแบบไม่มีพารามิเตอร์#1 (Nonparametric Tests)
วิธีการกระจายแบบอิสระ โดยไม่มีข้อสันนิฐานเกี่ยวกับการกระจายตัวของประชาการ (Distribution-free methods making no assumptions about the population distribution) ประเภทของการทดสอบ (Types of tests) การทดสอบเครื่องหมาย (Sign tests) การทดสอบเครื่องหมาย (Sign Test): การเปรียบเทียบการจับคู่ของค่าการสังเกต (Comparing paired observations) การของแมคนีมาร์McNemar Test: การเปรียบเทียบตัวแปรคุณภาพ (Comparing qualitative variables) การทดสอบของคอกซ์และสจวร์ต (Cox and Stuart Test): การตรวจสอบแนวโน้ม (Detecting trend) การทดสอบความต่อเนื่อง (Runs tests) การทดสอบความต่อเนื่อง (Runs Test): การตรวจสอบความเป็นสุ่ม (Detecting randomness) การทดสอบของวอร์ค – วูล์ฟอวิทซ์ (Wald-Wolfowitz Test): การเปรียบเทียบการกระจาย 2 กลุ่ม (Comparing two distributions)

56 การทดสอบแบบไม่มีพารามิเตอร์#2 (Nonparametric Tests)
การทดสอบการจัดลำดับที่ (Ranks tests) การทดสอบของแมน-วิทนี ยู (Mann-Whitney U Test): เปรียบเทียบประชากร 2 กลุ่ม (Comparing two populations) การทดสอบการจัดอันดับที่สัญลักษณ์ของวิลคอกชัน (Wilcoxon Signed-Rank Test): เปรียบเทียบการจับคู่ (Paired comparisons) การเปรียบเทียบประชากรหลายกลุ่ม (Comparing several populations): ANOVA ด้วยการจัดอันดับที่ (with ranks) การทดสอบของครัสคาลและวัลลิส (Kruskal-Wallis Test) การทดสอบของฟรีดแมน (Friedman Test): การวัดซ้ำ (Repeated measures) สัมประสิทธิ์สหสัมพันธ์อันดับที่ของสเปียร์แมน (Spearman Rank Correlation Coefficient) การทดสอบไคสแควร์ (Chi-Square Tests) การทดสอบความสอดคล้อง (Goodness of Fit) การทดสอบความเป็นอิสระ (Testing for independence): การวิเคราะห์ตารางไขว้(Contingency Table Analysis) ความเท่ากันของสัดส่วน (Equality of Proportions)

57 Inferential Statistics Descriptive Statistics
Nonparametric Measures of Location Parametric Measures of Variability


ดาวน์โหลด ppt การใช้โปรแกรมคอมพิวเตอร์ทางสถิติในด้านสังคมศาสตร์ (The Application of Statistical Package in Social Sciences) ความรู้พื้นฐานเกี่ยวกับสถิติ (Introduction.

งานนำเสนอที่คล้ายกัน


Ads by Google