ดาวน์โหลดงานนำเสนอ
งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ
ได้พิมพ์โดยมนู วอชิงตัน ได้เปลี่ยน 8 ปีที่แล้ว
1
Measures of Central Tendency & Measures of Spread or Variation
ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยูรวงศ์
2
Measures of Central Tendency
1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean) นำค่าข้อมูลที่ได้ทั้งหมดมารวมกัน หารด้วยจำนวนข้อมูลทั้งหมด ค่าเฉลี่ยของตัวอย่าง ค่าเฉลี่ยของประชากร x
3
ตัวอย่าง จงหาค่าเฉลี่ยของอายุของนักศึกษาป.โท ทันตสาธารณสุข x =
4
การหาค่าเฉลี่ยกรณีข้อมูลเป็นกลุ่ม (Grouped data)
k = จำนวนชั้นความถี่ xi = จุดกึ่งกลางชั้น fi = ความถี่ของชั้น
5
ตัวอย่าง จงหาค่าเฉลี่ยของอายุจากข้อมูลในตาราง 10-19 4 14.5 58.0
Class interval Class frequency(fi ) Class midpoint(xi) fixi Total
6
แทนค่าในสูตร = 32.0
7
2. มัธยฐาน (Median) เป็นค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลที่เรียงลำดับจากมากไปน้อย หรือน้อยไปมาก ค่า median จะแบ่งข้อมูลเป็นสองส่วนเท่าๆกัน ข้อมูลครึ่งหนึ่งมีค่าสูงกว่า median และอีกครึ่งหนึ่งมีค่าต่ำกว่า median การหาค่า median เรียงลำดับข้อมูลจากน้อยไปมาก หรือ มากไปน้อย ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) ค่าของข้อมูลที่ตำแหน่งกึ่งกลาง จะเป็นค่า median ถ้าจำนวนข้อมูลเป็นเลขคู่(even) ค่าเฉลี่ยของค่าของข้อมูลที่อยู่ 2 ตำแหน่งตรงกลาง จะเป็นค่า median
8
2. มัธยฐาน (Median) ต่อ ตัวอย่าง data set 10, 54, 21,33,35
เรียงลำดับข้อมูล 10,21,33,35,54 Median = 33 ตัวอย่าง data set 10, 54,21,33,35,53 เรียงลำดับข้อมูล 10,21,33,35,53,54 Median = (33+35)/2=34
9
ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd)
2. มัธยฐาน (Median) ต่อ ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) Median = ค่าที่ตำแหน่ง((n+1)/2) ถ้าจำนวนข้อมูลเป็นเลขคู่(even) Median = ค่าที่ตำแหน่ง(n/2)+ ค่าที่ตำแหน่ง((n/2)+1)) 2
10
3. ฐานนิยม (Mode) เป็นค่าของข้อมูลที่มีความถี่สูงสุด อาจมีได้หลายค่าถ้ามีความถี่เท่ากัน หรือ อาจไม่มีค่าmode ก็ได้ ตัวอย่าง หาค่า mode จากข้อมูลอายุ 3 ชุด 15,21,34,15,30,15,20,35,51,15 20,21,20,20,34,22,24,27,27,27 10,21,33,53,54,20,22,50,12,16
11
Which to use? ดู distribution of data
Measurement scale Central tendency nominal scale mode ordinal scale mode, median* interval scale ratio scale mode, median, mean ดู distribution of data
12
1. Symmetric distribution
Mean Median Mode
13
2. Distribution of data is skewed
2.1 Skewed to the left (เบ้ซ้าย) 2.2 Skewed to the right (เบ้ขวา) Mode Median Mean If the distribution of data is skewed, the median is a better descriptive measure than the mean.
14
การวัดการกระจาย (Measures of Spread /Variation/Dispersion)
พิสัย (Range) ค่าความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดและข้อมูลที่มีค่าต่ำสุด Range= Maximum-Minimum ตัวอย่าง หาค่า range ของอายุของนักศึกษาป.โททันตสาธารณสุข Range = Maximum-Minimum=
15
2. Interquartile range เป็นค่าพิสัยของ quartile ที่ 1 กับ 3 (Q1-Q3) การหา interquartile range เรียงลำดับข้อมูลทั้งหมด แบ่งข้อมูลเป็นสี่ส่วนเท่าๆกัน Q1 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ25 มีค่าต่ำกว่านี้ Q2 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ50 มีค่าต่ำกว่านี้ =median Q3 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ75 มีค่าต่ำกว่านี้
16
สูตรหาตำแหน่ง Percentile
Rk = k/100 x (n+1) k = ลำดับที่ของ percentile n = จำนวนข้อมูลทั้งหมด เช่น R25 =(25/100)x (100+1) = P25 or Q1=ค่าของข้อมูลตำแหน่งที่ 25.25 R75=(75/100)x (100+1) = P75 or Q3=ค่าของข้อมูลตำแหน่งที่ 75.75
17
3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบนมาตรฐาน (standard deviation)
ơ2= Population variance (ความแปรปรวนของประชากร) S2= sample variance (ความแปรปรวนของตัวอย่าง) Sum of squares Degree of freedom
18
3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบนมาตรฐาน (standard deviation)
standard deviation= SD or S หรือ
19
สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation)
Coefficient of variation (cv)
20
สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation)
ตัวอย่าง เปรียบเทียบการกระจายของข้อมูลน้ำหนัก (กก.)และส่วนสูง (ซม.)ของ นักศึกษาป.โททันตสาธารณสุข CV น้ำหนัก = CV ส่วนสูง = สรุป ค่าสัมประสิทธิ์ของความแปรปรวนของข้อมูล______ มีค่าสูงกว่าค่า สัมประสิทธิ์ของความแปรปรวนของข้อมูล________
21
แบบฝึกหัด หาค่า S2 , SD และ CV ของข้อมูลที่ให้ 4, 5, 6, 7, 8, 9, 10
Xi Xi – mean (Xi – mean)2 4 5 6 7 8 9 10 Mean = 49/7 = 7, S2 = 28/(7-1) = 4.67 SD = , CV = 2.16/7 =0.31
22
การประมาณค่า Estimation ณัฐพร ยูรวงศ์
23
Inferential statistics
ข้อมูลประชากร : ค่าพารามิเตอร์ (parameter) การหาค่าสถิติ เพื่อนำไปใช้ประมาณค่าพารามิเตอร์ statistic infer Parameter
24
การประมาณค่า 4.5 เป็น point estimate of ทำได้ 2 วิธี
การประมาณค่าแบบค่าเดียว (Point estimation) เป็นการนำค่าสถิติเพียงค่าเดียวที่ได้จากตัวอย่างไปประมาณค่า parameter ของประชากร เช่น sample mean population mean sample size , 3, 5, 8 x x=4.5 4.5 เป็น point estimate of
25
การประมาณค่า 2. การประมาณแบบช่วง (Interval estimation)
เป็นการนำค่าสถิติที่ของตัวอย่างไปประมาณค่า parameter ของประชากร ใน ลักษณะเป็นช่วง Estimates vary from one sample to another Variation : sampling distribution of the estimator
26
Brief on sampling distribution
Probability distribution of sample mean or proportion (estimator) The distribution of the sample mean x of a random sample drawn from practically any population with mean µ and variance ơ2 can be approximated by means of a normal distribution with mean µ and variance ơ2/n, provided the sample size is large. When the sample size is large, the distribution of is close to that of the standard normal variable Z. *To convert to Z-scale, the rule is: subtract the mean and divided by the SD of the random variable in question
27
Be useful to specify an interval to include
Sample mean (Estimate of ) x Single sample Close? Be useful to specify an interval to include ช่วงของการประมาณนี้ เรียกว่า confidence interval
28
ความหมายของช่วงเชื่อมั่น (Confidence interval or CI)
If we take 100 samples of size n, 95 of them will have sample mean within a distance of 1.96s/ from the population mean . For about 95 percent of all possible samples of size n, the population mean must be greater than and less than .
29
ปัจจัยที่มีผลต่อขนาดความกว้างของช่วงประมาณ
ในการประมาณค่าที่ต้องการ ให้ช่วงประมาณมีความเชื่อมั่นสูงๆ ช่วงประมาณจะกว้างมากขึ้นตามระดับความเชื่อมั่นที่สูงขึ้น ตัวอย่าง x = 68.2, SD = 7.7, n = 120 90% CI of [67.0, 69.4] 95% CI of [66.8, 69.6] 99% CI of [66.3, 70.0]
30
ปัจจัยที่มีผลต่อขนาดความกว้างของช่วงประมาณ
2. ขนาดของความคลาดเคลื่อนมาตรฐานการแจกแจงของ x (standard error or SE) standard error : variability of sample mean ขนาดของ SE ขึ้นอยู่กับ ขนาดตัวอย่าง ขนาดตัวอย่างใหญ่ SE เล็กลง ช่วงเชื่อมั่นแคบลง ตัวอย่าง x = 51.1, ơ = 10.2 n = % CI of [46.6, 55.6] n = % CI of [48.2, 54.0] n = % CI of [49.3, 52.9] สรุป: ขนาดตัวอย่างมีความสำคัญต่อการประมาณค่า ช่วงเชื่อมั่นที่แคบแสดงถึงความเที่ยง(precision)ของการประมาณค่าสูง
31
Standard error of mean and standard deviation of sample
The variation of measurements between individuals within the sample SD SE : variability of sample mean If comparing sample means (e.g. from different populations) then it is appropriate to use SE.
32
Confidence interval for the population mean when the sample size is large
For large n (n>100), normally distributed with mean 0, SD 1 Or
33
Confidence interval for the population mean when the sample size is large
100(1-)% CI for : where Z/2= two-sided 100 percentage point of the standard normal distribution
34
Confidence interval for the population mean when the sample size is small
A random sample of size n from normal population Sampling distribution of t-distribution with degree of freedom n-1
35
Confidence interval for the population mean when the sample size is small
100(1-)% CI for : where t/2= two-sided 100 percentage point of t-distribution with degree of freedom n-1
36
ตัวอย่างที่ 1 When 16 cigarettes of a particular brand were tested in a laboratory for the amount of tar content, it was found that their mean content was 18.3 mg with s=1.8 mg. Set a 90 percent confidence interval for the mean tar content in the population of cigarettes of this brand. n=16, =18.3, s =1.8, =0.10, degree of freedom =16-1=15, t15,/2= t15,0.05= 1.753 90 % confidence interval is given by
37
ตัวอย่างที่ 2 In order to estimate the amount of time (min) that a teller spends on a customer, a bank manager decided to observe 64 customers picked at random. The amount of time the teller spend on each customer was recorded It was found that the sample mean was 3.2 min with s2 =1.44. Find a 98%confidence interval for the mean amount of time . =3.2, s2 =1.44, n=64, =0.02, Z/2= Z0.01= 2.33 98 % confidence interval for is given by
38
Confidence interval for 1- 2 when sample sizes are large
n1, n2 >50 2 independent large samples of size n1, n2 from 2 population with mean 1, 2 X1 –X2 is normally distributed with mean 1-2 , 100(1-)% CI for : where Z/2= two-sided 100 % point of the standard normal distribution
39
Confidence interval for 1- 2 when sample sizes are small
100(1-)% CI for 1- 2 : t/2= two-sided 100 % point of t-distribution with degree of freedom n1+n2-2
40
ตัวอย่าง Gorman et al. conducted a study in which the subjects were homosexual men, some of whom were HIV positive and some of whom were HIV negative. Data were collected on a wide variety of medical, immunological, psychiatric, and neurological measures, one of which was the number of CD4+ cells in the blood. The mean number of CD4+ cells for the 112 men with HIV infection was with a standard deviation of For the 75 men without HIV infection the mean and standard deviation were and We wish to construct a 99 percent confidence interval for the difference between population means.
41
99% CI for the difference between population means:
เฉลย =0.01, /2 =0.005, Z/2= Z0.005= 2.58, n1=75, n2=112, S1=274.9, S2=226.4 Point estimate = = 426.4 99% CI for the difference between population means:
42
Confidence interval for a proportion P for large sample size
P = Population proportion = sample proportion 100(1-)% CI for P : normal distribution with mean P, r = the number of subjects with a particular condition in a sample Z/2= two-sided 100 % point of the standard normal distribution
43
Confidence interval for the difference between two proportions (P1-P2)
For large sample n1, n2, 100(1-)% CI for P1-P2 : ( ) 2 1 ˆ n p SE - + = Z/2= two-sided 100 % point of the standard normal distribution
44
ตัวอย่าง A survey was conducted to study the dental health practices and attitudes of a certain urban adult population. Of 300 adults interviewed, 123 said that they regularly had a dental check-up twice a year. Construct a 95% confidence interval for the proportion of people in the population who had regular dental check-up. =0.05, /2 =0.025, Z/2= Z0.025= 1.96, n=300, =123/300 =0.41 95% CI for proportion of people with regular dental check-up [0.41±(1.96X 0.028)] [0.36,0.46] =0.028
45
ตัวอย่าง In a survey conducted on a college campus, 48 out of 150 professors were smokers and 114 out of 300 students were smokers. a) Obtain a point estimate of p1-p2 where p1 is the proportion of smokers among all professors and p2 the proportion among all students. b) Obtain 95% confidence interval for p1-p2. a) Point estimate of p1-p2 = (48/150)-(114/300) = = b) =0.05, Z/2= Z0.025= 1.96, = 95%CI,
46
แบบฝึกหัด A sample of 225 adult males had a mean systolic blood pressure of 125 and a sample standard deviation of 30. Find 90% and 95% confidence interval for µ. The amount of dissolved oxygen content in rivers is an important measure of the quality of water and its ability to support aquatic life. The following reading (mg/l) were obtain when twelve random samples downstream from an industrial region were tested. Estimate the true mean content µ using 90% confidence interval.
47
แบบฝึกหัด Transverse diameter measurements of the hearts of adult males and females gave the following results: Group sample size (cm) s (cm) male female Construct 90, 95 and 99% confidence intervals for 1- 2.
48
แบบฝึกหัด 4. In order to test the effectiveness of a flu vaccine, it was administered to 650 people who were selected at random. At the end of the flu season it was determined that 553 of the individuals did not get the flu. Using a 90% confidence interval, estimate the true proportion of people who would not get the flu if given the vaccine. 5. When a surgical procedure was tried on 212 patients, 186 recovered and were able to resume a normal life. Based on this information, obtain a 98% confidence interval for p, the true proportion of patients who would recover and be able to resume a normal life after the surgical procedure.
49
แบบฝึกหัด 6. In a survey conducted in two sections of a large metropolitan area, the following results were obtained with respect to abnormal blood pressure. Area Number of persons screened Number abnormal on screening Construct the 95 and 99% confidence intervals for the difference between the two population proportions.
50
References and Textbook recommended
Wayne W. Daniel. Biostatistics: A Foundation for Analysis in the Health Sciences th edn. John Wiley & Sons Inc. Canada. Martin Bland. An Introduction to Medical Statistics Oxford University Press, London. Medical Statistics & Statistical Computing I: Module 6 Estimation. Mathematics Department and Epidemiology Unit, Prince of Songkla University, Thailand. (International Programme for Master’s Degree in Epidemiology).
งานนำเสนอที่คล้ายกัน
© 2024 SlidePlayer.in.th Inc.
All rights reserved.