งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยู รวงศ์

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยู รวงศ์"— ใบสำเนางานนำเสนอ:

1 ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยู รวงศ์

2 Measures of Central Tendency 1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean) นำค่าข้อมูลที่ได้ทั้งหมดมารวมกัน หารด้วย จำนวนข้อมูลทั้งหมด  ค่าเฉลี่ยของตัวอย่าง  ค่าเฉลี่ยของประชากร  x

3 ตัวอย่าง  จงหาค่าเฉลี่ยของอายุของนักศึกษาป. โท ทันตสาธารณสุข x =

4 การหาค่าเฉลี่ยกรณีข้อมูลเป็นกลุ่ม (Grouped data)  k = จำนวนชั้นความถี่  x i = จุดกึ่งกลางชั้น  f i = ความถี่ของชั้น

5 ตัวอย่าง  จงหาค่าเฉลี่ยของอายุจากข้อมูลในตาราง Class interval Class frequency( f i ) Class midpoint( x i ) f i x i Total

6 = 32.0 แทนค่าในสูตร

7 2. มัธยฐาน (Median)  เป็นค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลที่เรียงลำดับจาก มากไปน้อย หรือน้อยไปมาก  ค่า median จะแบ่งข้อมูลเป็นสองส่วนเท่าๆกัน ข้อมูล ครึ่งหนึ่งมีค่าสูงกว่า median และอีกครึ่งหนึ่งมีค่าต่ำกว่า median  การหาค่า median เรียงลำดับข้อมูลจากน้อยไปมาก หรือ มากไปน้อย ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) ค่าของข้อมูลที่ตำแหน่ง กึ่งกลาง จะเป็นค่า median ถ้าจำนวนข้อมูลเป็นเลขคู่ (even) ค่าเฉลี่ยของค่าของ ข้อมูลที่อยู่ 2 ตำแหน่งตรงกลาง จะเป็นค่า median

8 2. มัธยฐาน (Median) ต่อ  ตัวอย่าง data set 10, 54, 21,33,35 เรียงลำดับข้อมูล 10,21,33,35,54 Median = 33  ตัวอย่าง data set10, 54,21,33,35,53 เรียงลำดับข้อมูล 10,21,33,35,53,54 Median = (33+35)/2=34

9 2. มัธยฐาน (Median) ต่อ  ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) Median = ค่าที่ตำแหน่ง ((n+1)/2)  ถ้าจำนวนข้อมูลเป็นเลขคู่ (even) Median = ค่าที่ตำแหน่ง (n/2)+ ค่าที่ตำแหน่ง ((n/2)+1)) 2

10 3. ฐานนิยม (Mode)  เป็นค่าของข้อมูลที่มีความถี่สูงสุด อาจมีได้หลายค่าถ้า มีความถี่เท่ากัน หรือ อาจไม่มีค่า mode ก็ได้  ตัวอย่าง หาค่า mode จากข้อมูลอายุ 3 ชุด 15,21,34,15,30,15,20,35,51,15 20,21,20,20,34,22,24,27,27,27 10,21,33,53,54,20,22,50,12,16

11 Which to use? Measurement scale Central tendency nominal scalemode ordinal scalemode, median* interval scale ratio scalemode, median, mean ดู distribution of data

12 1. Symmetric distribution Mean Median Mode

13 2. Distribution of data is skewed Mode Median Mean 2.1 Skewed to the left ( เบ้ซ้าย ) 2.2 Skewed to the right ( เบ้ขวา ) If the distribution of data is skewed, the median is a better descriptive measure than the mean.

14 การวัดการกระจาย (Measures of Spread /Variation/Dispersion) 1. พิสัย (Range)  ค่าความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดและข้อมูล ที่มีค่าต่ำสุด  Range= Maximum-Minimum  ตัวอย่าง หาค่า range ของอายุของนักศึกษาป. โททันต สาธารณสุข Range =Maximum-Minimum=

15 2. Interquartile range  เป็นค่าพิสัยของ quartile ที่ 1 กับ 3 (Q 1 -Q 3 )  การหา interquartile range เรียงลำดับข้อมูลทั้งหมด แบ่งข้อมูลเป็นสี่ส่วนเท่าๆกัน Q 1 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ 25 มีค่า ต่ำกว่านี้ Q 2 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ 50 มีค่า ต่ำกว่านี้ =median Q 3 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ 75 มีค่า ต่ำกว่านี้

16 สูตรหาตำแหน่ง Percentile R k = k/100 x (n+1) k = ลำดับที่ของ percentile n = จำนวนข้อมูล ทั้งหมด เช่น R 25 =(25/100)x (100+1) = P 25 or Q 1 = ค่าของข้อมูลตำแหน่งที่ R 75 =(75/100)x (100+1) = P 75 or Q 3 = ค่าของข้อมูลตำแหน่งที่ 75.75

17 3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบน มาตรฐาน (standard deviation)  ơ 2 = Population variance ( ความแปรปรวนของ ประชากร )  S 2= sample variance ( ความแปรปรวนของตัวอย่าง ) Sum of squares Degree of freedom

18 3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบน มาตรฐาน (standard deviation) standard deviation= SD or S หรือ

19 สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation)  Coefficient of variation ( cv )

20 สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation) ตัวอย่าง เปรียบเทียบการกระจายของข้อมูลน้ำหนัก ( กก.) และส่วนสูง ( ซม.) ของนักศึกษาป. โททันตสาธารณสุข CV น้ำหนัก = CV ส่วนสูง = สรุป ค่าสัมประสิทธิ์ของความแปรปรวนของข้อมูล ______ มีค่าสูงกว่าค่า สัมประสิทธิ์ของความแปรปรวนของ ข้อมูล ________

21 แบบฝึกหัด  หาค่า S 2, SD และ CV ของข้อมูลที่ให้ 4, 5, 6, 7, 8, 9, 10 X i X i – mean(X i – mean) Mean = 49/7 = 7, S 2 = 28/(7-1) = 4.67 SD = 2.16, CV = 2.16/7 =0.31

22 การประมาณค่า Estimation ณัฐพร ยู รวงศ์

23 Inferential statistics ข้อมูลตัวอย่าง : ค่าสถิติ (statistic) ข้อมูลประชากร : ค่าพารามิเตอร์ (parameter) การหาค่าสถิติ เพื่อนำไปใช้ประมาณ ค่าพารามิเตอร์ statistic Parameter infer

24 การประมาณค่า  ทำได้ 2 วิธี  การประมาณค่าแบบค่าเดียว (Point estimation) เป็นการนำค่าสถิติเพียงค่าเดียวที่ได้จากตัวอย่าง ไปประมาณค่า parameter ของประชากร เช่น sample mean population mean  sample size 4 2, 3, 5, 8 x x= เป็น point estimate of 

25 การประมาณค่า 2. การประมาณแบบช่วง (Interval estimation) เป็นการนำค่าสถิติที่ของตัวอย่างไปประมาณค่า parameter ของประชากร ใน ลักษณะเป็นช่วง Estimates vary from one sample to another sampling distribution Variation : sampling distribution of the estimator

26 Brief on sampling distribution  Probability distribution of sample mean or proportion (estimator)  The distribution of the sample mean x of a random sample drawn from practically any population with mean µ and variance ơ 2 can be approximated by means of a normal distribution with mean µ and variance ơ 2 /n, provided the sample size is large.  When the sample size is large, the distribution of is close to that of the standard normal variable Z. * To convert to Z-scale, the rule is: subtract the mean and divided by the SD of the random variable in question

27 Single sample Sample mean (Estimate of ) x Be useful to specify an interval to include  ช่วงของการประมาณนี้ เรียกว่า confidence interval Close?

28 ความหมายของช่วงเชื่อมั่น (Confidence interval or CI) 95% CI หมายถึง ถ้ามีการสุ่มตัวอย่างด้วยวิธี เดียวกัน และขนาดตัวอย่างเท่ากัน 100 ครั้ง จะมี โอกาสที่จะได้ช่วงเชื่อมั่นที่มีค่า  ตกอยู่ ไม่ต่ำกว่า 95 ครั้ง If we take 100 samples of size n, 95 of them will have sample mean within a distance of 1.96s/ from the population mean . For about 95 percent of all possible samples of size n, the population mean  must be greater than and less than.

29 ปัจจัยที่มีผลต่อขนาดความกว้างของช่วง ประมาณ 1. ในการประมาณค่าที่ต้องการ ให้ช่วงประมาณมีความ เชื่อมั่นสูงๆ ช่วงประมาณจะกว้างมากขึ้นตามระดับ ความเชื่อมั่นที่สูงขึ้น ตัวอย่าง x = 68.2, SD = 7.7, n = % CI of  [67.0, 69.4] 95% CI of  [66.8, 69.6] 99% CI of  [66.3, 70.0]

30 ปัจจัยที่มีผลต่อขนาดความกว้างของช่วง ประมาณ 2. ขนาดของความคลาดเคลื่อนมาตรฐานการแจกแจงของ x (standard error or SE) standard error : variability of sample mean ขนาดของ SE ขึ้นอยู่กับ ขนาดตัวอย่าง ขนาดตัวอย่างใหญ่ SE เล็กลง ช่วงเชื่อมั่นแคบลง ตัวอย่าง x = 51.1, ơ = 10.2 n = 20 90% CI of  [46.6, 55.6] n = 50 95% CI of  [48.2, 54.0] n = % CI of  [49.3, 52.9] สรุป : ขนาดตัวอย่างมีความสำคัญต่อการประมาณค่า ช่วง เชื่อมั่นที่แคบแสดงถึงความเที่ยง (precision) ของการ ประมาณค่าสูง

31 Standard error of mean and standard deviation of sample  The variation of measurements between individuals within the sample SD  SE : variability of sample mean If comparing sample means (e.g. from different populations) then it is appropriate to use SE.

32 Confidence interval for the population mean when the sample size is large  For large n (n>100), normally distributed with mean 0, SD 1 Or

33 Confidence interval for the population mean when the sample size is large 100(1-  )% CI for  : where Z  /2 = two-sided 100  percentage point of the standard normal distribution

34 Confidence interval for the population mean when the sample size is small A random sample of size n from normal population Sampling distribution of t-distribution with degree of freedom n-1

35 Confidence interval for the population mean when the sample size is small 100(1-  )% CI for  : where t  /2 = two-sided 100  percentage point of t-distribution with degree of freedom n-1

36 ตัวอย่างที่ 1  When 16 cigarettes of a particular brand were tested in a laboratory for the amount of tar content, it was found that their mean content was 18.3 mg with s=1.8 mg. Set a 90 percent confidence interval for the mean tar content  in the population of cigarettes of this brand.  n=16, =18.3, s =1.8,  = 0.10, degree of freedom =16-1=15, t 15,  /2 = t 15,0.05 = % confidence interval is given by

37 ตัวอย่างที่ 2  In order to estimate the amount of time (min) that a teller spends on a customer, a bank manager decided to observe 64 customers picked at random. The amount of time the teller spend on each customer was recorded It was found that the sample mean was 3.2 min with s 2 =1.44. Find a 98%confidence interval for the mean amount of time .  =3.2, s 2 =1.44, n=64,  = 0.02, Z  /2 = Z 0.01 = % confidence interval for  is given by

38 Confidence interval for  1 -  2 when sample sizes are large n 1, n 2 >50  2 independent large samples of size n 1, n 2 from 2 population with mean  1,  2  X 1 –X 2 is normally distributed with mean  1 -  2,  100(1-  )% CI for  : where Z  /2 = two-sided 100  % point of the standard normal distribution

39 Confidence interval for  1 -  2 when sample sizes are small  100(1-  )% CI for  1 -  2 : t  /2 = two-sided 100  % point of t-distribution with degree of freedom n 1 +n 2 -2

40 ตัวอย่าง  Gorman et al. conducted a study in which the subjects were homosexual men, some of whom were HIV positive and some of whom were HIV negative. Data were collected on a wide variety of medical, immunological, psychiatric, and neurological measures, one of which was the number of CD4+ cells in the blood. The mean number of CD4+ cells for the 112 men with HIV infection was with a standard deviation of For the 75 men without HIV infection the mean and standard deviation were and We wish to construct a 99 percent confidence interval for the difference between population means.

41 เฉลย Point estimate = = % CI for the difference between population means:  =0.01,  /2 =0.005, Z  /2 = Z = 2.58, n 1 =75, n 2 =112, S 1 =274.9, S 2 =226.4

42 Confidence interval for a proportion P for large sample size P = Population proportion = sample proportion 100(1-  )% CI for P : Z  /2 = two-sided 100  % point of the standard normal distribution normal distribution with mean P, r = the number of subjects with a particular condition in a sample

43 Confidence interval for the difference between two proportions (P 1 -P 2 ) For large sample n 1, n 2, 100(1-  )% CI for P 1 -P 2 : Z  /2 = two-sided 100  % point of the standard normal distribution  ˆ 1 ˆˆ 1 ˆ n pp n pp SE    

44 ตัวอย่าง  A survey was conducted to study the dental health practices and attitudes of a certain urban adult population. Of 300 adults interviewed, 123 said that they regularly had a dental check-up twice a year. Construct a 95% confidence interval for the proportion of people in the population who had regular dental check-up.   = 0.05,  /2 = 0.025, Z  /2 = Z = 1.96, n=300, =123/300 = % CI for proportion of people with regular dental check-up [0.41±(1.96 X 0.028)] [0.36,0.46] =0.028

45 ตัวอย่าง  In a survey conducted on a college campus, 48 out of 150 professors were smokers and 114 out of 300 students were smokers. a) Obtain a point estimate of p 1 -p 2 where p 1 is the proportion of smokers among all professors and p 2 the proportion among all students. b) Obtain 95% confidence interval for p 1 -p 2.  a) Point estimate of p 1 -p 2 = (48/150)-(114/300) = = b)  = 0.05, Z  /2 = Z = 1.96, = %CI,

46 แบบฝึกหัด  A sample of 225 adult males had a mean systolic blood pressure of 125 and a sample standard deviation of 30. Find 90% and 95% confidence interval for µ.  The amount of dissolved oxygen content in rivers is an important measure of the quality of water and its ability to support aquatic life. The following reading (mg/l) were obtain when twelve random samples downstream from an industrial region were tested Estimate the true mean content µ using 90% confidence interval.

47 แบบฝึกหัด  Transverse diameter measurements of the hearts of adult males and females gave the following results: Groupsample size (cm) s (cm) male female Construct 90, 95 and 99% confidence intervals for  1 -  2.

48 แบบฝึกหัด 4. In order to test the effectiveness of a flu vaccine, it was administered to 650 people who were selected at random. At the end of the flu season it was determined that 553 of the individuals did not get the flu. Using a 90% confidence interval, estimate the true proportion of people who would not get the flu if given the vaccine. 5. When a surgical procedure was tried on 212 patients, 186 recovered and were able to resume a normal life. Based on this information, obtain a 98% confidence interval for p, the true proportion of patients who would recover and be able to resume a normal life after the surgical procedure.

49 แบบฝึกหัด 6. In a survey conducted in two sections of a large metropolitan area, the following results were obtained with respect to abnormal blood pressure. Area Number of persons screened Number abnormal on screening Construct the 95 and 99% confidence intervals for the difference between the two population proportions.

50 References and Textbook recommended  Wayne W. Daniel. Biostatistics: A Foundation for Analysis in the Health Sciences th edn. John Wiley & Sons Inc. Canada.  Martin Bland. An Introduction to Medical Statistics Oxford University Press, London.  Medical Statistics & Statistical Computing I: Module 6 Estimation. Mathematics Department and Epidemiology Unit, Prince of Songkla University, Thailand. (International Programme for Master’s Degree in Epidemiology).


ดาวน์โหลด ppt ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยู รวงศ์

งานนำเสนอที่คล้ายกัน


Ads by Google