Measures of Central Tendency & Measures of Spread or Variation

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
Texture การประมวลผลภาพแบบดิจิตอล Ian Thomas
Advertisements

Chapter 8: Interval Estimation
การวิเคราะห์ข้อมูลโดยสถิติเชิงพรรณนา (Descriptive Statistics)
(Statistical Package for the Social Sciences : SPSS)
Probability & Statistics
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
สถิติในการวัดและประเมินผล
การทดสอบความแปรปรวน ANOVA
Confidence Interval Estimation (การประมาณช่วงความเชื่อมั่น)
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล คณะ กายภาพบำบัด ข้อมูล ณ วันที่ 30 กันยายน 2557.
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล คณะสาธารณสุข ศาสตร์ ข้อมูล ณ วันที่ 30 กันยายน 2556.
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล สถาบันนวัตกรรม การเรียนรู้ ข้อมูล ณ วันที่ 30 กันยายน 2557.
การใช้งานโปรแกรม SPSS
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล สถาบันวิจัย ประชากรและสังคม ข้อมูล ณ วันที่ 30 กันยายน 2557.
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล คณะสาธารณสุข ศาสตร์ ข้อมูล ณ วันที่ 30 กันยายน 2557.
หลักการ เบื้องต้น ของการใช้สถิติ คณะเทคโนโลยีอุตสาหกรรมมหาวิทยาลัยราชภัฏสกลนคร.
ปริมาณสัมพันธ์ ผู้สอน อ. ศราวุทธ แสงอุไร Composition Stoichiometry ว ปริมาณสัมพันธ์ สถานะของ สาร และเคมีไฟฟ้า นายศราวุทธ แสงอุไร ครูวิชาการสาขาเคมี
ครูวิชาการสาขาเคมี โรงเรียนมหิดลวิทยานุสรณ์
กลุ่ม rraid. What's your name. คุณชื่ออะไร = Miss Bangon Buntanoom How old are you. - คุณอายุเท่าไหร่ = Ages 36 Years What you have finished your course.
การกระจายอายุของบุคลากร มหาวิทยาลัยมหิดล วิทยาลัยนานาชาติ ข้อมูล ณ วันที่ 30 กันยายน 2556.
 The nonconformities chart controls the count of nonconformities ( ข้อบกพร่อง หรือตำหนิ ) within the product or service.  An item is classified as a.
TEST FOR 3RD GRADERS IN THAILAND: COMPARATIVE STUDY Pimlak Moonpo Valaya Alongkorn Rajabhat University under the Patronage Assoc. Prof. Dr. Maitree Inprasitha.
Model development of TB active case finding in people with diabetes.
Eigenvalue & Eigenvector. 1. Get to know: Eigenvalue & Eigenvector 2. Estimation of Eigenvalue & Eigenvector 3. Theorem.
การเลือกข้อมูลจาก List การกำหนดเงื่อนไขการป้อนข้อมูลด้วย Data Validation การใส่ Comment / แสดง / แก้ไข / ลบ.
สถิติเบื้องต้นในการวัดผลและประเมินผลการศึกษา
สถิติเบื้องต้นสำหรับการวิเคราะห์ข้อมูล
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
การวิเคราะห์ข้อมูล ดร. นพ. วรสิทธิ์ ศรศรีวิชัย
The Hypergeometric Distribution
การวัด และเลขนัยสำคัญ
ISC2102 สถิติเพื่อการวิเคราะห์ข้อมูล
Chapter 2- Fundamentals of Statistics for Quality Control
Fundamentals of Statistics for Quality Control
สถิติและการวัดทางระบาดวิทยาที่ควรรู้
รูปแบบการเขียนบทที่ 3.
1. นี่เป็นสิ่งที่พระเยซูทรงทำ พระองค์ทรงรักษาทุกคน ที่เจ็บป่วยให้หายดี
รายวิชาชีวสถิติ (Biostatistics)
Important probability distribution of variable
สถิติที่ใช้ในงาน การวิจัยเชิงปริมาณ
บทที่ 7 การสุ่มตัวอย่าง.
Fundamentals of Statistics for Quality Control
Multistage Cluster Sampling
สถิติเพื่อการวิจัยและ วิเคราะห์ข้อมูลเชิงปริมาณ
บทที่ 11 สถิติเชิงสรุปอ้างอิง
บทที่ 10 สถิติเชิงบรรยาย
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
บทที่ 5 หลักการประมาณค่าและการทดสอบสมมติฐาน
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
การเลือกใช้สถิติเพื่อการวิจัย
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
ผศ.ดร. รัชนี มุขแจ้ง คณะบริหารธุริจ เศรษฐศาสตร์ และการสื่อสาร ภาควิชาเศรษฐศาสตร์ มหาวิทยาลัยนเรศวร.
(การสุ่มตัวอย่างเพื่อการยอมรับ)
Chapter 3: Measures of Central Tendency and Measure of Dispersion
การดูแลผู้สูงอายุระยะยาว ในบริบทกรมแพทย์ทหารเรือ
ดร.นพ.วรสิทธิ์ ศรศรีวิชัย มูลนิธิสุขภาพภาคใต้
หลัก MAX MIN CON การออกแบบแผนการวิจัยเชิงทดลอง
การสร้างแบบสอบถาม และ การกำหนดเงื่อนไข.
Probability and Statistics for Computing
BASIC STATISTICS MEAN / MODE / MEDIAN / SD / CV.
“เคลื่อนไปสู่ชีวิตใหม่ ตอนที่ 2” Moving Into the Newness of Life
บทที่ 7 การประมวลผลอาร์เรย์
การเลือกใช้สถิติเพื่อการวิจัย
Control Charts for Count of Non-conformities
ค่ารูรับแสง - F/Stop ค่ารูรับแสงที่มีค่าตัวเลขต่ำใกล้เคียง 1 มากเท่าไหร่ ค่าของรูรับแสงนั้นก็ยิ่งมีความกว้างมาก เพราะเราเปรียบเทียบค่าความสว่างที่ 1:1.
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
งานวิจัย.
Chapter 3: Measures of Central Tendency and Measure of Dispersion
ใบสำเนางานนำเสนอ:

Measures of Central Tendency & Measures of Spread or Variation ค่ากลางและการกระจาย Measures of Central Tendency & Measures of Spread or Variation ณัฐพร ยูรวงศ์

Measures of Central Tendency 1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean) นำค่าข้อมูลที่ได้ทั้งหมดมารวมกัน หารด้วยจำนวนข้อมูลทั้งหมด ค่าเฉลี่ยของตัวอย่าง ค่าเฉลี่ยของประชากร  x

ตัวอย่าง จงหาค่าเฉลี่ยของอายุของนักศึกษาป.โท ทันตสาธารณสุข x =

การหาค่าเฉลี่ยกรณีข้อมูลเป็นกลุ่ม (Grouped data) k = จำนวนชั้นความถี่ xi = จุดกึ่งกลางชั้น fi = ความถี่ของชั้น

ตัวอย่าง จงหาค่าเฉลี่ยของอายุจากข้อมูลในตาราง 10-19 4 14.5 58.0 Class interval Class frequency(fi ) Class midpoint(xi) fixi 10-19 4 14.5 58.0 20-29 66 24.5 1617.0 30-39 47 34.5 1621.5 40-49 36 44.5 1602.0 Total

แทนค่าในสูตร = 32.0

2. มัธยฐาน (Median) เป็นค่าที่อยู่ในตำแหน่งกึ่งกลางของข้อมูลที่เรียงลำดับจากมากไปน้อย หรือน้อยไปมาก ค่า median จะแบ่งข้อมูลเป็นสองส่วนเท่าๆกัน ข้อมูลครึ่งหนึ่งมีค่าสูงกว่า median และอีกครึ่งหนึ่งมีค่าต่ำกว่า median การหาค่า median เรียงลำดับข้อมูลจากน้อยไปมาก หรือ มากไปน้อย ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) ค่าของข้อมูลที่ตำแหน่งกึ่งกลาง จะเป็นค่า median ถ้าจำนวนข้อมูลเป็นเลขคู่(even) ค่าเฉลี่ยของค่าของข้อมูลที่อยู่ 2 ตำแหน่งตรงกลาง จะเป็นค่า median

2. มัธยฐาน (Median) ต่อ ตัวอย่าง data set 10, 54, 21,33,35 เรียงลำดับข้อมูล 10,21,33,35,54 Median = 33 ตัวอย่าง data set 10, 54,21,33,35,53 เรียงลำดับข้อมูล 10,21,33,35,53,54 Median = (33+35)/2=34

ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) 2. มัธยฐาน (Median) ต่อ ถ้าจำนวนข้อมูลเป็นเลขคี่ (odd) Median = ค่าที่ตำแหน่ง((n+1)/2) ถ้าจำนวนข้อมูลเป็นเลขคู่(even) Median = ค่าที่ตำแหน่ง(n/2)+ ค่าที่ตำแหน่ง((n/2)+1)) 2

3. ฐานนิยม (Mode) เป็นค่าของข้อมูลที่มีความถี่สูงสุด อาจมีได้หลายค่าถ้ามีความถี่เท่ากัน หรือ อาจไม่มีค่าmode ก็ได้ ตัวอย่าง หาค่า mode จากข้อมูลอายุ 3 ชุด 15,21,34,15,30,15,20,35,51,15 20,21,20,20,34,22,24,27,27,27 10,21,33,53,54,20,22,50,12,16

Which to use? ดู distribution of data Measurement scale Central tendency nominal scale mode ordinal scale mode, median* interval scale ratio scale mode, median, mean ดู distribution of data

1. Symmetric distribution Mean Median Mode

2. Distribution of data is skewed 2.1 Skewed to the left (เบ้ซ้าย) 2.2 Skewed to the right (เบ้ขวา) Mode Median Mean If the distribution of data is skewed, the median is a better descriptive measure than the mean.

การวัดการกระจาย (Measures of Spread /Variation/Dispersion) พิสัย (Range) ค่าความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดและข้อมูลที่มีค่าต่ำสุด Range= Maximum-Minimum ตัวอย่าง หาค่า range ของอายุของนักศึกษาป.โททันตสาธารณสุข Range = Maximum-Minimum=

2. Interquartile range เป็นค่าพิสัยของ quartile ที่ 1 กับ 3 (Q1-Q3) การหา interquartile range เรียงลำดับข้อมูลทั้งหมด แบ่งข้อมูลเป็นสี่ส่วนเท่าๆกัน Q1 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ25 มีค่าต่ำกว่านี้ Q2 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ50 มีค่าต่ำกว่านี้ =median Q3 = ค่าของข้อมูลที่มีจำนวนข้อมูลร้อยละ75 มีค่าต่ำกว่านี้

สูตรหาตำแหน่ง Percentile Rk = k/100 x (n+1) k = ลำดับที่ของ percentile n = จำนวนข้อมูลทั้งหมด เช่น R25 =(25/100)x (100+1) = 25.25 P25 or Q1=ค่าของข้อมูลตำแหน่งที่ 25.25 R75=(75/100)x (100+1) = 75.75 P75 or Q3=ค่าของข้อมูลตำแหน่งที่ 75.75

3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ơ2= Population variance (ความแปรปรวนของประชากร) S2= sample variance (ความแปรปรวนของตัวอย่าง) Sum of squares Degree of freedom

3. ความแปรปรวน (Variance) และส่วนเบี่ยงเบนมาตรฐาน (standard deviation) standard deviation= SD or S หรือ

สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation) Coefficient of variation (cv)

สัมประสิทธิ์ของความแปรปรวน (Coefficient of variation) ตัวอย่าง เปรียบเทียบการกระจายของข้อมูลน้ำหนัก (กก.)และส่วนสูง (ซม.)ของ นักศึกษาป.โททันตสาธารณสุข CV น้ำหนัก = CV ส่วนสูง = สรุป ค่าสัมประสิทธิ์ของความแปรปรวนของข้อมูล______ มีค่าสูงกว่าค่า สัมประสิทธิ์ของความแปรปรวนของข้อมูล________

แบบฝึกหัด หาค่า S2 , SD และ CV ของข้อมูลที่ให้ 4, 5, 6, 7, 8, 9, 10 Xi Xi – mean (Xi – mean)2 4 5 6 7 8 9 10 Mean = 49/7 = 7, S2 = 28/(7-1) = 4.67 SD = 2.16 , CV = 2.16/7 =0.31

การประมาณค่า Estimation ณัฐพร ยูรวงศ์

Inferential statistics ข้อมูลประชากร : ค่าพารามิเตอร์ (parameter) การหาค่าสถิติ เพื่อนำไปใช้ประมาณค่าพารามิเตอร์ statistic infer Parameter

การประมาณค่า 4.5 เป็น point estimate of  ทำได้ 2 วิธี การประมาณค่าแบบค่าเดียว (Point estimation) เป็นการนำค่าสถิติเพียงค่าเดียวที่ได้จากตัวอย่างไปประมาณค่า parameter ของประชากร เช่น sample mean population mean  sample size 4 2, 3, 5, 8 x x=4.5 4.5 เป็น point estimate of 

การประมาณค่า 2. การประมาณแบบช่วง (Interval estimation) เป็นการนำค่าสถิติที่ของตัวอย่างไปประมาณค่า parameter ของประชากร ใน ลักษณะเป็นช่วง Estimates vary from one sample to another Variation : sampling distribution of the estimator

Brief on sampling distribution Probability distribution of sample mean or proportion (estimator) The distribution of the sample mean x of a random sample drawn from practically any population with mean µ and variance ơ2 can be approximated by means of a normal distribution with mean µ and variance ơ2/n, provided the sample size is large. When the sample size is large, the distribution of is close to that of the standard normal variable Z. *To convert to Z-scale, the rule is: subtract the mean and divided by the SD of the random variable in question

Be useful to specify an interval to include  Sample mean (Estimate of ) x Single sample Close? Be useful to specify an interval to include  ช่วงของการประมาณนี้ เรียกว่า confidence interval

ความหมายของช่วงเชื่อมั่น (Confidence interval or CI) If we take 100 samples of size n, 95 of them will have sample mean within a distance of 1.96s/ from the population mean . For about 95 percent of all possible samples of size n, the population mean  must be greater than and less than .

ปัจจัยที่มีผลต่อขนาดความกว้างของช่วงประมาณ ในการประมาณค่าที่ต้องการ ให้ช่วงประมาณมีความเชื่อมั่นสูงๆ ช่วงประมาณจะกว้างมากขึ้นตามระดับความเชื่อมั่นที่สูงขึ้น ตัวอย่าง x = 68.2, SD = 7.7, n = 120 90% CI of  [67.0, 69.4] 95% CI of  [66.8, 69.6] 99% CI of  [66.3, 70.0]

ปัจจัยที่มีผลต่อขนาดความกว้างของช่วงประมาณ 2. ขนาดของความคลาดเคลื่อนมาตรฐานการแจกแจงของ x (standard error or SE) standard error : variability of sample mean ขนาดของ SE ขึ้นอยู่กับ ขนาดตัวอย่าง ขนาดตัวอย่างใหญ่ SE เล็กลง ช่วงเชื่อมั่นแคบลง ตัวอย่าง x = 51.1, ơ = 10.2 n = 20 90% CI of  [46.6, 55.6] n = 50 95% CI of  [48.2, 54.0] n = 120 99% CI of  [49.3, 52.9] สรุป: ขนาดตัวอย่างมีความสำคัญต่อการประมาณค่า ช่วงเชื่อมั่นที่แคบแสดงถึงความเที่ยง(precision)ของการประมาณค่าสูง

Standard error of mean and standard deviation of sample The variation of measurements between individuals within the sample SD SE : variability of sample mean If comparing sample means (e.g. from different populations) then it is appropriate to use SE.

Confidence interval for the population mean when the sample size is large For large n (n>100), normally distributed with mean 0, SD 1 Or

Confidence interval for the population mean when the sample size is large 100(1-)% CI for  : where Z/2= two-sided 100 percentage point of the standard normal distribution

Confidence interval for the population mean when the sample size is small A random sample of size n from normal population Sampling distribution of t-distribution with degree of freedom n-1

Confidence interval for the population mean when the sample size is small 100(1-)% CI for  : where t/2= two-sided 100 percentage point of t-distribution with degree of freedom n-1

ตัวอย่างที่ 1 When 16 cigarettes of a particular brand were tested in a laboratory for the amount of tar content, it was found that their mean content was 18.3 mg with s=1.8 mg. Set a 90 percent confidence interval for the mean tar content  in the population of cigarettes of this brand. n=16, =18.3, s =1.8,  =0.10, degree of freedom =16-1=15, t15,/2= t15,0.05= 1.753 90 % confidence interval is given by

ตัวอย่างที่ 2 In order to estimate the amount of time (min) that a teller spends on a customer, a bank manager decided to observe 64 customers picked at random. The amount of time the teller spend on each customer was recorded It was found that the sample mean was 3.2 min with s2 =1.44. Find a 98%confidence interval for the mean amount of time . =3.2, s2 =1.44, n=64,  =0.02, Z/2= Z0.01= 2.33 98 % confidence interval for  is given by

Confidence interval for 1- 2 when sample sizes are large n1, n2 >50 2 independent large samples of size n1, n2 from 2 population with mean 1, 2 X1 –X2 is normally distributed with mean 1-2 , 100(1-)% CI for  : where Z/2= two-sided 100 % point of the standard normal distribution

Confidence interval for 1- 2 when sample sizes are small 100(1-)% CI for 1- 2 : t/2= two-sided 100 % point of t-distribution with degree of freedom n1+n2-2

ตัวอย่าง Gorman et al. conducted a study in which the subjects were homosexual men, some of whom were HIV positive and some of whom were HIV negative. Data were collected on a wide variety of medical, immunological, psychiatric, and neurological measures, one of which was the number of CD4+ cells in the blood. The mean number of CD4+ cells for the 112 men with HIV infection was 401.8 with a standard deviation of 226.4. For the 75 men without HIV infection the mean and standard deviation were 828.2 and 274.9. We wish to construct a 99 percent confidence interval for the difference between population means.

99% CI for the difference between population means: เฉลย  =0.01, /2 =0.005, Z/2= Z0.005= 2.58, n1=75, n2=112, S1=274.9, S2=226.4 Point estimate = 828.2-401.8 = 426.4 99% CI for the difference between population means:

Confidence interval for a proportion P for large sample size P = Population proportion = sample proportion 100(1-)% CI for P : normal distribution with mean P, r = the number of subjects with a particular condition in a sample Z/2= two-sided 100 % point of the standard normal distribution

Confidence interval for the difference between two proportions (P1-P2) For large sample n1, n2, 100(1-)% CI for P1-P2 : ( ) 2 1 ˆ n p SE - + = Z/2= two-sided 100 % point of the standard normal distribution

ตัวอย่าง A survey was conducted to study the dental health practices and attitudes of a certain urban adult population. Of 300 adults interviewed, 123 said that they regularly had a dental check-up twice a year. Construct a 95% confidence interval for the proportion of people in the population who had regular dental check-up.  =0.05, /2 =0.025, Z/2= Z0.025= 1.96, n=300, =123/300 =0.41 95% CI for proportion of people with regular dental check-up [0.41±(1.96X 0.028)] [0.36,0.46] =0.028

ตัวอย่าง In a survey conducted on a college campus, 48 out of 150 professors were smokers and 114 out of 300 students were smokers. a) Obtain a point estimate of p1-p2 where p1 is the proportion of smokers among all professors and p2 the proportion among all students. b) Obtain 95% confidence interval for p1-p2. a) Point estimate of p1-p2 = (48/150)-(114/300) =0.32-0.38 = -0.06 b)  =0.05, Z/2= Z0.025= 1.96, = 0.0473 95%CI,

แบบฝึกหัด A sample of 225 adult males had a mean systolic blood pressure of 125 and a sample standard deviation of 30. Find 90% and 95% confidence interval for µ. The amount of dissolved oxygen content in rivers is an important measure of the quality of water and its ability to support aquatic life. The following reading (mg/l) were obtain when twelve random samples downstream from an industrial region were tested. 7.13 6.68 6.14 6.39 5.14 5.28 4.47 5.75 7.05 4.78 6.79 5.67 Estimate the true mean content µ using 90% confidence interval.

แบบฝึกหัด Transverse diameter measurements of the hearts of adult males and females gave the following results: Group sample size (cm) s (cm) male 12 13.21 1.05 female 9 11.00 1.01 Construct 90, 95 and 99% confidence intervals for 1- 2.

แบบฝึกหัด 4. In order to test the effectiveness of a flu vaccine, it was administered to 650 people who were selected at random. At the end of the flu season it was determined that 553 of the individuals did not get the flu. Using a 90% confidence interval, estimate the true proportion of people who would not get the flu if given the vaccine. 5. When a surgical procedure was tried on 212 patients, 186 recovered and were able to resume a normal life. Based on this information, obtain a 98% confidence interval for p, the true proportion of patients who would recover and be able to resume a normal life after the surgical procedure.

แบบฝึกหัด 6. In a survey conducted in two sections of a large metropolitan area, the following results were obtained with respect to abnormal blood pressure. Area Number of persons screened Number abnormal on screening 1 200 20 2 250 38 Construct the 95 and 99% confidence intervals for the difference between the two population proportions.

References and Textbook recommended Wayne W. Daniel. Biostatistics: A Foundation for Analysis in the Health Sciences. 1995. 6th edn. John Wiley & Sons Inc. Canada. Martin Bland. An Introduction to Medical Statistics. 1991. Oxford University Press, London. Medical Statistics & Statistical Computing I: Module 6 Estimation. Mathematics Department and Epidemiology Unit, Prince of Songkla University, Thailand. (International Programme for Master’s Degree in Epidemiology).