Fundamentals of Statistics for Quality Control

Fundamentals of Statistics for Quality Control
Lecture 2

Statistical Analysis (การวิเคราะห์ทางสถิติ)
Parametric Statistics (การวิเคราะห์แบบอิงพารามิเตอร์) Nonparametric Statistics (การวิเคราะห์แบบไม่อิงพารามิเตอร์) Descriptive Statistics (สถิติเชิงพรรณนา) Graph (กราฟ) Table (ตาราง) Percentage (ร้อยละ) Mean (ค่าเฉลี่ย) Standard Deviation (ค่าเบี่ยงเบนมาตรฐาน) Range (ค่าพิสัย) Inference Statistics (สถิติเชิงอนุมาน) Hypothesis Testing (การทดสอบสมมติฐาน) Confidence Interval (ช่วงความเชื่อมั่น) Regression Analysis (การวิเคราะห์การทดถอย) Analysis of Variance , ANOVA (การวิเคราะห์ความแปรปรวน) การรวบรวมข้อมูลจากประชากร หรือตัวอย่างสุ่ม เพื่อมาตีความหมายหรือนำมาสรุปโดยไม่มีการประมวลผลด้วยการทดสอบทางสถิติ (ความน่าจะเป็น, Law of Probability) การรวบรวมข้อมูลจากการสุ่มตัวอย่างแล้วนำมาผ่านการทดสอบทางสถิติ (ความน่าจะเป็น, Law of Probability) เพื่อใช้อ้างอิงหรือตีความข้อมูลของประชากรทั้งหมด

Descriptive and Inference Statistic
การวัด/measurement การวัด Population ประชากร ชักตัวอย่าง/ Sampling Sample สิ่งตัวอย่าง ข้อมูล ตีความหมาย/interpret ตีความหมาย/interpret Descriptive Statistics Population ประชากร ชักตัวอย่าง/ Sampling Sample สิ่งตัวอย่าง การวัด ข้อมูล ตีความหมาย/interpret Conclusion ข้อสรุป Inference Statistics

ค่าพารามิเตอร์ (Parameter) สามารถจัดแบ่งได้เป็น สองกลุ่ม ดังนี้
Statistics for QC ค่าสถิติ (Statistics ) คือค่าของข้อมูลที่รวบรวมมาจาก การสุ่มตัวอย่าง (Sampling ) ข้อมูลเพียงบางส่วนจากข้อมูลในระบบหรือกระบวนการทั้งหมด ซึ่งในทางสถิติมักจะใช้คำแทนระบบหรือกระบวนการที่สนใจด้วยคำว่า ประชากร ( Population) และเรียกข้อมูลจากการสุ่มตัวอย่างว่า ข้อมูลตัวอย่าง (Sample) ค่าสถิตินั้นได้พัฒนาขึ้นมาเพื่อใช้เป็นค่าประมาณของค่าจริงจากประชากร ซึ่งเรียกว่า ค่าพารามิเตอร์ (Parameter) ค่าพารามิเตอร์นี้เป็นค่าที่ใช้อธิบายลักษณะทั้งหมดที่สำคัญของประชากร ซึ่งจะทราบค่าพารามิเตอร์ได้ทั้งหมดต้องทราบค่าที่เป็นไปได้ทั้งหมดของประชากร หรือทราบการแจกแจงที่แท้จริงของประชากรนั้น ค่าพารามิเตอร์ (Parameter) สามารถจัดแบ่งได้เป็น สองกลุ่ม ดังนี้ ค่าแนวโน้มสู่ค่ากลาง (Central Tendency) 1.1 ค่าเฉลี่ยของประชากร (Population Mean,  ) 1.2 ค่ามัธยฐาน (Median, ) 1.3 ค่าฐานนิยม (Mode, Xmo) ค่าที่ใช้อธิบายความแปรปรวนของระบบ (Variability) 2.1 ค่าเบี่ยงเบนมาตราฐาน (Standard Deviation, S.D. or σ) 2.2 ค่าคลาดเคลื่อนมาตราฐาน (Standard Error ) 2.3 ค่าพิสัยควอไทล์ (Interquartile Range, IQR )

Population Population (ประชากรในเชิงจัดการและบริหาร) ประชารกรในเชิงสถิติหมายถึงสิ่งที่สนใจเพื่อที่จะนำมาใช้ในการตัดสินใจทางสถิติ เช่น ผลิตภัณฑ์ในแต่ละลอตการผลิต รูปแบบการกระจายของประชากรจะมีแน้วโน้มลู่เข้าสู่ค่าที่ควรจะเป็นค่าหนึ่ง () ค่าข้อมูลของประชารกรแต่ละค่าในเชิงสถิติอาจไม่เท่ากัน เป็นอิสระต่อกันและเบี่ยงเบนไปจากค่า  การเบี่ยงเบนนี้มีผลมาจาก สาเหตุสำคัญ 2 ชนิดคือ สาเหตุจากธรรมชาติ (Chance cause หรือCommon cause) และสาเหตุที่ระบุได้ หรือ สาเหตุที่เกิดจากความผิดผลาด (Assignable cause) Man, Machine, Method Processes (กระบวนการ) Products Hardware Service Raw Materials Population (ประชากรในเชิงสถิติ) ε Assignable cause Chance cause x1, x2,…, xn y = f(x1, x2,…, xn) + ε z1 + z2+… +zn = ε

ลักษณะสมบัติของข้อมูลทางสถิติ
Assignable cause (i) x1, x2,…, xn y = i + ε y = f(x1, x2,…, xn) + ε ε z1 + z2+… +zn = ε Chance cause ส่วนประกอบของข้อมูลทางสถิติ = ค่าที่ควรจะเป็นที่ได้จากการเก็บข้อมูล (i) ค่าความเบี่ยงเบนจากตัวแปรที่ไม่สามารถควบคุมได้ (ε)  หมายถึง ค่าที่ควรจะเป็นหรือค่าเฉลี่ยของประชากร i หมายถึง ค่าที่ควรจะเป็นหรือค่าเฉลี่ยของกลุ่มตัวอย่าง i หมายถึง อิทธิพลของตัวแปรที่ได้รับการควบคุม (Controlled Effect) ค่าของข้อมูลทางสถิติหลังจากกำจัดตัวแปรที่ควบคุมได้

Population and Sample Population
Set of all items that possess a characteristic of interest , สมาชิกทั้งหมดของเซ็ตหรือกลุ่มที่เราสนใจทั้งหมด ในเชิงวิศวกรรมอาจหมายถึง กระบวนการผลิต ผลิตภัณฑ์ที่ได้จากการผลิตในแต่ละลอต (Lot) Sample Subset of a population, สมาชิกในเซ็ตหรือกลุ่มที่เราสนใดใจที่ถูกสุมมาเพื่อใช้เป็นตัวแทนของประชากร

Parameter and Statistic
Parameter(s) is a characteristic of a population, i.o.w. it describes a population , เป็นค่าที่ใช้บรรยายลักษณะของประชากร เช่น ค่าเฉลี่ยของประชากร ค่าความแปรปรวนของประชากร Example: average weight of the population, e.g. 50,000 cans made in a month. Statistic(s) is a characteristic of a sample, used to make inferences on the population parameters that are typically unknown, called an estimator, เป็นค่าที่ใช้บอกถึงลักษณะของกลุ่มตัวอย่างและค่าเหล่านี้จะใช้เพื่ออนุมาน หรือประมาณค่า parameter ของประชากร Example: average weight of a sample of 500 cans from that month’s output, an estimate of the average weight of the 50,000 cans.

Comparison of Population & Data
samples Data (from samples) sampling measurement ข้อมูลที่ได้จากกลุ่มตัวอย่างของประชากรหนึ่งๆจะมีลักษณะความเบี่ยงเบนคล้ายกับประชากร และมีค่าแนวโน้มลู่เข้าหาค่าค่าหนึ่ง (ค่าเฉลี่ย)ใกล้เคียงกับค่าเฉลี่ยของประชากร ดังนั้นกลุ่มตัวอย่างอาจถูกนำมาใช้เป็นตัวแทนของประชากรเพื่อบอกคุณสมบัติหรือใช้ประมาณค่า parameter ของประชากร อย่างไรก็ตามในการควบคุมคุณภาพของการผลิต การที่กลุ่มตัวอย่างจะสามารถถูกนำมาใช้เพื่อเป็นตัวแทนของประชากรได้นั้นจะขึ้นอยู่กับ the size of the sample, sampling method, condition of processing

Precision and Accuracy of measurement system(ความแม่นยำ และความถูกต้องของระบบวัด)
True value High precision = Repeatability Low accuracy= Bias (small ε) High precision = Repeatability High accuracy= No Bias (small ε) Precision = a measure of the inherent variability in measurement system Accuracy = the ability of the instrument to measure the true value correctly on average bias Low precision = Low repeatability Accuracy = Bias (large ε) Low precision = Low repeatability Low accuracy = Bias (large ε) bias

Central Tendency (ค่าแนวโน้มสู่ค่ากลาง )
xi N ; ประไพศรี และ พงศ์ชนัน, สถิติวิศวกรรม, 2551

Central Tendency (ค่าแนวโน้มสู่ค่ากลาง )
ประไพศรี และ พงศ์ชนัน, สถิติวิศวกรรม, 2551

Questions (A) 1. ในสถานการณ์การทำงานในดรงงานแห่งหนึ่งทำการผลิตเหล็กเส้นสำหรับงานก่อสร้าง เจ้าหน้าที่ QC ทำการสรุปข้อมูลที่ได้จากพนักงานกะกลางคืนที่ทำการสุ่มวัดค่า Yield Strength ของตัวอย่างเหล็กเส้น 15 ชิ้น จาก 100 ชิ้น ในล็อตเดียวกัน มาขอคำแนะนำจาก วิศวกร (SUT) โดยข้อมูลที่สรุปได้มีดังนี้ MEAN MEDIAN MODE GPa 265 GPa 260 GPa MEAN MEDIAN MODE MPa 265 MPa 260 MPa ในกรณีที่ท่านทราบว่า specification ของผลิตภัณฑ์มีค่าอยู่ในช่วง MPa ท่านคิดว่าข้อมูลนี้น่าเชื่อถือหรือไม่ ถ้าไม่ท่านจะดำเนินการวิเคราะฆ์ข้อมูลเบื้องต้นอย่างไร (Excel) ประไพศรี และ พงศ์ชนัน, สถิติวิศวกรรม, 2551

Variability (ค่าที่ใช้อธิบายความแปรปรวนของระบบ )
และค่า Standard Deviation คือ ประไพศรี และ พงศ์ชนัน, สถิติวิศวกรรม, 2551

Variability (ค่าที่ใช้อธิบายความแปรปรวนของระบบ )
(Excel) ประไพศรี และ พงศ์ชนัน, สถิติวิศวกรรม, 2551

Questions จงอธิบายถึงความแตกต่างระหว่างสถิติเชิงพรรณนา กับ สถิติเชิงอนุมาน และยกตัวอย่าง จงอธิบายความหมายของประชากร และกลุ่มตัวอย่างในมุมมองของงาน Quality Control สาเหตุที่ทำให้ค่าข้อมูลของประชากรหรือกลุ่มตัวอย่างเบี่ยงเบนไปจากค่าที่ควรจะเป็น จงอธิบายถึงความแตกต่างระหว่างความเบี่ยงเบนเนื่องจากสาเหตุธรรมชาติ และจากสาเหตุความผิดผลาด ในการปรับปรุงคุณภาพความเบี่ยงเบนชนิดใดที่เราต้องควบคุม จงอธิบายถึงความหมายและความแตกต่างระหว่าง Precision (ความแม่นยำ) และ Accuracy (ความถูกต้อง) ของระบบการวัดและ ให้แสดงความคิดเห็นว่าความและแม่นยำความถูกต้องของระบบวัดจะมีผลต่อการควบคุมคุณภาพอย่างไร The measuring system is accurate if the average the series of measurements is close to the true value. The measuring system is precise if the series of repeated measurements close together. The measurement system exhibits both accuracy and precision when the series of repeated measurements are tightly grouped around the true value.

Statistical Data Analysis (for samples)
After sampling (collect data from production lot), data dispersion will be considered to evaluate the quality of data. หลังจากทำการสุ่มตัวอย่างเก็บข้อมูลจากลอตการผลิต รูปแบบการกระจายของข้อมูลจะถูกนำมาประเมิณคุณภาพของข้อมูล Data dispersion can be analyzed by using statistical parameters: Range Interquartile Range Mean Absolute Deviation Root Mean Square Standard deviation Coefficient of Variation Capability Index In addition, data dispersion can be evaluated by considering the pattern of dispersion using Skewness Kurtosis Normal Probability Paper (NOPP)

Range (ค่าพิสัย) R = Xmax – Xmin
R is Range, Xmax and Xmin is maximum and minimum value of data respectively. เนื่องจากค่า Range คำนวณจากเฉพาะค่าสูงสุดและต่ำสุดของชุดข้อมุลเท่านั้น ดังนั้น ค่า Range จึงเหมาะสมกับการใช้วัดความเบี่ยงเบนของข้อมูลที่มีจำนวณไม่มากนัก (ไม่เกิน10 ตัว)* * กิตติ พลอยพานิชเจริญ, สถิติสำหรับงานวิศวกรรม, 2540

Interquartile Range, IQR (พิสัยระหว่างควอไตล์)
IQR = Q3 – Q1 Q3 and Q1 is 75th and 25th percentile (or Q3 = P75 and Q1 = P25) of data respectively. ( 75th percentile หมายถึงค่าของข้อมูลมีค่ามากกว่า 75เปอร์เซนต์ของข้อมูลทั้งหมด) Note ค่าความเบี่ยงเบนจาก IQR จะพิจารณาเฉพาะข้อมูลกลุ่มใหญ่ที่มีข้อมูลกลุ่มใหญ่ที่มีปริมาณความถี่ 50% รอบค่ากลางเท่านั้น ดั้งนั้น IQR จะมีความไวต่อค่าข้อมูลที่สูงมากและต่ำมากผิดปกติ(Extreme Value) น้อยกว่าค่าพิสัย

Supplement for percentile calculation
Estimation of percentiles (1) Percentiles can be estimated from N measurements as follows: for the pth percentile, set p(N+1) equal to k + d for k an integer (เลขจำนวนเต็ม), and d (ทศนิยม), a fraction greater than or equal to 0 and less than 1. 1. For 0 < k < N, Y(p) = Y[k] + d(Y[k+1] - Y[k]); โดย Y(p) คือค่าข้อมูลที่ Percentile ที่ p, และY[k] คือค่าข้อมูลที่ Percentile ที่ k 2. For k = 0, Y(p) = Y[1] 3. For k = N, Y(p) = Y[N] (2) Some software packages (EXCEL, for example) set 1+p(N-1) equal to k + d, then proceed as above. (วิธีการคำนวณค่า Percentile ของ EXCEL) (3) A third way of calculating percentiles starts by calculating pN (p คูณ N). If pN is not an integer (เลขจำนวนเต็ม), round up (ปัดค่าทศนิยมขึ้นเป็นจำนวนเต็ม) to the next highest integer k and ,percentile Y(p) = Y[k] as the percentile estimate. If pN is an integer k, use Y(p) = 5(Y[k] +Y[k+1]). example

Mean Absolute Deviation, MAD (ความเบี่ยงเบนสมบูรณ์โดยเฉลี่ย)
Note แนวความคิดของการคำนวน Deviation นำค่าข้อมูลทุกตัวมาคำนวน พิจารณาการกระจายรอบค่าที่ควรจะเป็นของข้อมูล แนวความคิดของการคำนวน Range - นำเฉพาะค่าข้อมูลตัวที่มีค่ามากและต่ำสุดมาคำนวน

Root Mean Square, RMS (รากที่สองของมัชฌิมากำลังสอง)

Standard Deviation, SD (ความเบี่ยงเบนมาตรฐาน)
If  is the mean of population which we do not know, we can estimate  from the mean of samples ( ). ค่าเฉลี่ยของประชากร() อาจประมาณได้จากค่าเฉลี่ยของกลุ่มตัวอย่าง ( ) Note องศาแห่งความอิสระ (degree of freedom)คือจำนวนข้อมูลของกลุ่มตัวอย่างที่ถูกนำมาใช้ในการ อนุมาน(ประมาณ) ค่าเบี่ยงเบนของประชากร

Coefficient of Variation, COV (สัมประสิทธิ์แห่งความผันแปร)
Data set A: Data set B: ? ? 18.05% ? ? 6.82% Note COV เหมาะสมสำหรับการเปรียบเทียบการกระจายของข้อมูลที่มีฐานคะแนนที่แตกต่างกัน

Capability Index, Cp, Cpk (ดัชนีแสดงความสามารถ)
ความคลาดเคลื่อนที่ยอมให้เกิด (Tolerance of specification) LSL = 50 USL = 100 Cp = Cpk = 1.67 SD= 5 Cp = ? Cpk = ? SD= 5 ความเบี่ยงเบนของประชากรหรือกลุ่มตัวอย่าง Cp = ? Cpk = ? SD= 5 Cpk = ค่าที่ต่ำที่สุดระหว่าง Cpuและ Cplโดยค่าทั้งสองนี้หาได้จาก

xn หมายถึงค่าของข้อมูลลำดับที่ n
Skewness (ความเบ้) Negative skewed distribution Skew to the Left x[(n+1)/2] if n is an odd number (เลขคี่) (x(n/2) + x(n/2)+1)/2 if n is an even number (เลขคู่) xn หมายถึงค่าของข้อมูลลำดับที่ n Normal distribution Positive skewed distribution Skew to the Right

Kurtosis (ความโด่ง) โด่ง แบนราบ
* กิตติ พลอยพานิชเจริญ, สถิติสำหรับงานวิศวกรรม, 2540

HW จงอธิบายแนวความคิดที่แตกต่างกันของการวัดค่าการกระจายของข้อมูลด้วยหลักการของพิสัย (Rang) และหลักการของความเบี่ยงเบน (Deviation) หลักการสำคัญของการวัดค่าการกระจายของข้อมูลด้วยค่าความเบี่ยงเบนมาตรฐาน (Standard Deviation) และส.ป.ส.แห่งความแปรผัน (Coefficient of Variation) มีความแตกต่างกันอย่างไร ดัชนีความสามารถของกระบวนการทั้ง Cp และ Cpk มีประโยชน์อย่างไรในการวิเคราะห์ค่าการกระจายของข้อมูล ตลอดจนมีความแตกต่างประการใดกับค่าส.ป.ส.แห่งความแปรผัน COV

HW ข้อมูลข้างล่างแสดงค่าจากการวัดเส้นผ่านศูนย์กลางของงานประเภทหนึ่ง (หน่วยเป็นมิลลิเมตร) คำนวนค่า MAD, RMS, SD และอธิบายความหมาย คำนวนค่าความเบ้ และความโด่งพร้อมทั้งอธิบายรูปทรงของการกระจายของข้อมูล คำนวนหาค่าเฉลี่ย ค่ามัธยฐาน และค่าฐานนิยมของข้อมูล และอธิบายความหมาย ถ้าหากข้อกำหนดเฉพาะ (specification) ของเส้นผ่านศูนย์กลางของงานอยู่ที่ มิลลิเมตรแล้ว ให้คำนวนหาค่า Cp, Cpkพร้อมทั้งตีความหมาย (LSL = 105.5, USL = 106.5) 106.2 105.9 105.8 106.1 107.1 106.5 106.3

Normal Probability Paper (NOPP) (กราฟทดสอบการแจกแจงแบบปกติ)
Accumulative Freq. 50% Normal distribution Freq. How to plot a graph on NOPP Rearrange the data in ascending or descending order (จัดเรียงข้อมูลตามลำดับน้อยไปหามากหรือมากไปน้อยก็ได้) Calculate accumulative percentage by using this equation: (หาค่าเปอร์เซนต์หรือความถี่สะสม) Use the data to plot the curve on NOPP (สร้างกราฟบน NOPP) If the plotting result is a straight line, data dispersion is normal distribution (ถ้ากราฟที่ได้ป็นเส้นตรงแสดงว่าข้อมูลมีการแจกแจงแบบปกติ)

การใช้ NOPP สำหรับข้อมูลจำนวนน้อย
ในการศึกษาถึงความสามารถในการวัดซ้ำ หรือ Repeatability (ซึ่งเป็นส่วนหนึ่งของ Gauge Repeatability & Reproducibility or Gauge R&R ) ของเพลาชิ้นหนึ่งซึ่งมีเส้นผ่านศูนย์กลาง ซ.ม. ได้ผลดังนี้ (use Excel to prepare) ให้พิจารณาว่าข้อมูลที่ได้ดังกล่าวมีการแจงแบบปกติหรือไม่ ถ้าใช่ ท่านคิดว่าระบบการวัดนี้น่าเชื่อถือได้หรือไม่ ถ้าไม่ อะไรที่ท่านคิดว่าน่าจะเป็นสาเหตุ Note: There are two important aspects on a Gauge R&R: Repeatability, Repeatability is the variation in measurements taken by a single person or instrument on the same item and under the same conditions. Reproducibility, the variability induced by the operators. It is the variation induced when different operators (or different laboratories) measure the same part.

การใช้ NOPP สำหรับข้อมูลจำนวนมาก
ข้อมูลจากการวัดความกว้างของช่องว่าง (Gap Width) ของหัวบันทึกข้อมูล (Magnetic Recording Head) แสดงไว้ดั้งนี้ * (use Excel) 1.39 1.40 1.60 1.41 1.43 1.46 1.30 1.50 1.34 1.47 1.56 1.35 1.52 1.51 1.25 1.55 1.59 1.66 1.61 1.32 1.48 1.38 1.33 1.57 1.20 1.65 1.42 1.29 1.69 1.62 1.24 1.58 * กิตติ พลอยพานิชเจริญ, สถิติสำหรับงานวิศวกรรม, 2540

Fundamentals of Statistics for Quality Control

งานนำเสนอที่คล้ายกัน

งานนำเสนอเรื่อง: "Fundamentals of Statistics for Quality Control"— ใบสำเนางานนำเสนอ:

งานนำเสนอที่คล้ายกัน

เรื่องโครงการ

การติดต่อกลับ

เข้าสู่ระบบ

ลงทะเบียนผ่านเครือข่ายสังคม:

Fundamentals of Statistics for Quality Control

งานนำเสนอที่คล้ายกัน

งานนำเสนอเรื่อง: "Fundamentals of Statistics for Quality Control"— ใบสำเนางานนำเสนอ:

งานนำเสนอที่คล้ายกัน

เรื่องโครงการ

การติดต่อกลับ