ดาวน์โหลดงานนำเสนอ
งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ
1
การวิเคราะห์จำแนกกลุ่ม (Discriminant Analysis)
ดร.บุญเรือง ศรีเหรัญ
2
การวิเคราะห์จำแนกกลุ่ม : DA
Discriminant Analysis คำในภาษาไทยที่ใช้ เช่น การวิเคราะห์จัดกลุ่ม การวิเคราะห์จัดจำแนก การวิเคราะห์จำแนกประเภท การวิเคราะห์จำแนกกลุ่ม ฯลฯ การวิเคราะห์จำแนกกลุ่ม : DA
3
สถิติเป็นเครื่องมือที่ใช้เพื่อการจัดกระทำข้อมูลให้มีความหมายตามข้อกำหนดของสถิติที่ใช้
การใช้เครื่องมือใดๆ ผู้ใช้ต้องมีความรู้ต่อไปนี้ รู้จักเครื่องมือที่จะใช้ รู้ว่าเครื่องมือนั้นใช้ทำอะไร รู้ว่าเครื่องมือนั้นใช้อย่างไร รู้ผลที่จะเกิดขึ้นจากการใช้เครื่องมือนั้น
4
ประวัติของ Discriminant Analysis
1920 : English statistician - Karl Pearson Intergroup Distances, e.g., Coefficient of Racial Likeness 1930 : English statistician - Ronald A. Fisher translated multivariate intergroup distance into a linear combination of variables to aid in intergroup discrimination
5
เทคนิคของ Discriminant Analysis
เทคนิคการวิเคราะห์จำแนกกลุ่มมี 2 วิธี Predictive Discriminant Analysis : PDA Descriptive Discriminant Analysis : DDA
6
Predictive Discriminant Analysis : PDA
เป็นเทคนิคการวิเคราะห์จำแนกกลุ่มที่ ผู้วิจัยต้องการพยากรณ์หรือทำนายความแตกต่างระหว่างกลุ่มของตัวแปรตาม (ตัวแปรเกณฑ์ : Criterion) ด้วยตัวแปรอิสระชุดหนึ่ง (ตัวแปรพยากรณ์ : Predictors) Predictive Discriminant Analysis บางครั้งเรียกว่าClassification
7
Descriptive Discriminant Analysis : DDA
เป็นเทคนิคการวิเคราะห์จำแนกกลุ่มที่ผู้วิจัยต้องการอธิบายความแตกต่างระหว่างกลุ่มของตัวแปรตามด้วยตัวแปรอิสระชุดหนึ่ง
8
ลักษณะของ Discriminant Analysis
เป็นเทคนิคทางสถิติที่มีความเหมาะสมสำหรับการวิเคราะห์ตัวแปรพหุ (Multivariate Analysis) เมื่อตัวแปรตามมีลักษณะเป็นตัวแปรกลุ่ม (Categorical Variable) หรือ Nonmetric Variable อย่างแท้จริง
9
ถ้าตัวแปรตามมีลักษณะเป็น Metric Variable ต้องเปลี่ยนให้เป็น Nonmetric Variable ตามเงื่อนไขที่ผู้วิจัยกำหนด จึงจะนำไปวิเคราะห์ได้
10
ตัวแปรกลุ่มหรือ Nonmetric Variable คือตัวแปรที่มีค่าเป็น Nominal Scale, Ordinal Scale, Binary, Qualitative หรือ Taxonomic
11
จำนวนค่าของตัวแปรกลุ่มหรือ Nonmetric Variable มีได้ 2 ค่า หรือมากกว่า
12
ถ้าตัวแปรกลุ่มหรือ Nonmetric Variable มีค่าเพียง 2 ค่า เราเรียกว่า Two-groups Discriminant Analysis
13
ถ้าตัวแปรกลุ่มหรือ Nonmetric Variable มีค่ามากกว่า 2 ค่า เรียกว่า Multiple Discriminant Analysis : MDA
14
ค่าของตัวแปรอิสระที่ใช้ในการวิเคราะห์
ตัวแปรอิสระ 1 ตัวแปร หรือมากกว่า ที่มีค่าเป็น Interval scale หรือ Ratio Scale ที่เรียกว่า Metric Variables ค่าของตัวแปรอิสระที่ใช้ในการวิเคราะห์ จำแนกกลุ่มควรมีค่าเป็น Interval Scale หรือ Ratio Scale
15
ถ้าค่าของตัวแปรอิสระมีค่าเป็น Nominal Scale หรือ Ordinal Scale ต้องแปลงค่าของตัวแปรเหล่านั้นให้มีค่าเป็น 0 กับ 1 โดยสร้างเป็นตัวแปรใหม่ขึ้นมา เรียกว่า Dummy Variables จึงจะนำไปใช้ในการวิเคราะห์ได้
16
Model ของการวิเคราะห์จำแนกกลุ่ม Independent Variable n
… Nonmetric Independent Variable n Metric
17
Discriminant Analysis
เป็นส่วนกลับของ MANOVA
18
Model ของ MANOVA Dependent Variable 1 Independent Variable Dependent
Nonmetric Metric
19
ตัวอย่างคำถามวิจัยที่ใช้สำหรับ DA
มีปัจจัยใดบ้างที่ใช้บ่งชี้การเลือกบอกรับเป็นสมาชิกหนังสือพิมพ์รายวันภาษาไทย การเลือกใช้ระบบปฏิบัติการบนโทรศัพท์มือถือขึ้นอยู่กับปัจจัยใดบ้าง
20
วัตถุประสงค์ของ DA วัตถุประสงค์ของการวิเคราะห์จำแนกกลุ่ม มีดังนี้
เพื่อค้นหาตัวแปรอิสระ ปัจจัย หรือสาเหตุที่สามารถใช้ประเมินความแตกต่างของกลุ่ม เพื่อสร้างฟังก์ชั่นจำแนกกลุ่ม มิติของการจำแนกระหว่างกลุ่มจากชุดของตัวแปรอิสระ (ตัวแปรพยากรณ์) ชุดหนึ่ง
21
เพื่อทดสอบค่ากลางของกลุ่มจากชุดตัวแปรอิสระ (Group Centroid) ตั้งแต่ 2 กลุ่มขึ้นไป ว่ามีความแตกต่างกันหรือไม่ นำฟังก์ชั่นจำแนกกลุ่มมาใช้พยากรณ์หน่วยวิเคราะห์ใหม่ว่าควรจัดอยู่ในกลุ่มใด
22
Discriminant Function ในรูปของคะแนนดิบ
เมื่อ Yjk คือ ค่าคะแนนจำแนกกลุ่มของ Discriminant Function ที่ j กลุ่ม k a คือ ค่า Intercept bi คือ น้ำหนักการจำแนกมาตรฐาน (Disceiminant Weight) หรือค่า สัมประสิทธิ์การจำแนก (Discriminant Coefficient) ของ ตัวแปรอิสระ ที่ i เมื่อคิดจากคะแนนดิบ Xik คือ ตัวแปรอิสระที่ i ในกลุ่ม k
23
Discriminant Function ในรูปของคะแนนมาตรฐาน
เมื่อ Zjk คือ ค่าคะแนนจำแนกกลุ่มของ Discriminant Function ที่ j กลุ่ม k wi คือ น้ำหนักการจำแนกมาตรฐาน (Disceiminant Weight) หรือค่า สัมประสิทธิ์การจำแนก (Discriminant Coefficient) ของ ตัวแปรอิสระ ที่ i เมื่อคิดจากคะแนนมาตรฐาน Xik คือ ตัวแปรอิสระที่ i ในกลุ่ม k
24
ข้อตกลงเบื้องต้นของ DA
Normality of Independent Variables Linearity of Relationships Lack of Multicollinearity among Independent Variables Equal Dispersion Matrices
25
ค่าของตัวแปรอิสระต้องต้องไม่กระจายออกจากกลุ่มอย่างผิดปกติ (Outliers)
จำนวนหน่วยวิเคราะห์ในแต่ละกลุ่มควรมีจำนวนไม่แตกต่างกัน
26
Normality of Independent Variables
27
Normality of Independent Variables
28
องค์ประกอบของการใช้ DA
การวิเคราะห์จำแนกกลุ่ม ต้องพิจารณาสิ่งที่เกี่ยวข้องกับการวิเคราะห์ต่อไปนี้ ตัวแปรตามและการกำหนดจำนวนกลุ่ม ตัวแปรอิสระ จำนวนหน่วยวิเคราะห์ต่อกลุ่ม จำสวนหน่วยวิเคราะห์ทั้งหมด
29
ตัวแปรตามและการกำหนดจำนวนกลุ่ม
- Dichotomous - Multichotomous ตัวแปรตามต้องมีค่าเป็น Nonmetric และระหว่างกลุ่มมีความแตกต่างอย่างชัดเจน
30
ตัวแปรอิสระ ต้องสามารถอธิบายหรือบ่งบอกความแตกต่างของกลุ่มได้อย่างชัดเจน ต้องไม่มีค่าส่วนเบี่ยงเบนมาตรฐาน (SD.) เท่ากับ 0 ในแต่ละกลุ่ม จำนวนมากที่สุด คือ n – 2 เมื่อ n คือ จำนวนหน่วยวิเคราะห์ทั้งหมด
31
จำนวนหน่วยวิเคราะห์ต่อกลุ่มไม่ควรมีจำนวนแตกต่างกัน
จำนวนหน่วยวิเคราะห์ต่อกลุ่ม - ต้องมีจำนวนมากกว่าตัวแปรอิสระที่ใช้ในการวิเคราะห์ - จำนวนน้อยที่สุด คือ 20 หน่วยวิเคราะห์ จำนวนหน่วยวิเคราะห์ต่อกลุ่มไม่ควรมีจำนวนแตกต่างกัน
32
จำนวนหน่วยวิเคราะห์ทั้งหมด
- ต้องไม่น้อยกว่า 5 เท่าของจำนวนตัวแปรอิสระใน Model การวิเคราะห์ - โดยทั่วไปจะใช้ 20 เท่าของจำนวนตัวแปรอิสระใน Model การวิเคราะห์ ต้องมีจำนวนมากพอที่จะใช้กับการวิเคราะห์ จำแนกกลุ่ม
33
การเลือกวิธีประมาณค่าสำหรับ DA
วิธีการประมาณค่าที่ใช้สำหรับการวิเคราะห์จำแนกกลุ่ม มี 2 วิธี คือ Simultaneous Method Stepwise Method
34
Simultaneous Method อีกคำหนึ่งที่ใช้คือ Direct Method
โปรแกรม SPSS ใช้คำว่า Enter Independents Together เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนไม่มาก
35
Simultaneous Method หรือ Direct Method เป็นวิธีการนำตัวแปรอิสระทุกตัวตามที่ระบุไว้ด้วยเหตุผลทางทฤษฏีเข้ามาวิเคราะห์เพื่อสร้าง Discriminant Function เพื่อพิสูจน์ตัวแปรที่คิดว่ามีความสำคัญต่อการจำแนกที่ระบุไว้ตามทฤษฎีนั้น แท้จริงแล้วมีความ สำคัญหรือไม่
36
Discriminant Function ที่สร้างจะมีกี่สมการ และในแต่ละสมการประกอบด้วยตัวแปรอิสระใดบ้าง
37
เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนมาก
Stepwise Method โปรแกรม SPSS ใช้คำว่า Use Stepwise Method เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนมาก
38
Stepwise Method เป็นวิธีนำตัวแปรอิสระเข้ามาสร้าง Discriminant Function ที่ต่างจาก Simultaneous Method พิจารณาจาก Discriminant Power ของตัวแปรอิสระที่จะนำมาสร้าง Discriminant Function มีขั้นตอนดังนี้
39
เลือกตัวแปรอิสระที่ดีที่สุดในการจำแนกเข้า Discriminant Function เป็นตัวแรก โดยพิจารณาจาก Discriminant Power เลือกตัวแปรอิสระที่ดีที่สุดในการจำแนกตัวที่ 2 เข้า Discriminant Function เพื่อปรับปรุงแก้ไขให้ Discriminant Function สามารถจำแนกได้ดีขึ้น
40
ขั้นตอนต่อๆ ไปก็จะเป็นการนำตัวแปรอิสระที่ดีที่สุดที่เหลือมาเข้า Discriminant Function ต่อไป เพื่อให้ได้ Discriminant Function ในการจำแนกกลุ่มที่ดีที่สุด ทำต่อไปจนไม่มีตัวแปรอิสระที่มี Discriminant Power ดีพอที่จะนำมาสร้าง Discriminant Function
41
ค่าสถิติที่ใช้กับ DA ค่าสถิติของ Multivariate Analysis มีหลายค่า สำหรับ Discriminant Analysis สามารถแบ่งได้ดังนี้
42
สถิติทดสอบข้อตกลงเบื้องต้นของ DA
1.1 Normality of Independent Variables โดยการตรวจสอบจากข้อมูลสุดโต่งแบบหลายตัวแปร (Multivariate Outliers) ด้วยการวิเคราะห์ Mahalanobis Distances ของ MRA
43
เปรียบเทียบค่า Mahalanobis Distances ที่มากที่สุด กับค่าวิกฤตของ c2-Test ที่ df เท่ากับจำนวนตัวแปรอิสระ ถ้าค่า Mahalanobis Distances ที่มากที่สุด น้อยกว่า ค่าวิกฤตของ c2-Test แสดงว่า ตัวแปรอิสระน่าจะมีการ แจกแจงแบบปกติหลายตัวแปร
44
1.2 Linearity of Relationships
สามารถตรวจสอบจากสัมประสิทธิ์สหสัมพันธ์ระหว่าง ตัวแปรของเพียร์สัน แบบ Bivariate ของ MCA ถ้าตัวแปรอิสระและตัวแปรตามมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ แสดงว่าตัวแปรอิสระและตัวแปรตามมีความสัมพันธ์เชิงเส้นตรง
45
Tolerance = 1.3 Lack of Multicollinearity among Independent
Variables ตรวจสอบโดยใช้ค่าสถิติ Tolerance และ VIF ของ MRA หรือใช้ค่าสถิติ Tolerance ของ DA ก็ได้ โดยที่ Tolerance = เมื่อ คือ ความแปรปรวนของตัวแปรอิสระตัวที่ j ที่ถูก อธิบายด้วยความแปรปรวนของตัวแปรอิสระ ทั้งหมด
46
ถ้าค่า Tolerance มีค่าเท่ากับ 1
ต้องมีค่ามากกว่า 0.50
47
1.4 Equal Dispersion Matrices
ตรวจสอบได้ด้วยสถิติ Box’s M ซึ่งเป็นสถิติหนึ่งของ DA แล้วทดสอบนัยสำคัญทางสถิติด้วย ค่า F ถ้า ยอมรับสมมติฐาน H0 แสดงว่า เมตริกซ์ความแปรปรวนความแปรปรวนร่วมของตัวแปรอิสระของกลุ่มมีความเท่าเทียมกัน ถ้า ปฏิเสธสมมติฐาน H0 แสดงว่า เมตริกซ์ความแปรปรวนความแปรปรวนร่วมของตัวแปรอิสระของกลุ่มไม่มีความเท่าเทียมกัน
48
สถิติที่ใช้กับ Discriminant Analysis
2.1 Mean เป็นการนำเสนอเกี่ยวกับค่าเฉลี่ย ค่าส่วนเบี่ยงเบนมาตรฐาน จำนวนข้อมูล เสนอโดยแยกตามกลุ่มตัวแปรและในภาพรวม ค่าสถิติดังกล่าวแสดงอยู่ในตาราง Group Statistics
49
2.2 Univariate ANOVAs เป็นการนำเสนอเกี่ยวกับการทดสอบความเท่าเทียมกันของค่าเฉลี่ยของกลุ่ม (ค่าของตัวแปรตาม) ในแต่ละตัวแปรอิสระ ค่าสถิติที่ใช้ทดสอบ คือ Wilks’ lambda และทดสอบนัยสำคัญทางสถิติของค่า Wilks’ lambda ด้วยค่าสถิติ F ค่า Wilks’ lambda และค่าสถิติ F แสดงในตาราง Tests of Equality of Group Means และตารางผลการวิเคราะห์ในส่วนของ Stepwise Statistics
51
ผลการวิเคราะห์ในส่วนของ Stepwise Statistics
53
ค่า Wilks’ Lambda เป็นสถิติที่ใช้ทดสอบความแตกต่างระหว่างกลุ่ม และเป็นมาตรวัดอำนาจในการจำแนกกลุ่มของตัวแปรอิสระ ถ้าค่า Wilks’ Lambda มีค่ามาก ตัวแปรอิสระสามารถอธิบายการเป็นสมาชิกของกลุ่มได้น้อย ถ้าค่า Wilks’ Lambda มีค่าน้อย ตัวแปรอิสระสามารถอธิบายการเป็นสมาชิกของกลุ่มได้มาก
54
2.3 Box’s M เป็นการนำเสนอผลการตรวจสอบข้อตกลงเบื้องต้น เกี่ยวกับความเท่ากันของเมตริกซ์ความแปรปรวนร่วม
Box’s M จะปรากฏอยู่ในส่วนของผลการวิเคราะห์Box's Test of Equality of Covariance Matrices ประกอบด้วยตาราง Log Determinants และตาราง Test Results
56
2.4 Eigenvalue เป็นค่าที่แสดงอัตราส่วนการ ผันแปรระหว่างกลุ่มต่อการผันแปรภายในกลุ่มของ ตัวแปรตาม
Eigenvalue คือ Variance ของคะแนนแปลงรูป Y ที่แปลงมาจาก X1, X2,…, Xn นั่นเอง ถ้า Eigenvalue มีค่าสูง แสดงว่า Discriminant Function ดี หรือมีค่าจำแนกสูง
57
Eigenvalue จะปรากฏอยู่ในส่วนของผลการวิเคราะห์ Summary of Canonical Discriminant Functions
58
2.5 Canonical Correlation เป็นสถิติที่ใช้ในการตัดสินความสาคัญของ Discriminant Function
59
Canonical Correlation เป็นค่าที่แสดงว่า การเป็นสมาชิกกลุ่มมีความสัมพันธ์กับ Discriminant Function ที่ได้มากน้อยเพียงใด ถ้า Canonical Correlation มีค่าสูง แสดงว่า การเป็นสมาชิกของกลุ่มสามารถอธิบายความผันแปรของ ตัวแปรกับ Discriminant Function ได้มาก ค่า Canonical Correlation แสดงอยู่ในตารางเดียวกับค่า Eigenvalue
60
2.6 Group Centroids เป็นค่าที่สามารถใช้ประเมินDiscriminant Function ด้วยค่าเฉลี่ยของกลุ่ม ผลการวิเคราะห์เป็นคะแนนดิบ (Unstandardized) ถ้า Group Centroids ของแต่ละกลุ่มมีค่าแตกต่างกันมาก แสดงว่า Discriminant Function สามารถจำแนกได้ดี ค่า Group Centroids นำเสนอในตารางผลการวิเคราะห์ Function at Group Centroids
62
2.7 Fisher’s เป็นวิธีการนำเสนอค่าสัมประสิทธิ์ของตัวแปรอิสระในการจำแนกกลุ่ม (Classification Function Coefficients) หรือเป็นวิธีการนำเสนอค่าสัมประสิทธิ์การจำแนกกลุ่มตามวิธีของ Fisher’s Linear Discriminant Function ค่าสัมประสิทธิ์ของตัวแปรอิสระในการจำแนกกลุ่ม นำเสนอในตารางผลการวิเคราะห์ Classification Function Coefficients
64
2.8 Unstandardized เป็นวิธีการนำเสนอค่าสัมประสิทธิ์ของตัวแปรคาโนนิคอล (Canonical Discriminant Function Coefficients) ในรูปของคะแนนดิบ เพิ่มเติมจากการนาเสนอในรูปแบบของคะแนนมาตรฐาน ค่าสัมประสิทธิ์ของตัวแปรคาโนนิคอล นำเสนอในตารางผลการวิเคราะห์ Canonical Discriminant Function Coefficients และตาราง Standardized Canonical Discriminant Function Coefficients
67
2.9 Discriminant Loadings บางครั้งเรียกว่า Structure Correlations เป็นค่าที่แสดงความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรอิสระแต่ละตัวกับ Discriminant Function Discriminant Loading เป็นค่าที่แสดงให้เห็นว่า ตัวแปรอิสระทั้งหลายร่วมกันทำให้เกิดความผันแปรต่อตัวแปรตามในรูปของ Discriminant Function Discriminant Loading แสดงในตาราง Structure Matrix
69
2.10 Prior Probabilities ไม่ใช่ค่าสถิติ แต่เป็นการกำหนดโอกาสหรือความน่าจะเป็นของการเป็นกลุ่มต่างๆ ไว้ล่วงหน้า แบ่งออกเป็น 2 กรณี ให้โอกาสเท่ากันทุกกลุ่ม (All group equal) คำนวณจากขนาดของกลุ่มตัวอย่าง (Compute from group sizes)
70
2.11 Plots ไม่ใช่ค่าสถิติแต่เป็นส่วนที่กำหนดรูปแบการนำเสนอผลการวิเคราะห์ในรูปของแผนภาพ แบ่งออกเป็น
แบบรวมกลุ่ม (Combined-groups) แบบแยกกลุ่ม (Separate-group) แบบเขตแดน (Territorial map) โดยใช้ตัวเลขกลุ่ม (เช่น 1,2,3..) เป็นสัญลักษณ์ในการแบ่งแยกกลุ่ม
73
ตารางแสดงผลการทำนายการเป็นสมาชิกกลุ่ม
74
ผลจากการเลือก Save ในรายการคำสั่งของ DA จะไม่ปรากฏในผลการวิเคราะห์ แต่จะบันทึกในแฟ้มข้อมูล โดยสร้างเป็นตัวแปรใหม่เพิ่มขึ้นจากข้อมูลเดิม จำนวน 4 ตัวแปร คือ 1. ตัวแปร Dis_1 เป็นตัวแปรที่ระบุถึงการเป็นสมาชิกกลุ่มของหน่วยวิเคราะห์ที่ได้จากการทำนายของDiscriminant Function
75
2. ตัวแปร Dis1_1 เป็นตัวแปรที่บอกถึงคะแนนจำแนกของหน่วยวิเคราะห์ โดยทำนายจากค่าน้ำหนักและค่าที่วัดได้จากตัวแปรที่อยู่ใน Discriminant Function ในรูปคะแนนดิบ จำนวนตัวแปรขึ้นอยู่กับจำนวน Discriminant Function 3. ตัวแปร Dis1_2 เป็นตัวแปรที่บอกถึงโอกาสในการเป็นสมาชิกกลุ่มของแต่ละหน่วยวิเคราะห์ จำนวนตัวแปรขึ้นอยู่กับจำนวนกลุ่มของตัวแปรตาม
งานนำเสนอที่คล้ายกัน
© 2025 SlidePlayer.in.th Inc.
All rights reserved.