การวิเคราะห์จำแนกกลุ่ม (Discriminant Analysis)

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การวิเคราะห์จำแนกกลุ่ม (Discriminant Analysis)"— ใบสำเนางานนำเสนอ:

1 การวิเคราะห์จำแนกกลุ่ม (Discriminant Analysis)
ดร.บุญเรือง ศรีเหรัญ

2 การวิเคราะห์จำแนกกลุ่ม : DA
Discriminant Analysis คำในภาษาไทยที่ใช้ เช่น การวิเคราะห์จัดกลุ่ม การวิเคราะห์จัดจำแนก การวิเคราะห์จำแนกประเภท การวิเคราะห์จำแนกกลุ่ม ฯลฯ การวิเคราะห์จำแนกกลุ่ม : DA

3 สถิติเป็นเครื่องมือที่ใช้เพื่อการจัดกระทำข้อมูลให้มีความหมายตามข้อกำหนดของสถิติที่ใช้
การใช้เครื่องมือใดๆ ผู้ใช้ต้องมีความรู้ต่อไปนี้  รู้จักเครื่องมือที่จะใช้  รู้ว่าเครื่องมือนั้นใช้ทำอะไร  รู้ว่าเครื่องมือนั้นใช้อย่างไร  รู้ผลที่จะเกิดขึ้นจากการใช้เครื่องมือนั้น

4 ประวัติของ Discriminant Analysis
1920 : English statistician - Karl Pearson Intergroup Distances, e.g., Coefficient of Racial Likeness 1930 : English statistician - Ronald A. Fisher translated multivariate intergroup distance into a linear combination of variables to aid in intergroup discrimination

5 เทคนิคของ Discriminant Analysis
เทคนิคการวิเคราะห์จำแนกกลุ่มมี 2 วิธี  Predictive Discriminant Analysis : PDA  Descriptive Discriminant Analysis : DDA

6  Predictive Discriminant Analysis : PDA
เป็นเทคนิคการวิเคราะห์จำแนกกลุ่มที่ ผู้วิจัยต้องการพยากรณ์หรือทำนายความแตกต่างระหว่างกลุ่มของตัวแปรตาม (ตัวแปรเกณฑ์ : Criterion) ด้วยตัวแปรอิสระชุดหนึ่ง (ตัวแปรพยากรณ์ : Predictors) Predictive Discriminant Analysis บางครั้งเรียกว่าClassification

7  Descriptive Discriminant Analysis : DDA
เป็นเทคนิคการวิเคราะห์จำแนกกลุ่มที่ผู้วิจัยต้องการอธิบายความแตกต่างระหว่างกลุ่มของตัวแปรตามด้วยตัวแปรอิสระชุดหนึ่ง

8 ลักษณะของ Discriminant Analysis
เป็นเทคนิคทางสถิติที่มีความเหมาะสมสำหรับการวิเคราะห์ตัวแปรพหุ (Multivariate Analysis) เมื่อตัวแปรตามมีลักษณะเป็นตัวแปรกลุ่ม (Categorical Variable) หรือ Nonmetric Variable อย่างแท้จริง

9 ถ้าตัวแปรตามมีลักษณะเป็น Metric Variable ต้องเปลี่ยนให้เป็น Nonmetric Variable ตามเงื่อนไขที่ผู้วิจัยกำหนด จึงจะนำไปวิเคราะห์ได้

10 ตัวแปรกลุ่มหรือ Nonmetric Variable คือตัวแปรที่มีค่าเป็น Nominal Scale, Ordinal Scale, Binary, Qualitative หรือ Taxonomic

11 จำนวนค่าของตัวแปรกลุ่มหรือ Nonmetric Variable มีได้ 2 ค่า หรือมากกว่า

12 ถ้าตัวแปรกลุ่มหรือ Nonmetric Variable มีค่าเพียง 2 ค่า เราเรียกว่า Two-groups Discriminant Analysis

13 ถ้าตัวแปรกลุ่มหรือ Nonmetric Variable มีค่ามากกว่า 2 ค่า เรียกว่า Multiple Discriminant Analysis : MDA

14 ค่าของตัวแปรอิสระที่ใช้ในการวิเคราะห์
ตัวแปรอิสระ 1 ตัวแปร หรือมากกว่า ที่มีค่าเป็น Interval scale หรือ Ratio Scale ที่เรียกว่า Metric Variables ค่าของตัวแปรอิสระที่ใช้ในการวิเคราะห์ จำแนกกลุ่มควรมีค่าเป็น Interval Scale หรือ Ratio Scale

15 ถ้าค่าของตัวแปรอิสระมีค่าเป็น Nominal Scale หรือ Ordinal Scale ต้องแปลงค่าของตัวแปรเหล่านั้นให้มีค่าเป็น 0 กับ 1 โดยสร้างเป็นตัวแปรใหม่ขึ้นมา เรียกว่า Dummy Variables จึงจะนำไปใช้ในการวิเคราะห์ได้

16 Model ของการวิเคราะห์จำแนกกลุ่ม Independent Variable n
Nonmetric Independent Variable n Metric

17 Discriminant Analysis
เป็นส่วนกลับของ MANOVA

18 Model ของ MANOVA Dependent Variable 1 Independent Variable Dependent
Nonmetric Metric

19 ตัวอย่างคำถามวิจัยที่ใช้สำหรับ DA
 มีปัจจัยใดบ้างที่ใช้บ่งชี้การเลือกบอกรับเป็นสมาชิกหนังสือพิมพ์รายวันภาษาไทย  การเลือกใช้ระบบปฏิบัติการบนโทรศัพท์มือถือขึ้นอยู่กับปัจจัยใดบ้าง

20 วัตถุประสงค์ของ DA วัตถุประสงค์ของการวิเคราะห์จำแนกกลุ่ม มีดังนี้
 เพื่อค้นหาตัวแปรอิสระ ปัจจัย หรือสาเหตุที่สามารถใช้ประเมินความแตกต่างของกลุ่ม  เพื่อสร้างฟังก์ชั่นจำแนกกลุ่ม มิติของการจำแนกระหว่างกลุ่มจากชุดของตัวแปรอิสระ (ตัวแปรพยากรณ์) ชุดหนึ่ง

21  เพื่อทดสอบค่ากลางของกลุ่มจากชุดตัวแปรอิสระ (Group Centroid) ตั้งแต่ 2 กลุ่มขึ้นไป ว่ามีความแตกต่างกันหรือไม่  นำฟังก์ชั่นจำแนกกลุ่มมาใช้พยากรณ์หน่วยวิเคราะห์ใหม่ว่าควรจัดอยู่ในกลุ่มใด

22 Discriminant Function ในรูปของคะแนนดิบ
เมื่อ Yjk คือ ค่าคะแนนจำแนกกลุ่มของ Discriminant Function ที่ j กลุ่ม k a คือ ค่า Intercept bi คือ น้ำหนักการจำแนกมาตรฐาน (Disceiminant Weight) หรือค่า สัมประสิทธิ์การจำแนก (Discriminant Coefficient) ของ ตัวแปรอิสระ ที่ i เมื่อคิดจากคะแนนดิบ Xik คือ ตัวแปรอิสระที่ i ในกลุ่ม k

23 Discriminant Function ในรูปของคะแนนมาตรฐาน
เมื่อ Zjk คือ ค่าคะแนนจำแนกกลุ่มของ Discriminant Function ที่ j กลุ่ม k wi คือ น้ำหนักการจำแนกมาตรฐาน (Disceiminant Weight) หรือค่า สัมประสิทธิ์การจำแนก (Discriminant Coefficient) ของ ตัวแปรอิสระ ที่ i เมื่อคิดจากคะแนนมาตรฐาน Xik คือ ตัวแปรอิสระที่ i ในกลุ่ม k

24 ข้อตกลงเบื้องต้นของ DA
 Normality of Independent Variables  Linearity of Relationships  Lack of Multicollinearity among Independent Variables  Equal Dispersion Matrices

25  ค่าของตัวแปรอิสระต้องต้องไม่กระจายออกจากกลุ่มอย่างผิดปกติ (Outliers)
 จำนวนหน่วยวิเคราะห์ในแต่ละกลุ่มควรมีจำนวนไม่แตกต่างกัน

26 Normality of Independent Variables

27 Normality of Independent Variables

28 องค์ประกอบของการใช้ DA
การวิเคราะห์จำแนกกลุ่ม ต้องพิจารณาสิ่งที่เกี่ยวข้องกับการวิเคราะห์ต่อไปนี้  ตัวแปรตามและการกำหนดจำนวนกลุ่ม  ตัวแปรอิสระ  จำนวนหน่วยวิเคราะห์ต่อกลุ่ม  จำสวนหน่วยวิเคราะห์ทั้งหมด

29  ตัวแปรตามและการกำหนดจำนวนกลุ่ม
- Dichotomous - Multichotomous ตัวแปรตามต้องมีค่าเป็น Nonmetric และระหว่างกลุ่มมีความแตกต่างอย่างชัดเจน

30  ตัวแปรอิสระ ต้องสามารถอธิบายหรือบ่งบอกความแตกต่างของกลุ่มได้อย่างชัดเจน ต้องไม่มีค่าส่วนเบี่ยงเบนมาตรฐาน (SD.) เท่ากับ 0 ในแต่ละกลุ่ม จำนวนมากที่สุด คือ n – 2 เมื่อ n คือ จำนวนหน่วยวิเคราะห์ทั้งหมด

31 จำนวนหน่วยวิเคราะห์ต่อกลุ่มไม่ควรมีจำนวนแตกต่างกัน
 จำนวนหน่วยวิเคราะห์ต่อกลุ่ม - ต้องมีจำนวนมากกว่าตัวแปรอิสระที่ใช้ในการวิเคราะห์ - จำนวนน้อยที่สุด คือ 20 หน่วยวิเคราะห์ จำนวนหน่วยวิเคราะห์ต่อกลุ่มไม่ควรมีจำนวนแตกต่างกัน

32  จำนวนหน่วยวิเคราะห์ทั้งหมด
- ต้องไม่น้อยกว่า 5 เท่าของจำนวนตัวแปรอิสระใน Model การวิเคราะห์ - โดยทั่วไปจะใช้ 20 เท่าของจำนวนตัวแปรอิสระใน Model การวิเคราะห์ ต้องมีจำนวนมากพอที่จะใช้กับการวิเคราะห์ จำแนกกลุ่ม

33 การเลือกวิธีประมาณค่าสำหรับ DA
วิธีการประมาณค่าที่ใช้สำหรับการวิเคราะห์จำแนกกลุ่ม มี 2 วิธี คือ  Simultaneous Method  Stepwise Method

34  Simultaneous Method อีกคำหนึ่งที่ใช้คือ Direct Method
โปรแกรม SPSS ใช้คำว่า Enter Independents Together เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนไม่มาก

35 Simultaneous Method หรือ Direct Method เป็นวิธีการนำตัวแปรอิสระทุกตัวตามที่ระบุไว้ด้วยเหตุผลทางทฤษฏีเข้ามาวิเคราะห์เพื่อสร้าง Discriminant Function เพื่อพิสูจน์ตัวแปรที่คิดว่ามีความสำคัญต่อการจำแนกที่ระบุไว้ตามทฤษฎีนั้น แท้จริงแล้วมีความ สำคัญหรือไม่

36 Discriminant Function ที่สร้างจะมีกี่สมการ และในแต่ละสมการประกอบด้วยตัวแปรอิสระใดบ้าง

37 เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนมาก
 Stepwise Method โปรแกรม SPSS ใช้คำว่า Use Stepwise Method เหมาะสำหรับการวิเคราะห์จำแนกกลุ่มที่มีตัวแปรอิสระจำนวนมาก

38 Stepwise Method เป็นวิธีนำตัวแปรอิสระเข้ามาสร้าง Discriminant Function ที่ต่างจาก Simultaneous Method พิจารณาจาก Discriminant Power ของตัวแปรอิสระที่จะนำมาสร้าง Discriminant Function มีขั้นตอนดังนี้

39  เลือกตัวแปรอิสระที่ดีที่สุดในการจำแนกเข้า Discriminant Function เป็นตัวแรก โดยพิจารณาจาก Discriminant Power  เลือกตัวแปรอิสระที่ดีที่สุดในการจำแนกตัวที่ 2 เข้า Discriminant Function เพื่อปรับปรุงแก้ไขให้ Discriminant Function สามารถจำแนกได้ดีขึ้น

40  ขั้นตอนต่อๆ ไปก็จะเป็นการนำตัวแปรอิสระที่ดีที่สุดที่เหลือมาเข้า Discriminant Function ต่อไป เพื่อให้ได้ Discriminant Function ในการจำแนกกลุ่มที่ดีที่สุด ทำต่อไปจนไม่มีตัวแปรอิสระที่มี Discriminant Power ดีพอที่จะนำมาสร้าง Discriminant Function

41 ค่าสถิติที่ใช้กับ DA ค่าสถิติของ Multivariate Analysis มีหลายค่า สำหรับ Discriminant Analysis สามารถแบ่งได้ดังนี้

42  สถิติทดสอบข้อตกลงเบื้องต้นของ DA
1.1 Normality of Independent Variables โดยการตรวจสอบจากข้อมูลสุดโต่งแบบหลายตัวแปร (Multivariate Outliers) ด้วยการวิเคราะห์ Mahalanobis Distances ของ MRA

43 เปรียบเทียบค่า Mahalanobis Distances ที่มากที่สุด กับค่าวิกฤตของ c2-Test ที่ df เท่ากับจำนวนตัวแปรอิสระ ถ้าค่า Mahalanobis Distances ที่มากที่สุด น้อยกว่า ค่าวิกฤตของ c2-Test แสดงว่า ตัวแปรอิสระน่าจะมีการ แจกแจงแบบปกติหลายตัวแปร

44 1.2 Linearity of Relationships
สามารถตรวจสอบจากสัมประสิทธิ์สหสัมพันธ์ระหว่าง ตัวแปรของเพียร์สัน แบบ Bivariate ของ MCA ถ้าตัวแปรอิสระและตัวแปรตามมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ แสดงว่าตัวแปรอิสระและตัวแปรตามมีความสัมพันธ์เชิงเส้นตรง

45 Tolerance = 1.3 Lack of Multicollinearity among Independent
Variables ตรวจสอบโดยใช้ค่าสถิติ Tolerance และ VIF ของ MRA หรือใช้ค่าสถิติ Tolerance ของ DA ก็ได้ โดยที่ Tolerance = เมื่อ คือ ความแปรปรวนของตัวแปรอิสระตัวที่ j ที่ถูก อธิบายด้วยความแปรปรวนของตัวแปรอิสระ ทั้งหมด

46 ถ้าค่า Tolerance มีค่าเท่ากับ 1
ต้องมีค่ามากกว่า 0.50

47 1.4 Equal Dispersion Matrices
ตรวจสอบได้ด้วยสถิติ Box’s M ซึ่งเป็นสถิติหนึ่งของ DA แล้วทดสอบนัยสำคัญทางสถิติด้วย ค่า F ถ้า ยอมรับสมมติฐาน H0 แสดงว่า เมตริกซ์ความแปรปรวนความแปรปรวนร่วมของตัวแปรอิสระของกลุ่มมีความเท่าเทียมกัน ถ้า ปฏิเสธสมมติฐาน H0 แสดงว่า เมตริกซ์ความแปรปรวนความแปรปรวนร่วมของตัวแปรอิสระของกลุ่มไม่มีความเท่าเทียมกัน

48  สถิติที่ใช้กับ Discriminant Analysis
2.1 Mean เป็นการนำเสนอเกี่ยวกับค่าเฉลี่ย ค่าส่วนเบี่ยงเบนมาตรฐาน จำนวนข้อมูล เสนอโดยแยกตามกลุ่มตัวแปรและในภาพรวม ค่าสถิติดังกล่าวแสดงอยู่ในตาราง Group Statistics

49 2.2 Univariate ANOVAs เป็นการนำเสนอเกี่ยวกับการทดสอบความเท่าเทียมกันของค่าเฉลี่ยของกลุ่ม (ค่าของตัวแปรตาม) ในแต่ละตัวแปรอิสระ ค่าสถิติที่ใช้ทดสอบ คือ Wilks’ lambda และทดสอบนัยสำคัญทางสถิติของค่า Wilks’ lambda ด้วยค่าสถิติ F ค่า Wilks’ lambda และค่าสถิติ F แสดงในตาราง Tests of Equality of Group Means และตารางผลการวิเคราะห์ในส่วนของ Stepwise Statistics

50

51 ผลการวิเคราะห์ในส่วนของ Stepwise Statistics

52

53 ค่า Wilks’ Lambda เป็นสถิติที่ใช้ทดสอบความแตกต่างระหว่างกลุ่ม และเป็นมาตรวัดอำนาจในการจำแนกกลุ่มของตัวแปรอิสระ ถ้าค่า Wilks’ Lambda มีค่ามาก ตัวแปรอิสระสามารถอธิบายการเป็นสมาชิกของกลุ่มได้น้อย ถ้าค่า Wilks’ Lambda มีค่าน้อย ตัวแปรอิสระสามารถอธิบายการเป็นสมาชิกของกลุ่มได้มาก

54 2.3 Box’s M เป็นการนำเสนอผลการตรวจสอบข้อตกลงเบื้องต้น เกี่ยวกับความเท่ากันของเมตริกซ์ความแปรปรวนร่วม
Box’s M จะปรากฏอยู่ในส่วนของผลการวิเคราะห์Box's Test of Equality of Covariance Matrices ประกอบด้วยตาราง Log Determinants และตาราง Test Results

55

56 2.4 Eigenvalue เป็นค่าที่แสดงอัตราส่วนการ ผันแปรระหว่างกลุ่มต่อการผันแปรภายในกลุ่มของ ตัวแปรตาม
Eigenvalue คือ Variance ของคะแนนแปลงรูป Y ที่แปลงมาจาก X1, X2,…, Xn นั่นเอง ถ้า Eigenvalue มีค่าสูง แสดงว่า Discriminant Function ดี หรือมีค่าจำแนกสูง

57 Eigenvalue จะปรากฏอยู่ในส่วนของผลการวิเคราะห์ Summary of Canonical Discriminant Functions

58 2.5 Canonical Correlation เป็นสถิติที่ใช้ในการตัดสินความสาคัญของ Discriminant Function

59 Canonical Correlation เป็นค่าที่แสดงว่า การเป็นสมาชิกกลุ่มมีความสัมพันธ์กับ Discriminant Function ที่ได้มากน้อยเพียงใด ถ้า Canonical Correlation มีค่าสูง แสดงว่า การเป็นสมาชิกของกลุ่มสามารถอธิบายความผันแปรของ ตัวแปรกับ Discriminant Function ได้มาก ค่า Canonical Correlation แสดงอยู่ในตารางเดียวกับค่า Eigenvalue

60 2.6 Group Centroids เป็นค่าที่สามารถใช้ประเมินDiscriminant Function ด้วยค่าเฉลี่ยของกลุ่ม ผลการวิเคราะห์เป็นคะแนนดิบ (Unstandardized) ถ้า Group Centroids ของแต่ละกลุ่มมีค่าแตกต่างกันมาก แสดงว่า Discriminant Function สามารถจำแนกได้ดี ค่า Group Centroids นำเสนอในตารางผลการวิเคราะห์ Function at Group Centroids

61

62 2.7 Fisher’s เป็นวิธีการนำเสนอค่าสัมประสิทธิ์ของตัวแปรอิสระในการจำแนกกลุ่ม (Classification Function Coefficients) หรือเป็นวิธีการนำเสนอค่าสัมประสิทธิ์การจำแนกกลุ่มตามวิธีของ Fisher’s Linear Discriminant Function ค่าสัมประสิทธิ์ของตัวแปรอิสระในการจำแนกกลุ่ม นำเสนอในตารางผลการวิเคราะห์ Classification Function Coefficients

63

64 2.8 Unstandardized เป็นวิธีการนำเสนอค่าสัมประสิทธิ์ของตัวแปรคาโนนิคอล (Canonical Discriminant Function Coefficients) ในรูปของคะแนนดิบ เพิ่มเติมจากการนาเสนอในรูปแบบของคะแนนมาตรฐาน ค่าสัมประสิทธิ์ของตัวแปรคาโนนิคอล นำเสนอในตารางผลการวิเคราะห์ Canonical Discriminant Function Coefficients และตาราง Standardized Canonical Discriminant Function Coefficients

65

66

67 2.9 Discriminant Loadings บางครั้งเรียกว่า Structure Correlations เป็นค่าที่แสดงความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรอิสระแต่ละตัวกับ Discriminant Function Discriminant Loading เป็นค่าที่แสดงให้เห็นว่า ตัวแปรอิสระทั้งหลายร่วมกันทำให้เกิดความผันแปรต่อตัวแปรตามในรูปของ Discriminant Function Discriminant Loading แสดงในตาราง Structure Matrix

68

69 2.10 Prior Probabilities ไม่ใช่ค่าสถิติ แต่เป็นการกำหนดโอกาสหรือความน่าจะเป็นของการเป็นกลุ่มต่างๆ ไว้ล่วงหน้า แบ่งออกเป็น 2 กรณี ให้โอกาสเท่ากันทุกกลุ่ม (All group equal) คำนวณจากขนาดของกลุ่มตัวอย่าง (Compute from group sizes)

70 2.11 Plots ไม่ใช่ค่าสถิติแต่เป็นส่วนที่กำหนดรูปแบการนำเสนอผลการวิเคราะห์ในรูปของแผนภาพ แบ่งออกเป็น
แบบรวมกลุ่ม (Combined-groups) แบบแยกกลุ่ม (Separate-group) แบบเขตแดน (Territorial map) โดยใช้ตัวเลขกลุ่ม (เช่น 1,2,3..) เป็นสัญลักษณ์ในการแบ่งแยกกลุ่ม

71

72

73 ตารางแสดงผลการทำนายการเป็นสมาชิกกลุ่ม

74 ผลจากการเลือก Save ในรายการคำสั่งของ DA จะไม่ปรากฏในผลการวิเคราะห์ แต่จะบันทึกในแฟ้มข้อมูล โดยสร้างเป็นตัวแปรใหม่เพิ่มขึ้นจากข้อมูลเดิม จำนวน 4 ตัวแปร คือ 1. ตัวแปร Dis_1 เป็นตัวแปรที่ระบุถึงการเป็นสมาชิกกลุ่มของหน่วยวิเคราะห์ที่ได้จากการทำนายของDiscriminant Function

75 2. ตัวแปร Dis1_1 เป็นตัวแปรที่บอกถึงคะแนนจำแนกของหน่วยวิเคราะห์ โดยทำนายจากค่าน้ำหนักและค่าที่วัดได้จากตัวแปรที่อยู่ใน Discriminant Function ในรูปคะแนนดิบ จำนวนตัวแปรขึ้นอยู่กับจำนวน Discriminant Function 3. ตัวแปร Dis1_2 เป็นตัวแปรที่บอกถึงโอกาสในการเป็นสมาชิกกลุ่มของแต่ละหน่วยวิเคราะห์ จำนวนตัวแปรขึ้นอยู่กับจำนวนกลุ่มของตัวแปรตาม


ดาวน์โหลด ppt การวิเคราะห์จำแนกกลุ่ม (Discriminant Analysis)

งานนำเสนอที่คล้ายกัน


Ads by Google