งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

บทที่ 12 การวิเคราะห์การถดถอย

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "บทที่ 12 การวิเคราะห์การถดถอย"— ใบสำเนางานนำเสนอ:

1 บทที่ 12 การวิเคราะห์การถดถอย
บทที่ 12 การวิเคราะห์การถดถอย BC428 : Research in Business Computer

2 Regression เป็นการวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรอิสระหรือตัวแปรต้น กับตัวแปรตาม ตัวแปรที่จะใช้ในการวิเคราะห์จะเป็นตัวแปรเชิงปริมาณ จะนำเสนอผลการวิเคราะห์ในรูปแบบของสมการ เชิงเส้น ความสัมพันธ์ ระหว่างตัวแปร ไม่เป็นเชิงเส้น BC428 : Research in Business Computer

3 Regression แบ่งเป็น Simple Linear Regression Analysis
Multiple Linear Regression Analysis BC428 : Research in Business Computer

4 Simple Linear Regression Analysis
ศึกษาความสัมพันธ์ของตัวแปร 2 ตัว ตัวแปรต้น (X) ตัวแปรตาม (Y) BC428 : Research in Business Computer

5 Y X สมการการถดถอยเชิงเส้นของประชากร Y = β0 + β1X + ε
สมการการถดถอยเชิงเส้นของกลุ่มตัวอย่าง Y = b0 + b1X + e สมการจากการพยากรณ์ (การประมาณค่า) β0 β1 X Y= β0 + β1X Y = b0 + b1X BC428 : Research in Business Computer

6 ขั้นตอนการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย
ตรวจสอบว่าตัวแปร X และ Y มีความสัมพันธ์กันเชิงเส้นหรือไม่ สร้างสมการการพยากรณ์ เพื่อใช้สำหรับการประมาณค่า Y ตรวจสอบข้อตกลงเบื้องต้นของการวิเคราะห์ความถดถอยเชิงเส้นอย่างง่ายของตัวแปรทั้งสอง BC428 : Research in Business Computer

7 ค่าสถิติที่ควรรู้ 1) ค่าสัมประสิทธิ์สหสัมพันธ์
1) ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) เป็นค่าความสัมพันธ์ของตัวแปร X กับ Y สัญลักษณ์ที่ใช้คือ rxy หรือ r ค่าที่คำนวณได้อยู่ในช่วงระหว่าง -1 ถึง 1 BC428 : Research in Business Computer

8 ความหมายของค่าสัมประสิทธิ์สหสัมพันธ์
ค่า r ความหมาย ค่าบวก มีความสัมพันธ์ในทิศทางเดียวกัน ค่าลบ มีความสัมพันธ์ในทิศทางตรงกันข้าม ค่าเข้าใกล้ 1 มีความสัมพันธ์กันมาก และในทิศทางเดียวกัน ค่าเข้าใกล้ -1 มีความสัมพันธ์กันมาก และในทิศทางตรงกันข้าม ค่าเข้าใกล้ 0 มีความสัมพันธ์กันน้อย ค่าเท่ากับ 1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางเดียวกัน ค่าเท่ากับ -1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางตรงกันข้าม ค่าเท่ากับ 0 ไม่มีความสัมพันธ์กัน เช่น r=0.56 หมายความว่า ? BC428 : Research in Business Computer

9 2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination)
2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination) เกิดจากการนำค่าสัมประสิทธิ์สหสัมพันธ์ยกกำลังสอง ใช้แสดงความแปรผันที่เกิดขึ้นกับตัวแปร Y มีผลเนื่องมาจากตัวแปร X คิดเป็นกี่เปอร์เซ็นต์ ใช้ศึกษาว่า สมการการประมาณค่ามีความเหมาะสมที่จะนำไปใช้ได้มากหรือน้อย ค่าที่คำนวณได้จะอยู่ในช่วงระหว่าง 0 ถึง 1 สัญลักษณ์ที่ใช้คือ r2 BC428 : Research in Business Computer

10 ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 1 แสดงว่าตัวแปร X มีอิทธิพลต่อตัวแปร Y อย่างมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้มาก ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 0 แสดงว่า ตัวแปร X มีอิทธิพลต่อตัวแปร Y น้อยมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้น้อย เช่น r2=0.56 หมายความว่า ? BC428 : Research in Business Computer

11 3) ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (Standard Error of the Estimate)
เป็นค่าคลาดเคลื่อนที่เกิดจากการประมาณค่า Y ด้วย สัญลักษณ์ที่ใช้คือ SY.X X = b0 + b1X Y X = b0 + b1X Y SY.X > 0 SY.X = 0 BC428 : Research in Business Computer

12 4)ค่าสัมประสิทธิ์การถดถอย (Regression Coefficient)
เป็นค่าความชันของเส้นสมการการถดถอย สัญลักษณ์ที่ใช้คือ b1 b1 = 0 b1 > 0 b1 < 0 X = b0 + b1X Y X = b0 - b1X Y X = b0 + b1X Y BC428 : Research in Business Computer

13 การตรวจสอบความเป็นเชิงเส้นของข้อมูล
X Y ก) ความสัมพันธ์แบบเส้นตรงทางบวก ข) ความสัมพันธ์แบบเส้นตรงทางลบ ค) ความสัมพันธ์แบบเอกโปเนนเชียลทางบวก จ) ความสัมพันธ์แบบพาราโบล่าทางบวก ง) ความสัมพันธ์แบบเอกโปเนนเชียลทางลบ ฉ) ไม่มีความสัมพันธ์กัน BC428 : Research in Business Computer

14 ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่
Data12_1.sav ลักษณะของคำถามในแบบสอบถาม (จะเป็นข้อมูลเชิงปริมาณ) 1.เวลาในการออกอากาศ นาที/สัปดาห์ 2.อัตราค่าโฆษณา บาท/นาที ตัวแปร X คือ ? ตัวแปร Y คือ ? ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่ คำสั่ง Graphs  Scatter… BC428 : Research in Business Computer

15 Graph ข้อมูลมีลักษณะการกระจายตัวเป็นในแนวเส้นตรง แสดงว่าเวลาที่ใช้ในการโฆษณามีความสัมพันธ์เชิงเส้นกับอัตราค่าโฆษณา BC428 : Research in Business Computer

16 วิธีการสร้างสมการการถดถอย
จะมีวิธีการคัดเลือกตัวแปรอิสระในการทดสอบได้หลายวิธี ดังนี้ Enter Forward Backward Stepwise Remove BC428 : Research in Business Computer

17 Analyze  Regression  Linear …
คำสั่ง Analyze  Regression  Linear … BC428 : Research in Business Computer

18 สัมประสิทธิ์สหสัมพันธ์ (R)= 0
สัมประสิทธิ์สหสัมพันธ์ (R)= หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาในทิศทางเดียวกัน และมีความสัมพันธ์กันในระดับสูง (เนื่องจากค่า R มีค่ามาก) สัมประสิทธิ์การกำหนด (R2)= หมายความว่า อิทธิพลของเวลาที่ใช้ในการโฆษณาที่มีต่ออัตราค่าโฆษณาคิดเป็น 71.9 เปอร์เซ็นต์ ที่เหลืออีก 28.1 เปอร์เซ็นต์ เป็นผลเนื่องมาจากตัวแปรอื่น ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (SY.X) = หมายความว่า การประมาณค่าของอัตราค่าโฆษณา( )มีความคลาดเคลื่อนเกิดขึ้นเท่ากับ พันบาท/นาที (ใช้หน่วยเดียวกับหน่วยของตัวแปรตาม) BC428 : Research in Business Computer

19 Ho : เวลาที่ใช้ในการโฆษณาไม่มีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น
สถิติทดสอบ คือ F = ค่า Sig = ระดับนัยสำคัญ() = 0.05 ค่า Sig <  แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 BC428 : Research in Business Computer

20 ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร
Ho : β1 = 0 H1 : β1 ≠ 0 ค่า สถิติทดสอบ คือ t = 4.905 Sig = ระดับนัยสำคัญ() = 0.05 ค่า Sig <  แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ β1 ≠ 0 หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร BC428 : Research in Business Computer

21 = b0 + b1X จะได้สมการพยากรณ์ ดังนี้ ^
อัตราค่าโฆษณา = (เวลาในการโฆษณา) BC428 : Research in Business Computer

22 เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^
วิธีการพยากรณ์ค่า ในการพยากรณ์ค่า หรือการประมาณค่า จะต้องทราบค่า X เพื่อจะใช้ประมาณให้เกิดค่า Y ได้ เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^ อัตราค่าโฆษณา = (100) = พันบาท/นาที = 386,767 บาท/นาที BC428 : Research in Business Computer

23 BC428 : Research in Business Computer

24 ผลการวิเคราะห์ ตัวแปร ค่าสัมประสิทธิ์การถดถอยไม่ปรับมาตรฐาน ค่าสัมประสิทธิ์การถดถอยปรับมาตรฐาน t Sig. ค่าคงที่ 53.967 1.378 0.205 เวลา 3.328 0.866 4.905 0.001 R2=0.719, F=24.058, Sig of F=0.001 จากตาราง เป็นผลการวิเคราะห์ความถดถอยของเวลาในการโฆษณาที่มีอิทธิพลต่ออัตราค่าโฆษณา โดยใช้วิธี Enter ในการคัดเลือกตัวแปร พบว่าเวลาในการโฆษณามีความสัมพันธ์แบบเชิงเส้นกับอัตราค่าโฆษณา และสามารถสร้างสมการการถดถอยเชิงเส้นอย่างง่ายได้ดังนี้ อัตราค่าโฆษณา = (เวลา) BC428 : Research in Business Computer

25 การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย
ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ ค่า e มีความแปรปรวนคงที่ ค่า e มีการแจกแจงแบบปกติ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer

26 e BC428 : Research in Business Computer

27 กฎข้อ 1 ค่า e มีค่าเฉลี่ยเท่ากับศูนย์
ไม่ต้องทดสอบ เนื่องจากในการวิเคราะห์ค่าสัมประสิทธิ์การถดถอย จะใช้วิธีกำลังสองน้อยสุด(Least Square Method) จะทำให้ค่าผลรวมของ e มีค่าเท่ากับศูนย์ ดังนั้น ค่าเฉลี่ยของ e จะมีค่าเท่ากับศูนย์ตามไปด้วย กฎข้อที่ 1 จึงเป็นจริงเสมอ BC428 : Research in Business Computer

28 กฎข้อ 2 ค่า e มีความแปรปรวนคงที่
^ Y คำสั่ง Analysis Regression  Linear … BC428 : Research in Business Computer

29 ทั้ง 2 รูป ใช้สำหรับดูการแจกแจงแบบปกติของค่า e
BC428 : Research in Business Computer

30 ลักษณะของข้อมูลมีการกระจายตัวแบบไม่เป็นรูปแบบ แสดงว่า ค่าความแปรปรวนของค่า e คงที่ (ถ้าลักษณะของข้อมูลมีการกระจายตัวแบบเป็นรูปแบบ คือเป็นแบบเชิงเส้น แสดงว่า ค่าความแปรปรวนของค่า e ไม่คงที่) BC428 : Research in Business Computer

31 กฎข้อ 3 ค่า e มีการแจกแจงแบบปกติ
ใช้รูป Histrogram หรือ Normal P-P Plot หรือใช้วิธีการทดสอบการแจกแจงแบบปกติ Komogolov หรือ Shapiro wilk คำสั่ง Analyze Descriptive Statistics  Explore… BC428 : Research in Business Computer

32 Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ
Explore Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ H1 : ค่าความคลาดไม่มีการแจกแจงแบบปกติ สถิติทดสอบ คือ Shapiro-Wilk = 0.932 ค่า Sig = ระดับนัยสำคัญ() = 0.05 ค่า Sig>  แสดงว่ายอมรับสมมติฐานหลัก นั่นคือ ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติที่ระดับนัยสำคัญ 0.05 ดังนั้น จากการตรวจสอบ กฎข้อที่ 3 พบว่า ค่า e มีการแจกแจงแบบปกติ BC428 : Research in Business Computer

33 กฎข้อ 4 ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน
โดยจะตรวจสอบจากค่าของ Durbin-Watson ดังนี้ ค่า Durbin-Watson ความหมาย เข้าใกล้ 2 ค่าความคลาดเคลื่อนแต่ละค่าเป็นอิสระกัน มากกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางลบ น้อยกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางบวก BC428 : Research in Business Computer

34 จากผลลัพธ์พบว่า ค่า Durbin-Watson = 1
จากผลลัพธ์พบว่า ค่า Durbin-Watson = เนื่องจากมีค่าเข้าใกล้ 2 แสดงว่า ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer

35 การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย ในกฎทั้ง 4 ข้อ คือ ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ , ค่า e มีความแปรปรวนคงที่, ค่า e มีการแจกแจงแบบปกติ และ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน ซึ่งจากการตรวจสอบ พบว่าผ่านกฎทั้ง 4 ข้อ ทำให้สมการการถดถอยที่สร้างขึ้น สามารถนำไปใช้ในการพยากรณ์ได้อย่างมีประสิทธิภาพ BC428 : Research in Business Computer

36 แบบฝึกหัดท้ายบทที่ 12 ข้อ 1
การบ้าน แบบฝึกหัดท้ายบทที่ 12 ข้อ 1 BC428 : Research in Business Computer


ดาวน์โหลด ppt บทที่ 12 การวิเคราะห์การถดถอย

งานนำเสนอที่คล้ายกัน


Ads by Google