บทที่ 12 การวิเคราะห์การถดถอย บทที่ 12 การวิเคราะห์การถดถอย BC428 : Research in Business Computer
Regression เป็นการวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรอิสระหรือตัวแปรต้น กับตัวแปรตาม ตัวแปรที่จะใช้ในการวิเคราะห์จะเป็นตัวแปรเชิงปริมาณ จะนำเสนอผลการวิเคราะห์ในรูปแบบของสมการ เชิงเส้น ความสัมพันธ์ ระหว่างตัวแปร ไม่เป็นเชิงเส้น BC428 : Research in Business Computer
Regression แบ่งเป็น Simple Linear Regression Analysis Multiple Linear Regression Analysis BC428 : Research in Business Computer
Simple Linear Regression Analysis ศึกษาความสัมพันธ์ของตัวแปร 2 ตัว ตัวแปรต้น (X) ตัวแปรตาม (Y) BC428 : Research in Business Computer
Y X สมการการถดถอยเชิงเส้นของประชากร Y = β0 + β1X + ε สมการการถดถอยเชิงเส้นของกลุ่มตัวอย่าง Y = b0 + b1X + e สมการจากการพยากรณ์ (การประมาณค่า) β0 β1 X Y= β0 + β1X Y = b0 + b1X BC428 : Research in Business Computer
ขั้นตอนการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ตรวจสอบว่าตัวแปร X และ Y มีความสัมพันธ์กันเชิงเส้นหรือไม่ สร้างสมการการพยากรณ์ เพื่อใช้สำหรับการประมาณค่า Y ตรวจสอบข้อตกลงเบื้องต้นของการวิเคราะห์ความถดถอยเชิงเส้นอย่างง่ายของตัวแปรทั้งสอง BC428 : Research in Business Computer
ค่าสถิติที่ควรรู้ 1) ค่าสัมประสิทธิ์สหสัมพันธ์ 1) ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) เป็นค่าความสัมพันธ์ของตัวแปร X กับ Y สัญลักษณ์ที่ใช้คือ rxy หรือ r ค่าที่คำนวณได้อยู่ในช่วงระหว่าง -1 ถึง 1 BC428 : Research in Business Computer
ความหมายของค่าสัมประสิทธิ์สหสัมพันธ์ ค่า r ความหมาย ค่าบวก มีความสัมพันธ์ในทิศทางเดียวกัน ค่าลบ มีความสัมพันธ์ในทิศทางตรงกันข้าม ค่าเข้าใกล้ 1 มีความสัมพันธ์กันมาก และในทิศทางเดียวกัน ค่าเข้าใกล้ -1 มีความสัมพันธ์กันมาก และในทิศทางตรงกันข้าม ค่าเข้าใกล้ 0 มีความสัมพันธ์กันน้อย ค่าเท่ากับ 1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางเดียวกัน ค่าเท่ากับ -1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางตรงกันข้าม ค่าเท่ากับ 0 ไม่มีความสัมพันธ์กัน เช่น r=0.56 หมายความว่า ? BC428 : Research in Business Computer
2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination) 2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination) เกิดจากการนำค่าสัมประสิทธิ์สหสัมพันธ์ยกกำลังสอง ใช้แสดงความแปรผันที่เกิดขึ้นกับตัวแปร Y มีผลเนื่องมาจากตัวแปร X คิดเป็นกี่เปอร์เซ็นต์ ใช้ศึกษาว่า สมการการประมาณค่ามีความเหมาะสมที่จะนำไปใช้ได้มากหรือน้อย ค่าที่คำนวณได้จะอยู่ในช่วงระหว่าง 0 ถึง 1 สัญลักษณ์ที่ใช้คือ r2 BC428 : Research in Business Computer
ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 1 แสดงว่าตัวแปร X มีอิทธิพลต่อตัวแปร Y อย่างมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้มาก ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 0 แสดงว่า ตัวแปร X มีอิทธิพลต่อตัวแปร Y น้อยมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้น้อย เช่น r2=0.56 หมายความว่า ? BC428 : Research in Business Computer
3) ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (Standard Error of the Estimate) เป็นค่าคลาดเคลื่อนที่เกิดจากการประมาณค่า Y ด้วย สัญลักษณ์ที่ใช้คือ SY.X X = b0 + b1X Y X = b0 + b1X Y SY.X > 0 SY.X = 0 BC428 : Research in Business Computer
4)ค่าสัมประสิทธิ์การถดถอย (Regression Coefficient) เป็นค่าความชันของเส้นสมการการถดถอย สัญลักษณ์ที่ใช้คือ b1 b1 = 0 b1 > 0 b1 < 0 X = b0 + b1X Y X = b0 - b1X Y X = b0 + b1X Y BC428 : Research in Business Computer
การตรวจสอบความเป็นเชิงเส้นของข้อมูล X Y ก) ความสัมพันธ์แบบเส้นตรงทางบวก ข) ความสัมพันธ์แบบเส้นตรงทางลบ ค) ความสัมพันธ์แบบเอกโปเนนเชียลทางบวก จ) ความสัมพันธ์แบบพาราโบล่าทางบวก ง) ความสัมพันธ์แบบเอกโปเนนเชียลทางลบ ฉ) ไม่มีความสัมพันธ์กัน BC428 : Research in Business Computer
ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่ Data12_1.sav ลักษณะของคำถามในแบบสอบถาม (จะเป็นข้อมูลเชิงปริมาณ) 1.เวลาในการออกอากาศ ......................... นาที/สัปดาห์ 2.อัตราค่าโฆษณา ................................. บาท/นาที ตัวแปร X คือ ? ตัวแปร Y คือ ? ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่ คำสั่ง Graphs Scatter… BC428 : Research in Business Computer
Graph ข้อมูลมีลักษณะการกระจายตัวเป็นในแนวเส้นตรง แสดงว่าเวลาที่ใช้ในการโฆษณามีความสัมพันธ์เชิงเส้นกับอัตราค่าโฆษณา BC428 : Research in Business Computer
วิธีการสร้างสมการการถดถอย จะมีวิธีการคัดเลือกตัวแปรอิสระในการทดสอบได้หลายวิธี ดังนี้ Enter Forward Backward Stepwise Remove BC428 : Research in Business Computer
Analyze Regression Linear … คำสั่ง Analyze Regression Linear … BC428 : Research in Business Computer
สัมประสิทธิ์สหสัมพันธ์ (R)= 0 สัมประสิทธิ์สหสัมพันธ์ (R)= 0.866 หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาในทิศทางเดียวกัน และมีความสัมพันธ์กันในระดับสูง (เนื่องจากค่า R มีค่ามาก) สัมประสิทธิ์การกำหนด (R2)= 0.719 หมายความว่า อิทธิพลของเวลาที่ใช้ในการโฆษณาที่มีต่ออัตราค่าโฆษณาคิดเป็น 71.9 เปอร์เซ็นต์ ที่เหลืออีก 28.1 เปอร์เซ็นต์ เป็นผลเนื่องมาจากตัวแปรอื่น ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (SY.X) = 37.470 หมายความว่า การประมาณค่าของอัตราค่าโฆษณา( )มีความคลาดเคลื่อนเกิดขึ้นเท่ากับ 37.470 พันบาท/นาที (ใช้หน่วยเดียวกับหน่วยของตัวแปรตาม) BC428 : Research in Business Computer
Ho : เวลาที่ใช้ในการโฆษณาไม่มีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น สถิติทดสอบ คือ F = 24.058 ค่า Sig = 0.001 ระดับนัยสำคัญ() = 0.05 ค่า Sig < แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 BC428 : Research in Business Computer
ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร Ho : β1 = 0 H1 : β1 ≠ 0 ค่า สถิติทดสอบ คือ t = 4.905 Sig = 0.001 ระดับนัยสำคัญ() = 0.05 ค่า Sig < แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ β1 ≠ 0 หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร BC428 : Research in Business Computer
= b0 + b1X จะได้สมการพยากรณ์ ดังนี้ ^ อัตราค่าโฆษณา = 53.967 + 3.328(เวลาในการโฆษณา) BC428 : Research in Business Computer
เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^ วิธีการพยากรณ์ค่า ในการพยากรณ์ค่า หรือการประมาณค่า จะต้องทราบค่า X เพื่อจะใช้ประมาณให้เกิดค่า Y ได้ เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^ อัตราค่าโฆษณา = 53.967 + 3.328 (100) = 386.767 พันบาท/นาที = 386,767 บาท/นาที BC428 : Research in Business Computer
BC428 : Research in Business Computer
ผลการวิเคราะห์ ตัวแปร ค่าสัมประสิทธิ์การถดถอยไม่ปรับมาตรฐาน ค่าสัมประสิทธิ์การถดถอยปรับมาตรฐาน t Sig. ค่าคงที่ 53.967 1.378 0.205 เวลา 3.328 0.866 4.905 0.001 R2=0.719, F=24.058, Sig of F=0.001 จากตาราง เป็นผลการวิเคราะห์ความถดถอยของเวลาในการโฆษณาที่มีอิทธิพลต่ออัตราค่าโฆษณา โดยใช้วิธี Enter ในการคัดเลือกตัวแปร พบว่าเวลาในการโฆษณามีความสัมพันธ์แบบเชิงเส้นกับอัตราค่าโฆษณา และสามารถสร้างสมการการถดถอยเชิงเส้นอย่างง่ายได้ดังนี้ อัตราค่าโฆษณา = 53.967 + 3.328(เวลา) BC428 : Research in Business Computer
การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ ค่า e มีความแปรปรวนคงที่ ค่า e มีการแจกแจงแบบปกติ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer
e BC428 : Research in Business Computer
กฎข้อ 1 ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ ไม่ต้องทดสอบ เนื่องจากในการวิเคราะห์ค่าสัมประสิทธิ์การถดถอย จะใช้วิธีกำลังสองน้อยสุด(Least Square Method) จะทำให้ค่าผลรวมของ e มีค่าเท่ากับศูนย์ ดังนั้น ค่าเฉลี่ยของ e จะมีค่าเท่ากับศูนย์ตามไปด้วย กฎข้อที่ 1 จึงเป็นจริงเสมอ BC428 : Research in Business Computer
กฎข้อ 2 ค่า e มีความแปรปรวนคงที่ ^ Y คำสั่ง Analysis Regression Linear … BC428 : Research in Business Computer
ทั้ง 2 รูป ใช้สำหรับดูการแจกแจงแบบปกติของค่า e BC428 : Research in Business Computer
ลักษณะของข้อมูลมีการกระจายตัวแบบไม่เป็นรูปแบบ แสดงว่า ค่าความแปรปรวนของค่า e คงที่ (ถ้าลักษณะของข้อมูลมีการกระจายตัวแบบเป็นรูปแบบ คือเป็นแบบเชิงเส้น แสดงว่า ค่าความแปรปรวนของค่า e ไม่คงที่) BC428 : Research in Business Computer
กฎข้อ 3 ค่า e มีการแจกแจงแบบปกติ ใช้รูป Histrogram หรือ Normal P-P Plot หรือใช้วิธีการทดสอบการแจกแจงแบบปกติ Komogolov หรือ Shapiro wilk คำสั่ง Analyze Descriptive Statistics Explore… BC428 : Research in Business Computer
Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ Explore Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ H1 : ค่าความคลาดไม่มีการแจกแจงแบบปกติ สถิติทดสอบ คือ Shapiro-Wilk = 0.932 ค่า Sig = 0.469 ระดับนัยสำคัญ() = 0.05 ค่า Sig> แสดงว่ายอมรับสมมติฐานหลัก นั่นคือ ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติที่ระดับนัยสำคัญ 0.05 ดังนั้น จากการตรวจสอบ กฎข้อที่ 3 พบว่า ค่า e มีการแจกแจงแบบปกติ BC428 : Research in Business Computer
กฎข้อ 4 ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน โดยจะตรวจสอบจากค่าของ Durbin-Watson ดังนี้ ค่า Durbin-Watson ความหมาย เข้าใกล้ 2 ค่าความคลาดเคลื่อนแต่ละค่าเป็นอิสระกัน มากกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางลบ น้อยกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางบวก BC428 : Research in Business Computer
จากผลลัพธ์พบว่า ค่า Durbin-Watson = 1 จากผลลัพธ์พบว่า ค่า Durbin-Watson = 1.637 เนื่องจากมีค่าเข้าใกล้ 2 แสดงว่า ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer
การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย ในกฎทั้ง 4 ข้อ คือ ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ , ค่า e มีความแปรปรวนคงที่, ค่า e มีการแจกแจงแบบปกติ และ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน ซึ่งจากการตรวจสอบ พบว่าผ่านกฎทั้ง 4 ข้อ ทำให้สมการการถดถอยที่สร้างขึ้น สามารถนำไปใช้ในการพยากรณ์ได้อย่างมีประสิทธิภาพ BC428 : Research in Business Computer
แบบฝึกหัดท้ายบทที่ 12 ข้อ 1 การบ้าน แบบฝึกหัดท้ายบทที่ 12 ข้อ 1 BC428 : Research in Business Computer