บทที่ 12 การวิเคราะห์การถดถอย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
DSP 6 The Fast Fourier Transform (FFT) การแปลงฟูริเยร์แบบเร็ว
Advertisements

Analyze → Compare Means → Paired-Sample T test…
การใช้โปรแกรม SPSS ในการตรวจสอบการแจกแจงของข้อมูล

เป็นการศึกษาผลต่างของประชากรสองกลุ่ม ซึ่งประชากรทั้งสองกลุ่มต้องเป็นอิสระต่อกัน หรือไม่มีความสัมพันธ์กันโดยการกำหนดสมมติฐานในการทดสอบเป็นดังนี้
การทดสอบสมมติฐานเกี่ยวกับ ค่าเฉลี่ยประชากร 1 กลุ่ม
ไม่อิงพารามิเตอร์เบื้องต้น
การซ้อนทับกัน และคลื่นนิ่ง
DSP 6 The Fast Fourier Transform (FFT) การแปลงฟูริเยร์แบบเร็ว
EEET0485 Digital Signal Processing Asst.Prof. Peerapol Yuvapoositanon DSP3-1 ผศ.ดร. พีระพล ยุวภูษิตานนท์ ภาควิชา วิศวกรรมอิเล็กทรอนิกส์ DSP 6 The Fast.
สถิติ และ การวิเคราะห์ข้อมูล
1.7 ระเบียบวิธีทางสถิติ 1. การเก็บรวบรวมข้อมูล (Data Collection)
การวิเคราะห์ความสัมพันธ์ของตัวแปร
การตั้งสมมติฐานและตัวแปร
การวิเคราะห์ค่าเฉลี่ยของประชากร
บทที่ 12 การวิเคราะห์การถดถอย (ต่อ)
การเตรียมความพร้อมข้อมูลก่อนการวิเคราะห์
การวิเคราะห์สถิติเชิงพรรณนา
การวิเคราะห์สถิติแบบ ไม่ใช้พารามิเตอร์
การถดถอยเชิงเดียว (simple regression)
สถิติที่ใช้ในการวิจัย
สถิติที่ใช้ในการวิจัย
สถิติ.
การประยุกต์สมการเชิงเส้นตัวแปรเดียว
เอกสารประกอบคำสอน อาจารย์ศุกรี อยู่สุข
NUMBER SYSTEM เลขฐานสิบ (Decimal Number) เลขฐานสอง (Binary Number)
บทที่ 6 การวิเคราะห์สหสัมพันธ์
การประมาณค่าทางสถิติ
คณะครุศาสตร์อุตสาหกรรม สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง
การวิเคราะห์สหสัมพันธ์และการถดถอย
กลุ่มสาระการเรียนรู้ คณิตศาสตร์ โรงเรียนบ้านหนองกุง อำเภอนาเชือก
การวิเคราะห์ความแปรปรวน
การคำนวณค่าสถิติเบื้องต้น … สถิติเชิงพรรณนา
ความคลาดเคลื่อนมาตรฐานในการพยากรณ์ (Standard Error of Estimate: SEE)
ตัวอย่างงานวิจัย องค์ประกอบที่มีความสัมพันธ์กับการใช้ห้องสมุดของนักเรียนมัธยมศึกษา ตารางที่ 4-7 ตารางที่
การเขียนโปรแกรมเชิงวัตถุ ด้วยภาษาจาวา
การใช้งานเบื้องต้นของเครื่องคิดเลขทางการเงิน
Menu Analyze > Correlate
สถิติเชิงสรุปอ้างอิง(Inferential or Inductive Statistics)
Kampol chanchoengpan it สถาปัตยกรรมคอมพิวเตอร์ Arithmetic and Logic Unit 1.
ทำการตั้งเบิกเพิ่ม แบบฟอร์ม GFMIS.ขบ.02 เพื่อชดใช้ใบสำคัญ
แนวทางการปฏิบัติโครงการจูงมือ น้องน้อยบนดอยสูง 1.
การทดสอบสมมติฐาน
ง30212 การเขียนโปรแกรมภาษาคอมพิวเตอร์ โรงเรียนปลวกแดงพิทยาคม
การวัดการกระจาย (Measures of Dispersion)
สหสัมพันธ์ (correlation)
สัปดาห์ที่ 7 การแปลงลาปลาซ The Laplace Transform.
สัปดาห์ที่ 15 โครงข่ายสองพอร์ท Two-Port Networks (Part I)
สถาปัตยกรรมคอมพิวเตอร์ (Computer Architecture)
การแจกแจงปกติ.
ค21201 คณิตศาสตร์เพิ่มเติม 1
ความหมายของวิทยาศาสตร์
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
ภาษาอังกฤษเพื่อการสื่อสาร อ32204
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
แบบฝึกหัด จงหาคำตอบที่ดีที่สุด หรือหาค่ากำไรสูงสุด จาก
การวิเคราะห์สหสัมพันธ์อย่างง่าย
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
Chi-Square Test การทดสอบไคสแควร์ 12.
หน่วยการเรียนรู้ที่ 7 ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
หน่วยการเรียนรู้ที่ 7 ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
วิธีเรียงสับเปลี่ยนและวิธีจัดหมู่
1 คำสั่งในการวิเคราะห์สถิติเชิงพรรณนา 1.การวิเคราะห์เชิงพรรณนาในภาพรวม
Correlation Tipsuda Janjamlha 06 Sep. 08. X1X2 > interval Ho: ตัวแปรทั้ง 2 ไม่มี ความสัมพันธ์กัน Ha: ตัวแปรทั้ง 2 มีความสัมพันธ์ กัน.
สถิติเพื่อการวิจัย 1. สถิติเชิงบรรยาย 2. สถิติเชิงอ้างอิง.
การตรวจสอบข้อกำหนดของการวิเคราะห์ความแปรปรวน
คณิตศาสตร์ (ค33101) ชั้นมัธยมศึกษาปีที่ 3 หน่วยการเรียนรู้ที่ 7
โครงสร้างข้อมูลแบบ สแตก (stack)
ใบสำเนางานนำเสนอ:

บทที่ 12 การวิเคราะห์การถดถอย บทที่ 12 การวิเคราะห์การถดถอย BC428 : Research in Business Computer

Regression เป็นการวิเคราะห์หาความสัมพันธ์ระหว่างตัวแปรอิสระหรือตัวแปรต้น กับตัวแปรตาม ตัวแปรที่จะใช้ในการวิเคราะห์จะเป็นตัวแปรเชิงปริมาณ จะนำเสนอผลการวิเคราะห์ในรูปแบบของสมการ เชิงเส้น ความสัมพันธ์ ระหว่างตัวแปร ไม่เป็นเชิงเส้น BC428 : Research in Business Computer

Regression แบ่งเป็น Simple Linear Regression Analysis Multiple Linear Regression Analysis BC428 : Research in Business Computer

Simple Linear Regression Analysis ศึกษาความสัมพันธ์ของตัวแปร 2 ตัว ตัวแปรต้น (X) ตัวแปรตาม (Y) BC428 : Research in Business Computer

Y X สมการการถดถอยเชิงเส้นของประชากร Y = β0 + β1X + ε สมการการถดถอยเชิงเส้นของกลุ่มตัวอย่าง Y = b0 + b1X + e สมการจากการพยากรณ์ (การประมาณค่า) β0 β1 X Y= β0 + β1X Y = b0 + b1X BC428 : Research in Business Computer

ขั้นตอนการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ตรวจสอบว่าตัวแปร X และ Y มีความสัมพันธ์กันเชิงเส้นหรือไม่ สร้างสมการการพยากรณ์ เพื่อใช้สำหรับการประมาณค่า Y ตรวจสอบข้อตกลงเบื้องต้นของการวิเคราะห์ความถดถอยเชิงเส้นอย่างง่ายของตัวแปรทั้งสอง BC428 : Research in Business Computer

ค่าสถิติที่ควรรู้ 1) ค่าสัมประสิทธิ์สหสัมพันธ์ 1) ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient) เป็นค่าความสัมพันธ์ของตัวแปร X กับ Y สัญลักษณ์ที่ใช้คือ rxy หรือ r ค่าที่คำนวณได้อยู่ในช่วงระหว่าง -1 ถึง 1 BC428 : Research in Business Computer

ความหมายของค่าสัมประสิทธิ์สหสัมพันธ์ ค่า r ความหมาย ค่าบวก มีความสัมพันธ์ในทิศทางเดียวกัน ค่าลบ มีความสัมพันธ์ในทิศทางตรงกันข้าม ค่าเข้าใกล้ 1 มีความสัมพันธ์กันมาก และในทิศทางเดียวกัน ค่าเข้าใกล้ -1 มีความสัมพันธ์กันมาก และในทิศทางตรงกันข้าม ค่าเข้าใกล้ 0 มีความสัมพันธ์กันน้อย ค่าเท่ากับ 1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางเดียวกัน ค่าเท่ากับ -1 มีความสัมพันธ์กันอย่างสมบูรณ์ และในทิศทางตรงกันข้าม ค่าเท่ากับ 0 ไม่มีความสัมพันธ์กัน เช่น r=0.56 หมายความว่า ? BC428 : Research in Business Computer

2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination) 2) ค่าสัมประสิทธิ์การกำหนด (The Coefficient of Determination) เกิดจากการนำค่าสัมประสิทธิ์สหสัมพันธ์ยกกำลังสอง ใช้แสดงความแปรผันที่เกิดขึ้นกับตัวแปร Y มีผลเนื่องมาจากตัวแปร X คิดเป็นกี่เปอร์เซ็นต์ ใช้ศึกษาว่า สมการการประมาณค่ามีความเหมาะสมที่จะนำไปใช้ได้มากหรือน้อย ค่าที่คำนวณได้จะอยู่ในช่วงระหว่าง 0 ถึง 1 สัญลักษณ์ที่ใช้คือ r2 BC428 : Research in Business Computer

ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 1 แสดงว่าตัวแปร X มีอิทธิพลต่อตัวแปร Y อย่างมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้มาก ในกรณีที่ค่า r2 มีค่าเข้าใกล้ 0 แสดงว่า ตัวแปร X มีอิทธิพลต่อตัวแปร Y น้อยมาก หมายความว่า สมการการประมาณค่าจะมีความเหมาะสมที่จะนำไปใช้งานได้น้อย เช่น r2=0.56 หมายความว่า ? BC428 : Research in Business Computer

3) ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (Standard Error of the Estimate) เป็นค่าคลาดเคลื่อนที่เกิดจากการประมาณค่า Y ด้วย สัญลักษณ์ที่ใช้คือ SY.X X = b0 + b1X Y X = b0 + b1X Y SY.X > 0 SY.X = 0 BC428 : Research in Business Computer

4)ค่าสัมประสิทธิ์การถดถอย (Regression Coefficient) เป็นค่าความชันของเส้นสมการการถดถอย สัญลักษณ์ที่ใช้คือ b1 b1 = 0 b1 > 0 b1 < 0 X = b0 + b1X Y X = b0 - b1X Y X = b0 + b1X Y BC428 : Research in Business Computer

การตรวจสอบความเป็นเชิงเส้นของข้อมูล X Y ก) ความสัมพันธ์แบบเส้นตรงทางบวก ข) ความสัมพันธ์แบบเส้นตรงทางลบ ค) ความสัมพันธ์แบบเอกโปเนนเชียลทางบวก จ) ความสัมพันธ์แบบพาราโบล่าทางบวก ง) ความสัมพันธ์แบบเอกโปเนนเชียลทางลบ ฉ) ไม่มีความสัมพันธ์กัน BC428 : Research in Business Computer

ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่ Data12_1.sav ลักษณะของคำถามในแบบสอบถาม (จะเป็นข้อมูลเชิงปริมาณ) 1.เวลาในการออกอากาศ ......................... นาที/สัปดาห์ 2.อัตราค่าโฆษณา ................................. บาท/นาที ตัวแปร X คือ ? ตัวแปร Y คือ ? ต้องการตรวจสอบว่า X และ Y มีความสัมพันธ์เชิงเส้นหรือไม่ คำสั่ง Graphs  Scatter… BC428 : Research in Business Computer

Graph ข้อมูลมีลักษณะการกระจายตัวเป็นในแนวเส้นตรง แสดงว่าเวลาที่ใช้ในการโฆษณามีความสัมพันธ์เชิงเส้นกับอัตราค่าโฆษณา BC428 : Research in Business Computer

วิธีการสร้างสมการการถดถอย จะมีวิธีการคัดเลือกตัวแปรอิสระในการทดสอบได้หลายวิธี ดังนี้ Enter Forward Backward Stepwise Remove BC428 : Research in Business Computer

Analyze  Regression  Linear … คำสั่ง Analyze  Regression  Linear … BC428 : Research in Business Computer

สัมประสิทธิ์สหสัมพันธ์ (R)= 0 สัมประสิทธิ์สหสัมพันธ์ (R)= 0.866 หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาในทิศทางเดียวกัน และมีความสัมพันธ์กันในระดับสูง (เนื่องจากค่า R มีค่ามาก) สัมประสิทธิ์การกำหนด (R2)= 0.719 หมายความว่า อิทธิพลของเวลาที่ใช้ในการโฆษณาที่มีต่ออัตราค่าโฆษณาคิดเป็น 71.9 เปอร์เซ็นต์ ที่เหลืออีก 28.1 เปอร์เซ็นต์ เป็นผลเนื่องมาจากตัวแปรอื่น ค่าความคลาดเคลื่อนมาตรฐานของการประมาณ (SY.X) = 37.470 หมายความว่า การประมาณค่าของอัตราค่าโฆษณา( )มีความคลาดเคลื่อนเกิดขึ้นเท่ากับ 37.470 พันบาท/นาที (ใช้หน่วยเดียวกับหน่วยของตัวแปรตาม) BC428 : Research in Business Computer

Ho : เวลาที่ใช้ในการโฆษณาไม่มีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น สถิติทดสอบ คือ F = 24.058 ค่า Sig = 0.001 ระดับนัยสำคัญ() = 0.05 ค่า Sig <  แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 BC428 : Research in Business Computer

ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร Ho : β1 = 0 H1 : β1 ≠ 0 ค่า สถิติทดสอบ คือ t = 4.905 Sig = 0.001 ระดับนัยสำคัญ() = 0.05 ค่า Sig <  แสดงว่าปฏิเสธสมมติฐานหลัก นั่นคือ β1 ≠ 0 หมายความว่า เวลาที่ใช้ในการโฆษณามีความสัมพันธ์กับอัตราค่าโฆษณาแบบเชิงเส้น ที่ระดับนัยสำคัญ 0.05 ทดสอบความสัมพันธ์ เชิงเส้นระหว่างตัวแปรอิสระและตัวแปร BC428 : Research in Business Computer

= b0 + b1X จะได้สมการพยากรณ์ ดังนี้ ^ อัตราค่าโฆษณา = 53.967 + 3.328(เวลาในการโฆษณา) BC428 : Research in Business Computer

เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^ วิธีการพยากรณ์ค่า ในการพยากรณ์ค่า หรือการประมาณค่า จะต้องทราบค่า X เพื่อจะใช้ประมาณให้เกิดค่า Y ได้ เช่น เมื่อ เวลาในการโฆษณา = 100 นาที/สัปดาห์ อัตราค่าโฆษณาจะเป็น ^ อัตราค่าโฆษณา = 53.967 + 3.328 (100) = 386.767 พันบาท/นาที = 386,767 บาท/นาที BC428 : Research in Business Computer

BC428 : Research in Business Computer

ผลการวิเคราะห์ ตัวแปร ค่าสัมประสิทธิ์การถดถอยไม่ปรับมาตรฐาน ค่าสัมประสิทธิ์การถดถอยปรับมาตรฐาน t Sig. ค่าคงที่ 53.967 1.378 0.205 เวลา 3.328 0.866 4.905 0.001 R2=0.719, F=24.058, Sig of F=0.001 จากตาราง เป็นผลการวิเคราะห์ความถดถอยของเวลาในการโฆษณาที่มีอิทธิพลต่ออัตราค่าโฆษณา โดยใช้วิธี Enter ในการคัดเลือกตัวแปร พบว่าเวลาในการโฆษณามีความสัมพันธ์แบบเชิงเส้นกับอัตราค่าโฆษณา และสามารถสร้างสมการการถดถอยเชิงเส้นอย่างง่ายได้ดังนี้ อัตราค่าโฆษณา = 53.967 + 3.328(เวลา) BC428 : Research in Business Computer

การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ ค่า e มีความแปรปรวนคงที่ ค่า e มีการแจกแจงแบบปกติ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer

e BC428 : Research in Business Computer

กฎข้อ 1 ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ ไม่ต้องทดสอบ เนื่องจากในการวิเคราะห์ค่าสัมประสิทธิ์การถดถอย จะใช้วิธีกำลังสองน้อยสุด(Least Square Method) จะทำให้ค่าผลรวมของ e มีค่าเท่ากับศูนย์ ดังนั้น ค่าเฉลี่ยของ e จะมีค่าเท่ากับศูนย์ตามไปด้วย กฎข้อที่ 1 จึงเป็นจริงเสมอ BC428 : Research in Business Computer

กฎข้อ 2 ค่า e มีความแปรปรวนคงที่ ^ Y คำสั่ง Analysis Regression  Linear … BC428 : Research in Business Computer

ทั้ง 2 รูป ใช้สำหรับดูการแจกแจงแบบปกติของค่า e BC428 : Research in Business Computer

ลักษณะของข้อมูลมีการกระจายตัวแบบไม่เป็นรูปแบบ แสดงว่า ค่าความแปรปรวนของค่า e คงที่ (ถ้าลักษณะของข้อมูลมีการกระจายตัวแบบเป็นรูปแบบ คือเป็นแบบเชิงเส้น แสดงว่า ค่าความแปรปรวนของค่า e ไม่คงที่) BC428 : Research in Business Computer

กฎข้อ 3 ค่า e มีการแจกแจงแบบปกติ ใช้รูป Histrogram หรือ Normal P-P Plot หรือใช้วิธีการทดสอบการแจกแจงแบบปกติ Komogolov หรือ Shapiro wilk คำสั่ง Analyze Descriptive Statistics  Explore… BC428 : Research in Business Computer

Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ Explore Ho : ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติ H1 : ค่าความคลาดไม่มีการแจกแจงแบบปกติ สถิติทดสอบ คือ Shapiro-Wilk = 0.932 ค่า Sig = 0.469 ระดับนัยสำคัญ() = 0.05 ค่า Sig>  แสดงว่ายอมรับสมมติฐานหลัก นั่นคือ ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติที่ระดับนัยสำคัญ 0.05 ดังนั้น จากการตรวจสอบ กฎข้อที่ 3 พบว่า ค่า e มีการแจกแจงแบบปกติ BC428 : Research in Business Computer

กฎข้อ 4 ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน โดยจะตรวจสอบจากค่าของ Durbin-Watson ดังนี้ ค่า Durbin-Watson ความหมาย เข้าใกล้ 2 ค่าความคลาดเคลื่อนแต่ละค่าเป็นอิสระกัน มากกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางลบ น้อยกว่า 2 ค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ในกันทิศทางบวก BC428 : Research in Business Computer

จากผลลัพธ์พบว่า ค่า Durbin-Watson = 1 จากผลลัพธ์พบว่า ค่า Durbin-Watson = 1.637 เนื่องจากมีค่าเข้าใกล้ 2 แสดงว่า ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน BC428 : Research in Business Computer

การตรวจสอบข้อตกลงเบื้องต้นของสมการการถดถอย ในกฎทั้ง 4 ข้อ คือ ค่า e มีค่าเฉลี่ยเท่ากับศูนย์ , ค่า e มีความแปรปรวนคงที่, ค่า e มีการแจกแจงแบบปกติ และ ค่า e แต่ละตัวจะต้องเป็นอิสระต่อกัน ซึ่งจากการตรวจสอบ พบว่าผ่านกฎทั้ง 4 ข้อ ทำให้สมการการถดถอยที่สร้างขึ้น สามารถนำไปใช้ในการพยากรณ์ได้อย่างมีประสิทธิภาพ BC428 : Research in Business Computer

แบบฝึกหัดท้ายบทที่ 12 ข้อ 1 การบ้าน แบบฝึกหัดท้ายบทที่ 12 ข้อ 1 BC428 : Research in Business Computer