บทที่ 12 การวิเคราะห์สหสัมพันธ์และการถดถอย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
Chapter 3 Data Representation (การแทนข้อมูล)
Advertisements

ครุศาสตรมหาบัณฑิต สาขาวิชา การสอนภาษาอังกฤษเพื่อ วิชาการและงานอาชีพ
ศูนย์เรียนรู้ชุมชนเศรษฐกิจ พอเพียงบ้านซ่อง อ.พนมสารคาม จ.ฉะเชิงเทรา
สาระที่ ๒ การเขียน.
การบริหารจัดการโครงการ และการเบิกจ่ายงบประมาณ
ศึกษาข้อมูลท้องถิ่นบ้านสนาม
ยินดีต้อนรับ คณะกรรมการประเมินคุณภาพการศึกษาภายใน “สำนักส่งเสริมวิชาการและงานทะเบียน” วันอังคารที่ 23 สิงหาคม พ.ศ
Application of Electron Paramagnetic Resonance (EPR)
Lubna Shamshad (Ph.D Student) Supervisor Dr.GulRooh
Q n° R n°.
อาคารสำนักงานเขต พื้นที่การศึกษา (สพป./สพม.)
อ. ปิยวรรณ โถปาสอน
Chapter 3 Design of Discrete-Time control systems Frequency Response
ยินดีต้อนรับ นสต. ภ.๙.
การส่งเสริมจริยธรรมและคุณธรรม เพื่อการป้องกันการทุจริต
พอช.องค์การมหาชนของชุมชนไทย
ชั้นมัธยมศึกษาปีที่ ๖ โรงเรียนสาธิตมหาวิทยาลัยราชภัฏสวนสุนันทา
หน่วยที่ 2 การประกันคุณภาพภายในสถานศึกษา
หลักสูตรการศึกษานอกระบบ ระดับการศึกษาขั้นพื้นฐาน พุทธศักราช 2551
Multiple Input Multiple Output (MIMO)
บทที่ 7 TAS 17 (ปรับปรุง 2558): สัญญาเช่า (Leases)
หลักการสร้างมาตรวัดทางจิตวิทยา
โครงการส่งเสริมการพัฒนาคุณภาพงาน คณะวิทยาศาสตร์ มหาวิทยาลัยเชียงใหม่
แผนการจัดการเรียนรู้ กลุ่มสาระการเรียนรู้วิทยาศาสตร์
แนวการตรวจสอบภายใน การตรวจสอบรถราชการ
ทะเบียนราษฎร.
นายธนวิทย์ โพธิ์พฤกษ์ เลขที่ 8 นายอนุสรณ์ ขำหลง เลขที่ 29
เรื่อง การบริหารการศึกษาตาม พ.ร.บ ระเบียบบริหารราชการกระทรวงศึกษาธิการ
เอกสารประกอบการบรรยายครั้ง ๒ วิชาซื้อขาย - เช่าทรัพย์ - เช่าซื้อ
ระเบียบกระทรวงมหาดไทย
DATA STRUCTURES AND ALGORITHMS
ขั้นตอนการจัดตั้งกลุ่มส่งเสริมอาชีพ จังหวัดนครราชสีมา ปี ๒๕๕๘/๕๙
หลักการจัดกิจกรรมนันทนาการ
การประชุมผู้บริหารระดับสูงกระทรวงวัฒนธรรม ครั้งที่ ๔/๒๕๖๐
การเบิกจ่ายเงินเกี่ยวกับค่าใช้จ่าย ในการบริหารงานของส่วนราชการ
การแก้ไขปัญหา สหกรณ์เครดิตยูเนี่ยนคลองจั่น จำกัด
ขั้นตอนของกิจกรรม : ปฏิบัติเป็นประจำ เพื่อให้เกิดการพัฒนาอย่างต่อเนื่อง
ตอนที่ 2.๒ บทบาทหน้าที่ของเจ้าหน้าที่ส่งเสริมการเกษตรระดับอำเภอ
บทที่ 4 การกระจาย อำนาจด้านการคลัง
งานเงินสมทบและการตรวจสอบ
ยินดีต้อนรับเข้าสู่บทเรียนคอมพิวเตอร์ วัยรุ่นไทยใส่ใจวัฒนธรรม เรื่อง
การพัฒนาระบบบริหารจัดการกำลังคนด้านสุขภาพ “การพัฒนาบุคลากร”
ค่าใช้จ่ายต่างๆ ในโครงการฯ
วันเสาร์ที่ 2 กรกฎาคม 2559 วิทยาลัยเทคโนโลยีอักษรพัทยา
วิชาสังคมศึกษา ม.3 สาระที่ 1 ศาสนา ศีลธรรม จริยธรรม.
มหาวิยาลัยราชภัฏนครราชสีมา
โครงการสนับสนุนสินเชื่อเกษตรกรชาวสวนยาง รายย่อยเพื่อประกอบอาชีพเสริม
ความหมายของหนี้สาธารณะ
การจัดการชั้นเรียน.
การบริหารการเงิน ในสถานศึกษา
องค์ประกอบและผลกระทบของธุรกิจไมซ์
โคลง ร่าย และ โดยครูธาริตา นพสุวรรณ
Matrix 1.Thamonaporn intasuwan no.7 2.Wannisa chawlaw no.13 3.Sunita taoklang no.17 4.Aungkhana mueagjinda no.20.
สมาชิกโต๊ะ 1 นายสุรวินทร์ รีเรียง นายภาณุวิชญ์ อนุศรี
นำเสนอ วัดเกาะชัน ด.ช.ปกรณ์ ร้อยจันทร์ ม.2/7 เลขที่ 19
รศ.ดร.อนันต์ จันทรโอภากร
การเขียนวิจารณ์วรรณกรรม ๒
การยืมเงิน จากแหล่งเงินงบประมาณรายได้
วิชา หลักการตลาด บทที่ 7 การออกแบบกลยุทธ์ราคา
ผังมโนทัศน์สาระการเรียนรู้ภาษาไทย ชั้นมัธยมศึกษาปีที่ ๑
สาระสำคัญพ.ร.บ.การทวงถามหนี้ พ.ศ.๒๕๕๘ สาระสำคัญพ.ร.บ.การทวงถามหนี้ พ.ศ.๒๕๕๘.
การบัญชีตามความรับผิดชอบและ การประเมินผลการปฏิบัติงาน
ตำบลหนองพลับ ประวัติความเป็นมา
แบบทดสอบ เรื่อง ความน่าจะเป็น.
การปฏิรูประบบศาลยุติธรรม หลังรัฐประหาร 2557
ธาตุ สารประกอบ และปฏิกิริยาเคมี
ข้อกำหนด/มาตรฐาน ด้านสุขาภิบาลอาหาร
การบริหารหลักสูตร ความหมาย : การดำเนินงานที่เกี่ยวข้องกับการทำหลักสูตร และเอกสารประกอบหลักสูตร ไปสู่การปฏิบัติในสถานการณ์จริงหรือกิจกรรมการเรียนการสอนให้เป็นไปตามเป้าหมายที่กำหนดไว้ในหลักสูตรโดยอาศัยการสนับสนุนและร่วมมือจากบุคคลที่เกี่ยวข้องกับการใช้หลักส
PHYSICS by P’Tum LINE
การพิจารณาสัญชาติของบุคคล
ใบสำเนางานนำเสนอ:

บทที่ 12 การวิเคราะห์สหสัมพันธ์และการถดถอย บทที่ 12 การวิเคราะห์สหสัมพันธ์และการถดถอย 88520159 Probability and Statistics for Computing

การวิเคราะห์สหสัมพันธ์และการถดถอย การวิเคราะห์ความสัมพันธ์เชิงเหตุผลระหว่าง ตัวแปร 2 ตัว ที่เป็นตัวแปรเชิงปริมาณ โดยมีตัวแปรหนึ่งเป็นเหตุ เรียกว่า ตัวแปรต้น หรือ ตัวแปรอิสระ (Independent variable; X) อีกตัวแปรหนึ่งเป็นตัวแปรผล เรียกว่า ตัวแปร ตาม (Dependent variable; Y) สมมติฐานที่ตั้งขึ้นคือเพื่อศึกษาหา ความสัมพันธ์หรือศึกษาอิทธิพลระหว่างปัจจัย ต่างๆ กับผลที่เกิดขึ้น

การวิเคราะห์สหสัมพันธ์และการถดถอย ตัวอย่าง ผู้วิจัยต้องการศึกษาอิทธิพลปริมาณและ อุณหภูมิของอากาศ ว่ามีรูปแบบความสัมพันธ์ อย่างไร ทิศทางใด และมีขนาดมาน้อยเพียงใด ตลอดจนสามารถทำนายว่าปริมาณของตัว แปรตาม (Y) มีปริมาณเท่าใด ถ้าทราบค่าของ ปริมาณของตัวแปรอิสระ (X) โดยพยายามให้ ค่าที่ประมาณหรือค่าที่พยากรณ์ได้มีความคาด เคลื่อนน้อย หรือมีค่าใกล้เคียงกับความเป็น จริงมากที่สุด โดยใช้เทคนิค Correlation และ Regression

ตัวแปรอิสระ และ ตัวแปรตาม 1. เกรดเฉลี่ยมีผลต่อรายได้หรือไม่ ตัวแปรอิสระ (X) คือ ตัวแปรตาม (Y) คือ 2. คะแนนสอบกลางภาคมีผลต่อคะแนนสอบ ปลายภาคหรือไม่ 3. ยอดขายสินค้าขึ้นอยู่กับโฆษณาหรือไม่

แผนภาพการกระจาย เพื่อดูลักษณะความสัมพันธ์ระหว่างตัวแปร อิสระ (X) และตัวแปรตาม (Y) ว่ามีลักษณะแบบ ใด ในการวิเคราะห์ Regression และ Correlation จำเป็นต้องดูลักษณะสัมพันธ์ทั้ง X และ Y ว่ามี ความสัมพันธ์ในเชิงเส้นตรงหรือไม่ โดยนำค่า X และ Y มาทำการ Scatter Plot

แผนภาพการกระจาย ลักษณะของ Scatter Plot มีดังนี้

สัมประสิทธิ์สหสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Simple Correlation Coefficient) เป็นค่าที่วัด ความสัมพันธ์ของ X กับ Y ว่ามีขนาดและ ทิศทางของความสัมพันธ์อย่างไร กำหนดให้ 𝜌 คือ สัมประสิทธิ์สหสัมพันธ์อย่าง ง่ายของประชากร เมื่อ −1≤𝜌≤1 เนื่องจากในการวิเคราะห์สหสัมพันธ์ ไม่ได้เก็บ ข้อมูลจากประชากร แต่เป็นการเก็บข้อมูลจาก ตัวอย่าง ดังนั้นค่าสัมประสิทธิ์ที่ได้ จึงเป็นค่า สัมประสิทธิ์สหสัมพันธ์อย่างง่ายของตัวอย่าง โดยใช้สัญลักษณ์ว่า 𝑟

สัมประสิทธิ์สหสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์อย่างง่ายของ ตัวอย่าง (𝑟) คำนวณได้ดังนี้ 𝑟= 𝒊=𝟏 𝒏 𝒙 𝒊 𝒚 𝒊 −𝒏 𝒙𝒚 𝒊=𝟏 𝒏 𝒙 𝒊 𝟐 − 𝒏 𝒙 𝟐 𝒊=𝟏 𝒏 𝒚 𝒊 𝟐 − 𝒏 𝒚 𝟐 ความหมายของค่า 𝑟 1. ค่า 𝑟 เป็น + แสดงว่า X กับ Y มีความสัมพันธ์ ในทิศทางเดียวกัน 2. ค่า 𝑟 เป็น - แสดงว่า X กับ Y มีความสัมพันธ์ ในทิศทางตรงกันข้าม 3. ค่า 𝑟 เป็น 0 แสดงว่า X กับ Y ไม่มี ความสัมพันธ์กันเลย 4. ค่า |𝑟| มีค่าเข้าใกล้ 1 แสดงว่า X กับ Y มี ความสัมพันธ์กันมาก 5. ค่า |𝑟| มีค่าเข้าใกล้ 0 แสดงว่า X กับ Y มี ความสัมพันธ์กันน้อย

สัมประสิทธิ์สหสัมพันธ์ สมมติฐานของการทดสอบ 𝐻 0 : 𝜌=0 (X กับ Y ไม่มีความสัมพันธ์กัน) 𝐻 1 : 𝜌≠0 (X กับ Y มีความสัมพันธ์กัน) สถิติทดสอบ 𝑡= 𝑟 𝑛−1 1− 𝑟 2 , 𝑑𝑓=𝑛−2 เขตวิกฤตและการสรุป จะปฏิเสธ 𝐻 0 เมื่อค่า 𝑡 มากกว่าหรือเท่ากับ 𝑡 𝛼,𝑛−2 หรือ 𝑡 น้อยกว่าหรือเท่ากับ −𝑡 𝛼,𝑛−2 หรือใช้เกณฑ์ของ p-value นั่นคือ จะปฏิเสธ 𝐻 0 เมื่อ p-value มีค่าน้อยกว่าระดับนัยสำคัญ

คำสั่งโปรแกรม R วิเคราะห์ความสัมพันธ์ ฟังก์ชันสำหรับหาค่า 𝑟 เพื่อหาขนาดและ ทิศทางของความสัมพันธ์ cor(x, y) ฟังก์ชันหาค่า p-value เพื่อทดสอบสมมติฐาน cor.test(x, y) เมื่อ x และ y คือ ข้อมูลแบบ vector ของตัว แปรอิสระและตัวแปรตาม

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์ แผนกวิจัยตลาดของบริษัทวีสิน จำกัด ต้องการ ศึกษาความสัมพันธ์ระหว่างค่าใช้จ่ายในการ โฆษณาและยอดขาย โดยที่ข้อมูลเกี่ยวกับ ค่าใช้จ่ายและยอดขายในรอบ 8 ปีที่ผ่านมา มี ดังนี้ ปีที่ ค่าโฆษณา (แสนบาท) ยอดขาย (แสนบาท) 1 5 40 2 7 50 3 10 60 4 12 65 15 70 6 20 80 25 92 8 30 100

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์ 1.1 แสดงภาพภาพการกระจายระหว่างค่าโฆษณาและยอดขาย > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > plot(advertise,sales) สรุป จากกราฟพบว่า ค่าโฆษณาและยอดขายมีความสัมพันธ์ทิศทางเดียวกัน

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์ 1.2 ทดสอบว่าค่าโฆษณาและยอดขายมีความสัมพันธ์กันหรือไม่ ที่ระดับนัยสำคัญ 0.05 > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > cor.test(advertise,sales) Pearson's product-moment correlation data: advertise and slaes t = 16.574, df = 6, p-value = 3.077e-06 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.9395266 0.9981301 sample estimates: cor 0.9892546

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์ ทดสอบสมมติฐาน 1. ตั้งสมมติฐาน 𝐻 0 : 𝜌=0 (X กับ Y ไม่มีความสัมพันธ์กัน) 𝐻 1 : 𝜌≠0 (X กับ Y มีความสัมพันธ์กัน) 2. กำหนดระดับนัยสำคัญ = 0.05 3. หาค่า p-value = 3.077e-06 ซึ่งน้อยกว่าระดับ นัยสำคัญ 4. สรุป ปฏิเสธ 𝐻 0 แสดงว่า ที่ระดับนัยสำคัญ 0.05 ค่าโฆษณาและยอดขายมีความสัมพันธ์กัน

ตัวอย่างที่ 1 วิเคราะห์ความสัมพันธ์ 1.3 คำนวณหาค่าสัมประสิทธิ์สหสัมพันธ์ (𝑟) หรือ หาขนาดความสัมพันธ์ของค่าโฆษณาและยอดขาย > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > cor(advertise,sales) [1] 0.9892546 สรุป ค่า 𝑟 = 0.9892546 แสดงว่า ค่าโฆษณาและยอดขายมีความสัมพันธ์กันขนาด 0.9892546 ซึ่งมีค่าสูงมาก และมีความสัมพันธ์ไปในทิศทางเดียวกัน

การวิเคราะห์การถดถอย (Regression Analysis) การวิเคราะห์การถดถอยเป็นการศึกษา ความสัมพันธ์ระหว่างตัวแปรตาม (Y) และ ตัวแปร อิสระ (X) ที่อยู่ในรูปแบบสมการเชิงคณิตศาสตร์ โดยที่ รูปแบบการถดถอยแบบง่ายเชิงเส้นตรงที่ แทนความสัมพันธ์ของ X และ Y คือ 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜖 𝑖 , 𝑖 = 1, 2, …, n เมื่อ 𝑌 𝑖 เป็นค่าสังเกตที่ 𝑖 ของตัวแปรตาม 𝑋 𝑖 เป็นค่าสังเกตที่ 𝑖 ของตัวแปรอิสระ 𝛽 0 เป็นจุดที่เส้นถดถอยตัดแกน Y หรือค่าของ Y เมื่อ X=0 𝛽 1 เป็นค่าความสันของเส้นตรง ซึ่งเป็นค่าที่แสดงถึง อัตราการเปลี่ยนแปลงของ Y เมื่อ X เปลี่ยนไป 1 หน่วย 𝜖 𝑖 เป็นความคาดเคลื่อนที่เกิดขึ้นโดยสุ่ม

การวิเคราะห์การถดถอย กราฟแสดงความสัมพันธ์ระหว่าง X และ Y และสมการประมาณค่า

การวิเคราะห์การถดถอย ข้อตกลงเบื้องต้นของรูปแบบในการวิเคราะห์ การถดถอย มีดังนี้ 1. ความคาดเคลื่อน ( 𝜖 𝑖 ) มีการแจกแจงที่เป็น อิสระแบบปกติมีค่าเฉลี่ยเท่ากับ 0 และมีความ แปรปรวนเท่ากับ 𝜎 2 2. 𝑋 𝑖 เป็นตัวแปรอิสระที่กำหนดค่าได้ และวัด โดยไม่มีความคลาดเคลื่อน 3. จากข้อสมมติพบว่าที่แต่ละค่าของ X จะมี ประชากรของ Y ที่มีการแจกแจงปกติ มี ค่าเฉลี่ย 𝛽 0 + 𝛽 1 𝑋 และมีค่าความปรปรวนเท่ากับ 𝜎 2 4. X และ Y มีความสัมพันธ์แบบเส้นตรง

การวิเคราะห์การถดถอย จากข้อตกลกตงที่ 1 จะสามารถหาค่าเฉลี่ยของ Y เมื่อกำหนดทุกค่าของ X ได้ดังนี้ 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜖 𝑖 𝐸(𝑌 𝑖 )= 𝐸(𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜖 𝑖 ) = 𝐸(𝛽 0 )+ 𝐸(𝛽 1 𝑋 𝑖 )+ 𝐸(𝜖 𝑖 ) = 𝛽 0 + 𝛽 1 𝑋 𝑖 สมการถดถอยตัวอย่าง 𝑌 𝑖 = 𝑏 0 + 𝑏 1 𝑋 𝑖 𝑌 𝑖 เป็นค่าประมาณของ 𝐸(𝑌 𝑖 ) 𝑏 0 เป็นค่าประมาณของ 𝛽 0 𝑏 1 เป็นค่าประมาณของ 𝛽 1

การวิเคราะห์การถดถอย การหาค่า 𝑏 0 และ 𝑏 1 จะใช้วิธีกำลังสองน้อยที่สุด (Least Square Method) ซึ่งเป็นวิธีการหา 𝑏 0 และ 𝑏 1 ที่ ทำให้ผลบวกกำลังสองของความคลาดเคลื่อน (Sum of Square Error, SEE) ซึ่ง 𝑆𝐸𝐸 = 𝜖 2 มีค่าต่ำที่สุด จาก 𝜖 𝑖 = 𝑌 𝑖 − 𝑌 𝑖 คือความคลาดเคลื่อนจากการ ประมาณค่าที่ 𝑖 จะได้ 𝑆𝐸𝐸 = 𝜖 𝑖 2 = ( 𝑌 𝑖 − 𝑌 𝑖 ) 2 = ( 𝑌 𝑖 − 𝑏 0 − 𝑏 1 𝑋 𝑖 ) 2 โดยการหาอนุพันธ์บางส่วนของ SEE เทียบกับ 𝑏 0 และ 𝑏 1 แล้วกำหนให้เท่ากับศูนย์ แล้วแก้วสมการหาค่าของ 𝑏 0 และ 𝑏 1 ได้ค่าดังนี้ 𝑏 1 = 𝑛 𝑋 𝑖 𝑌 𝑖 − 𝑋 𝑖 𝑌 𝑖 𝑛 𝑋 𝑖 2 − ( 𝑋 𝑖 ) 2 𝑏 0 = 𝑌 − 𝑏 1 𝑋

การวิเคราะห์การถดถอย ความหมายของค่าสัมประสิทธิ์การถดถอย ( 𝑏 0 และ 𝑏 1 ) 𝑏 0 เป็นค่าที่บอกให้ทราบว่า ถ้าค่า X เป็น 0 แล้ว ค่า Y จะมีค่าเป็น 𝑏 0 โดยเฉลี่ย เครื่องหมายของ 𝑏 0 เป็นได้ทั้งบวกและลบ ถ้าเป็นลบแสดงว่าเส้น ถดถอยตัดแกน Y ต่ำกว่าจุดกำเนิด (Origin) แต่ถ้า เครื่องหมายเป็นบวก ก็แสดงว่า เส้นถดถอยตัด แกน Y เหนือจุดกำเนิด 𝑏 1 เป็นอัตราการเพิ่มหรือลดลงของ Y เมื่อ X มีค่า เพิ่มขึ้น 1 หน่วย เมื่อ 𝑏 1 มีค่าเป็นลบจะบอกให้ ทราบว่าตัวแปร X กับ Y มีความสัมพันธ์กันในทาง ตรงกันข้าม นั่นคือเมื่อ X มีค่าเพิ่มขึ้น Y จะมีค่า ลดลง แต่ถ้า 𝑏 1 มีค่าเป็นบวก X กับ Y จะมี ความสัมพันธ์ไปในทางเดียวกันคือ เมื่อ X มีค่า เพิ่มขึ้น Y ก็จะเพิ่มด้วย

คำสั่งโปรแกรม R สร้างสมการถดถอย ฟังก์ชันสำหรับหาค่าสัมประสิทธิ์การถดถอย ( 𝑏 0 และ 𝑏 1 ) lm(y ~ x) เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัว แปรตามและตัวแปรอิสระ ** ฟังก์ชัน lm จะใช้คู่กับ ฟังก์ชัน anova และ summary

ตัวอย่างที่ 2 สร้างสมการถดถอย จากตัวอย่างที่ 1 จะเห็นว่ามูลค่าโฆษณาและ ยอดขายมีความสัมพันธ์ในทิศทางเดียวกัน และมีแนวโน้มเป็นเส้นตรง ซึ่งสามารถสร้าง สมการแทนความสัมพันธ์ของค่าโฆษณาและ ยอดขายได้ดังนี้ > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > model=lm(sales~advertise) > model Call: lm(formula = sales ~ advertise) Coefficients: (Intercept) advertise 34.239 2.283 ตัวแปรตาม ตัวแปรอิสระ 𝑏 0 𝑏 1

ตัวอย่างที่ 2 สร้างสมการถดถอย จากการสร้างสมการถดถอยด้วยฟังก์ชัน lm จะได้ ค่าว่า ค่า 𝑏 0 = 34.239 และ ค่า 𝑏 1 = 2.283 ซึ่งมีค่าเป็นบวก แสดงว่าตัวแปรทั้งสองมี ความสัมพันธ์ไปในทิศทางเดียวกัน และสามารถ เขียนสมการถดถอยได้ คือ 𝑠𝑎𝑙𝑒𝑠 =34.239+2.283advertise จากสมการถดถอย จะได้ความหมายของ สัมประสิทธิ์การถดถอยดังนี้ 𝑏 0 หมายถึง เมื่อค่าใช้จ่ายในการโฆษณาเป็น 0 บาท จะมียอดขาย 3,423,900 บาท โดยเฉลี่ย 𝑏 1 หมายถึง เมื่อค่าใช้จ่ายในการโฆษณาเพิ่มขึ้น 1 แสนบาท จะมียอดขายเพิ่มขึ้น 228,300 บาท โดย เฉลี่ย

การทดสอบสมมติฐานเกี่ยวกับสมการถดถอย เป็นการทดสอบว่าตัวแปรอิสระ (X) มีอิทธิพล ต่อตัวแปรตาม (Y) หรือไม่ หรือกล่าวอีกนัย หนึ่งก็คือทำการทดสอบว่าตัวแปร X มีผลต่อ ตัวแปร Y หรือไม่ มีขั้นตอนการทดสอบ สมมติฐานดังนี้ 1. ตั้งสมมติฐานการทดสอบ 𝐻 0 : 𝛽=0 (ตัวแปรอิสระไม่มีอิทธิพลต่อตัวแปร ตาม) 𝐻 1 : 𝛽≠0 (ตัวแปรอิสระมีอิทธิพลต่อตัวแปรตาม) 2. กำหนดระดับนัยสำคัญ 3. คำนวณค่า p-value โดยใช้ตัวทดสอบ F 4. สรุป

คำสั่งโปรแกรม R ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย ฟังก์ชันสำหรับหาสมการถดถอย และฟังก์ชันทดสอบสมมติฐานเกี่ยวกับสมการ ถดถอย เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัว แปรตามและตัวแปรอิสระ model = lm(y ~ x) anova(model)

ตัวอย่างที่ 3 ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย จากตัวอย่างที่ 1 จงทดสอบสมติฐานเกี่ยวกับ สมการถดถอย ที่ระดับนัยสำคัญ 0.05 > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > model=lm(sales~advertise) > anova(model) Analysis of Variance Table Response: sales Df Sum Sq Mean Sq F value Pr(>F) advertise 1 2845.72 2845.72 274.7 3.077e-06 *** Residuals 6 62.16 10.36 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 p-value

ตัวอย่างที่ 3 ทดสอบสมมติฐานเกี่ยวกับสมการถดถอย 1. ตั้งสมมติฐานการทดสอบ 𝐻 0 : 𝛽=0 (ตัวแปรอิสระไม่มีอิทธิพลต่อตัวแปร ตาม) 𝐻 1 : 𝛽≠0 (ตัวแปรอิสระมีอิทธิพลต่อตัวแปรตาม) 2. กำหนดระดับนัยสำคัญ = 0.05 3. คำนวณค่า p-value = 3.077e-06 ซึ่งมีค่าน้อยกว่า ระดับนัยสำคัญ 4. สรุป ปฎิเสธ 𝐻 0 ที่ระดับนัยสำคัญ 0.05 ตัวแปร อิสระมีอิทธิพลต่อตัวแปรตาม นั้นคือ ค่า โฆษณามีผลต่อยอดขาย

การพยากรณ์ เมื่อเราสร้างสมการถดถอยที่ตัวแปรอิสระมี ความสัมพันธ์กับตัวแปรตามได้แล้ว อีกหนึ่ง วัตถุประสงค์ของการสร้างสมการถดถอยคือ เพื่อใช้ในการพยากรณ์ค่าของตัวแปรที่ไม่ทราบ (Y) โดยกำหนดค่าของตัวแปรอิสระ X ซึ่งสามารถพยากรณ์ได้โดยแทนค่าของตัวแปร อิสระ X ลงในสมการถดถอยแล้วคำนวณหาค่า Y

ตัวอย่างที่ 4 การพยากรณ์ จากตัวอย่างที่ 1 จงพยากรณ์ค่ายอดขายเมื่อ กำหนดให้ค่าโฆษณามีค่าเป็น 230,000 บาท จากการกำหนดค่าโฆษณา 230,000 บาท นั่น คือให้ advertise=2.3 จึงแทนค่าลงในสมการ ดังนี้ 𝑠𝑎𝑙𝑒𝑠 =34.239+2.283advertise =34.239+2.283 ∗ 2.3 = 39.4899 สรุป เมื่อกำหนดให้ค่าโฆษณา 230,000 บาท แล้วยอดขายจะมีค่าเป็น 3,948,900 บาท

สัมประสิทธิ์การตัดสินใจ สัมประสิทธ์การตัดสินใจ (coefficient of determination: 𝑅 2 ) เป็นค่าที่ใช้วัดว่าตัวแปร อิสระนั่นมีอิทธิพลต่อความผันแปรของค่าของ ตัวแปรตาม Y มากน้อยเพียงใด หรืออีกนัยหนึ่ง เป็นค่าที่บอกว่าสมการถดถอยที่ได้นั้นเป็น สมการที่เหมาะสมหรือไม่ ค่า 𝑅 2 มีค่าอยู่ในช่วง 0 ถึง 1 ถ้า 𝑅 2 มีค่าเข้าใกล้ 1 หมายถึงตัวแปรอิสระมี อิทธิพลต่อความผันแปรของตัวแปรตามมาก ถ้า 𝑅 2 มีค่าเข้าใกล้ 0 แสดงว่ามีอิทธิพลต่อความ ผันแปรของตัวแปรตามน้อย

คำสั่งโปรแกรม R สัมประสิทธิ์การตัดสินใจ ฟังก์ชันสำหรับหาสมการถดถอย และฟังก์ชันหาสัมประสิทธิ์การตัดสินใจ เมื่อ y และ x คือ ข้อมูลแบบ vector ของตัว แปรตามและตัวแปรอิสระ model = lm(y ~ x) summary(model)

ตัวอย่างที่ 5 สัมประสิทธิ์การตัดสินใจ จากตัวอย่างที่ 1 จงหาหาสัมประสิทธิ์การ ตัดสินใจ ( 𝑅 2 ) > advertise=c(5,7,10,12,15,20,25,30) > sales=c(40,50,60,65,70,80,92,100) > model=lm(sales~advertise) > summary(model) Call: lm(formula = sales ~ advertise) Residuals: Min 1Q Median 3Q Max -5.6538 -0.8468 0.3942 1.8702 3.3654 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 34.2390 2.4194 14.15 7.78e-06 *** advertise 2.2830 0.1377 16.57 3.08e-06 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.219 on 6 degrees of freedom Multiple R-squared: 0.9786, Adjusted R-squared: 0.9751 F-statistic: 274.7 on 1 and 6 DF, p-value: 3.077e-06 𝑅 2

ตัวอย่างที่ 5 สัมประสิทธิ์การตัดสินใจ สรุป จะได้ว่าสัมประสิทธิ์การตัดสินใจ เท่ากับ 0.9786 หมายถึงค่าโฆษณามีอิทธิพลต่อ ความผันแปรของยอดขาย 97.86% ซึ่งมีค่า สูงมาก