การวิเคราะห์การถดถอย และสหสัมพันธ์อย่างง่าย

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
คอมพิวเตอร์ช่วยสอนการเลือกใช้ ตัวสถิติทดสอบที่ถูกต้อง
Advertisements

บำรุง พ่วงเกิด Office: ME201 Homepage: 12/17/2008
บทที่ 12 การวิเคราะห์การถดถอย
บทที่ 12 การวิเคราะห์การถดถอย (ต่อ)
การถดถอยเชิงเดียว (simple regression)
สถิติที่ใช้ในการวิจัย
Chapter 10: Hypothesis Testing: Application
บทที่ 6 การวิเคราะห์สหสัมพันธ์
ปฏิบัติการที่ 1 การนำเสนอข้อมูลจากการทดลอง
การคำนวณทางสถิติ (Statistics worksheet)
CPE 332 Computer Engineering Mathematics II
วิจัย (Research) คือ อะไร
สถิติสำหรับการวิจัย ผู้ช่วยศาสตราจารย์ ดร. สมบัติ ท้ายเรือคำ
5.4 ปัญหา ปัจจัยและอุปสรรคในการศึกษา
แผนการคัดเลือก สามารถแบ่งได้ดังนี้ Tandem Method
เรื่อง จัดทำโดย กราฟ นายเทวา หาระโคตร ปวช.2 กลุ่ม.2 คอมพิวเตอร์ธุรกิจ
ขอนำเสนอ แผนภูมิกราฟ.
Correlation Tipsuda Janjamlha 06 Sep. 08. X1X2 > interval Ho: ตัวแปรทั้ง 2 ไม่มี ความสัมพันธ์กัน Ha: ตัวแปรทั้ง 2 มีความสัมพันธ์ กัน.
Basic Statistical Tools
การวิเคราะห์ข้อมูลพหุระดับ (Multilevel Analysis) ด้วยโปรแกรม HLM
Basic Statistical Tools
E D E,C 1 D E,C 1,C 2,C 3 D ตัวแปรต้น ตัวแปร ตาม ตัวแปรอิสระ แทนด้วย X X 1, X 2,... X k D ตัวอย่าง : X 1 = E X 4 = E*C 1 X 2 = C 1 X 5 = C 1 *C 2 X 3 =
การวิเคราะห์ต้นทุนผสม
MATLAB Week 4.
Wilcoxon Signed Ranks test ใช้เมื่อไร? 2 correlated group design ตัวอย่างถูกเลือกมาจากประชากร แล้วทดลองเปรียบเทียบ 1.Before/Method 1 2.After/Method 2 สมมุติฐาน.
ประธานกลุ่ม:พ.อ.กิตติศักดิ์ ดวงกลาง สมาชิก:ผู้แทนจาก สขว.กอ.รมน., ศปป.1 กอ.รมน., ศปป.6 กอ.รมน., กอ.รมน.ภาค 2, กอ.รมน.จังหวัด ก.ส., ข.ก., บ.ก., น.ค., ล.ย.,
การวิเคราะห์ข้อมูลเรื่องข้าว เพื่อการทบทวนประเด็นยุทธศาสตร์
สถิติเบื้องต้นในการวัดผลและประเมินผลการศึกษา
การประเมินคุณภาพภายนอก รอบสี่ (พ.ศ
การหาความสัมพันธ์ของตัวแปร
Thanapon Thiradathanapattaradecha
สถิติอ้างอิง: ไร้พารามิเตอร์ (Inferential Statistics: Nonparametric)
บทที่ 9 การกำหนดขนาดของตัวอย่าง
เสถียรภาพของระบบไฟฟ้ากำลัง Power System Stability (Part 1)
1. น้ำหนักดินเนื่องจากแรงโน้มถ่วงของโลก
ความรู้เบื้องต้นเกี่ยวกับ คุณภาพของเครื่องมือวัด
Chapter 8 Classification อาจารย์อนุพงศ์ สุขประเสริฐ
ระเบียบวิธีวิจัยทางธุรกิจโรงแรม และท่องเที่ยว
การวิเคราะห์เชิงปริมาณเบื้องต้น
คุณภาพชีวิตและปัจจัยที่สัมพันธ์กับคุณภาพชีวิต
สถิติที่ใช้ในงาน การวิจัยเชิงปริมาณ
13 October 2007
การพัฒนางานผู้ป่วยนอก
ความรู้เบื้องต้นเกี่ยวกับสถิติและโปรแกรมสำเร็จรูปทางสถิติ
วิทยาลัยเทคโนโลยีธีรภาดา จังหวัดร้อยเอ็ด
บทที่ 10 สถิติเชิงบรรยาย
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
บทที่ 1 ภาพรวมของการวิเคราะห์เชิงปริมาณ
ระเบียบวิธีวิจัยพื้นฐานทางการเงิน
ระเบียบวิธีวิจัยพื้นฐานทางการจัดการโลจิสติกส์
โดย นายไพสุข สุขศรีเพ็ง รหัสนักศึกษา
การรวบรวมและวิเคราะห์ข้อมูลสถิติ
ข้อมูล และ เครื่องมือเก็บข้อมูลเชิงปริมาณ
นายกิตติพงษ์ สว่างลาภ วท.บ., บธ.บ., ศศ.บ., วท.ม.
การจัดทำแผนอัตรากำลัง 3 ปี
ขององค์กรปกครองส่วนท้องถิ่น
Model Management (การจัดการแบบจำลอง)
การพยากรณ์ ญาลดา พรประเสริฐ คณะวิทยาการจัดการ
ระเบียบวิธีวิจัยทางการบัญชี
การวัดและประเมินผลการเรียนรู้
ระเบียบวิธีวิจัยพื้นฐานทางธุรกิจ
อ.ดร. วรพล ยะมะกะ ภาคการเรียนที่ 2/2561
อนุพันธ์ของเวคเตอร์ อนุพันธ์ธรรมดาของเวคเตอร์ (Ordinary of Vectors)
การเลือกใช้สถิติเพื่อการวิจัย
กิจกรรมที่ 9 การสร้างตัวแปร ใน Scratch.
นักวิเคราะห์นโยบายและแผนชำนาญการพิเศษ
ประจำปีการศึกษา พุทธศักราช 2555
ระเบียบวิธีวิจัยทางการบัญชีบริหาร
Chapter 3: Measures of Central Tendency and Measure of Dispersion
ใบสำเนางานนำเสนอ:

การวิเคราะห์การถดถอย และสหสัมพันธ์อย่างง่าย (Simple Linear Regression and Correlation Analysis)

การวิเคราะห์การถดถอย และสหสัมพันธ์อย่างง่าย เป็นการศึกษาถึงข้อมูลที่ประกอบด้วยตัวแปร2 ตัว หรือ เรียกว่า ตัวแปรคู่ (bivariate data)โดยการวิเคราะห์ จะนำตัวแปรทั้งสองมาพิจารณาพร้อม ๆ กัน เพื่อศึกษาถึงความสัมพันธ์ระหว่างตัวแปร 2 ตัว หรือ 2 ลักษณะโดยที่ต้องทราบค่าของตัวแปรตัวหนึ่ง หรือต้องกำหนดค่าของตัวแปรตัวหนึ่งไว้ล่วงหน้า

การวิเคราะห์การถดถอย และสหสัมพันธ์อย่างง่าย โดยตัวแปรที่ต้องการทราบค่า หรือ ต้องการพยากรณ์ เรียกว่า ตัวแปร ตาม มีสัญลักษณ์แทนด้วย y และตัวแปรตามขึ้นอยู่กับตัวแปรอีกตัว หนึ่งเป็นตัวแปรที่ทราบค่า เรียกว่า ตัวแปรอิสระ มีสัญลักษณ์แทนด้วย x

ตัวอย่างของการวิเคราะห์ด้วยการวิเคราะห์การถดถอย ความดันโลหิตกับอายุ มูลค่าการส่งออกสินค้ากับปริมาณการผลิต ความสัมพันธ์ระหว่างค่าใช้จ่ายเพื่อการบริโภค กับรายได้ เป็นต้น การวิเคราะห์การถดถอยจะเกี่ยวข้องกับการประมาณค่าหรือการ พยากรณ์ค่าของตัวแปรตาม เมื่อกำหนดค่าของตัวแปรอิสระโดยพยายาม ให้ค่าที่ประมาณหรือค่าที่พยากรณ์ได้มีความคลาดเคลื่อนน้อย หรือมีค่า ใกล้เคียงกับความเป็นจริงมากที่สุด

x1 ปริมาณปุ๋ย x3 อุณหภูมิ การวิเคราะห์การถดถอยเชิงพหุ (Multiple Regression Analysis) คือ การวิเคราะห์การถดถอยที่มีตัวแปรอิสระ ที่เราศึกษานั้นมีค่ามากกว่า 1 ตัวแปร เช่น การศึกษาความสัมพันธ์ระหว่างผลผลิตข้าวต่อไร่กับปริมาณปุ๋ยที่ใช้ ปริมาณน้ำฝน อุณหภูมิ โดย y ผลผลิตข้าวต่อไร่ x2 ปริมาณน้ำฝน x1 ปริมาณปุ๋ย x3 อุณหภูมิ

การวิเคราะห์ความถดถอยเชิงเส้นอย่างง่าย จะศึกษาเฉพาะความสัมพันธ์ของตัวแปร x และ y ในรูปเชิงเส้น หรือเส้นตรงเท่านั้น จึงเรียก การวิเคราะห์การถดถอยอย่างง่าย ที่ความสัมพันธ์ของตัวแปรอยู่ในรูปเชิงเส้นว่า การวิเคราะห์ความถดถอยเชิงเส้นอย่างง่าย (Simple Linear Regression Analysis)

ตัวอย่างที่ 1 บริษัทแห่งหนึ่งต้องการหาความสัมพันธ์ระหว่างค่าโฆษณากับยอดขายจึงใช้ข้อมูลค่าโฆษณาและยอดขายรายเดือนของปีที่ผ่านมาดังนี้ เดือนที่ ค่าโฆษณา (แสนบาท) ยอดขาย (แสนบาท) 1 2 3 4 5 6 7 8 9 10 11 12 4.8 6.4 8.5 10.5 15 11.6 16 52 80 100 90 110 114 140 128 112 104 120 160

จากข้อมูลสามารถสร้างแผนภาพการกระจายได้ดังนี้ จากรูป ทำให้สามารถมองเห็นได้คร่าวๆว่าแผนภาพการกระจายระหว่าง 2 ตัวแปร ดูเหมือนว่าจะมีความสัมพันธ์กันในเชิงเส้นตรง และมีทิศทางสูงขึ้นไป ดังนั้น เราอาจจะสรุปตรงนี้ได้ว่า ตัวแปร x (ค่าโฆษณา) และตัวแปร y (ยอดขาย) มีความสัมพันธ์กัน

กำหนดให้ x และ y เป็นตัวแปรอิสระและตัวแปรตาม ตามลำดับ จะสามารถเขียนรูปแบบสมการถดถอยเชิงเส้น อย่างง่ายที่แสดงความสัมพันธ์ระหว่างตัวแปรอิสระ 1 ตัว และตัวแปรตาม 1 ตัว โดยอาศัยรูปแบบสมการเส้นตรง ทางคณิตศาสตร์ ดังนี้

การประมาณค่า และ โดยวิธีกำลังสองน้อยที่สุด การประมาณค่า และ โดยวิธีกำลังสองน้อยที่สุด การประมาณค่า และ ด้วย a และ b ตามลำดับนั้น มี เป้าหมายเพื่อให้ความคลาดเคลื่อนในการประมาณค่าต่ำสุด โดย ใช้วิธีกำลังสองน้อยที่สุดเนื่องจาก

โดยที่ a เป็น ค่าระยะตัดแกน y (y-intercept) เมื่อ x = 0 นั่นเอง b เป็น ค่าความชัน (slope) ของเส้นตรง คือ ค่าแสดงให้ทราบว่าเมื่อ x มีค่าเปลี่ยนไป 1 หน่วย y จะเปลี่ยนไปโดยเฉลี่ยเท่าใดหรือ เรียกค่านี้ว่า สัมประสิทธิ์ความถดถอย (regression coefficient)

ถ้า b มีค่าเป็นบวก หรือมากกว่า 0 หมายความว่า x และ y มีความสัมพันธ์ไปในทิศทางเดียวกัน

x และ y มีความสัมพันธ์ไปในทิศทางตรงกันข้าม ถ้า b มีค่าเป็นลบ หรือน้อยกว่า 0 หมายความว่า x และ y มีความสัมพันธ์ไปในทิศทางตรงกันข้าม

ถ้า b มีค่าเท่ากับ 0 หมายความว่า การเปลี่ยนแปลงของ y ไม่ขึ้นกับการเปลี่ยนแปลงของ x

ei เป็นความคลาดเคลื่อนสุ่มของการประมาณ y โดยที่ และ

กำหนดให้ การหาค่า a และ b ที่ทำให้ S มีค่าต่ำสุด โดยการใช้ อนุพันธ์เชิงส่วน (Partial derevation) ดังนี้

จะได้สมการปกติ (Normal Equations) คือ จากการแก้สมการข้างต้น จะได้

และ โดยที่

ซึ่งสามารถเขียนได้อีกรูปหนึ่งเพื่อสะดวกในการคำนวณ คือ ซึ่งสามารถเขียนได้อีกรูปหนึ่งเพื่อสะดวกในการคำนวณ คือ โดยที่

ข้อสมมติเบื้องต้นของความคลาดเคลื่อน มีดังนี้ การประมาณค่า และ ด้วยค่า a และ b โดยใช้วิธีกำลังสองน้อยที่สุดนี้ จะทำให้ มีค่าต่ำสุด และทำให้จุด เป็นจุดที่อยู่บนเส้นถดถอยด้วย ข้อสมมติเบื้องต้นของความคลาดเคลื่อน มีดังนี้ ค่า x จะต้องเป็นค่าที่กำหนดไว้ล่วงหน้าหรือทราบค่า ความคลาดเคลื่อน เป็นตัวแปรสุ่มที่มีการแจกแจงปกติ โดยที่ และ แต่ละตัวต้องเป็นอิสระต่อกัน นั่นคือ เมื่อ

ตัวอย่างที่ 2 จากข้อมูลในตัวอย่างที่ 1 ถ้าบริษัทแห่งนี้ต้องการวิเคราะห์ข้อมูลเกี่ยวกับยอดขายในรอบปีที่ผ่านมา เพื่อนำผลการวิเคราะห์นี้ไปวางแผนการขายต่อไป จงสร้างสมการถดถอยแสดงความสัมพันธ์ระหว่างค่าโฆษณากับยอดขาย

XY X2 Y2 ผลรวม เดือนที่ ค่าโฆษณา (x) (แสนบาท) ยอดขาย(y) 120.80 1310.00 4 5 6 7 8 9 10 11 12 4.8 6.4 8.5 10.5 15 11.6 16 52 80 100 90 110 114 140 128 112 104 120 160 249.6 512 800 765 1155 1140 2100 1536 896 1040 1392 2560 23.04 40.96 64 72.25 110.25 225 144 134.56 256 2704 6400 10000 8100 12100 12996 19600 16384 12544 10816 14400 25600 ผลรวม 120.80 1310.00 14545.60 134.06 151644 ค่าเฉลี่ย 10.067 109.167 1178.80 111.171 12637

วิธีทำ จากข้อมูลในตัวอย่างที่ 1 สามารถคำนวณหาค่าต่างๆ ได้ดังนี้ วิธีทำ จากข้อมูลในตัวอย่างที่ 1 สามารถคำนวณหาค่าต่างๆ ได้ดังนี้ จะคำนวณหาค่าสัมประสิทธิ์ การถดถอย a และ b ได้ดังนี้ n = 12 = 120.80 = 1310.00 = 14145.60 = 1334.06 = 151644

ดังนั้น สมการถดถอยอย่างง่ายที่ประมาณขึ้นคือ = a + bxi =8.124 และ ดังนั้น สมการถดถอยอย่างง่ายที่ประมาณขึ้นคือ = a + bxi หรือแทนค่าได้ว่า = 27.383+8.124 Xi = = =

=27.383+8.124 Xi สมการที่ได้หมายความว่า เมื่อระยะตัดแกน Y คงที่ ถ้าบริษัท เปลี่ยนแปลงค่าโฆษณา (X) ไป 1 หน่วย หรือ 100,000บาท ยอดขายของบริษัท (Y) จะเปลี่ยนแปลงไปในทางเดียวกัน 8.124 หน่วยหรือ 821,400 บาท แต่ถ้าบริษัทลดค่าโฆษณา (X) ลง 1 หน่วยหรือ 100,000 บาท ยอดขายของบริษัท (Y) จะลดลง 821,400 บาท

ตัวอย่าง 3 จากตัวอย่างที่ 2 ถ้าบริษัทจะเพิ่มค่าใช้จ่ายในการโฆษณาเป็น 500,000 บาท จงหาแนวโน้มของยอดขายมีค่าเท่ากับเท่าใด วิธีทำ จากสมการถดถอยที่ได้ = 27.383+8.124 Xi และถ้ากำหนดให้ค่าโฆษณาเท่ากับ 500,000 จะได้ x = 5 = 27.383+8.124 (5) = 68.003 = 6,800,300 บาท