Regression with Time-Series Data: Stationary Variables Chapter 1 Regression with Time-Series Data: Stationary Variables Dr. Woraphon Yamaka https://wyamaka.wordpress.com
1. Regression model 𝑌= 𝑋 ′ 𝛽+𝜀 เพื่อใช้ศึกษาผลกระทบของสิ่งหนึ่งต่ออีกสิ่งหนึ่ง ตัวอย่างเช่น Microeconomic: : Demand and supply equations Macroeconomic Production function Cost function EX. Demand equation 𝑌= 𝑋 ′ 𝛽+𝜀
2.1 Dynamic regression model (Autoregressive (AR model) คือการศึกษาปัจจัยของตัวมันเองในอดีตส่งผลต่อตัวมันเองในปัจจุบันอย่างไร เราจะเขียน แบบจำลอง AR(p) หรือเราจะเขียนในสมการอย่างย่อได้ว่า EX. Demand equation ปกติแล้วเราจะใช้แบบจำลองนี้เพื่อการพยากรณ์ค่าในอนาคต
2.2 Dynamic regression model (Moving Average (MA) model) แบบจำลองนี้คล้ายๆกับ AR model แต่แทนที่จะที่จะตัวแปรตามจะเป็น 𝑌 𝑡.−𝑝 แบบจำลองนี้จะทำการ ถดถอยด้วย 𝜀 𝑡−1 แทน ดังนั้นสมการที่เราทำการประมาณ MA(q) คือ หรือเราจะเขียนในสมการอย่างย่อได้ว่า ปกติแล้วเราจะใช้แบบจำลองนี้เพื่อการพยากรณ์ค่าในอนาคตเช่นกัน
2.3 Dynamic regression model (Autoregressive Moving Average (ARMA) model) แบบจำลองนี้คล้ายๆกับ AR model แต่จะเพิ่มพจน์ MA ขึ้นมาในแบบจำลองด้วย หรือก็คือ แบบจำลองนี้รวมแบบจำลอง AR และ แบบจำลอง MA เข้าด้วยกันนั่นเอง ดังนั้นแบบจำลอง ARMA(p,q) เขียนได้ดังนี้ หรือเราจะเขียนในสมการอย่างย่อได้ว่า แบบจำลองอื่น ๆที่ใช้พยากรณ์ในอนาคต เช่น แบบจำลอง ARIMA, SARIMA และ AFRIMA
สิ่งแรกที่ต้องคำนึงถึงเกี่ยวกับการประมาณด้วยแบบจำลองเศรษฐมิติต่าง ๆ คืออะไร คำตอบ นักเศรษฐมิติต้องคำนึงถึงหัวข้อวิจัยเป็นอันดับแรก และสิ่งที่สำคัญที่สุดรองลงมาคือความ น่าเชื่อถือของข้อมูล ซึ่งในทางสถิติหรือทางเศรษฐมิติเราสามารถทำการเช็คความน่าเชื่อถือ ข้อมูล จากการทดสอบความนิ่งของข้อมูล ซึ่งเราจะต้องทำการทดสอบข้อมูลก่อนการประมาณ แบบจำลองทางเศรษฐมิติ โดยเฉพาะแบบจำลองที่เป็น time series และ Panel. ความนิ่งของข้อมูลถือว่าเป็นอีกสมมุติฐานหนึ่งที่เราต้องเพิ่มขึ้นมาอีกข้อต่อจาก Gauss Markov Theorem
Stationary data ข้อมูลที่นิ่งคืออะไร? ข้อมูลที่มีลักษณะที่นิ่งคือข้อมูลที่คุณสมบัติ คือ มีค่าเฉลี่ย ค่าความ แปรปรวน ที่นิ่งนั่นเอง
การทดสอบความนิ่ง หรือ Unit root test ในการทดสอบความนิ่งของข้อมูล time series และ Panel จะมีความแตกต่างกันอยู่บ้าง โดยปัจจุบันสถิติ ที่ใช้ของแต่ละข้อมูลก็มีหลากหลายวิธีด้วยกัน แต่ที่เป็นที่นิยมกันมาก ก็คือ Dickey Fuller (DF) test ( Time series data) Augmented Dickey Fuller (ADF) test (Time series data) Phillips perron test (PP) test (Time series data) Kwiatkowski–Phillips–Schmidt–Shin (KPSS) test (Time series data) Levin, Lin, and Chu (LLC) test ( Panel data) ซึ่งการทดสอบข้อมูลเหล่านี้ จะใช้สมการของแบบจำลอง dynamic regression มาประยุกต์ใช้ใน การทดสอบ
DICKEY–FULLER TEST ในการทดสอบแบบ DF test เราสามารถทำได้ 3 วิธีด้วยกัน คือ กรณีไม่มีค่าคงที่และค่าแนวโน้ม กรณีมีค่าคงที่และไม่มีค่าแนวโน้มเวลา กรณีมีค่าคงที่และมีค่าแนวโน้มเวลา โดยที่ 𝛥 𝑦 𝑡 = 𝑦 𝑡 - 𝑦 𝑡−1 𝑡 = 1,2,3,…,T
การทดสอบภายใต้ DICKEY–FULLER TEST ในกรณีเราจะดูว่า ค่า 𝛾 =0 หรือไม่ ดังนั้นเราจะตั้งสมมุติฐานได้ว่า จากการทดสอบข้างต้นเราจะเห็นว่าเป็นการทดสอบตัวแปรเดียว ดังนั้นเราสามารถใช้ T-test ในการ ทดสอบว่าเราจะยอมรับหรือปฎิเสธ 𝐻 0 สรุปคือ ถ้า ยอมรับ –> ข้อมูลไม่นิ่ง ถ้า ปฎิเสธ –> ข้อมูลนิ่ง จากสมการทั้ง 3 สมการข้างต้น เราควรทำการทดสอบทั้ง 3 สมการเลย และดูว่าให้ผลทางเดียวกัน หรือไม่
การทดสอบภายใต้ Augmented DICKEY–FULLER TEST อย่างไรก็ตามการทอสอบความนิ่งของข้อมูลด้วยวิธี DF test ถูกมองว่ายังมีปัญหาอยู่ เนื่องจากอาจเกิด ปัญหา autocorrelation และนำไปสู่ OLS ไม่ BLUE ได้ และทำให้เกิด Bias ขึ้นในการประมาณ ดังนั้น เราจึงต้องระมัดระวังปัญหานี้ในแบบจำลอง AR ด้วย Augmented DICKEY–FULLER TEST จึงถูกพัฒนาขึ้นมา โดยปรับให้สมการ กรณีไม่มีค่าคงที่และค่าแนวโน้ม กรณีมีค่าคงที่และไม่มีค่าแนวโน้มเวลา กรณีมีค่าคงที่และมีค่าแนวโน้มเวลา
ปัญหา Autocorrelation (คร่าวๆ) ปัญหาที่จะเกิดในข้อมูล time series และ Panel ซึ่งจะคล้ายๆ กับ Heteroscedasticity คือเป็นปัญหาที่ตัวแปรรบกวนมีความสัมพันธ์กับตัวมันเองในอดีตนั้นเอง 𝑢 𝑡 สัมพันธ์กับ 𝑢 𝑡−1 ซึ่งกรณีนี้เราจะเรียกว่า First order autocorrelation
แบบจำลอง Regression ที่จำเป็นต้องมีข้อมูลที่นิ่ง แบบจำลองทางเศรษฐมิติเกือบทุกแบบจำลองที่ใช้ข้อมูลแบบ Time series และ Panel จะต้องมี การทดสอบความนิ่งของข้อมูลก่อนที่จะนำไปประมาณผลการศึกษา ถ้าข้อมูลนิ่งเราก็สามารถใช้ข้อมูลนั้น ไปประมาณในแบบจำลองต่อไปได้ แต่ถ้าข้อมูลไม่นิ่ง เราต้องมีการแปลงข้อมูลให้นิ่งก่อนที่จะไปใช้ใน แบบจำลอง การแปลงข้อมูลสามารถทำได้หลายวิธีด้วยกัน เช่น 1) ln( 𝑦 𝑡 2) ln( 𝑦 𝑡 - ln( 𝑦 𝑡−1 3) 𝛥 ( 𝑦 𝑡
Program training R code Eview
R code Unit root test (DF-test) gnp=scan(file="http://faculty.chicagobooth.edu/ruey.tsay/teaching/fts3/dgnp82.txt") lag=0 lag=lag+1 z=diff(gnp) n=length(z) z.diff=embed(z, lag)[,1] z.lag.1=gnp[(lag):n] tt <- lag:n # no constant and trend summary(lm(z.diff~-1+z.lag.1)) # has constant and no trend summary(lm(z.diff~+1+z.lag.1)) # has constant and trend summary(lm(z.diff~tt+z.lag.1)) # Use Package urca library(urca) ur.df(gnp,type="none",lags=0) ur.df(gnp,type="drift",lags=0) ur.df(gnp,type="trend",lags=0)
R code Unit root test (ADF-test) lag=1 lag=lag+1 z=diff(gnp) n=length(z) z.diff=embed(z, lag)[,1] z.lag.1=gnp[(lag):n] z.diff.lag = embed(z, lag)[, 2:lag] tt <- lag:n # no constant and trend summary(lm(z.diff~-1+z.lag.1+z.diff.lag )) # has constant and no trend summary(lm(z.diff~z.lag.1+z.diff.lag )) # has constant and trend summary(lm(z.diff~tt+z.lag.1+z.diff.lag )) # Use Package urca library(urca) ur.df(gnp,type="none",lags=1) ur.df(gnp,type="drift",lags=1) ur.df(gnp,type="trend",lags=1)
R code แบบจำลอง AR, MA และ ARMA gnp=scan(file="http://faculty.chicagobooth.edu/ruey.tsay/teaching/fts3/dgnp82.txt") # To create a time-series object gnp1=ts(gnp,frequency=4,start=c(1947,2)) par(mfrow=c(1,1)) plot(gnp1) points(gnp1,pch="*") # Find the AR order m1=ar(gnp,method="mle") m1$order m2=arima(gnp,order=c(3,0,0)) summary(m2)
EVIEWs Unit root test (1)
EVIEWs Unit root test (2) Double click
EVIEWs Unit root test
EVIEWs Unit root test ตรงนี้คือให้เราเลือกว่าจะเช็ค Unit root test แบบใด
EVIEWs Unit root test ผลการศึกษา P value ขอบเขตวิกฤต
EVIEWs AR model
EVIEWs MA model พิมพ์ code คำสั่ง ในตัวอย่างนี้คือ AR(1) หรือ 𝑌 𝑡 =𝛼+𝛽 𝑌 𝑡−1 +𝑢
EVIEWs AR model ผลการศึกษา
EVIEWs MA model พิมพ์ code คำสั่ง ในตัวอย่างนี้คือ MA(1) หรือ 𝑌 𝑡 =𝛼+𝛾 𝜇 𝑡−1 + 𝜇 𝑡
EVIEWs MA model ผลการศึกษา
EVIEWs ARMA model พิมพ์ code คำสั่ง ในตัวอย่างนี้คือ ARMA(1,1) หรือ 𝑌 𝑡 =𝛼+𝛽 𝑌 𝑡−1 +𝛾 𝜇 𝑡−1 + 𝜇 𝑡
EVIEWs ARMA model ผลการศึกษา
แบบฝึกหัด Dynamic regression และ regression เหมือนหรือต่างกันอย่างไร และจงยกตัวอย่างหัวข้อวิจัยที่ใช้ แบบจำลอง Dynamic regression และ regression ปัญหาความไม่นิ่งของข้อมูล เป็นปัญหาที่ผู้วิจัยต้องคำนึงถึงเมื่อใช้ข้อมูล cross section และ Time series ใช้ หรือไม่ และเหตุใดเราจึงจำเป็นต้องตรวจสอบความนิ่งของข้อมูล ก่อนการประมาณแบบจำลอง จากข้อมูล GNP ที่ใช้เป็นตัวอย่างในบทนี้ อยากให้ทดสอบตวามนิ่งของข้อมูลในทุกรูปแบบ โดยใช้วิธีการทดสอบ ADF test และ Phillipis-Perron test และแสดงผลการศึกษาในตารางให้พอเข้าใจ (ดูตัวอย่างจากบทความวิจัยใน อดีตว่าแสดงผลการศึกษาอย่างไร ) พร้อมทั้งแปลผลการศึกษา ในการพยากรณ์ GNP เราจะใช้แบบจำลองรูปแบบใด เป็นแบบจำลองในการพยากรณ์อนาคต