A collection of time series analysis exercises
๊ทธ๋์ ์ตํ ์๊ณ์ด ๋ถ์๊ด๋ จ ๋ด์ฉ์ ์ ๋ฆฌ/์์ฝํด๋ ๊ณณ์ ๋๋ค.
์๊ณ์ด(Time-Series) ์๋ฃ: ์ด๋ ํ ๋์์ ์ฌ๋ฌ ์์ ์์ ๊ด์ฐฐํ ์ผ๋ จ์ ๊ธฐ๋ก, ์ข ๋จ ์๋ฃ
-
์๊ธฐ์๊ด์ฑ์ ๊ฐ์ง๋ค. ์๊ณ์ด, ์ข ๋จ๋ฉด ๋ฐ์ดํฐ์์ ์ด๋ ํ ๊ด์ธก์น๋ ๋ ๋ฆฝ์ ์ด์ง ์๊ณ ๊ฐ์ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ฐ์ก๋ค๊ณ ๋ ๋ณผ ์ ์๋ค.
-
์๊ฐ, ์์ ๋ค ์ฌ์ด ๊ด๊ณ๋ฅผ ํตํด ๋ฏธ๋๋ฅผ ์์ธกํ๋ Forecasting์ด ์ฃผ๋ ๋ชฉ์ ์ด๋ค.
์๊ณ์ด์ ์ฃผ์ ๋ฒ๋ 4 ๊ฐ์ง
๋๋ค(๋ฌด์์), ๊ณ์ , ์ถ์ธ, ๊ณ์ ์ถ์ธ(๋ณตํฉ) ๋ณ๋
์๊ณ์ด ๋ค๋ฃจ๊ธฐ-
์ฐจ๋ถ: ์ง์ ์ ๊ฐ๊ณผ์ ์ฐจ์ด๋ฅผ ๊ตฌํ์ฌ ์ฅ๊ธฐ์ ์ธ ์ถ์ธ๋ฅผ ์ ๊ฑฐํ๊ณ "์ ์ํ"์ํฌ ๋ ์ด๋ค. ๊ณ์ ์ฑ์ ์ ๊ฑฐํ ๋๋ 1๋ ๋จ์๋ก ์ฐจ๋ถํ๋ ๊ณ์ ์ฐจ๋ถ์ด๋ผ๊ณ ๋ ํ๋ค. (and ์ญ์ฐจ๋ถ, ์๋์, ํฉ/๊ต์งํฉ ๋ฑ ์ฝ๋ ์ฐธ์กฐ)
-
ํํํ(smoothing): ๊ณผ๊ฑฐ์ ๊ฐ์ ๋ค๋ฃฐ ๋ ์ฃผ๋ก ์ฐ๋ ๊ธฐ๋ฒ. ์ฃผ๋ก ๊ณ์ ์ ์ด๊ณ ๋ถ๊ท์นํ ๋ณ๋๋ค์ ์ ๊ฑฐํ๋ค. (by aggregating) ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก MA(์ด๋ํ๊ท ๊ธฐ๋ฒ), ์ง์ํํ๋ฒ ๋ฑ์ด ์๋ค.
*์ฌ๊ธฐ์ ๊ณผ๊ฑฐ์ ๊ด์ธก์น๋ฅผ ํตํด ํ์ฌ์ ์ํ๋ฅผ ์ถ์ ํ ๋ "ํํฐ๋ง(Filtering)"์ด๋ผ๊ณ ๋ ํ๊ณ , ๋ฏธ๋์ ์ํ๋ฅผ ์ถ์ ํ ๋ "์์ธก(Forecasting)"์ด๋ผ๊ณ ํ๊ธฐ๋ ํ๋ค.
- ์์๋ถํด(decomposing): ์ด๋ ํ ์๊ณ์ด์ ๋๋ค, ๊ณ์ , ์ถ์ธ ๋ณ๋์ผ๋ก ๋ถํดํ๋ค. ์ด ๋ ์ค์ํ ๊ฒ์ ๋๋ค๋ณ๋์ด ์ด๋ ํ ๋ค๋ฅธ ๋ณ๋์ด ์๋ "์ ์์๊ณ์ด"์ ๋ง์กฑํด์ผ ํ๋ค๋ ๊ฒ์ด๋ค.
์กฐ๊ฑด: Stationary process
ํก๋จ๋ฉด ๋ฐ์ดํฐ(ํ ์์ ์ cross sectionalํ ๊ด์ธก์น)์ ๋ฌ๋ฆฌ ์๊ณ์ด ๋ฐ์ดํฐ๋ ์๊ธฐ์๊ด์์ ์์ ๋ก์ธ ์ ์๋ค. ์ฆ, ์ด๋ ํ ๊ด์ธก์น๋ ๋ ๋ฆฝ์ ์ด์ง ์์ผ๋ฉฐ ์ด์ ์ ๊ด์ธก์น์ ์ํฅ์ ๋ฐ๊ณ ์๋ค. (i.i.d ๊ฐ์ ๋ถ๊ฐ๋ฅ)
์ด์ bias๋ฅผ ์ค์ด๊ณ ๊ฐ๊ด์ ์ธ ์์ธก์ ํ๊ธฐ ์ํด์ ์๊ณ์ด๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ๊ฐ ๊ฐ์ง๋ ๋ด์ฌ์ ์ธ ํจํด์ ์ ๊ฑฐํด์ผ ํ๋ค.
์ ์์๊ณ์ด: ์ด๋ ํ ๋ฐ์ดํฐ๊ฐ ๊ฐ์ง๊ณ ์๋ ํน์ง๋ค(์ถ์ธ, ๊ณ์ , ์ํ ๋ฑ)์ ์ ๊ฑฐํ์ฌ ๋๋คํ๋ ์๊ณ์ด์ ๋งํ๋๋ฐ, ์์ ์ ๋ฐ๋ผ ํ๊ท ๊ณผ ๋ถ์ฐ์ด ๋์ผํ์ฌ ๊ฐ์ ํ๋ฅ ๋ถํฌ๋ก์จ ์์ธก์ด ๊ฐ๋ฅํ๋ค.
*๊ฐ์ ์์ฑ: ์ด๋ค ์์ ๋ค๊ฐ์ ๊ฒฐํฉ๋ถํฌ๊ฐ ๋ชจ๋ ๋์ผํ๋ค.
*์ฝ์ ์์ฑ: 1. ์ด๋ค ์์ ์์๋ ๊ธฐ๋๊ฐ์ด ๊ฐ๊ณ 2. ๋ถ์ฐ์ด ๋ฌดํ๋๋ก ํฝ์ฐฝํ์ง ์์ผ๋ฉฐ 3. ์์ ๊ฐ ๊ณต๋ถ์ฐ์ด "์์ฐจ"์๋ง ์์กดํ๋ค. (์ฝ์ ์์ฑ๋ง ์ถฉ์กฑ์์ผ๋ ์ ์์ฑ์ ๊ฐ์ง๋ค๊ณ ํ๋จํ๋๊ฒ ์ผ๋ฐ์ ์ด๋ค.)
์๊ณ์ด ๋ฐ์ดํฐ์ ํ์ ๋ชจ๋ธ๋ง ๊ณผ์ : ์ ์์ฑ ์ฒดํฌ -> ์ ์์ฑ ์ฒ๋ฆฌ(๋น์ ์ ์๊ณ์ด์ธ ๊ฒฝ์ฐ) -> ์ ์์ฑ ๊ฒ์ฆ(Test), ๋ณดํต ADF test๋ฅผ ์งํํ๋ค. (H0: ๋น์ ์์๊ณ์ด์ด๋ค.)
>> Case 1) ์ ์ ์๊ณ์ด
- AR model
์๊ธฐ์์ ์ ๊ณผ๊ฑฐ ๊ฐ์ผ๋ก ์ ํ ๊ฒฐํฉํ์ฌ ๋ณ๋์ ์ค๋ช ํ๊ณ ๊ด์ฌ ์๋ ๋ณ์๋ฅผ ์์ธกํ๋ค.
AR(p): p์ฐจ ์๊ธฐํ๊ท ๋ชจํ
y_t = c + ฮฆ1 * y_t-1 + ฮฆ2 * y_t-2 + ... + ฮฆp * y_t-p + ฮต_t *ฮต_t๋ ์์ฐจ์ด์ ๋ฐฑ์์์
- MA model
ํํํ(smoothing) ๊ธฐ๋ฒ์ ์ ์ฉํ ๋ชจ๋ธ๋ก, ์ ์์๊ณ์ด์ธ ๋ฐฑ์์์์ ํํํํ์ฌ ๋จ์์๋ ๋ณ๋์ ์ค๋ช ํ๋ค.
MA(q) : q์ฐจ ์ด๋ํ๊ท ๋ชจํ
y_t = c + ฮ1 * ฮต_t-1 + ฮ2 * ฮต_t-2 + ... + ฮq * ฮต_t-q + ฮต_t
- ARMA model
AR + MA
p๊ฐ์ ์๊ธฐ ์์ ์ ๊ณผ๊ฑฐ๊ฐ๊ณผ q๊ฐ์ ๊ณผ๊ฑฐ ๋ฐฑ์ ์ก์์ ์ ํ ๊ฒฐํฉ
>> Case 2) ๋น์ ์ ์๊ณ์ด
- ARIMA model
ARMA๋ชจ๋ธ์ ์ฐจ๋ถ์ ๊ฐ๋ ์ด ํฌํจ๋ ๋ชจ๋ธ. ์ฆ, ๋น์ ์์๊ณ์ด์ ๋จผ์ ์ ์์๊ณ์ด๋ก ๋ฐ๊พผ ๋ค(by diffrencing) AR๊ณผ MA ๋ชจ๋ธ์ ๊ฒฐํฉํ๋ค.
ARIMA(p, d, q) : d์ฐจ ์ฐจ๋ถํ ๋ฐ์ดํฐ์ AR(p) ๋ชจํ๊ณผ MA(q) ๋ชจํ์ ํฉ์น ๋ชจํ
>> ACF , PACF
ACF์์ q๊ฒฐ์ (MA๋ชจ๋ธ์ ์๊ธฐ์๊ด์ด ์ต์ํ๋๋ ์ง์ ), PACF์์ p๊ฒฐ์ (AR๋ชจ๋ธ์ ์๊ธฐ์๊ด์ด ์ต์ํ๋๋ ์ง์ )
1. VAR(๋ฒกํฐ์๊ธฐํ๊ท, Vector AutoRegressive Model)
ํ์ค์ธ๊ณ์ ํ์์ ๋๋ถ๋ถ ํ๋์ ์์ธ์ด ์๋ ์ฌ๋ฌ ์์ธ์ ์ํด ์ผ์ด๋๋ค.
์ฆ, ์๊ฐ์ ๋ฐ๋ผ ๋ณํํ๋ ์ฌ๋ฌ ํ์๋ค ๋ํ ๊ทธ ์๊ณ์ด ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ์กด์ฌํ๋ค.(๋ ๋ฆฝ์ ์ผ ์๊ฐ ์๋ค.)
์ด์ ๋ฒกํฐ์๊ธฐํ๊ท(VAR)๋ k๊ฐ์ AR์, ์ฌ๋ฌ ์๊ณ์ด์ ๋ฒกํฐ๋ก ์์ ํ์์ ์์ธกํ๋ค.
๋จ์ผ ์๊ณ์ด AR๊ณผ ๋ค๋ฅธ ์ ์ ์ค๋ช
๋ณ์๋ก ์๊ธฐ ์์ ์ lag๋ฟ ์๋๋ผ ๋ค๋ฅธ ๋ณ์๋ค์ lag๋ ํฌํจํ๋ค๋ ๊ฒ์ด๋ค.
2. ๋ณ๋์ฑ ๋ชจํ (ARCH, GARCH)
๋๋ถ๋ถ์ ์๊ณ์ด ํ์, ํนํ ์ฌํ๊ณผํ์์ ๋ํ๋๋ ํ์์ ๋ฑ๋ถ์ฐ์ฑ์ ์ถฉ์กฑํ์ง ๋ชปํ๋ค.
์ฆ, ์๊ฐ์ด ํ๋ฅผ์๋ก ๊ทธ ๋ณ๋ ํญ ๋ํ ๋ณํํ๋ ๊ฒ์ธ๋ฐ, ๋ณดํต์ ๊ทธ ํญ์ด ์ฆ๊ฐํ๋ ์ถ์ธ๋ฅผ ๋ณด์ธ๋ค.
์ด๋ฌํ ์ํฉ์์ ํนํ ๊ธ์ต๋๋ฉ์ธ์์๋ ๋ณํํ๋ y๊ฐ ์ด์ธ์๋ ๊ทธ ๋ณ๋์ฑ๊น์ง ํต์ ํ๊ณ ๊ด๋ฆฌํด์ผ ํ ํ์์ฑ์ ๊ฐ์ง๊ธฐ ๋ง๋ จ์ด๋ค.
+
- ์กฐ๊ฑด๋ถ ๋ถ์ฐ
x ์ ๊ฐ์ ์๊ณ ์์ ๋ ์ด์ ๋ํ ์กฐ๊ฑด๋ถํ๋ฅ ๋ถํฌ p(y|x)์ ๋ถ์ฐ
์์ธก๋ฌธ์ ์ ๊ด์ ์ผ๋ก ๋ณด๋ฉด ์กฐ๊ฑด๋ถ๋ถ์ฐ์ ์์ธก์ ๋ถํ์ค์ฑ๋ฅผ ์๋ฏธํ๊ธฐ๋ ํ๋ค.
GARCH ๋ชจ๋ธ์ ARCH ๋ชจ๋ธ์ Generalizedํ ๋ชจ๋ธ์ด๋ค.
ARCH๋ ๊ทธ ๊ณ์์ธ q์ ๋ฐ๋ผ ๋ชจํ์ด ๋งค์ฐ ๋ณต์กํด์ง๊ณ ์ฑ๋ฅ ๋ํ ์ค๋ฅด์ง ์๋ ๋ฌธ์ ๊ฐ ๋น๋ฒํ ๋ฐ์ํ๋ค.(์ด๋์ ๋ ์์ ๊น์ง์ ๋ณ๋์ ์ด์ฉํ์ฌ ์์ธกํ ๊ฒ์ธ๊ฐ)
GARCH๋ชจ๋ธ์ ARCH๋ฅผ ์ผ๋ฐํํ์ฌ ์ถ์ ํด์ผํ ๋ชจ์๋ฅผ ์ค์ด๊ณ , ๋ถ์ฐ์ด ์์ฒด ์์ฐจ๊ฐ(lagged values)์ ์์กดํ๋๋ก ํ์ฌ ๋์ฑ ํจ๊ณผ/ํจ์จ์ ์ธ ๋ถ์์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
time-series or ordered task์์ ๋ฅ๋ฌ๋์ด ๊ฐ์ง๋ ์ฅ์
-
์๋์ ์ผ๋ก ๊ธด t์์ ์ ์ ํฉํ๋ค. (arima๋ ์ ์์ฑ ๋ฑ์ ์ ์ฝ ๋๋ฌธ์ ๊ธด ๋ณ๋์ ์ค๋ช ํ๊ธฐ์๋ ๋ฌด๋ฆฌ๊ฐ ์๋ค.)
-
๋ค๋ณ๋ X, ๋ค๋ณ๋ Y ๋ฌธ์ ์ ์ ์ฉ์ด ๊ฐ๋ฅํ๋ค.
-
์ํ, "๊ธฐ์ต(Memory)"์ ๊ฐ๋ ์ด ์ ์ฉ๋๋ค. (์ฆ, ์๊ธฐ์๊ด์ ๊ทธ๋๋ก ๋ฐ์ ๋ชจ๋ธ๋งํ๋ค.)
-
์์น, ์ซ์ ๋ฟ๋ง ์๋๋ผ ์์, ๋ฌธ์, ํ๋๊ธฐ๋ก(๋ก๊ทธ) ๋ฑ ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ์ ์๋ค.
- Vanilla RNN
๋ฐ๋๋ผ, ์ฆ, ๊ธฐ๋ณธ RNN ๋ชจ๋ธ์ ๋ฅ๋ฌ๋์ Recurrentํ ๊ตฌ์กฐ๋ฅผ ์ ๋ชฉํ ๋ชจ๋ธ๋ก sequentialํ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐ ์ด์ฉ๋๋ค.
๊ทธ๋ฌ๋, ์ด๋ ํ์ต์ด ์ ์ฐจ ์ฅ๊ธฐ์ ์ผ๋ก ์ด์ด์ง ๋ ๊ธฐ์ธ๊ธฐ ์๋ฉธ ํน์ ํญ์ฃผ์ ๋ฌธ์ ๋ก temporalํ dependency๋ฅผ ํ์ ํ๋ ๋ฐ ํ๊ณ๊ฐ ์๋ค.
- LSTM
LSTM์ RNN ๊ตฌ์กฐ์ ๋ด๋ถ์ cell state์ 4๊ฐ์ gate๋ฅผ ๋์ด ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ค.
LSTM์ vanilla RNN์ ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์๋ค.
Blog Review -> RNN, LSTM
์ฝ๋๋ ์ ํด๋๋ฅผ ์ฐธ๊ณ ํด์ฃผ์ธ์!




