Skip to content

Latest commit

ย 

History

History
195 lines (124 loc) ยท 7.9 KB

File metadata and controls

195 lines (124 loc) ยท 7.9 KB

Time-Series

A collection of time series analysis exercises

๊ทธ๋™์•ˆ ์ตํžŒ ์‹œ๊ณ„์—ด ๋ถ„์„๊ด€๋ จ ๋‚ด์šฉ์„ ์ •๋ฆฌ/์š”์•ฝํ•ด๋‘” ๊ณณ์ž…๋‹ˆ๋‹ค.

1. ์‹œ๊ณ„์—ด์˜ ๊ธฐ๋ณธ ๊ฐœ๋…๋“ค

์‹œ๊ณ„์—ด(Time-Series) ์ž๋ฃŒ: ์–ด๋– ํ•œ ๋Œ€์ƒ์„ ์—ฌ๋Ÿฌ ์‹œ์ ์—์„œ ๊ด€์ฐฐํ•œ ์ผ๋ จ์˜ ๊ธฐ๋ก, ์ข…๋‹จ ์ž๋ฃŒ

  • ์ž๊ธฐ์ƒ๊ด€์„ฑ์„ ๊ฐ€์ง„๋‹ค. ์‹œ๊ณ„์—ด, ์ข…๋‹จ๋ฉด ๋ฐ์ดํ„ฐ์—์„œ ์–ด๋– ํ•œ ๊ด€์ธก์น˜๋Š” ๋…๋ฆฝ์ ์ด์ง€ ์•Š๊ณ  ๊ฐ™์€ ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ๊ฐ€์กŒ๋‹ค๊ณ ๋„ ๋ณผ ์ˆ˜ ์—†๋‹ค.

  • ์‹œ๊ฐ„, ์‹œ์ ๋“ค ์‚ฌ์ด ๊ด€๊ณ„๋ฅผ ํ†ตํ•ด ๋ฏธ๋ž˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” Forecasting์ด ์ฃผ๋œ ๋ชฉ์ ์ด๋‹ค.

์‹œ๊ณ„์—ด์˜ ์ฃผ์š” ๋ฒˆ๋™ 4 ๊ฐ€์ง€

๋žœ๋ค(๋ฌด์ž‘์œ„), ๊ณ„์ ˆ, ์ถ”์„ธ, ๊ณ„์ ˆ์ถ”์„ธ(๋ณตํ•ฉ) ๋ณ€๋™

์‹œ๊ณ„์—ด ๋‹ค๋ฃจ๊ธฐ
  • ์ฐจ๋ถ„: ์ง์ „์˜ ๊ฐ’๊ณผ์˜ ์ฐจ์ด๋ฅผ ๊ตฌํ•˜์—ฌ ์žฅ๊ธฐ์ ์ธ ์ถ”์„ธ๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  "์ •์ƒํ™”"์‹œํ‚ฌ ๋•Œ ์“ด๋‹ค. ๊ณ„์ ˆ์„ฑ์„ ์ œ๊ฑฐํ•  ๋•Œ๋Š” 1๋…„ ๋‹จ์œ„๋กœ ์ฐจ๋ถ„ํ•˜๋Š” ๊ณ„์ ˆ ์ฐจ๋ถ„์ด๋ผ๊ณ ๋„ ํ•œ๋‹ค. (and ์—ญ์ฐจ๋ถ„, ์œˆ๋„์ž‰, ํ•ฉ/๊ต์ง‘ํ•ฉ ๋“ฑ ์ฝ”๋“œ ์ฐธ์กฐ)

  • ํ‰ํ™œํ™”(smoothing): ๊ณผ๊ฑฐ์˜ ๊ฐ’์„ ๋‹ค๋ฃฐ ๋•Œ ์ฃผ๋กœ ์“ฐ๋Š” ๊ธฐ๋ฒ•. ์ฃผ๋กœ ๊ณ„์ ˆ์ ์ด๊ณ  ๋ถˆ๊ทœ์น™ํ•œ ๋ณ€๋™๋“ค์„ ์ œ๊ฑฐํ•œ๋‹ค. (by aggregating) ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ MA(์ด๋™ํ‰๊ท ๊ธฐ๋ฒ•), ์ง€์ˆ˜ํ‰ํ™œ๋ฒ• ๋“ฑ์ด ์žˆ๋‹ค.

*์—ฌ๊ธฐ์„œ ๊ณผ๊ฑฐ์˜ ๊ด€์ธก์น˜๋ฅผ ํ†ตํ•ด ํ˜„์žฌ์˜ ์ƒํƒœ๋ฅผ ์ถ”์ •ํ•  ๋–„ "ํ•„ํ„ฐ๋ง(Filtering)"์ด๋ผ๊ณ ๋„ ํ•˜๊ณ , ๋ฏธ๋ž˜์˜ ์ƒํƒœ๋ฅผ ์ถ”์ •ํ•  ๋–„ "์˜ˆ์ธก(Forecasting)"์ด๋ผ๊ณ  ํ•˜๊ธฐ๋„ ํ•œ๋‹ค.

  • ์š”์†Œ๋ถ„ํ•ด(decomposing): ์–ด๋– ํ•œ ์‹œ๊ณ„์—ด์„ ๋žœ๋ค, ๊ณ„์ ˆ, ์ถ”์„ธ ๋ณ€๋™์œผ๋กœ ๋ถ„ํ•ดํ•œ๋‹ค. ์ด ๋•Œ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๋žœ๋ค๋ณ€๋™์ด ์–ด๋– ํ•œ ๋‹ค๋ฅธ ๋ณ€๋™์ด ์—†๋Š” "์ •์ƒ์‹œ๊ณ„์—ด"์„ ๋งŒ์กฑํ•ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

2. ๋ชจ๋ธ๋ง

์กฐ๊ฑด: Stationary process

ํšก๋‹จ๋ฉด ๋ฐ์ดํ„ฐ(ํ•œ ์‹œ์ ์˜ cross sectionalํ•œ ๊ด€์ธก์น˜)์™€ ๋‹ฌ๋ฆฌ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋Š” ์ž๊ธฐ์ƒ๊ด€์—์„œ ์ž์œ ๋กœ์šธ ์ˆ˜ ์—†๋‹ค. ์ฆ‰, ์–ด๋– ํ•œ ๊ด€์ธก์น˜๋Š” ๋…๋ฆฝ์ ์ด์ง€ ์•Š์œผ๋ฉฐ ์ด์ „์˜ ๊ด€์ธก์น˜์— ์˜ํ–ฅ์„ ๋ฐ›๊ณ  ์žˆ๋‹ค. (i.i.d ๊ฐ€์ • ๋ถˆ๊ฐ€๋Šฅ)

์ด์— bias๋ฅผ ์ค„์ด๊ณ  ๊ฐ๊ด€์ ์ธ ์˜ˆ์ธก์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์‹œ๊ณ„์—ด๋กœ ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ€์ง€๋Š” ๋‚ด์žฌ์ ์ธ ํŒจํ„ด์„ ์ œ๊ฑฐํ•ด์•ผ ํ•œ๋‹ค.

์ •์ƒ์‹œ๊ณ„์—ด: ์–ด๋– ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ํŠน์ง•๋“ค(์ถ”์„ธ, ๊ณ„์ ˆ, ์ˆœํ™˜ ๋“ฑ)์„ ์ œ๊ฑฐํ•˜์—ฌ ๋žœ๋คํ™”๋œ ์‹œ๊ณ„์—ด์„ ๋งํ•˜๋Š”๋ฐ, ์‹œ์ ์— ๋”ฐ๋ผ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์ด ๋™์ผํ•˜์—ฌ ๊ฐ™์€ ํ™•๋ฅ ๋ถ„ํฌ๋กœ์จ ์˜ˆ์ธก์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

*๊ฐ•์ •์ƒ์„ฑ: ์–ด๋–ค ์‹œ์ ๋“ค๊ฐ„์˜ ๊ฒฐํ•ฉ๋ถ„ํฌ๊ฐ€ ๋ชจ๋‘ ๋™์ผํ•˜๋‹ค.

*์•ฝ์ •์ƒ์„ฑ: 1. ์–ด๋–ค ์‹œ์ ์—์„œ๋“  ๊ธฐ๋Œ“๊ฐ’์ด ๊ฐ™๊ณ  2. ๋ถ„์‚ฐ์ด ๋ฌดํ•œ๋Œ€๋กœ ํŒฝ์ฐฝํ•˜์ง€ ์•Š์œผ๋ฉฐ 3. ์‹œ์ ๊ฐ„ ๊ณต๋ถ„์‚ฐ์ด "์‹œ์ฐจ"์—๋งŒ ์˜์กดํ•œ๋‹ค. (์•ฝ์ •์ƒ์„ฑ๋งŒ ์ถฉ์กฑ์‹œ์ผœ๋„ ์ •์ƒ์„ฑ์„ ๊ฐ€์ง„๋‹ค๊ณ  ํŒ๋‹จํ•˜๋Š”๊ฒŒ ์ผ๋ฐ˜์ ์ด๋‹ค.)



์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ํ•„์ˆ˜ ๋ชจ๋ธ๋ง ๊ณผ์ •: ์ •์ƒ์„ฑ ์ฒดํฌ -> ์ •์ƒ์„ฑ ์ฒ˜๋ฆฌ(๋น„์ •์ƒ ์‹œ๊ณ„์—ด์ธ ๊ฒฝ์šฐ) -> ์ •์ƒ์„ฑ ๊ฒ€์ฆ(Test), ๋ณดํ†ต ADF test๋ฅผ ์ง„ํ–‰ํ•œ๋‹ค. (H0: ๋น„์ •์ƒ์‹œ๊ณ„์—ด์ด๋‹ค.)

2-1. ๋‹จ๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด


>> Case 1) ์ •์ƒ ์‹œ๊ณ„์—ด

  • AR model

์ž๊ธฐ์ž์‹ ์˜ ๊ณผ๊ฑฐ ๊ฐ’์œผ๋กœ ์„ ํ˜• ๊ฒฐํ•ฉํ•˜์—ฌ ๋ณ€๋™์„ ์„ค๋ช…ํ•˜๊ณ  ๊ด€์‹ฌ ์žˆ๋Š” ๋ณ€์ˆ˜๋ฅผ ์˜ˆ์ธกํ•œ๋‹ค.

AR(p): p์ฐจ ์ž๊ธฐํšŒ๊ท€ ๋ชจํ˜•

y_t = c + ฮฆ1 * y_t-1 + ฮฆ2 * y_t-2 + ... + ฮฆp * y_t-p + ฮต_t *ฮต_t๋Š” ์ž”์ฐจ์ด์ž ๋ฐฑ์ƒ‰์†Œ์Œ

  • MA model

ํ‰ํ™œํ™”(smoothing) ๊ธฐ๋ฒ•์„ ์ ์šฉํ•œ ๋ชจ๋ธ๋กœ, ์ •์ƒ์‹œ๊ณ„์—ด์ธ ๋ฐฑ์ƒ‰์†Œ์Œ์„ ํ‰ํ™œํ™”ํ•˜์—ฌ ๋‚จ์•„์žˆ๋Š” ๋ณ€๋™์„ ์„ค๋ช…ํ•œ๋‹ค.

MA(q) : q์ฐจ ์ด๋™ํ‰๊ท  ๋ชจํ˜•

y_t = c + ฮ˜1 * ฮต_t-1 + ฮ˜2 * ฮต_t-2 + ... + ฮ˜q * ฮต_t-q + ฮต_t

  • ARMA model

AR + MA

p๊ฐœ์˜ ์ž๊ธฐ ์ž์‹ ์˜ ๊ณผ๊ฑฐ๊ฐ’๊ณผ q๊ฐœ์˜ ๊ณผ๊ฑฐ ๋ฐฑ์ƒ‰ ์žก์Œ์˜ ์„ ํ˜• ๊ฒฐํ•ฉ



>> Case 2) ๋น„์ •์ƒ ์‹œ๊ณ„์—ด

  • ARIMA model

ARMA๋ชจ๋ธ์— ์ฐจ๋ถ„์˜ ๊ฐœ๋…์ด ํฌํ•จ๋œ ๋ชจ๋ธ. ์ฆ‰, ๋น„์ •์ƒ์‹œ๊ณ„์—ด์„ ๋จผ์ € ์ •์ƒ์‹œ๊ณ„์—ด๋กœ ๋ฐ”๊พผ ๋’ค(by diffrencing) AR๊ณผ MA ๋ชจ๋ธ์„ ๊ฒฐํ•ฉํ•œ๋‹ค.

ARIMA(p, d, q) : d์ฐจ ์ฐจ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ์— AR(p) ๋ชจํ˜•๊ณผ MA(q) ๋ชจํ˜•์„ ํ•ฉ์นœ ๋ชจํ˜•




>> ACF , PACF


์ถœ์ฒ˜) ํŒจ์ŠคํŠธ์บ ํผ์Šค

ACF์—์„œ q๊ฒฐ์ •(MA๋ชจ๋ธ์˜ ์ž๊ธฐ์ƒ๊ด€์ด ์ตœ์†Œํ™”๋˜๋Š” ์ง€์ ), PACF์—์„œ p๊ฒฐ์ •(AR๋ชจ๋ธ์˜ ์ž๊ธฐ์ƒ๊ด€์ด ์ตœ์†Œํ™”๋˜๋Š” ์ง€์ )

2-2. ๋‹ค๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด



1. VAR(๋ฒกํ„ฐ์ž๊ธฐํšŒ๊ท€, Vector AutoRegressive Model)

ํ˜„์‹ค์„ธ๊ณ„์˜ ํ˜„์ƒ์€ ๋Œ€๋ถ€๋ถ„ ํ•˜๋‚˜์˜ ์š”์ธ์ด ์•„๋‹Œ ์—ฌ๋Ÿฌ ์š”์ธ์— ์˜ํ•ด ์ผ์–ด๋‚œ๋‹ค.

์ฆ‰, ์‹œ๊ฐ„์— ๋”ฐ๋ผ ๋ณ€ํ™”ํ•˜๋Š” ์—ฌ๋Ÿฌ ํ˜„์ƒ๋“ค ๋˜ํ•œ ๊ทธ ์‹œ๊ณ„์—ด ๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์กด์žฌํ•œ๋‹ค.(๋…๋ฆฝ์ ์ผ ์ˆ˜๊ฐ€ ์—†๋‹ค.)

์ด์— ๋ฒกํ„ฐ์ž๊ธฐํšŒ๊ท€(VAR)๋Š” k๊ฐœ์˜ AR์‹, ์—ฌ๋Ÿฌ ์‹œ๊ณ„์—ด์„ ๋ฒกํ„ฐ๋กœ ์Œ“์•„ ํ˜„์ƒ์„ ์˜ˆ์ธกํ•œ๋‹ค.

๋‹จ์ผ ์‹œ๊ณ„์—ด AR๊ณผ ๋‹ค๋ฅธ ์ ์€ ์„ค๋ช…๋ณ€์ˆ˜๋กœ ์ž๊ธฐ ์ž์‹ ์˜ lag๋ฟ ์•„๋‹ˆ๋ผ ๋‹ค๋ฅธ ๋ณ€์ˆ˜๋“ค์˜ lag๋„ ํฌํ•จํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.



2. ๋ณ€๋™์„ฑ ๋ชจํ˜• (ARCH, GARCH)

๋Œ€๋ถ€๋ถ„์˜ ์‹œ๊ณ„์—ด ํ˜„์ƒ, ํŠนํžˆ ์‚ฌํšŒ๊ณผํ•™์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ํ˜„์ƒ์€ ๋“ฑ๋ถ„์‚ฐ์„ฑ์„ ์ถฉ์กฑํ•˜์ง€ ๋ชปํ•œ๋‹ค.

์ฆ‰, ์‹œ๊ฐ„์ด ํ๋ฅผ์ˆ˜๋ก ๊ทธ ๋ณ€๋™ ํญ ๋˜ํ•œ ๋ณ€ํ™”ํ•˜๋Š” ๊ฒƒ์ธ๋ฐ, ๋ณดํ†ต์€ ๊ทธ ํญ์ด ์ฆ๊ฐ€ํ•˜๋Š” ์ถ”์„ธ๋ฅผ ๋ณด์ธ๋‹ค.

์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ ํŠนํžˆ ๊ธˆ์œต๋„๋ฉ”์ธ์—์„œ๋Š” ๋ณ€ํ™”ํ•˜๋Š” y๊ฐ’ ์ด์™ธ์—๋„ ๊ทธ ๋ณ€๋™์„ฑ๊นŒ์ง€ ํ†ต์ œํ•˜๊ณ  ๊ด€๋ฆฌํ•ด์•ผ ํ•  ํ•„์š”์„ฑ์„ ๊ฐ€์ง€๊ธฐ ๋งˆ๋ จ์ด๋‹ค.
+

  • ์กฐ๊ฑด๋ถ€ ๋ถ„์‚ฐ

x ์˜ ๊ฐ’์„ ์•Œ๊ณ  ์žˆ์„ ๋•Œ ์ด์— ๋Œ€ํ•œ ์กฐ๊ฑด๋ถ€ํ™•๋ฅ ๋ถ„ํฌ p(y|x)์˜ ๋ถ„์‚ฐ

์˜ˆ์ธก๋ฌธ์ œ์˜ ๊ด€์ ์œผ๋กœ ๋ณด๋ฉด ์กฐ๊ฑด๋ถ€๋ถ„์‚ฐ์€ ์˜ˆ์ธก์˜ ๋ถˆํ™•์‹ค์„ฑ๋ฅผ ์˜๋ฏธํ•˜๊ธฐ๋„ ํ•œ๋‹ค.


ARCH(q)



GARCH(p,q)

GARCH ๋ชจ๋ธ์€ ARCH ๋ชจ๋ธ์„ Generalizedํ•œ ๋ชจ๋ธ์ด๋‹ค.

ARCH๋Š” ๊ทธ ๊ณ„์ˆ˜์ธ q์— ๋”ฐ๋ผ ๋ชจํ˜•์ด ๋งค์šฐ ๋ณต์žกํ•ด์ง€๊ณ  ์„ฑ๋Šฅ ๋˜ํ•œ ์˜ค๋ฅด์ง€ ์•Š๋Š” ๋ฌธ์ œ๊ฐ€ ๋นˆ๋ฒˆํžˆ ๋ฐœ์ƒํ•œ๋‹ค.(์–ด๋А์ •๋„ ์‹œ์ ๊นŒ์ง€์˜ ๋ณ€๋™์„ ์ด์šฉํ•˜์—ฌ ์˜ˆ์ธกํ•  ๊ฒƒ์ธ๊ฐ€)

GARCH๋ชจ๋ธ์€ ARCH๋ฅผ ์ผ๋ฐ˜ํ™”ํ•˜์—ฌ ์ถ”์ •ํ•ด์•ผํ•  ๋ชจ์ˆ˜๋ฅผ ์ค„์ด๊ณ , ๋ถ„์‚ฐ์ด ์ž์ฒด ์‹œ์ฐจ๊ฐ’(lagged values)์— ์˜์กดํ•˜๋„๋ก ํ•˜์—ฌ ๋”์šฑ ํšจ๊ณผ/ํšจ์œจ์ ์ธ ๋ถ„์„์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

3. ๋”ฅ๋Ÿฌ๋‹๊ณผ ์‹œ๊ณ„์—ด

time-series or ordered task์—์„œ ๋”ฅ๋Ÿฌ๋‹์ด ๊ฐ€์ง€๋Š” ์žฅ์ 

  1. ์ƒ๋Œ€์ ์œผ๋กœ ๊ธด t์‹œ์ ์— ์ ํ•ฉํ•˜๋‹ค. (arima๋Š” ์ •์ƒ์„ฑ ๋“ฑ์˜ ์ œ์•ฝ ๋•Œ๋ฌธ์— ๊ธด ๋ณ€๋™์„ ์„ค๋ช…ํ•˜๊ธฐ์—๋Š” ๋ฌด๋ฆฌ๊ฐ€ ์žˆ๋‹ค.)

  2. ๋‹ค๋ณ€๋Ÿ‰ X, ๋‹ค๋ณ€๋Ÿ‰ Y ๋ฌธ์ œ์— ์ ์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.

  3. ์ˆœํ™˜, "๊ธฐ์–ต(Memory)"์˜ ๊ฐœ๋…์ด ์ ์šฉ๋œ๋‹ค. (์ฆ‰, ์ž๊ธฐ์ƒ๊ด€์„ ๊ทธ๋Œ€๋กœ ๋ฐ›์•„ ๋ชจ๋ธ๋งํ•œ๋‹ค.)

  4. ์ˆ˜์น˜, ์ˆซ์ž ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์˜์ƒ, ๋ฌธ์ž, ํ–‰๋™๊ธฐ๋ก(๋กœ๊ทธ) ๋“ฑ ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋‹ค.


  • Vanilla RNN

๋ฐ”๋‹๋ผ, ์ฆ‰, ๊ธฐ๋ณธ RNN ๋ชจ๋ธ์€ ๋”ฅ๋Ÿฌ๋‹์— Recurrentํ•œ ๊ตฌ์กฐ๋ฅผ ์ ‘๋ชฉํ•œ ๋ชจ๋ธ๋กœ sequentialํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋ฐ ์ด์šฉ๋œ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜, ์ด๋Š” ํ•™์Šต์ด ์ ์ฐจ ์žฅ๊ธฐ์ ์œผ๋กœ ์ด์–ด์งˆ ๋–„ ๊ธฐ์šธ๊ธฐ ์†Œ๋ฉธ ํ˜น์€ ํญ์ฃผ์˜ ๋ฌธ์ œ๋กœ temporalํ•œ dependency๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๋ฐ ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค.

  • LSTM

LSTM์€ RNN ๊ตฌ์กฐ์— ๋‚ด๋ถ€์˜ cell state์™€ 4๊ฐœ์˜ gate๋ฅผ ๋‘์–ด ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•œ๋‹ค.

LSTM์€ vanilla RNN์˜ ์žฅ๊ธฐ ์˜์กด์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜์˜€๋‹ค.

Blog Review -> RNN, LSTM

์ฝ”๋“œ๋Š” ์œ„ ํด๋”๋ฅผ ์ฐธ๊ณ ํ•ด์ฃผ์„ธ์š”!