블로그 보관함

2011년 7월 1일 금요일

시계열자료: 분해법에서 말하는 성분들

시계열 예측모형의 종류에는 다음과 같은 것들이 있다.
  •  추세분석(trend analysis): 관측값을 시간의 함수로 표현하는 전통적인 분석 방법.
  •  평활법(smoothing method): 최근의 자료에 큰 가중값, 과거로 갈수록 작은 가중값을 주는 방법. 1970년대 이전에 많이 사용됨.
  •  분해법(decomposition method): 가장 오래된 전통적인 방법으로 20세기 초 경제학자들의 경기변동 예측 시도에서 비롯. 시계열을 구성하는 성분들이 결정적이고 서로 독립이라는 가정에 기반.
  • ARIMA: 현 시점의 관측값을 과거 관측값과 오차의 선형결합으로 표현. 1970년대에 Box-Jenkins 모형이 제시되면서 널리 사용고 있음.
전통적인 시계열 분석 방법인 분해법에서는  시계열이 다음 성분들로 이루어졌다고 본다. 정말로 시계열이 이렇게 몇가지 성분들로 분해될 수 있는지는 논란이 있지만 나름대로 시계열의 특성을 이해하는 데에 도움이 되는 아이디어이다.
  • 불규칙 성분(irregular component)
  • 체계적 성분(systematic component)
    • 추세 성분(trend component)
    • 계절 성분(seasonal component)
    • 순환 성분(cyclical component)

불규칙 성분

불규칙 성분으로만 이루어진 시계열을 흉내내기 위해 \[ Z_t = 1000 + \epsilon_t,\quad \epsilon_t \sim N(0, 10^2) \] 와 같은 모형을 생각하면 R에서
Z <- rnorm(120, mean=1000, sd=10)
Zt <- ts(Z, start=2001, frequency=12)
plot(Zt)
와 같이 생성할 수 있다.

추세 성분

추세 성분과 불규칙 성분으로 이루어진 시계열을 흉내내기 위해 \[ Z_t = 5 + 0.1t + \epsilon_t, \quad \epsilon_t \sim N(0,1) \] 와 같은 모형을 R에서
t <- 1:120
e <- rnorm(120)
Z <- 5 + 0.1*t + e
Zt <- ts(Z, start=2001, frequency=12)
plot(Zt)
와 같이 생성해 보면…

계절 성분

계절 성분과 불규칙 성분으로 이루어진 시계열을 흉내내기 위해 \[ Z_t = 5 + 2\sin(2\pi t /12) + \epsilon_t, \quad \epsilon_t \sim (0,1) \] 와 같은 모형을 R에서
N <- 120
t <- 1:N
e <- rnorm(N)
Z <- 5 + 2*cos(2*pi*t/12) + e
Zt <- ts(Z, start=2001, frequency=12)
plot(Zt)
와 같이 생성해 보면…

추세 성분과 계절 성분

추세 성분과 계절 성분을 가진 시계열을 흉내내기 위해 \[ Z_t = 5 + 0.1t + 2\cos(2\pi t /12) + \epsilon_t, \quad \epsilon_t \sim (0,1) \] 와 같은 모형을 R에서
N <- 120
t <- 1:N
e <- rnorm(N)
Z <- 5 + 0.1*t + 2*cos(2*pi*t/12) + e
Zt <- ts(Z, start=2001, frequency=12)
plot(Zt)
와 같이 생성해 보면…
분해는 stl() 함수를 이용하여 할 수 있다. 바로 위에서 생성한 데이터를 분해해 보면
> plot(stl(Zt, "periodic"))


참고

  • 조신섭, 손영숙 (2010), SAS/ETS를 이용한 시계열분석, 3판 2쇄, 율곡출판사, 제1장
  • Crawley (2007), The R Book, Wiley, Chapter 22.

댓글 없음:

댓글 쓰기