Allen's 데이터 맛집
시계열 분석 - AR 모형, MA 모형 및 자기 상관성 본문
시계열 데이터 분석에서 AR(자기회귀) 모형과 MA(이동평균) 모형은 가장 기본적이면서 중요한 예측 모델 중 두 가지입니다. 이 글에서는 AR 모형, MA 모형, 자기 상관 함수(ACF), 부분 자기 상관 함수(PACF), 그리고 백색잡음에 대해 설명하고, 각각의 중요성과 데이터 분석에서의 역할을 알아보겠습니다.
AR(자기회귀) 모형
- 정의: AR 모형은 과거 관측값의 선형 조합으로 현재의 시계열 값을 예측하는 모델입니다. 모델의 주요 매개변수는 'p'로, 과거 'p' 기간의 데이터가 현재 값을 예측하는 데 사용됩니다.
- 장단점 및 사용처: AR 모형은 시계열 데이터의 시간적 변동을 설명하는 데 강력합니다. 특히, 시간에 따라 자기 상관성을 보이는 데이터에 적합합니다. 그러나 고정된 패턴이나 계절성을 갖는 데이터에 대해서는 제한적일 수 있습니다.
MA(이동평균) 모형
- 정의: MA 모형은 과거 오차 항의 선형 조합을 사용하여 시계열 값을 예측합니다. 'q'는 모델에 포함된 과거 오차 항의 수를 나타냅니다.
- 장단점 및 사용처: MA 모형은 불규칙한 충격이 시계열에 미치는 영향을 모델링하는 데 유용합니다. 단기 예측에 강점을 보이며, AR 모형과 결합된 ARMA 모형으로 사용될 때 더욱 강력해집니다.
자기 상관 함수(ACF) 및 부분 자기 상관 함수(PACF)
- ACF: 시계열 데이터 내에서 서로 다른 시점의 관측치 간 상관관계의 정도를 측정합니다. ACF는 데이터의 자기 상관성을 파악하는 데 중요한 도구입니다.
- PACF: 두 시점 간의 상관관계를 그 사이에 있는 모든 관측치의 영향을 제거한 후 측정한 것입니다. AR 모형의 차수 'p'를 결정하는 데 유용합니다.
백색잡음
- 정의: 백색잡음은 평균이 0이고, 일정한 분산을 가지며, 시점 간에 상관관계가 전혀 없는 시계열 데이터입니다. 이는 시계열 모델의 오차 항에서 이상적인 상태를 나타냅니다.
- 중요성: 시계열 모델이 데이터의 패턴을 충분히 설명할 때, 잔차는 백색잡음과 유사한 특성을 보여야 합니다. 이는 모델의 적합성을 평가하는 중요한 지표가 됩니다.
AR 모형과 MA 모형은 시계열 데이터의 패턴과 구조를 이해하고 예측하는 데 필수적인 도구입니다. ACF와 PACF는 이러한 모형의 매개변수를 결정하는 데 중요한 역할을 하며, 백색잡음은 모델의 적합성을 평가하는 기준을 제공합니다.