Ch9. 시계열 분석 — 과거 데이터로 미래를 예측하는 법

시계열 데이터란

시계열(Time Series): 시간에 따라 순차적으로 수집된 데이터.

예시: 주가, GDP, 소비자물가지수, 판매량, 기온

시계열의 4대 성분

Y_t = T_t × S_t × C_t × I_t  (승법 모형)
Y_t = T_t + S_t + C_t + I_t  (가법 모형)

성분	기호	설명
추세(Trend)	T	장기적 증가·감소 방향
계절성(Seasonality)	S	1년 이내 주기적 패턴
순환(Cycle)	C	경기 순환 등 수년 주기 패턴
불규칙(Irregular)	I	예측 불가능한 무작위 변동

이동평균법 (Moving Average)

과거 n기간의 평균으로 다음 기간을 예측.

MA(n) = (Y_t + Y_{t-1} + ... + Y_{t-n+1}) / n

장점: 단기 변동(노이즈) 제거, 추세 파악
단점: 최근 데이터와 오래된 데이터에 동일한 가중치

지수평활법 (Exponential Smoothing)

최근 데이터에 더 높은 가중치 부여.

Ŷ_{t+1} = α × Y_t + (1-α) × Ŷ_t

α: 평활 계수 (0 < α < 1)
  α → 1: 최근 데이터 중시 (변동에 민감)
  α → 0: 과거 데이터 중시 (부드러운 예측)

홀트-윈터스(Holt-Winters): 추세+계절성 포함 지수평활법.

자기상관과 정상성

자기상관(Autocorrelation, ACF): 시계열이 자기 자신의 과거 값과 얼마나 상관되어 있는지

정상 시계열(Stationary): 시간이 지나도 평균·분산이 일정
→ 비정상 시계열은 차분(differencing)으로 정상화

차분(Differencing):

ΔY_t = Y_t - Y_{t-1}  (1차 차분)

ARIMA 모형

ARIMA(p, d, q): 자기회귀(AR) + 차분(I) + 이동평균(MA)

기호	의미
p	AR 차수 (자기회귀 항 수)
d	차분 횟수 (정상화 차수)
q	MA 차수 (이동평균 오차항 수)

AR(p): Y_t = φ₁Y_{t-1} + ... + φₚY_{t-p} + ε_t
MA(q): Y_t = ε_t + θ₁ε_{t-1} + ... + θqε_{t-q}
ARMA(p,q): AR + MA 결합
ARIMA(p,d,q): 비정상 시계열의 d회 차분 후 ARMA

예측 정확도 지표

MAE  = Σ|Y_t - Ŷ_t| / n  (평균절대오차)
MSE  = Σ(Y_t - Ŷ_t)² / n  (평균제곱오차)
RMSE = √MSE              (평균제곱근오차)
MAPE = Σ|Y_t - Ŷ_t| / Y_t / n × 100%  (평균절대백분율오차)

핵심 개념 카드

시계열 4대 성분 ★★★★★ : 추세(T)·계절성(S)·순환(C)·불규칙(I). 시계열 분해와 예측 모형 선택의 기초. 암기 포인트: 추-계-순-불 (추세계절성 순환불규칙)

지수평활법 ★★★★☆ : α가 클수록 최근 데이터 중시. 단순·이중·삼중(홀트-윈터스) 방식. 암기 포인트: α→1=최근 민감, α→0=느린 반응

ARIMA(p,d,q) ★★★★☆ : 비정상 시계열의 표준 예측 모형. d=차분 횟수, p=AR항, q=MA항. 암기 포인트: d=정상화, p=자기회귀, q=오차이동평균

실전 퀴즈

Q. 매출 데이터에 강한 계절성이 있다. 어떤 예측 방법이 적합한가?

홀트-윈터스 지수평활법 또는 SARIMA(계절성 ARIMA). 계절 성분을 명시적으로 모형화해야 계절적 패턴을 반영한 예측이 가능.

Q. ARIMA(1,1,0)의 의미는?

AR 항 1개(p=1), 1회 차분(d=1, 비정상 시계열 처리), MA 항 없음(q=0). 1차 차분 후 AR(1) 모형 적용.