Ch9. 시계열 분석 — 과거 데이터로 미래를 예측하는 법
시계열 데이터란
시계열(Time Series): 시간에 따라 순차적으로 수집된 데이터.
예시: 주가, GDP, 소비자물가지수, 판매량, 기온
시계열의 4대 성분
Y_t = T_t × S_t × C_t × I_t (승법 모형)
Y_t = T_t + S_t + C_t + I_t (가법 모형)
| 성분 | 기호 | 설명 |
|---|---|---|
| 추세(Trend) | T | 장기적 증가·감소 방향 |
| 계절성(Seasonality) | S | 1년 이내 주기적 패턴 |
| 순환(Cycle) | C | 경기 순환 등 수년 주기 패턴 |
| 불규칙(Irregular) | I | 예측 불가능한 무작위 변동 |
이동평균법 (Moving Average)
과거 n기간의 평균으로 다음 기간을 예측.
MA(n) = (Y_t + Y_{t-1} + ... + Y_{t-n+1}) / n
장점: 단기 변동(노이즈) 제거, 추세 파악
단점: 최근 데이터와 오래된 데이터에 동일한 가중치
지수평활법 (Exponential Smoothing)
최근 데이터에 더 높은 가중치 부여.
Ŷ_{t+1} = α × Y_t + (1-α) × Ŷ_t
α: 평활 계수 (0 < α < 1)
α → 1: 최근 데이터 중시 (변동에 민감)
α → 0: 과거 데이터 중시 (부드러운 예측)
홀트-윈터스(Holt-Winters): 추세+계절성 포함 지수평활법.
자기상관과 정상성
자기상관(Autocorrelation, ACF): 시계열이 자기 자신의 과거 값과 얼마나 상관되어 있는지
정상 시계열(Stationary): 시간이 지나도 평균·분산이 일정
→ 비정상 시계열은 차분(differencing)으로 정상화
차분(Differencing):
ΔY_t = Y_t - Y_{t-1} (1차 차분)
ARIMA 모형
ARIMA(p, d, q): 자기회귀(AR) + 차분(I) + 이동평균(MA)
| 기호 | 의미 |
|---|---|
| p | AR 차수 (자기회귀 항 수) |
| d | 차분 횟수 (정상화 차수) |
| q | MA 차수 (이동평균 오차항 수) |
AR(p): Y_t = φ₁Y_{t-1} + ... + φₚY_{t-p} + ε_t
MA(q): Y_t = ε_t + θ₁ε_{t-1} + ... + θqε_{t-q}
ARMA(p,q): AR + MA 결합
ARIMA(p,d,q): 비정상 시계열의 d회 차분 후 ARMA
예측 정확도 지표
MAE = Σ|Y_t - Ŷ_t| / n (평균절대오차)
MSE = Σ(Y_t - Ŷ_t)² / n (평균제곱오차)
RMSE = √MSE (평균제곱근오차)
MAPE = Σ|Y_t - Ŷ_t| / Y_t / n × 100% (평균절대백분율오차)
핵심 개념 카드
시계열 4대 성분 ★★★★★ : 추세(T)·계절성(S)·순환(C)·불규칙(I). 시계열 분해와 예측 모형 선택의 기초. 암기 포인트: 추-계-순-불 (추세계절성 순환불규칙)
지수평활법 ★★★★☆ : α가 클수록 최근 데이터 중시. 단순·이중·삼중(홀트-윈터스) 방식. 암기 포인트: α→1=최근 민감, α→0=느린 반응
ARIMA(p,d,q) ★★★★☆ : 비정상 시계열의 표준 예측 모형. d=차분 횟수, p=AR항, q=MA항. 암기 포인트: d=정상화, p=자기회귀, q=오차이동평균
실전 퀴즈
Q. 매출 데이터에 강한 계절성이 있다. 어떤 예측 방법이 적합한가?
홀트-윈터스 지수평활법 또는 SARIMA(계절성 ARIMA). 계절 성분을 명시적으로 모형화해야 계절적 패턴을 반영한 예측이 가능.
Q. ARIMA(1,1,0)의 의미는?
AR 항 1개(p=1), 1회 차분(d=1, 비정상 시계열 처리), MA 항 없음(q=0). 1차 차분 후 AR(1) 모형 적용.
OIYO 편집부
Content Editor지식 인큐베이터이자 전문 콘텐츠 크리에이터. 경영, 경제, 법률 및 실생활에 유용한 실무/자격증 중심의 깊이 있는 정보를 연구하고 공유합니다.