본문 바로가기
Chapter 8

시계열 분석 기초: 시간의 흐름 속에 숨겨진 패턴

#시계열(Time Series)#정상성(Stationarity)#자기상관(Autocorrelation)#ARIMA

시계열 분석: 어제의 데이터로 내일을 말하다

주가, 환율, 월별 매출액처럼 ‘시간의 흐름’에 따라 관측된 데이터를 시계열 데이터라고 합니다. 일반적인 관측치와 달리, 시계열 데이터는 과거의 값이 미래의 값에 영향을 주는 ‘자기상관성’을 가지고 있습니다.

1. 시계열 데이터의 4가지 구성 요소

우리가 보는 복잡한 그래프는 사실 네 가지 리듬이 합쳐진 결과입니다.

시계열 구성 성분 분석

요소의미사례
추세 (Trend)장기적으로 상승하거나 하락하는 경향인구 증가, 기술 발전
계절성 (Seasonality)일정한 주기(1년, 1주 등)마다 반복되는 패턴여름철 에어컨 판매량, 주말 외식 비중
순환성 (Cycle)정해진 주기는 없으나 경기 변동처럼 오르내림경제 성장률, 부동산 경기
불규칙 요인 (Irregular)예측할 수 없는 화재, 천재지변 등으로 인한 변동코로나19 팬데믹, 갑작스러운 전쟁

2. 시계열 분석의 전제 조건: 정상성 (Stationarity)

모델이 미래를 잘 예측하려면 데이터의 통계적 특성(평균, 분산)이 시간에 따라 일정해야 합니다. 이를 정상성이라고 합니다. 만약 추세가 있다면 ‘차분(Differencing)‘을 통해 데이터를 정상적으로 만든 뒤 분석을 시작합니다.

3. ARIMA 모델링의 3단계 (Box-Jenkins법)

가장 대표적인 시계열 모델인 ARIMA(Autoregressive Integrated Moving Average)는 다음 과정을 거쳐 완성됩니다.

1
식별 (Identification)

ACF, PACF 그래프를 보고 AR과 MA의 차수를 결정합니다.

2
추정 (Estimation)

최소자승법 등을 활용해 모델의 계수(파라미터)를 구합니다.

3
진단 (Diagnosis)

잔차(오차)가 아무런 패턴이 없는 백색잡음(White Noise)인지 확인합니다.

4. 계절적 패턴의 시각화

아래는 특정 제품의 월별 판매량 데이터에서 나타나는 전형적인 계절성 패턴을 보여줍니다.

월별 아이스크림 판매량 추이 (계절성 사례)

매년 여름철(7~8월)에 정점을 찍고 겨울에 하락하는 명확한 리듬을 보여줍니다.


💡 교수님의 팁

시계열 분석의 1계명은 “그래프를 그려보는 것”입니다. 통계적 테스트를 하기 전에 눈으로 먼저 추세나 계절성을 확인하는 것이 분석의 절반 이상을 차지합니다. 시계열 분석가는 눈으로 리듬을 읽는 지휘자와 같습니다.

🔗 다음 단계