데이터 분석/ADP 자격증 공부

[ADP 필기] 시계열 분석

나르시스트 2026. 4. 4. 13:06

*시계열 분석

– 시계열 데이터 분석을 통해 미래감을 예측하고 경향(추세), 주기, 계절성 등을 파악
– 비정상성/정상성 시계열 자료 *정상 시계열

  • E(y+)=M, var(y+)=σ2
    ① 평균이 일정할 경우 ← 차분을 통해 정상화 (현시점-전시점 자료)
    ② 분산이 일정 ← 변환을 통해 정상화
    ③ 공분산도 단지 시차에만 의존, 실제 특정 시점 t, s에는 의존 X
    Cov(yt, yt + s) = Cov(yt, yt – s) = rs (공분산은 t가 아닌, s에 의존)
  • 일변량 시계열분석: 시간(t)을 설명변수로 한 회귀모형주가, 소매물가지수 등 하나의 변수에 관성
    Box-Jenkins (ARMA), (직관적 방법) 지수평활법, 시계열분해법
  • 다중 시계열분석: 여러 개의 시간(t)에 따른 변수들을 활용
    계량경제모형(회귀분석, 장기예측), 전이항수모형, 개입분석, 상태공간분석, 다변량 ARIMA
    ※ 수학적 이론 모형 – Box-Jenkins, 계량경제모형

*이동평균법

– 일정기간별 이동평균을 계산하고, 추세를 파악하여 다음 기간을 예측하는 방법
→ 계절 변동과 불규칙 변동을 제거하여 추세 변동과 순환 변동만 가진 시계열로 변환하는 방법 사용
간단하고 쉬움, 자료 多 +안정된 패턴일 때 예측 품질↑, 적절한 n개 수 결정!
불규칙변동이 심한 경우는 긴 기간(m 개수 ↑)의 평균을 사용

*지수평활법

– 모든 시계열 자료를 사용 + 최근 시계열에 더 많은 가중치 부여해서 미래 예측
→ 단기간에 발생하는 불규칙 변동을 평활하는방법 (0.05~0.3)
※ 중기 예측 이상에 주로 사용(?)
→ 자료 多 + 안정된 패턴일 때 예측 품질 ↑
→ 가중치 역할 – 지수평활*계수(α) – 불규칙 변동이 큰 경우 지수평활계수는 작은 값 적용
*예측 오차(실제 관측치와 예측치 사이의 잔차 제공합)가 가장 작은 값
(단, 단순 지수 평활법의 경우는 장기추세 or 계절변동 포함된 시계열 예측엔 적합X)

*시계열 모형

1. 자기회귀 모형 (AR모형, Auto Regressive) – PACF 편자기상관계수

– P 시점 전의 자료가 현재 자료에 영향을 주는 모형
– AR(1) – 직전 시점 데이터, AR(2)-연속된 3시점 정도의 데이터로 분석
– 자기상관함수(ACF)는 빠르게 감소, 부분자기함수 (PACF)는 어느 시점에서 절단점을 가짐 ex) AR(3)

2. 이동평균 모형 (MA모형, Moving Average) – ACF 자기상관계수

– 유한한 개수의 백색잡음의 결합이므로, 언제나 정상성을 만족
– ACF에서 절단점을 갖고, PACF가 빠르게 감소 ex) MA(1)

3. 자기회귀누적이동평균 모형

– ARIMA(p, d, q) 모형 (Autoregressive integrated moving average model)
– 비정상시계열 모형 → 차분, 변환 → 모형 정상화 가능
※ AR: (p), MA: (q), ARMA: d번 차분 – ARMA(p, q)
→ 정상성 시계열 한해 사용

  • d = 0, ARMA(p, q) – 정상성 만족
  • p = 0, IMA(d, q) – d번 차분 → MA(q)
  • q = 0, ARI(p, d) – d번 차분 → AR(p)
    → AIC 점수가 낮은 모형 선정

*분해 시계열

– 시계열에 영향을 주는 일반적 요인을 시계열에서 분리해 분석하는 방법

  • Zt = f(Tt, St, Ct, It)
    ※ 순서대로 경향(추세), 계절, 순환(알려지지 않은 주기), 불규칙 요인

ⓐ 시간 그래프 그리기
ⓑ 추세와 계절성 제거
ⓒ 잔차예측
ⓓ 잔차에 대한 모델 적합
ⓔ 예측된 잔차에 추세와 계절성을 더하여 미래 예측