해당 논문에서는 실제 콜센터의 데이터를 활용하여 콜량을 예측하기 위한 최적화된 모델을 개발해서 상담 인력의 적정 수준을 결정하도록 하는 내용을 다뤘다.
1. 선행 연구 분석
1) 2주 후의 콜량을 예측
단변량 시계열 방법을 활용하고, ARIMA와 시계열을 분해하기 위한 Holt-Winters를 통해 어느 정도는 예측할 수 있었다. 그러나, 다른 요인이나 회귀 모델 등과의 비교까지는 이루어지지 못했다.
2) 모바일 기지국에 인입되는 호출 부하 예측
반향 상태 네트워크 모델과 유전 알고리즘을 통해 파라미터 최적화에는 성공했다. 하지만, 모바일 기지국간의 콜 트래픽 예측이기 때문에 콜센터 대기 상황에서의 인입 예측이 아니라는 점에서 한계가 있었다.
3) 다양한 리드타임(경과 시간) 및 일간 혹은 일자 내의 상관관계에 따른 콜량 예측
바로 다음 날의 예측보다는 2주 이후의 예측 성능이 더 좋다는 점에서 의미 있는 연구였다. 그러나, 부족한 데이터로 인해 계절성이나 추세에 대해 고려하지 못했기에 적용하기는 어려웠다.
콜센터의 콜량 예측에 대한 대부분의 선행 연구는 위의 3가지 경우가 많았다. 이 외에도 콜량을 예측해서 상담사 인력에 대한 스케줄링에 대한 연구가 있었으나 구체적인 프로세스 정의가 부족했던 사례도 있었다.
2. 배경 이론
1) 평활화
평활화는 시계열 데이터에 있는 변동이나 불연속성을 약하게 해서 시계열 데이터의 추세 변동을 파악하여 예측하는 방법이다. 그 중 지수 평활화는 이동평균에 시간에 대해 가중치를 부여한 것이며, 지수 평활을 사용해서 얻은 값은 과거의 관측값의 가중 평균이 된다. 과거 시점일수록 가중치는 지수적으로 감소하게 된다.
이후 Holt에 의해 시간에 따른 증감 추세를 고려한 지수 평활화 모델이 제시되었고, Winters는 Holt가 제시한 모형에 계절성을 추가해서 Holt-Winters의 계절성 모델이 탄생했다.
논문에는 나와있지 않지만 Holt-Winters 모델의 사용 예시를 간단히 소개하고자 한다. 해당 데이터는 R에 내장된 1960~1986년 영국의 분기별 가스 소비량이 담긴 것이다.
gas <- window(UKgas)
hw_add <- hw(gas, seasonal = 'additive')
hw_mult <- hw(gas, seasonal = 'multiplicative')
autoplot(gas) + autolayer(hw_add, series = 'additive', PI = FALSE) +
autolayer(hw_mult, series = 'multiplicative', PI = FALSE)
Holt-Winters의 덧셈, 곱셈 기법을 활용하여 1987~1990년의 가스 소비량을 예측한 그래프가 나타나게 된다.
다시 해당 본문으로 돌아와서 보면, 최근에는 푸리에 변환 등이 적용되어 계산 속도를 높인 다중 계절성 지수평활모형이라고도 하는 TBATS 모델도 사용한다고 한다.
2) ARMA / ARIMA
- ARMA : 자기회귀이동평균(Autoregressive Moving Average)
- ARIMA : 자기회귀누적이동평균(Autoregressive Intergration Moving Average)
ARMA는 시계열 데이터가 정상성(Stationary)을 가진다고 가정한 상태에서 분석할 때 사용하는 모형이다. ARMA는 자기회귀이동평균이라는 말 그대로 자귀회귀 모형(AR)과 이동평균 모형(MA)이 결합된 형태를 지닌다.
AR(자기회귀)은 시점의 값을 과거 시점의 값을 이용해서 회귀식으로 표현하는 것이고, MA(이동평균)는 시점의 값을 현재와 과거 시점의 백색잡음(오차항)으로 표현하는 것을 의미한다.
그러나 대부분의 시계열은 정상성이 아닌 경우가 많다. 이러한 비정상 시계열을 정상화하기 위해서는 연이은 관측값의 차이를 계산하는 차분이라는 것을 통해 회귀 추세나 계절적 변동 등을 제거하는 과정이 필요하다. 여기서, 차분이 포함된 방식이 ARIMA 모형이며, ARIMA의 I(Integration)가 차분을 의미한다. 차분을 거치더라도 비정상성을 가질 수 있으며, 여러 차례의 차분을 거치면 정상성 시계열로 변환할 수 있다.
Reference
류기동, 김우제 (2018). 콜센터 인입 콜량 예측을 위한 시계열 모델 비교 분석. 한국정보기술학회논문지, 16(8), 83-96.
'딥러닝 > 시계열' 카테고리의 다른 글
조건수(Condition Number)에 대한 이해 (0) | 2021.03.14 |
---|---|
[논문 Review] 콜센터 인입 콜량 예측을 위한 시계열 모델 비교 분석 2 (0) | 2021.03.13 |
현실적인 데이터 전처리 (0) | 2021.03.05 |
시계열 분석 실습 코드 - 6 ( OLS, 검증 지표) (0) | 2021.03.04 |
시계열 분석 실습 코드 - 5 (시각화, 상관도) (0) | 2021.03.04 |
최근댓글