1. 예측 모델 적용 및 평가
이전 글 [논문 Review] 콜센터 인입 콜량 예측을 위한 시계열 모델 비교 분석 1에서 소개한 것처럼, 콜센터의 콜량을 예측하는 기법은 다양하다. 하지만, 국내 데이터로 연구된 사례는 드물다.
해당 연구에서는 ARIMA, 인공신경망 등 다양한 모델 기법을 활용해서 결과를 비교한 뒤 최적의 모델을 도출하는 순서로 진행되었다. 모델 평가 지표는 MAPE(Mean Absolute Percentage Error)와 RMSE(Root Mean Square Error)를 사용했다.
- MAPE : 예측 값과 실제 값의 차이의 절댓값에 대한 평균값으로 실제 값과 예측 오류 사이의 비율을 확인하는 지표다.
- RMSE : MSE(Mean Square Error)의 제곱근에 해당하는 값으로, 해당 연구에서는 MAPE가 갖는 선형적 특성을 보완하는 보조 지표 용도로 사용했다.
모 항공사의 731일 간의 일일 콜 인입량(min : 3,196, max : 23,050, avg : 10,400) 데이터를 기반으로 진행되었다.
위 그래프를 보면 70일간 10번의 반복된 패턴이 나타났으며, 1주일 단위로 계절성이 드러남을 확인할 수 있다. 분해 모델에서는 어떤 데이터든 추세와 주기성을 분해할 수 있는 STL, 평활화 모델에서는 다중계절성을 고려한 TBATS(다중 계절성 지수 평활화)기법 및 ARIMA, 회귀, LSTM 등의 모델을 사용했다. 각 모델별 training set은 701개로, 28일을 예측한 결과는 다음과 같다.
모형 | RMSE | MAPE |
분해 - STL | 966.3 | 8 |
평활화 - TBATS | 1183.3 | 9.7 |
ARIMA | 1743.3 | 12.6 |
회귀 | 942.8 | 7 |
인공신경망 - LSTM | 2445.9 | 5.3 |
LSTM이 가장 낮은 MAPE값을 나타내며 좋은 결과를 드러냈다.
2. 결론 및 향후 과제
해당 논문에서 기술된 내용을 요약하면 다음과 같다.
본 연구의 목표는 콜센터 운영자의 비용을 최소화 하면서 응대할 수 있는 상담 인력의 적정 수준을 결정하기 위한 인입 콜량을 예측하기 위한 시계열 기법을 실제에서도 사용할 수 있도록 모델링하여 적합한 기법을 찾는 것이다. 국내에는 이러한 내용의 예측 연구는 거의 없으며, 다양한 시계열 기법을 통해 LSTM이 MAPE측면에서는 우수한 결과를 도출했다. 본 연구에서는 일일 콜량을 예측했지만, 실제 콜센터에서는 시간 단위의 콜량 예측이 되도록 실무적으로 도움이 되는 연구가 필요하다.
추가로, 논문에 밝혀진 것과 같이 시계열 분석을 포함한 대부분의 데이터 분석에서는 모델에 데이터를 입력하는 것을 넘어 최적화된 결론을 도출하는 것이 중요함에는 동의한다. 그러면서도, 실무에 도움이 되기 위한 연구가 되려면 예측에 대한 검증 기간을 늘려 제대로 사용할 수 있는 모델인지에 대해 정교한 평가가 필요하다고 보는데, 해당 연구에서의 test 비율이 낮은 것에 대해서는 의구심이 든다.
Reference
류기동, 김우제 (2018). 콜센터 인입 콜량 예측을 위한 시계열 모델 비교 분석. 한국정보기술학회논문지, 16(8), 83-96.
'딥러닝 > 시계열' 카테고리의 다른 글
조건수를 줄이는 방법 (0) | 2021.03.15 |
---|---|
조건수(Condition Number)에 대한 이해 (0) | 2021.03.14 |
[논문 Review] 콜센터 인입 콜량 예측을 위한 시계열 모델 비교 분석 1 (0) | 2021.03.12 |
현실적인 데이터 전처리 (0) | 2021.03.05 |
시계열 분석 실습 코드 - 6 ( OLS, 검증 지표) (0) | 2021.03.04 |
최근댓글