Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

У статті розглядаються галузі застосування тимчасових рядів, розв'язувані завдання та алгоритми, що використовуються. Прогнозування часового ряду використовується в таких завданнях, як прогнозування попиту, навантаження на контактний центр, дорожнього та інтернет-трафіку, вирішення задачі холодного старту в рекомендаційних системах та пошуку аномалій у поведінці обладнання та користувачів.

Розглянемо завдання докладніше.

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

1) Прогнозування попиту.

Мета: знизити складські витрати та оптимізувати графік роботи персоналу.

Як вирішується: маючи прогноз покупок товарів та кількості клієнтів, мінімізуємо кількість товару на складі, і зберігати рівно стільки, скільки куплять у заданий часовий діапазон. Знаючи кількість клієнтів у кожний момент часу, складемо оптимальний робочий розклад, щоб з мінімумом витрат була достатня кількість персоналу.

2) Прогнозування навантаження на службу доставки

Ціль: не допустити колапсу логістики при пікових навантаженнях.

Як вирішується: прогнозуючи кількість замовлень, вивести на лінію оптимальну кількість машин та кур'єрів.

3) Прогнозування навантаження на контактний центр

Ціль: при мінімумі витрат на фонд оплати праці забезпечити необхідну доступність контактного центру.

Як вирішується: прогнозування кількості дзвінків у часі, складемо оптимальний розклад для операторів.

4) Прогнозування трафіку

Мета: спрогнозувати кількість серверів та пропускного каналу для стійкої роботи. Щоб ваш сервіс не впав у день прем'єри популярного серіалу чи футбольного матчу 😉

5) Прогнозування оптимального часу інкасації банкоматів

Мета: мінімізація обсягу готівки, що зберігається в мережі АТМ

6) Розв'язання задачі холодного старту в рекомендаційних системах

Ціль: рекомендувати релевантні товари новим користувачам.

Коли користувач здійснив кілька покупок, для рекомендації можна побудувати алгоритм колаборативної фільтрації, але коли інформації про користувача немає, оптимально рекомендувати найпопулярніші товари.

Рішення: популярність товарів залежить від часу, коли зроблено рекомендацію. Використання прогнозування часового ряду допомагає виявити релевантні товари у кожний момент часу.

Лайфхакі побудови рекомендаційних систем ми розглянули в попередній статті.

7) Пошук аномалій

Мета: виявити проблеми в роботі обладнання та нестандартні ситуації у бізнесі
Рішення: якщо значення, що вимірюється, вибивається з довірчого інтервалу прогнозу, аномалія виявлена. Якщо це АЕС, настав час нарощувати квадрат відстані 😉

Алгоритми для розв'язання задачі

1) Ковзне середнє

Найпростішим алгоритмом є ковзне середнє. Давайте порахуємо середнє значення кількох останніх елементах і зробимо прогноз. У прогнозі погоди більше ніж на 10 днів використовується подібний підхід.

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

Коли важливо, щоб останні значення в ряду вносили більшу вагу, введемо коефіцієнти в залежності від віддаленості дати, отримавши зважену модель:

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

Так, можна задати коефіцієнт W, щоб максимальна вага припадала на 2 останні дні та вхідні.

Врахування циклічних факторів

На якість рекомендацій можуть впливати циклічні чинники, такі як збіг із днем ​​тижня, датою, передування святам тощо.

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій
Мал. 1. Приклад декомпозиції часового ряду на тренд, сезонний компонент та шум

Експонентне згладжування – рішення обліку циклічних факторів.

Розглянемо 3 базові підходи

1. Просте згладжування (модель Брауна)

Є обчисленням виваженого середнього на останніх 2-х елементах ряду.

2. Подвійне згладжування (модель Хольта)

Враховує зміну тренда і коливання значень залишків навколо цього тренду.

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

Обчислюємо передбачення зміни залишків ® та тренду (d). Підсумкове значення y - сума цих двох величин.

3. Потрійне згладжування (модель Хольта - Вінтерса)

Потрійне згладжування додатково враховує сезонні коливання.

Тимчасові ряди у прогнозуванні попиту, навантаженні на КЦ, товарних рекомендаціях та пошуку аномалій

Формули для потрійного згладжування.

Алгоритм ARIMA та SARIMA

Особливістю часових рядів для застосування ARIMA полягає у зв'язку минулих значень пов'язаних з поточними та майбутніми.

SARIMA – розширення для рядів із сезонною складовою. SARIMAX – розширення, що включає зовнішню регресійну складову.

ARIMA-моделі дозволяють моделювати інтегровані або різницево-стаціонарні часові ряди.

Підхід ARIMA до часових рядів у тому, що у першу чергу оцінюється стаціонарність ряду.

Далі ряд перетворюється взяттям різниці відповідного порядку і для перетвореної моделі будується деяка ARMA-модель.

ARMA - лінійна модель множинної регресії.

Важливо, щоб ряд був стаціонарний, тобто. не змінювалося середнє, і дисперсія. Якщо ряд нестаціонарний, його слід призвести до стаціонарного вигляду.

XGBoost – куди ж без нього

Якщо у ряду немає внутрішньої вираженої структури, але є зовнішні фактори, що впливають (менеджер, погода і т.д.), то можна сміливо використовувати такі моделі машинного навчання як бустинг, випадкові ліси, регресія, нейронні мережі і SVM.

З досвіду роботи команди ДАНІ4, прогнозування часових рядів, одне з основних завдань для вирішення оптимізації складських витрат, витрат на персонал, оптимізації обслуговування мереж АТМ, логістики та побудови рекомендаційних систем. Складні моделі, такі як SARIMA, дають якісний результат, але вимагають великих витрат часу і підходять лише для певного кола завдань.

У наступній статті ми розглянемо основні підходи пошуку аномалій.

Щоб статті були релевантні вашим інтересам, пройдіть опитування нижче, або напишіть у коментарях, про які теми написати наступні статті.

Тільки зареєстровані користувачі можуть брати участь в опитуванні. Увійдіть, будь ласка.

Статті на яку тему вам цікаві

  • Рекомендаційні системи

  • Розпізнавання зображень

  • Оброблення мови та текстів

  • Нові архітектури в DNN

  • Тимчасові ряди та пошук аномалій

  • ML у бізнесі, кейси використання

Проголосували 17 користувачів. Утрималися 3 користувача.

Джерело: habr.com

Додати коментар або відгук