В статье рассматриваются области применения временных рядов, решаемые задачи, и используемые алгоритмы. Прогнозирование временного ряда используется в таких задачах, как прогнозирование спроса, нагрузки на контактный центр, дорожного и интернет-трафика, решения задачи холодного старта в рекомендательных системах и поиска аномалий в поведении оборудования и пользователей.
Рассмотрим задачи подробнее.
1) Vraagvoorspelling.
Doel: verminder pakhuiskoste en optimaliseer personeel se werkskedules.
Как решается: имея прогноз покупкок товаров и количества клиентов, минимизируем количество товара на складе, и хранить ровно столько, сколько купят в заданный временной диапазон. Зная количество клиентов в каждый момент времени, составим оптимальное рабочее расписание, чтобы с минимумом затрат, было достаточное количество персонала.
2) Voorspelling van die las op die afleweringsdiens
Doelwit: om logistieke ineenstorting tydens spitsladings te voorkom.
Как решается: прогнозируя количество заказов, вывести на линию оптимальное количество машин и курьеров.
3) Voorspelling van die las op die kontaksentrum
Цель: при минимуме затрат на фонд оплаты труда обеспечить требуемую доступность контактного центра.
Как решается: прогнозирование количество звонков во времени, составим оптимальное расписание для операторов.
4) Verkeersvoorspelling
Цель: спрогнозировать количество серверов и пропускного канала для устойчивой работы. Чтобы ваш сервис не упал в день премьеры популярного сериала или футбольного матча 😉
5) Voorspelling van die optimale tyd vir OTM-versameling
Цель: минимизация объема наличности, хранимой в сети АТМ
6) Oplossings vir die koue begin probleem in aanbevelingstelsels
Doelwit: Beveel relevante produkte aan vir nuwe gebruikers.
Когда пользователь совершил несколько покупок, для рекомендации можно построить алгоритм коллаборативной фильтрации, но когда информации о пользователе нет, оптимально рекомендовать наиболее популярные товары.
Решение: популярность товаров зависит от времени, когда сделана рекомендация. Использование прогнозирование временного ряда помогает выявить релевантные товары в каждый конкретный момент времени.
Ons het gekyk na life hacks vir die bou van aanbevelingstelsels in
7) Soek vir anomalieë
Цель: выявить проблемы в работе оборудования и нестандартные ситуации в бизнесе
Решение: если измеряемое значение выбивается из доверительного интервала прогноза, аномалия выявлена. Если это АЭС, пора наращивать квадрат расстояния 😉
Algoritmes om die probleem op te los
1) Скользящее среднее
Простейшим алгоритмом является скользящее среднее. Давайте посчитаем среднее значение на нескольких последних элементах и сделаем прогноз. В прогнозе погоды больше чем на 10 дней, используется подобный подход.
Когда важно, чтобы последние значения в ряду вносили больший вес, введем коэффициенты в зависимости от удаленности даты, получив взвешенную модель:
Так, можно задать коэффициент W, чтобы максимальный вес приходился на 2 последних дня и входные.
Met inagneming van sikliese faktore
На качество рекомендаций могут влияют циклические факторы, такие как совпадение с днем недели, датой, предшествование праздникам и т. д.
Рис. 1. Пример декомпозиции временного ряда на тренд, сезонный компонент и шум
Eksponensiële gladmaak is 'n oplossing om sikliese faktore in ag te neem.
Kom ons kyk na 3 basiese benaderings
1. Eenvoudige gladmaak (bruin model)
Представляет собой вычисление взвешенного среднего на последних 2-х элементах ряда.
2. Dubbele gladmaak (Holt-model)
Принимает в расчет изменение тренда и колебания значений остатков вокруг этого тренда.
Вычисляем предсказание изменения остатков ® и тренда (d). Итоговое значение y — сумма этих двух величин.
3. Drievoudige gladmaak (Holt-Winters-model)
Drievoudige gladmaak neem ook seisoenale variasies in ag.
Formules vir drievoudige gladmaak.
ARIMA en SARIMA algoritme
Особенностью временных рядов для применения ARIMA заключается в связи прошлых значений связанных с текущими и будущими.
SARIMA – расширение для рядов с сезонной составляющей. SARIMAX – расширение, включающее внешнюю регрессионную составляющую.
ARIMA-модели позволяют моделировать интегрированные или разностно-стационарные временные ряды.
Подход ARIMA к временным рядам заключается в том, что в первую очередь оценивается стационарность ряда.
Далее ряд преобразуется взятием разности соответствующего порядка и уже для преобразованной модели строится некоторая ARMA-модель.
ARMA is 'n lineêre meervoudige regressiemodel.
Важно, чтобы ряд был стационарен, т.е. не менялось среднее, и дисперсия. Если ряд нестационарен, его следует привести к стационарному виду.
XGBoost – waar sou ons daarsonder wees?
Если у ряда нет внутренней выраженной структуры, но есть внешние влияющие факторы (менеджер, погода и т.д.), то можно смело использовать такие модели машинного обучения как бустинг, случайные леса, регрессия, нейронные сети и SVM.
Uit die span se ervaring DATA 4, прогнозирование временных рядов, одна из основных задач для решения оптимизации складских затрат, затрат на персонал, оптимизации обслуживания сетей АТМ, логистики и построения рекомендательных систем. Сложные модели, такие как SARIMA дают качественный результат, но требуют больших затрат времени и подходят только для определенного круга задач.
В следующей статье мы рассмотрим основные подходы к поиску аномалий.
Для того, чтобы статьи были релевантны вашим интересам, пройдите опрос ниже, или напишите в комментариях, про какие темы написать следующие статьи.
Slegs geregistreerde gebruikers kan aan die opname deelneem.
Artikels oor watter onderwerp stel jy belang?
-
Aanbeveling stelsels
-
Beeldherkenning
-
Spraak- en teksverwerking
-
Nuwe argitekture in DNN
-
Временные ряды и поиск аномалий
-
ML in besigheid, gebruik gevalle
17 gebruikers het gestem. 3 gebruikers het buite stemming gebly.
Bron: will.com