Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

L'article aborde les domaines d'application des séries temporelles, les problèmes à résoudre et les algorithmes utilisés. La prévision de séries chronologiques est utilisée dans des tâches telles que la prévision de la demande, la charge du centre de contact, le trafic routier et Internet, la résolution du problème de démarrage à froid dans les systèmes de recommandation et la recherche d'anomalies dans le comportement des équipements et des utilisateurs.

Examinons les tâches plus en détail.

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

1) Prévision de la demande.

Objectif : réduire les coûts d’entrepôt et optimiser les horaires de travail du personnel.

Comment le résoudre : ayant une prévision des achats de marchandises et du nombre de clients, nous minimisons la quantité de marchandises dans l'entrepôt et stockons exactement autant qu'elles seront achetées dans un intervalle de temps donné. Connaissant le nombre de clients à un moment donné, nous établirons un horaire de travail optimal afin d'avoir un effectif suffisant avec un minimum de coûts.

2) Prévision de la charge sur le service de livraison

Objectif : éviter l’effondrement de la logistique lors des pics de charge.

Comment le résoudre : prédire le nombre de commandes, mettre en ligne le nombre optimal de voitures et de coursiers.

3) Prévision de la charge sur le centre de contact

Objectif : assurer la disponibilité requise du centre de contact tout en minimisant les coûts du fonds salarial.

Comment résoudre : prévoir le nombre d'appels dans le temps, créant un planning optimal pour les opérateurs.

4) Prévision du trafic

Objectif : prédire le nombre de serveurs et la bande passante pour un fonctionnement stable. Pour que votre service ne plante pas le jour de la première d'une série télévisée populaire ou d'un match de football 😉

5) Prévoir le moment optimal pour la collecte aux guichets automatiques

Objectif : minimiser le montant d’argent liquide stocké dans le réseau ATM

6) Solutions au problème du démarrage à froid dans les systèmes de recommandation

Objectif : Recommander des produits pertinents aux nouveaux utilisateurs.

Lorsque l'utilisateur a effectué plusieurs achats, un algorithme de filtrage collaboratif peut être construit pour les recommandations, mais lorsqu'il n'y a aucune information sur l'utilisateur, il est optimal de recommander les produits les plus populaires.

Solution : La popularité des produits dépend du moment où la recommandation est faite. L'utilisation de prévisions de séries chronologiques permet d'identifier les produits pertinents à un moment donné.

Nous avons examiné des astuces pour créer des systèmes de recommandation dans article précédent.

7) Recherche d'anomalies

Objectif : identifier les problèmes de fonctionnement des équipements et les situations atypiques en entreprise
Solution : Si la valeur mesurée est en dehors de l'intervalle de confiance prévu, une anomalie a été détectée. S’il s’agit d’une centrale nucléaire, il est temps d’augmenter le carré de la distance 😉

Algorithmes pour résoudre le problème

1) Moyenne mobile

L'algorithme le plus simple est la moyenne mobile. Calculons la valeur moyenne des derniers éléments et faisons une prédiction. Pour les prévisions météorologiques de plus de 10 jours, une approche similaire est utilisée.

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

Lorsqu'il est important que les dernières valeurs d'une série apportent plus de poids, nous introduisons des coefficients en fonction de la distance de la date, obtenant ainsi un modèle pondéré :

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

Ainsi, vous pouvez régler le coefficient W pour que le poids maximum tombe sur les 2 derniers jours et les jours d'entrée.

Prise en compte des facteurs cycliques

La qualité des recommandations peut être affectée par des facteurs cycliques, tels que la coïncidence avec le jour de la semaine, la date, les jours fériés précédents, etc.

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies
Riz. 1. Exemple de décomposition de séries chronologiques en tendance, composante saisonnière et bruit

Le lissage exponentiel est une solution pour prendre en compte les facteurs cycliques.

Examinons 3 approches de base

1. Lissage simple (modèle marron)

Représente le calcul d'une moyenne pondérée sur les 2 derniers éléments d'une série.

2. Double lissage (modèle Holt)

Prend en compte les changements de tendance et les fluctuations des valeurs résiduelles autour de cette tendance.

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

Nous calculons la prédiction des changements dans les résidus ® et la tendance (d). La valeur finale de y est la somme de ces deux quantités.

3. Triple lissage (modèle Holt-Winters)

Le triple lissage prend en outre en compte les variations saisonnières.

Séries temporelles dans la prévision de la demande, la charge sur les centres de distribution, les recommandations de produits et la recherche d'anomalies

Formules pour un triple lissage.

Algorithme ARIMA et SARIMA

La particularité des séries chronologiques pour l'utilisation d'ARIMA est le lien entre les valeurs passées associées aux valeurs actuelles et futures.

SARIMA – extension pour séries à composante saisonnière. SARIMAX est une extension qui inclut un composant de régression externe.

Les modèles ARIMA vous permettent de simuler des séries temporelles intégrées ou stationnaires en différence.

L'approche ARIMA des séries chronologiques consiste à évaluer d'abord la stationnarité de la série.

Ensuite, la série est transformée en prenant la différence dans l'ordre approprié, et un modèle ARMA est construit pour le modèle transformé.

ARMA est un modèle de régression multiple linéaire.

Il est important que la série soit stationnaire, c'est-à-dire la moyenne et la variance n'ont pas changé. Si la série est non stationnaire, elle doit être amenée à une forme stationnaire.

XGBoost – où serions-nous sans lui ?

Si une série n'a pas de structure exprimée interne, mais qu'il existe des facteurs d'influence externes (gestionnaire, météo, etc.), vous pouvez alors utiliser en toute sécurité des modèles d'apprentissage automatique tels que le boosting, les forêts aléatoires, la régression, les réseaux de neurones et SVM.

De l'expérience de l'équipe DONNÉES4, prévision de séries chronologiques, l'une des tâches principales pour résoudre l'optimisation des coûts d'entrepôt, les coûts de personnel, l'optimisation de la maintenance des réseaux ATM, la logistique et les systèmes de recommandation de construction. Les modèles complexes tels que SARIMA donnent des résultats de haute qualité, mais prennent du temps et ne conviennent qu'à un certain nombre de tâches.

Dans le prochain article, nous examinerons les principales approches de recherche d'anomalies.

Pour vous assurer que les articles correspondent à vos intérêts, répondez au sondage ci-dessous ou écrivez dans les commentaires sur les sujets sur lesquels vous souhaitez écrire dans les prochains articles.

Seuls les utilisateurs enregistrés peuvent participer à l'enquête. se connecters'il te plait.

Des articles sur quel sujet vous intéresse ?

  • Systèmes de recommandation

  • Reconnaissance d'image

  • Traitement de la parole et du texte

  • Nouvelles architectures dans DNN

  • Recherche de séries chronologiques et d'anomalies

  • ML en entreprise, cas d'utilisation

17 utilisateurs ont voté. 3 utilisateurs se sont abstenus.

Source: habr.com

Ajouter un commentaire