Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

Het artikel bespreekt de toepassingsgebieden van tijdreeksen, de op te lossen problemen en de gebruikte algoritmen. Tijdreeksvoorspellingen worden gebruikt bij taken zoals het voorspellen van de vraag, de belasting van het contactcentrum, het weg- en internetverkeer, het oplossen van het koudestartprobleem in aanbevelingssystemen en het zoeken naar afwijkingen in het gedrag van apparatuur en gebruikers.

Laten we de taken in meer detail bekijken.

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

1) Vraagvoorspelling.

Doel: magazijnkosten verlagen en de werkschema's van het personeel optimaliseren.

Hoe dit op te lossen: met een prognose van de aankopen van goederen en het aantal klanten, minimaliseren we de hoeveelheid goederen in het magazijn en slaan we precies zoveel op als er in een bepaald tijdsbestek zal worden gekocht. Omdat we op elk moment het aantal klanten kennen, stellen we een optimale werkplanning op, zodat er voldoende personeel aanwezig is tegen minimale kosten.

2) Het voorspellen van de belasting van de bezorgdienst

Doel: voorkomen dat de logistiek instort tijdens piekbelastingen.

Hoe het op te lossen: het aantal bestellingen voorspellen, het optimale aantal auto's en koeriers aan de lijn brengen.

3) Voorspellen van de belasting van het contactcenter

Doel: het waarborgen van de benodigde beschikbaarheid van het contactcenter en het minimaliseren van de loonfondskosten.

Hoe op te lossen: het aantal oproepen in de loop van de tijd voorspellen, een optimale planning voor operators creëren.

4) Verkeersvoorspelling

Doel: het aantal servers en bandbreedte voorspellen voor een stabiele werking. Zodat je service niet crasht op de dag van de première van een populaire tv-serie of voetbalwedstrijd 😉

5) Voorspelling van de optimale tijd voor het ophalen van geldautomaten

Doel: het minimaliseren van de hoeveelheid contant geld die in het geldautomatennetwerk is opgeslagen

6) Oplossingen voor het koudestartprobleem in aanbevelingssystemen

Doel: Relevante producten aanbevelen aan nieuwe gebruikers.

Wanneer de gebruiker meerdere aankopen heeft gedaan, kan er een collaboratief filteralgoritme worden gebouwd voor aanbevelingen, maar als er geen informatie over de gebruiker is, is het optimaal om de meest populaire producten aan te bevelen.

Oplossing: De populariteit van producten hangt af van het tijdstip waarop de aanbeveling wordt gedaan. Het gebruik van tijdreeksprognoses helpt bij het identificeren van relevante producten op een bepaald moment.

We hebben gekeken naar lifehacks voor het bouwen van aanbevelingssystemen vorige artikel.

7) Zoek naar afwijkingen

Doel: problemen bij de werking van apparatuur en niet-standaard situaties in het bedrijfsleven identificeren
Oplossing: Als de gemeten waarde buiten het voorspelde betrouwbaarheidsinterval ligt, is er een afwijking gedetecteerd. Als dit een kerncentrale is, is het tijd om het kwadraat van de afstand te vergroten 😉

Algoritmen voor het oplossen van het probleem

1) voortschrijdend gemiddelde

Het eenvoudigste algoritme is het voortschrijdend gemiddelde. Laten we de gemiddelde waarde van de laatste paar elementen berekenen en een voorspelling doen. Voor weersvoorspellingen langer dan 10 dagen wordt een soortgelijke aanpak gehanteerd.

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

Wanneer het belangrijk is dat de laatste waarden in een reeks meer gewicht bijdragen, introduceren we coëfficiënten afhankelijk van de afstand tot de datum, waardoor een gewogen model ontstaat:

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

U kunt de W-coëfficiënt dus zo instellen dat het maximale gewicht op de laatste 2 dagen en de instapdagen valt.

Rekening houdend met conjuncturele factoren

De kwaliteit van de aanbevelingen kan worden beïnvloed door conjuncturele factoren, zoals het samenvallen met de dag van de week, de datum, voorafgaande feestdagen, enz.

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen
Rijst. 1. Voorbeeld van de ontleding van tijdreeksen in trend, seizoenscomponent en ruis

Exponentiële afvlakking is een oplossing om rekening te houden met cyclische factoren.

Laten we eens kijken naar drie basisbenaderingen

1. Eenvoudig gladmaken (bruin model)

Vertegenwoordigt de berekening van een gewogen gemiddelde van de laatste 2 elementen van een reeks.

2. Dubbele afvlakking (Holt-model)

Houdt rekening met trendveranderingen en schommelingen in restwaarden rondom deze trend.

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

We berekenen de voorspelling van veranderingen in residuen ® en trend (d). De uiteindelijke waarde van y is de som van deze twee grootheden.

3. Drievoudige afvlakking (Holt-Winters-model)

Triple smoothing houdt bovendien rekening met seizoensvariaties.

Tijdreeksen bij het voorspellen van de vraag, de belasting van distributiecentra, productaanbevelingen en het zoeken naar afwijkingen

Formules voor drievoudige gladmaking.

ARIMA- en SARIMA-algoritme

De eigenaardigheid van tijdreeksen voor het gebruik van ARIMA is het verband tussen waarden uit het verleden geassocieerd met huidige en toekomstige waarden.

SARIMA – uitbreiding voor series met seizoenscomponent. SARIMAX is een uitbreiding die een externe regressiecomponent bevat.

Met ARIMA-modellen kunt u geïntegreerde of verschil-stationaire tijdreeksen simuleren.

De ARIMA-benadering van tijdreeksen is dat eerst de stationariteit van de reeks wordt beoordeeld.

Vervolgens wordt de reeks getransformeerd door het verschil van de juiste volgorde te nemen, en wordt een ARMA-model geconstrueerd voor het getransformeerde model.

ARMA is een lineair meervoudig regressiemodel.

Het is belangrijk dat de reeks stationair is, d.w.z. het gemiddelde en de variantie veranderden niet. Als de reeks niet-stationair is, moet deze in een stationaire vorm worden gebracht.

XGBoost – waar zouden we zijn zonder?

Als een reeks geen intern uitgedrukte structuur heeft, maar er zijn externe beïnvloedende factoren (manager, weer, etc.), dan kun je veilig machine learning-modellen gebruiken zoals boosting, willekeurige bossen, regressie, neurale netwerken en SVM.

Uit de ervaring van het team GEGEVENS4, tijdreeksvoorspellingen, een van de belangrijkste taken voor het oplossen van de optimalisatie van magazijnkosten, personeelskosten, het optimaliseren van het onderhoud van ATM-netwerken, logistiek en gebouwaanbevelingssystemen. Complexe modellen zoals SARIMA geven resultaten van hoge kwaliteit, maar zijn tijdrovend en slechts geschikt voor een bepaald scala aan taken.

In het volgende artikel zullen we kijken naar de belangrijkste benaderingen voor het zoeken naar afwijkingen.

Om er zeker van te zijn dat de artikelen relevant zijn voor uw interesses, vult u de onderstaande enquête in of schrijft u in de reacties over welke onderwerpen u in de volgende artikelen moet schrijven.

Alleen geregistreerde gebruikers kunnen deelnemen aan het onderzoek. Inloggen, Alsjeblieft.

Artikelen over welk onderwerp ben je geïnteresseerd?

  • Aanbevolen systemen

  • Beeldherkenning

  • Spraak- en tekstverwerking

  • Nieuwe architecturen in DNN

  • Zoeken naar tijdreeksen en afwijkingen

  • ML in het bedrijfsleven, gebruiksscenario's

17 gebruikers hebben gestemd. 3 gebruikers onthielden zich van stemming.

Bron: www.habr.com

Voeg een reactie