Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

Artikeln diskuterar tillämpningsområdena för tidsserier, de problem som ska lösas och de algoritmer som används. Tidsserieprognoser används i uppgifter som att prognostisera efterfrågan, kontaktcenterbelastning, väg- och internettrafik, lösa kallstartproblemet i rekommendatorsystem och söka efter anomalier i utrustningens och användarnas beteende.

Låt oss titta på uppgifterna mer i detalj.

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

1) Efterfrågeprognoser.

Mål: minska lagerkostnaderna och optimera personalens arbetsscheman.

Hur man löser det: med en prognos över inköp av varor och antal kunder, minimerar vi mängden varor på lagret och lagrar exakt lika mycket som kommer att köpas inom ett givet tidsintervall. Med kännedom om antalet kunder vid varje given tidpunkt kommer vi att upprätta ett optimalt arbetsschema så att det finns tillräckligt med personal med ett minimum av kostnader.

2) Prognostisera belastningen på leveranstjänsten

Mål: att förhindra logistikkollaps under toppbelastningar.

Hur man löser det: förutsäga antalet beställningar, ta med det optimala antalet bilar och kurirer på linjen.

3) Prognostisera belastningen på kontaktcentret

Mål: att säkerställa den nödvändiga tillgängligheten till kontaktcentret samtidigt som lönefondkostnaderna minimeras.

Så här löser du: prognostisera antalet samtal över tid, skapa ett optimalt schema för operatörerna.

4) Trafikprognoser

Mål: förutsäga antalet servrar och bandbredd för stabil drift. Så att din tjänst inte kraschar på premiärdagen av en populär tv-serie eller fotbollsmatch 😉

5) Förutsäga den optimala tiden för bankomaterinsamling

Mål: minimera mängden kontanter som lagras i bankomatnätverket

6) Lösningar på kallstartsproblemet i rekommendationssystem

Mål: Rekommendera relevanta produkter till nya användare.

När användaren har gjort flera köp kan en kollaborativ filtreringsalgoritm byggas för rekommendationer, men när det inte finns någon information om användaren är det optimalt att rekommendera de mest populära produkterna.

Lösning: Produkternas popularitet beror på den tidpunkt då rekommendationen görs. Att använda tidsserieprognoser hjälper till att identifiera relevanta produkter vid en given tidpunkt.

Vi tittade på life hacks för att bygga rekommendatorsystem i tidigare artikel.

7) Sök efter anomalier

Mål: att identifiera problem i driften av utrustning och icke-standardiserade situationer i näringslivet
Lösning: Om det uppmätta värdet ligger utanför det prognostiserade konfidensintervallet har en anomali upptäckts. Om det här är ett kärnkraftverk är det dags att öka kvadraten på avståndet 😉

Algoritmer för att lösa problemet

1) Glidande medelvärde

Den enklaste algoritmen är det glidande medelvärdet. Låt oss beräkna medelvärdet på de sista elementen och göra en förutsägelse. För väderprognoser längre än 10 dagar används ett liknande tillvägagångssätt.

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

När det är viktigt att de sista värdena i en serie bidrar med mer vikt, introducerar vi koefficienter beroende på avståndet till datumet, och erhåller en viktad modell:

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

Så du kan ställa in W-koefficienten så att den maximala vikten faller på de senaste 2 dagarna och inträdesdagarna.

Med hänsyn till cykliska faktorer

Kvaliteten på rekommendationerna kan påverkas av cykliska faktorer, såsom sammanträffande med veckodag, datum, föregående helgdagar, etc.

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier
Ris. 1. Exempel på tidsserieuppdelning till trend, säsongskomponent och brus

Exponentiell utjämning är en lösning för att ta hänsyn till cykliska faktorer.

Låt oss titta på 3 grundläggande tillvägagångssätt

1. Enkel utjämning (brun modell)

Representerar beräkningen av ett vägt medelvärde för de två sista elementen i en serie.

2. Dubbel utjämning (Holt-modell)

Tar hänsyn till förändringar i trend och fluktuationer i restvärden kring denna trend.

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

Vi beräknar förutsägelsen av förändringar i residualer ® och trend (d). Slutvärdet av y är summan av dessa två storheter.

3. Trippel utjämning (Holt-Winters modell)

Trippel utjämning tar dessutom hänsyn till säsongsvariationer.

Tidsserier för att prognostisera efterfrågan, belastning på distributionscenter, produktrekommendationer och sökande efter anomalier

Formler för trippel utjämning.

ARIMA och SARIMA algoritm

Det speciella med tidsserier för användning av ARIMA är kopplingen mellan tidigare värden associerade med nuvarande och framtida.

SARIMA – förlängning för serier med säsongskomponent. SARIMAX är en förlängning som inkluderar en extern regressionskomponent.

ARIMA-modeller låter dig simulera integrerade eller differensstationära tidsserier.

ARIMAs syn på tidsserier är att seriens stationaritet först bedöms.

Därefter transformeras serien genom att ta skillnaden i lämplig ordning, och en ARMA-modell konstrueras för den transformerade modellen.

ARMA är en linjär multipel regressionsmodell.

Det är viktigt att serien är stationär, d.v.s. medelvärdet och variansen ändrades inte. Om serien är icke-stationär, bör den föras till en stationär form.

XGBoost – var skulle vi vara utan det?

Om en serie inte har en intern uttryckt struktur, men det finns externa påverkande faktorer (manager, väder, etc.), så kan du säkert använda maskininlärningsmodeller som boosting, random forests, regression, neurala nätverk och SVM.

Från lagets erfarenhet DATA4, tidsserieprognoser, en av huvuduppgifterna för att lösa optimering av lagerkostnader, personalkostnader, optimering av underhållet av ATM-nätverk, logistik och byggnadsrekommendationssystem. Komplexa modeller som SARIMA ger resultat av hög kvalitet, men är tidskrävande och lämpar sig endast för ett visst antal uppgifter.

I nästa artikel kommer vi att titta på de viktigaste metoderna för att söka efter anomalier.

För att säkerställa att artiklarna är relevanta för dina intressen, ta undersökningen nedan, eller skriv i kommentarerna vilka ämnen du ska skriva om i nästa artiklar.

Endast registrerade användare kan delta i undersökningen. Logga in, Snälla du.

Artiklar om vilket ämne är du intresserad av?

  • Rekommendationssystem

  • Bildigenkänning

  • Tal och textbehandling

  • Nya arkitekturer i DNN

  • Tidsserier och anomalisökning

  • ML i näringslivet, användningsfall

17 användare röstade. 3 användare avstod från att rösta.

Källa: will.com

Lägg en kommentar