Artikeln diskuterar tillämpningsområdena för tidsserier, de problem som ska lösas och de algoritmer som används. Tidsserieprognoser används i uppgifter som att prognostisera efterfrågan, kontaktcenterbelastning, väg- och internettrafik, lösa kallstartproblemet i rekommendatorsystem och söka efter anomalier i utrustningens och användarnas beteende.
Låt oss titta på uppgifterna mer i detalj.
1) Efterfrågeprognoser.
Mål: minska lagerkostnaderna och optimera personalens arbetsscheman.
Hur man löser det: med en prognos över inköp av varor och antal kunder, minimerar vi mängden varor på lagret och lagrar exakt lika mycket som kommer att köpas inom ett givet tidsintervall. Med kännedom om antalet kunder vid varje given tidpunkt kommer vi att upprätta ett optimalt arbetsschema så att det finns tillräckligt med personal med ett minimum av kostnader.
2) Prognostisera belastningen på leveranstjänsten
Mål: att förhindra logistikkollaps under toppbelastningar.
Hur man löser det: förutsäga antalet beställningar, ta med det optimala antalet bilar och kurirer på linjen.
3) Prognostisera belastningen på kontaktcentret
Mål: att säkerställa den nödvändiga tillgängligheten till kontaktcentret samtidigt som lönefondkostnaderna minimeras.
Så här löser du: prognostisera antalet samtal över tid, skapa ett optimalt schema för operatörerna.
4) Trafikprognoser
Mål: förutsäga antalet servrar och bandbredd för stabil drift. Så att din tjänst inte kraschar på premiärdagen av en populär tv-serie eller fotbollsmatch 😉
5) Förutsäga den optimala tiden för bankomaterinsamling
Mål: minimera mängden kontanter som lagras i bankomatnätverket
6) Lösningar på kallstartsproblemet i rekommendationssystem
Mål: Rekommendera relevanta produkter till nya användare.
När användaren har gjort flera köp kan en kollaborativ filtreringsalgoritm byggas för rekommendationer, men när det inte finns någon information om användaren är det optimalt att rekommendera de mest populära produkterna.
Lösning: Produkternas popularitet beror på den tidpunkt då rekommendationen görs. Att använda tidsserieprognoser hjälper till att identifiera relevanta produkter vid en given tidpunkt.
Vi tittade på life hacks för att bygga rekommendatorsystem i
7) Sök efter anomalier
Mål: att identifiera problem i driften av utrustning och icke-standardiserade situationer i näringslivet
Lösning: Om det uppmätta värdet ligger utanför det prognostiserade konfidensintervallet har en anomali upptäckts. Om det här är ett kärnkraftverk är det dags att öka kvadraten på avståndet 😉
Algoritmer för att lösa problemet
1) Glidande medelvärde
Den enklaste algoritmen är det glidande medelvärdet. Låt oss beräkna medelvärdet på de sista elementen och göra en förutsägelse. För väderprognoser längre än 10 dagar används ett liknande tillvägagångssätt.
När det är viktigt att de sista värdena i en serie bidrar med mer vikt, introducerar vi koefficienter beroende på avståndet till datumet, och erhåller en viktad modell:
Så du kan ställa in W-koefficienten så att den maximala vikten faller på de senaste 2 dagarna och inträdesdagarna.
Med hänsyn till cykliska faktorer
Kvaliteten på rekommendationerna kan påverkas av cykliska faktorer, såsom sammanträffande med veckodag, datum, föregående helgdagar, etc.
Ris. 1. Exempel på tidsserieuppdelning till trend, säsongskomponent och brus
Exponentiell utjämning är en lösning för att ta hänsyn till cykliska faktorer.
Låt oss titta på 3 grundläggande tillvägagångssätt
1. Enkel utjämning (brun modell)
Representerar beräkningen av ett vägt medelvärde för de två sista elementen i en serie.
2. Dubbel utjämning (Holt-modell)
Tar hänsyn till förändringar i trend och fluktuationer i restvärden kring denna trend.
Vi beräknar förutsägelsen av förändringar i residualer ® och trend (d). Slutvärdet av y är summan av dessa två storheter.
3. Trippel utjämning (Holt-Winters modell)
Trippel utjämning tar dessutom hänsyn till säsongsvariationer.
Formler för trippel utjämning.
ARIMA och SARIMA algoritm
Det speciella med tidsserier för användning av ARIMA är kopplingen mellan tidigare värden associerade med nuvarande och framtida.
SARIMA – förlängning för serier med säsongskomponent. SARIMAX är en förlängning som inkluderar en extern regressionskomponent.
ARIMA-modeller låter dig simulera integrerade eller differensstationära tidsserier.
ARIMAs syn på tidsserier är att seriens stationaritet först bedöms.
Därefter transformeras serien genom att ta skillnaden i lämplig ordning, och en ARMA-modell konstrueras för den transformerade modellen.
ARMA är en linjär multipel regressionsmodell.
Det är viktigt att serien är stationär, d.v.s. medelvärdet och variansen ändrades inte. Om serien är icke-stationär, bör den föras till en stationär form.
XGBoost – var skulle vi vara utan det?
Om en serie inte har en intern uttryckt struktur, men det finns externa påverkande faktorer (manager, väder, etc.), så kan du säkert använda maskininlärningsmodeller som boosting, random forests, regression, neurala nätverk och SVM.
Från lagets erfarenhet DATA4, tidsserieprognoser, en av huvuduppgifterna för att lösa optimering av lagerkostnader, personalkostnader, optimering av underhållet av ATM-nätverk, logistik och byggnadsrekommendationssystem. Komplexa modeller som SARIMA ger resultat av hög kvalitet, men är tidskrävande och lämpar sig endast för ett visst antal uppgifter.
I nästa artikel kommer vi att titta på de viktigaste metoderna för att söka efter anomalier.
För att säkerställa att artiklarna är relevanta för dina intressen, ta undersökningen nedan, eller skriv i kommentarerna vilka ämnen du ska skriva om i nästa artiklar.
Endast registrerade användare kan delta i undersökningen.
Artiklar om vilket ämne är du intresserad av?
-
Rekommendationssystem
-
Bildigenkänning
-
Tal och textbehandling
-
Nya arkitekturer i DNN
-
Tidsserier och anomalisökning
-
ML i näringslivet, användningsfall
17 användare röstade. 3 användare avstod från att rösta.
Källa: will.com