Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

Artikkelen diskuterer bruksområdene for tidsserier, problemene som skal løses og algoritmene som brukes. Tidsserieprognoser brukes i oppgaver som å spå etterspørsel, kontaktsenterbelastning, vei- og internettrafikk, løse kaldstartproblemet i anbefalingssystemer og søke etter uregelmessigheter i utstyrets og brukernes oppførsel.

La oss se på oppgavene mer detaljert.

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

1) Etterspørselsprognoser.

Mål: redusere lagerkostnader og optimalisere personalets arbeidsplaner.

Slik løser du det: Med en prognose for varekjøp og antall kunder, minimerer vi varemengden på lageret og lagrer nøyaktig så mye som vil bli kjøpt i et gitt tidsrom. Med kjennskap til antall kunder til enhver tid, vil vi utarbeide en optimal arbeidsplan slik at det er tilstrekkelig antall ansatte med et minimum av kostnader.

2) Forutsi belastningen på leveringstjenesten

Mål: å hindre logistikkkollaps under toppbelastninger.

Slik løser du det: forutsi antall bestillinger, ta med det optimale antallet biler og kurerer på linjen.

3) Forutsi belastningen på kontaktsenteret

Mål: å sikre nødvendig tilgjengelighet til kontaktsenteret samtidig som lønnsfondkostnadene minimeres.

Slik løser du: forutsi antall samtaler over tid, skaper en optimal tidsplan for operatører.

4) Trafikkvarsling

Mål: forutsi antall servere og båndbredde for stabil drift. Slik at tjenesten din ikke krasjer på premieredagen på en populær TV-serie eller fotballkamp 😉

5) Forutsi det optimale tidspunktet for innsamling av minibanker

Mål: minimere mengden kontanter som er lagret i minibanknettverket

6) Løsninger på kaldstartproblemet i anbefalingssystemer

Mål: Anbefal relevante produkter til nye brukere.

Når brukeren har gjort flere kjøp, kan det bygges en samarbeidsfiltreringsalgoritme for anbefalinger, men når det ikke er informasjon om brukeren, er det optimalt å anbefale de mest populære produktene.

Løsning: Produktenes popularitet avhenger av tidspunktet da anbefalingen er laget. Bruk av tidsserieprognoser hjelper til med å identifisere relevante produkter på et gitt tidspunkt.

Vi så på life hacks for å bygge anbefalingssystemer i forrige artikkel.

7) Søk etter anomalier

Mål: å identifisere problemer i driften av utstyr og ikke-standardiserte situasjoner i virksomheten
Løsning: Hvis den målte verdien er utenfor prognosekonfidensintervallet, er det oppdaget en anomali. Hvis dette er et kjernekraftverk, er det på tide å øke kvadratet på avstanden 😉

Algoritmer for å løse problemet

1) Glidende gjennomsnitt

Den enkleste algoritmen er det glidende gjennomsnittet. La oss beregne gjennomsnittsverdien på de siste elementene og lage en prediksjon. For værmeldinger lengre enn 10 dager brukes en lignende tilnærming.

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

Når det er viktig at de siste verdiene i en serie bidrar med mer vekt, introduserer vi koeffisienter avhengig av avstanden til datoen, og får en vektet modell:

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

Så du kan stille inn W-koeffisienten slik at maksimalvekten faller på de siste 2 dagene og inngangsdagene.

Tar hensyn til sykliske faktorer

Kvaliteten på anbefalingene kan påvirkes av sykliske faktorer, som sammenfall med ukedag, dato, forutgående helligdager, etc.

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier
Ris. 1. Eksempel på tidsseriedekomponering til trend, sesongkomponent og støy

Eksponentiell utjevning er en løsning for å ta hensyn til sykliske faktorer.

La oss se på 3 grunnleggende tilnærminger

1. Enkel utjevning (brun modell)

Representerer beregningen av et vektet gjennomsnitt på de to siste elementene i en serie.

2. Dobbel utjevning (Holt-modell)

Tar hensyn til endringer i trend og svingninger i restverdier rundt denne trenden.

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

Vi beregner prediksjonen av endringer i residualer ® og trend (d). Den endelige verdien av y er summen av disse to størrelsene.

3. Trippel utjevning (Holt-Winters modell)

Trippel utjevning tar i tillegg hensyn til sesongvariasjoner.

Tidsserier i prognoser for etterspørsel, belastning på distribusjonssentraler, produktanbefalinger og søk etter anomalier

Formler for trippel utjevning.

ARIMA og SARIMA algoritme

Det særegne med tidsserier for bruk av ARIMA er forbindelsen mellom tidligere verdier assosiert med nåværende og fremtidige.

SARIMA – utvidelse for serier med sesongkomponent. SARIMAX er en utvidelse som inkluderer en ekstern regresjonskomponent.

ARIMA-modeller lar deg simulere integrerte eller forskjellsstasjonære tidsserier.

ARIMA-tilnærmingen til tidsserier er at stasjonariteten til serien først vurderes.

Deretter transformeres serien ved å ta forskjellen i riktig rekkefølge, og en ARMA-modell konstrueres for den transformerte modellen.

ARMA er en lineær multippel regresjonsmodell.

Det er viktig at serien er stasjonær, d.v.s. gjennomsnittet og variansen endret seg ikke. Hvis serien er ikke-stasjonær, bør den bringes til en stasjonær form.

XGBoost – hvor ville vi vært uten det?

Hvis en serie ikke har en intern uttrykt struktur, men det er eksterne påvirkningsfaktorer (manager, vær osv.), så kan du trygt bruke maskinlæringsmodeller som boosting, random skog, regresjon, nevrale nettverk og SVM.

Fra lagets erfaring DATA4, tidsserieprognoser, en av hovedoppgavene for å løse optimalisering av lagerkostnader, personalkostnader, optimalisering av vedlikehold av minibanknettverk, logistikk og bygningsanbefalingssystemer. Komplekse modeller som SARIMA gir resultater av høy kvalitet, men er tidkrevende og egner seg kun for en viss rekke oppgaver.

I den neste artikkelen vil vi se på hovedtilnærmingene til å søke etter anomalier.

For å sikre at artiklene er relevante for dine interesser, ta undersøkelsen nedenfor, eller skriv i kommentarfeltet hvilke emner du skal skrive om i de neste artiklene.

Kun registrerte brukere kan delta i undersøkelsen. Logg inn, vær så snill.

Artikler om hvilket emne er du interessert i?

  • Anbefaler systemer

  • Bildegjenkjenning

  • Tale- og tekstbehandling

  • Nye arkitekturer i DNN

  • Tidsserier og anomalisøk

  • ML i næringslivet, brukssaker

17 brukere stemte. 3 brukere avsto.

Kilde: www.habr.com

Legg til en kommentar