Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

Nell'articolo vengono discussi gli ambiti di applicazione delle serie temporali, i problemi da risolvere e gli algoritmi utilizzati. La previsione delle serie temporali viene utilizzata in attività quali la previsione della domanda, il carico dei contact center, il traffico stradale e Internet, la risoluzione del problema dell'avvio a freddo nei sistemi di raccomandazione e la ricerca di anomalie nel comportamento delle apparecchiature e degli utenti.

Diamo un'occhiata ai compiti in modo più dettagliato.

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

1) Previsione della domanda.

Obiettivo: ridurre i costi di magazzino e ottimizzare gli orari di lavoro del personale.

Come risolverlo: avendo una previsione degli acquisti di merce e del numero di clienti, minimizziamo la quantità di merce in magazzino e immagazziniamo esattamente quanto verrà acquistato in un dato intervallo di tempo. Conoscendo il numero di clienti in un dato momento, elaboreremo un programma di lavoro ottimale in modo che ci sia un numero sufficiente di dipendenti con un costo minimo.

2) Previsione del carico sul servizio di consegna

Obiettivo: evitare il collasso della logistica durante i picchi di carico.

Come risolverlo: prevedere il numero di ordini, mettere in linea il numero ottimale di auto e corrieri.

3) Previsione del carico sul contact center

Obiettivo: garantire la necessaria disponibilità del contact center riducendo al minimo i costi della cassa salariale.

Come risolvere: prevedere il numero di chiamate nel tempo, creando una pianificazione ottimale per gli operatori.

4) Previsione del traffico

Obiettivo: prevedere il numero di server e la larghezza di banda per un funzionamento stabile. In modo che il tuo servizio non si blocchi il giorno della première di una famosa serie TV o di una partita di calcio 😉

5) Previsione del momento ottimale per il ritiro del bancomat

Obiettivo: ridurre al minimo la quantità di contante depositato nella rete ATM

6) Soluzioni al problema dell'avvio a freddo nei sistemi di raccomandazione

Obiettivo: consigliare prodotti pertinenti ai nuovi utenti.

Quando l'utente ha effettuato diversi acquisti, è possibile creare un algoritmo di filtraggio collaborativo per i consigli, ma quando non sono disponibili informazioni sull'utente, è ottimale consigliare i prodotti più popolari.

Soluzione: la popolarità dei prodotti dipende dal momento in cui viene formulata la raccomandazione. L'utilizzo delle previsioni delle serie temporali aiuta a identificare i prodotti rilevanti in un dato momento.

Abbiamo esaminato gli hack utili per creare sistemi di raccomandazione articolo precedente.

7) Ricerca anomalie

Obiettivo: identificare i problemi nel funzionamento delle apparecchiature e le situazioni non standard negli affari
Soluzione: Se il valore misurato è al di fuori dell'intervallo di confidenza della previsione, è stata rilevata un'anomalia. Se questa è una centrale nucleare, è ora di aumentare il quadrato della distanza 😉

Algoritmi per risolvere il problema

1) Media mobile

L’algoritmo più semplice è la media mobile. Calcoliamo il valore medio sugli ultimi elementi e facciamo una previsione. Per le previsioni meteorologiche superiori a 10 giorni viene utilizzato un approccio simile.

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

Quando è importante che gli ultimi valori di una serie contribuiscano con maggiore peso, introduciamo coefficienti dipendenti dalla distanza della data, ottenendo un modello ponderato:

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

Quindi è possibile impostare il coefficiente W in modo che il peso massimo ricada sugli ultimi 2 giorni e sui giorni di ingresso.

Tenendo conto dei fattori ciclici

La qualità delle raccomandazioni può essere influenzata da fattori ciclici, come la coincidenza con il giorno della settimana, la data, le festività precedenti, ecc.

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie
Riso. 1. Esempio di scomposizione delle serie storiche in trend, componente stagionale e rumore

Il livellamento esponenziale è una soluzione per tenere conto dei fattori ciclici.

Diamo un'occhiata a 3 approcci di base

1. Levigatura semplice (modello Marrone)

Rappresenta il calcolo di una media ponderata sugli ultimi 2 elementi di una serie.

2. Doppio livellamento (modello Holt)

Tiene conto dei cambiamenti di tendenza e delle fluttuazioni dei valori residui attorno a questa tendenza.

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

Calcoliamo la previsione delle variazioni dei residui ® e del trend (d). Il valore finale di y è la somma di queste due quantità.

3. Triplo livellamento (modello Holt-Winters)

Il triplo livellamento tiene inoltre conto delle variazioni stagionali.

Serie temporali nella previsione della domanda, del carico sui centri di distribuzione, delle raccomandazioni sui prodotti e della ricerca di anomalie

Formule per il triplo lisciamento.

Algoritmo ARIMA e SARIMA

La particolarità delle serie temporali per l'utilizzo di ARIMA è la connessione tra i valori passati associati a quelli attuali e futuri.

SARIMA – estensione per serie con componente stagionale. SARIMAX è un'estensione che include un componente di regressione esterna.

I modelli ARIMA consentono di simulare serie temporali integrate o stazionarie.

L'approccio ARIMA alle serie temporali prevede che venga innanzitutto valutata la stazionarietà delle serie.

Successivamente, la serie viene trasformata prendendo la differenza dell'ordine appropriato e per il modello trasformato viene costruito un modello ARMA.

ARMA è un modello di regressione multipla lineare.

È importante che la serie sia stazionaria, cioè la media e la varianza non sono cambiate. Se la serie non è stazionaria è opportuno portarla in forma stazionaria.

XGBoost – dove saremmo senza di esso?

Se una serie non ha una struttura espressa interna, ma sono presenti fattori di influenza esterni (manager, condizioni meteorologiche, ecc.), è possibile utilizzare in sicurezza modelli di apprendimento automatico come boosting, foreste casuali, regressione, reti neurali e SVM.

Dall'esperienza della squadra DATI4, previsione delle serie temporali, uno dei compiti principali per risolvere l'ottimizzazione dei costi di magazzino, dei costi del personale, dell'ottimizzazione della manutenzione delle reti ATM, della logistica e dei sistemi di raccomandazione degli edifici. Modelli complessi come SARIMA forniscono risultati di alta qualità, ma richiedono molto tempo e sono adatti solo per una determinata gamma di compiti.

Nel prossimo articolo vedremo i principali approcci alla ricerca delle anomalie.

Per assicurarti che gli articoli siano pertinenti ai tuoi interessi, partecipa al sondaggio qui sotto, oppure scrivi nei commenti quali argomenti scrivere nei prossimi articoli.

Solo gli utenti registrati possono partecipare al sondaggio. AccediPer favore.

Articoli su quale argomento ti interessa?

  • Sistemi di raccomandazione

  • Riconoscimento delle immagini

  • Elaborazione del parlato e del testo

  • Nuove architetture in DNN

  • Ricerca di serie temporali e anomalie

  • ML negli affari, casi d'uso

17 utenti hanno votato. 3 utenti si sono astenuti.

Fonte: habr.com

Aggiungi un commento