Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

Der Artikel geht auf die Einsatzgebiete von Zeitreihen, die zu lösenden Probleme und die verwendeten Algorithmen ein. Zeitreihenprognosen werden für Aufgaben wie die Prognose von Bedarf, Kontaktcenter-Auslastung, Straßen- und Internetverkehr, die Lösung des Kaltstartproblems in Empfehlungssystemen und die Suche nach Anomalien im Verhalten von Geräten und Benutzern verwendet.

Schauen wir uns die Aufgaben genauer an.

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

1) Nachfrageprognose.

Ziel: Lagerkosten senken und Arbeitspläne der Mitarbeiter optimieren.

So lösen Sie das Problem: Mit einer Prognose der Wareneinkäufe und der Anzahl der Kunden minimieren wir die Warenmenge im Lager und lagern genau so viel ein, wie in einem bestimmten Zeitraum gekauft wird. Da wir die Anzahl der Kunden zu jedem Zeitpunkt kennen, erstellen wir einen optimalen Arbeitsplan, sodass bei minimalen Kosten eine ausreichende Anzahl von Mitarbeitern zur Verfügung steht.

2) Prognose der Auslastung des Lieferdienstes

Ziel: Logistikkollaps bei Belastungsspitzen verhindern.

So lösen Sie das Problem: Vorhersagen der Anzahl der Bestellungen, Bereitstellung der optimalen Anzahl an Autos und Kurieren am Band.

3) Prognose der Belastung des Contact Centers

Ziel: Sicherstellung der erforderlichen Verfügbarkeit des Contact Centers bei gleichzeitiger Minimierung der Lohnkosten.

Lösung: Prognose der Anzahl der Anrufe im Laufe der Zeit, Erstellung eines optimalen Zeitplans für Betreiber.

4) Verkehrsprognose

Ziel: Vorhersage der Anzahl der Server und der Bandbreite für einen stabilen Betrieb. Damit Ihr Dienst am Tag der Premiere einer beliebten TV-Serie oder eines Fußballspiels nicht abstürzt 😉

5) Vorhersage des optimalen Zeitpunkts für die Abholung am Geldautomaten

Ziel: Minimierung der im Geldautomatennetzwerk gespeicherten Bargeldmenge

6) Lösungen für das Kaltstartproblem in Empfehlungssystemen

Ziel: Relevante Produkte neuen Nutzern empfehlen.

Wenn der Benutzer mehrere Einkäufe getätigt hat, kann ein kollaborativer Filteralgorithmus für Empfehlungen erstellt werden. Wenn jedoch keine Informationen über den Benutzer vorliegen, ist es optimal, die beliebtesten Produkte zu empfehlen.

Lösung: Die Beliebtheit von Produkten hängt vom Zeitpunkt der Empfehlung ab. Die Verwendung von Zeitreihenprognosen hilft dabei, relevante Produkte zu jedem Zeitpunkt zu identifizieren.

Wir haben uns Lifehacks zum Aufbau von Empfehlungssystemen angesehen vorheriger Artikel.

7) Suche nach Anomalien

Ziel: Probleme beim Betrieb von Geräten und nicht standardmäßige Situationen im Unternehmen identifizieren
Lösung: Liegt der Messwert außerhalb des prognostizierten Konfidenzintervalls, wurde eine Anomalie erkannt. Wenn es sich um ein Kernkraftwerk handelt, ist es an der Zeit, den Abstand im Quadrat zu vergrößern 😉

Algorithmen zur Lösung des Problems

1) Gleitender Durchschnitt

Der einfachste Algorithmus ist der gleitende Durchschnitt. Berechnen wir den Durchschnittswert der letzten paar Elemente und treffen wir eine Vorhersage. Für Wettervorhersagen, die länger als 10 Tage dauern, wird ein ähnlicher Ansatz verwendet.

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

Wenn es wichtig ist, dass die letzten Werte in einer Reihe mehr Gewicht beitragen, führen wir Koeffizienten ein, die vom Datumsabstand abhängen, und erhalten so ein gewichtetes Modell:

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

Sie können den W-Koeffizienten also so einstellen, dass das maximale Gewicht auf die letzten 2 Tage und die Einreisetage fällt.

Unter Berücksichtigung konjunktureller Faktoren

Die Qualität der Empfehlungen kann durch zyklische Faktoren wie die Übereinstimmung mit dem Wochentag, dem Datum, vorangegangenen Feiertagen usw. beeinflusst werden.

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien
Reis. 1. Beispiel für die Zerlegung von Zeitreihen in Trend, Saisonkomponente und Rauschen

Exponentielle Glättung ist eine Lösung zur Berücksichtigung zyklischer Faktoren.

Schauen wir uns drei grundlegende Ansätze an

1. Einfaches Glätten (Brown-Modell)

Stellt die Berechnung eines gewichteten Durchschnitts der letzten beiden Elemente einer Reihe dar.

2. Doppelte Glättung (Holt-Modell)

Berücksichtigt Trendänderungen und Schwankungen der Restwerte um diesen Trend herum.

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

Wir berechnen die Vorhersage von Änderungen der Residuen ® und des Trends (d). Der Endwert von y ist die Summe dieser beiden Größen.

3. Dreifache Glättung (Holt-Winters-Modell)

Durch die dreifache Glättung werden zusätzlich saisonale Schwankungen berücksichtigt.

Zeitreihen zur Prognose von Nachfrage, Auslastung von Distributionszentren, Produktempfehlungen und Suche nach Anomalien

Formeln zur dreifachen Glättung.

ARIMA- und SARIMA-Algorithmus

Die Besonderheit von Zeitreihen für den Einsatz von ARIMA ist die Verbindung vergangener Werte mit aktuellen und zukünftigen Werten.

SARIMA – Erweiterung für Serien mit saisonalem Anteil. SARIMAX ist eine Erweiterung, die eine externe Regressionskomponente enthält.

Mit ARIMA-Modellen können Sie integrierte oder differenzstationäre Zeitreihen simulieren.

Der ARIMA-Ansatz für Zeitreihen besteht darin, dass zunächst die Stationarität der Reihe bewertet wird.

Als nächstes wird die Reihe transformiert, indem die Differenz der entsprechenden Ordnung gebildet wird, und für das transformierte Modell wird ein ARMA-Modell erstellt.

ARMA ist ein lineares multiples Regressionsmodell.

Wichtig ist, dass die Reihe stationär ist, d.h. Mittelwert und Varianz änderten sich nicht. Wenn die Reihe instationär ist, sollte sie in eine stationäre Form gebracht werden.

XGBoost – was wären wir ohne es?

Wenn eine Serie keine intern ausgedrückte Struktur hat, aber externe Einflussfaktoren (Manager, Wetter usw.) vorhanden sind, können Sie maschinelle Lernmodelle wie Boosting, Random Forests, Regression, neuronale Netze und SVM bedenkenlos verwenden.

Aus der Erfahrung des Teams DATA4, Zeitreihenprognose, eine der Hauptaufgaben zur Lösung der Optimierung von Lagerkosten, Personalkosten, Optimierung der Wartung von Geldautomatennetzen, Logistik und Aufbau von Empfehlungssystemen. Komplexe Modelle wie SARIMA liefern qualitativ hochwertige Ergebnisse, sind jedoch zeitaufwändig und nur für einen bestimmten Aufgabenbereich geeignet.

Im nächsten Artikel werden wir uns mit den wichtigsten Ansätzen zur Suche nach Anomalien befassen.

Um sicherzustellen, dass die Artikel für Ihre Interessen relevant sind, nehmen Sie an der Umfrage unten teil oder schreiben Sie in die Kommentare, über welche Themen Sie in den nächsten Artikeln schreiben möchten.

An der Umfrage können nur registrierte Benutzer teilnehmen. Einloggenbitte.

Artikel zu welchem ​​Thema interessieren Sie?

  • Empfehlungssysteme

  • Bilderkennung

  • Sprach- und Textverarbeitung

  • Neue Architekturen in DNN

  • Zeitreihen- und Anomaliesuche

  • ML in der Wirtschaft, Anwendungsfälle

17 Benutzer haben abgestimmt. 3 Benutzer enthielten sich der Stimme.

Source: habr.com

Kommentar hinzufügen