A cikk az idősorok alkalmazási területeit, a megoldandó problémákat és az alkalmazott algoritmusokat tárgyalja. Az idősoros előrejelzést olyan feladatokban alkalmazzák, mint a kereslet, a kapcsolattartó központok terhelése, a közúti és internetes forgalom előrejelzése, a hidegindítási probléma megoldása ajánlórendszerekben, valamint a berendezések és a felhasználók viselkedésében fellépő anomáliák keresése.
Nézzük meg részletesebben a feladatokat.
1) A kereslet előrejelzése.
Cél: a raktári költségek csökkentése és a személyzet munkabeosztásának optimalizálása.
Megoldás: az áruvásárlások és a vásárlók számának előrejelzésével minimalizáljuk a raktárban lévő áru mennyiségét, és pontosan annyit tárolunk, amennyit adott időintervallumban megvásárolunk. Az adott időpontban lévő ügyfélszám ismeretében optimális munkarendet állítunk össze, hogy minimális költségek mellett legyen elegendő létszám.
2) A szállítási szolgáltatás terhelésének előrejelzése
Cél: a logisztikai összeomlás megelőzése csúcsterhelés alatt.
Megoldás: a rendelések számának előrejelzése, az optimális számú autó és futár felhozatala a sorba.
3) A kapcsolati központ terhelésének előrejelzése
Cél: a kapcsolati központ szükséges elérhetőségének biztosítása a béralap költségeinek minimalizálása mellett.
Megoldás: a hívások számának időbeli előrejelzése, optimális menetrend kialakítása az üzemeltetők számára.
4) Forgalom-előrejelzés
Cél: megjósolni a szerverek számát és a sávszélességet a stabil működés érdekében. Nehogy lefagyjon a szolgáltatásod egy népszerű tévésorozat vagy focimeccs premierjének napján 😉
5) Az ATM-gyűjtés optimális időpontjának előrejelzése
Cél: az ATM-hálózatban tárolt készpénz mennyiségének minimalizálása
6) A hidegindítási probléma megoldásai az ajánlórendszerekben
Cél: Releváns termékek ajánlása új felhasználóknak.
Ha a felhasználó több vásárlást bonyolított le, az ajánlásokhoz kollaboratív szűrési algoritmust lehet építeni, de ha nincs információ a felhasználóról, akkor optimális a legnépszerűbb termékek ajánlása.
Megoldás: A termékek népszerűsége az ajánlás időpontjától függ. Az idősoros előrejelzés használata segít azonosítani a releváns termékeket egy adott időpontban.
Megvizsgáltuk a life hack-eket az ajánlórendszerek kiépítéséhez
7) Anomáliák keresése
Cél: a berendezések működésével kapcsolatos problémák és a nem szabványos üzleti helyzetek azonosítása
Megoldás: Ha a mért érték kívül esik az előrejelzési konfidencia intervallumon, anomáliát észlelt. Ha ez egy atomerőmű, akkor itt az ideje növelni a távolság négyzetét 😉
Algoritmusok a probléma megoldásához
1) Mozgóátlag
A legegyszerűbb algoritmus a mozgóátlag. Számítsuk ki az utolsó néhány elem átlagértékét, és készítsünk előrejelzést. A 10 napnál hosszabb időjárás-előrejelzések esetében hasonló megközelítést alkalmaznak.
Ha fontos, hogy egy sorozat utolsó értékei nagyobb súllyal járuljanak hozzá, a dátum távolságától függő együtthatókat vezetünk be, így súlyozott modellt kapunk:
Tehát beállíthatja a W együtthatót úgy, hogy a maximális súly az utolsó 2 napra és a belépési napokra essen.
Ciklikus tényezők figyelembe vétele
Az ajánlások minőségét ciklikus tényezők befolyásolhatják, például a hét napjával, dátummal, ünnepnapok előtti egybeesés stb.
Rizs. 1. Példa az idősorok trendre, szezonális komponensre és zajra történő bontására
Az exponenciális simítás egy megoldás a ciklikus tényezők figyelembevételére.
Nézzünk meg 3 alapvető megközelítést
1. Egyszerű simítás (barna modell)
A sorozat utolsó 2 elemére vonatkozó súlyozott átlag kiszámítását jelenti.
2. Dupla simítás (Holt modell)
Figyelembe veszi a trend változásait és a maradványértékek e trend körüli ingadozásait.
Kiszámítjuk a reziduumok ® és a trend (d) változásának előrejelzését. Az y végső értéke ennek a két mennyiségnek az összege.
3. Háromszoros simítás (Holt-Winters modell)
A háromszoros simítás emellett figyelembe veszi a szezonális eltéréseket is.
Képletek a hármas simításhoz.
ARIMA és SARIMA algoritmus
Az ARIMA használatában az idősorok sajátossága a múltbeli és a jövőbeli értékek közötti kapcsolat.
SARIMA – szezonális komponensű sorozatok bővítése. A SARIMAX egy külső regressziós összetevőt tartalmazó bővítmény.
Az ARIMA modellek lehetővé teszik integrált vagy különbség-stacionárius idősorok szimulálását.
Az idősorok ARIMA megközelítése az, hogy először a sorozatok stacionaritását értékelik.
Ezt követően a sorozatot a megfelelő sorrend különbségének felvételével transzformáljuk, és a transzformált modellhez ARMA modellt készítünk.
Az ARMA egy lineáris többszörös regressziós modell.
Fontos, hogy a sorozat stacioner legyen, pl. az átlag és a szórás nem változott. Ha a sorozat nem stacionárius, akkor stacioner formába kell hozni.
XGBoost – hol lennénk nélküle?
Ha egy sorozatnak nincs belső kifejezett szerkezete, de vannak külső befolyásoló tényezők (kezelő, időjárás stb.), akkor nyugodtan használhatja a gépi tanulási modelleket, mint például a boosting, a véletlenszerű erdők, a regresszió, a neurális hálózatok és az SVM.
A csapat tapasztalataiból ADATOK4, idősoros előrejelzés, a raktári költségek, személyi költségek optimalizálásának megoldásának egyik fő feladata, ATM hálózatok karbantartásának optimalizálása, logisztika és épületajánló rendszerek. Az olyan összetett modellek, mint a SARIMA, kiváló minőségű eredményeket adnak, de időigényesek, és csak bizonyos feladatok elvégzésére alkalmasak.
A következő cikkben megvizsgáljuk az anomáliák keresésének főbb módjait.
Annak érdekében, hogy a cikkek megfeleljenek érdeklődésének, töltse ki az alábbi kérdőívet, vagy írja meg kommentben, hogy milyen témákról írjon a következő cikkekben.
A felmérésben csak regisztrált felhasználók vehetnek részt.
Milyen témájú cikkek érdekelnek?
-
Ajánló rendszerek
-
Képfelismerés
-
Beszéd- és szövegfeldolgozás
-
Új architektúrák a DNN-ben
-
Idősorok és anomália keresés
-
ML az üzleti életben, használati esetek
17 felhasználó szavazott. 3 felhasználó tartózkodott.
Forrás: will.com