Makalede zaman serilerinin uygulama alanları, çözülmesi gereken problemler ve kullanılan algoritmalar tartışılmaktadır. Zaman serisi tahmini, talebin, iletişim merkezi yükünün, yol ve internet trafiğinin tahmin edilmesi, öneri sistemlerinde soğuk başlangıç sorununun çözülmesi ve ekipman ve kullanıcıların davranışlarındaki anormalliklerin araştırılması gibi görevlerde kullanılır.
Görevlere daha ayrıntılı olarak bakalım.
1) Talep tahmini.
Hedef: Depo maliyetlerini azaltmak ve personelin çalışma programlarını optimize etmek.
Nasıl çözülür: Mal alımlarına ve müşteri sayısına ilişkin bir tahmine sahip olarak, depodaki mal miktarını en aza indirir ve belirli bir zaman aralığında tam olarak satın alınacak kadar depolarız. Herhangi bir zamandaki müşteri sayısını bildiğimizden, minimum maliyetle yeterli sayıda personelin olmasını sağlayacak şekilde optimum bir çalışma programı hazırlayacağız.
2) Teslimat hizmetindeki yükün tahmin edilmesi
Amaç: Pik yükler sırasında lojistik çöküşünü önlemek.
Nasıl çözülür: Sipariş sayısını tahmin ederek en uygun sayıda araba ve kuryeyi devreye alın.
3) İletişim merkezindeki yükün tahmin edilmesi
Hedef: Ücret fonu maliyetlerini en aza indirirken iletişim merkezinin gerekli kullanılabilirliğini sağlamak.
Nasıl çözülür: Zaman içindeki çağrı sayısını tahmin etmek, operatörler için en uygun programı oluşturmak.
4) Trafik tahmini
Hedef: Kararlı çalışma için sunucu sayısını ve bant genişliğini tahmin etmek. Böylece hizmetiniz popüler bir dizinin veya futbol maçının yayınlanacağı gün çökmez 😉
5) ATM tahsilatı için en uygun zamanın tahmin edilmesi
Hedef: ATM ağında depolanan nakit miktarını en aza indirmek
6) Tavsiye sistemlerinde soğuk çalıştırma problemine çözümler
Hedef: Yeni kullanıcılara alakalı ürünleri önermek.
Kullanıcı birkaç satın alma işlemi gerçekleştirdiğinde öneriler için işbirlikçi bir filtreleme algoritması oluşturulabilir, ancak kullanıcı hakkında hiçbir bilgi olmadığında en popüler ürünleri tavsiye etmek en uygunudur.
Çözüm: Ürünlerin popülaritesi tavsiyenin yapıldığı zamana bağlıdır. Zaman serisi tahmininin kullanılması, ilgili ürünlerin herhangi bir zamanda belirlenmesine yardımcı olur.
Tavsiye sistemleri oluşturmaya yönelik yaşam tüyolarına baktık.
7) Anormallikleri arayın
Amaç: Ekipmanın çalışmasındaki sorunları ve iş dünyasındaki standart dışı durumları belirlemek
Çözüm: Ölçülen değer tahmin güven aralığının dışındaysa bir anormallik tespit edilmiştir. Eğer bu nükleer santral ise mesafenin karesini arttırmanın zamanı geldi 😉
Sorunu çözmek için algoritmalar
1) Hareketli ortalama
En basit algoritma hareketli ortalamadır. Son birkaç elementin ortalama değerini hesaplayalım ve bir tahminde bulunalım. 10 günden uzun hava tahminleri için de benzer bir yaklaşım kullanılıyor.
Bir serideki son değerlerin daha fazla ağırlığa katkıda bulunması önemli olduğunda, tarihin uzaklığına bağlı olarak katsayılar ekleyerek ağırlıklı bir model elde ederiz:
Böylece W katsayısını, maksimum ağırlık son 2 güne ve giriş günlerine düşecek şekilde ayarlayabilirsiniz.
Döngüsel faktörlerin dikkate alınması
Önerilerin kalitesi haftanın günüyle çakışma, tarih, önceki tatiller vb. gibi döngüsel faktörlerden etkilenebilir.
Pirinç. 1. Zaman serilerinin trend, mevsimsel bileşen ve gürültüye ayrıştırılmasına örnek
Üstel yumuşatma döngüsel faktörleri hesaba katan bir çözümdür.
3 temel yaklaşıma bakalım
1. Basit yumuşatma (Kahverengi model)
Bir serinin son 2 öğesine ilişkin ağırlıklı ortalamanın hesaplanmasını temsil eder.
2. Çift yumuşatma (Holt modeli)
Trenddeki değişiklikleri ve bu trend etrafındaki kalıntı değerlerdeki dalgalanmaları dikkate alır.
Artıklar ® ve trend (d)'deki değişikliklerin tahminini hesaplıyoruz. Y'nin son değeri bu iki miktarın toplamıdır.
3. Üçlü yumuşatma (Holt-Winters modeli)
Üçlü yumuşatma ayrıca mevsimsel değişiklikleri de hesaba katar.
Üçlü yumuşatma formülleri.
ARIMA ve SARIMA algoritması
ARIMA'nın kullanımına yönelik zaman serilerinin özelliği, mevcut ve gelecekteki değerlerle ilişkili geçmiş değerler arasındaki bağlantıdır.
SARIMA – mevsimsel bileşen içeren serilerin uzantısı. SARIMAX, harici bir regresyon bileşeni içeren bir uzantıdır.
ARIMA modelleri, entegre veya fark-durağan zaman serilerini simüle etmenize olanak tanır.
ARIMA'nın zaman serisi yaklaşımı, öncelikle serinin durağanlığının değerlendirilmesine dayanmaktadır.
Daha sonra uygun sıranın farkı alınarak seri dönüştürülür ve dönüştürülen model için bir ARMA modeli oluşturulur.
ARMA doğrusal bir çoklu regresyon modelidir.
Serinin durağan olması önemlidir. ortalama ve varyans değişmedi. Seri durağan değilse durağan hale getirilmesi gerekir.
XGBoost – onsuz nerede olurduk?
Bir serinin içsel olarak ifade edilen bir yapısı yoksa ancak dış etkileyici faktörler (yönetici, hava durumu vb.) varsa bu durumda boosting, rastgele ormanlar, regresyon, sinir ağları ve SVM gibi makine öğrenimi modellerini güvenle kullanabilirsiniz.
Takımın deneyiminden VERİ4, zaman serisi tahmini, depo maliyetlerinin, personel maliyetlerinin optimizasyonunun çözülmesi, ATM ağlarının bakımının optimize edilmesi, lojistik ve bina öneri sistemlerinin ana görevlerinden biri. SARIMA gibi karmaşık modeller yüksek kaliteli sonuçlar verir ancak zaman alıcıdır ve yalnızca belirli bir dizi görev için uygundur.
Bir sonraki makalede anormallikleri aramaya yönelik ana yaklaşımlara bakacağız.
Makalelerin ilgi alanlarınıza uygun olduğundan emin olmak için aşağıdaki ankete katılın veya sonraki makalelerde hangi konuları yazacağınızı yorumlara yazın.
Ankete sadece kayıtlı kullanıcılar katılabilir.
Hangi konuyla ilgili makaleler ilginizi çekiyor?
-
Tavsiye sistemleri
-
Görüntü tanıma
-
Konuşma ve metin işleme
-
DNN'deki yeni mimariler
-
Zaman serisi ve anormallik arama
-
İş dünyasında makine öğrenimi, kullanım örnekleri
17 kullanıcı oy kullandı. 3 kullanıcı çekimser kaldı.
Kaynak: habr.com