本文討論了時間序列的應用領域、要解決的問題以及所使用的演算法。 時間序列預測用於預測需求、聯絡中心負載、道路和網路流量、解決推薦系統中的冷啟動問題以及搜尋設備和使用者行為的異常等任務。
讓我們更詳細地看看任務。
1)需求預測。
目標:降低倉庫成本並優化員工工作安排。
如何解決:透過對商品購買量和客戶數量的預測,我們最大限度地減少倉庫中的商品數量,並存放在給定時間範圍內購買的商品數量。 了解任何特定時間的客戶數量,我們將製定最佳的工作時間表,以便以最低的成本擁有足夠的員工數量。
2) 預測配送服務的負載
目標:防止高峰負載期間物流崩潰。
如何解決:預測訂單數量,將最優的車數和快遞員上線。
3)預測聯絡中心的負載
目標:確保聯絡中心所需的可用性,同時最大限度地降低工資基金成本。
如何解決:預測一段時間內的呼叫數量,為接線員制定最佳時間表。
4)流量預測
目標:預測穩定運作的伺服器數量和頻寬。 這樣您的服務就不會在熱門電視劇或足球比賽首映當天崩潰 😉
5)預測ATM收款的最佳時間
目標:盡量減少 ATM 網路中儲存的現金量
6)推薦系統冷啟動問題的解決方案
目標:向新用戶推薦相關產品。
當用戶進行了多次購買時,可以建立協同過濾演算法進行推薦,但是當沒有關於用戶的資訊時,推薦最受歡迎的產品是最優的。
解決方案:產品的受歡迎程度取決於建議的時間。 使用時間序列預測有助於識別任何給定時間點的相關產品。
我們研究了建構推薦系統的生活小技巧
7) 搜尋異常狀況
目標:發現設備運作中的問題和業務中的不規範情況
解決方案:如果測量值超出預測信賴區間,則偵測到異常。 如果這是一座核電廠,是時候增加距離的平方了😉
解決問題的演算法
1)移動平均線
最簡單的演算法是移動平均線。 讓我們計算最後幾個元素的平均值並進行預測。 對於超過 10 天的天氣預報,使用類似的方法。
當系列中的最後一個值貢獻更多權重很重要時,我們根據日期的距離引入係數,獲得加權模型:
因此,可以設定W係數,使最大權重落在最後2天和入場日。
考慮週期性因素
建議的品質可能會受到週期性因素的影響,例如與星期幾、日期、之前的假期等重疊。
米。 1. 時間序列分解為趨勢、季節性成分和雜訊的範例
指數平滑是考慮週期性因素的解決方案。
讓我們來看看 3 種基本方法
1.簡單平滑(布朗模型)
表示對系列的最後 2 個元素進行加權平均值的計算。
2.雙重平滑(Holt模型)
考慮趨勢的變化以及圍繞該趨勢的殘值波動。
我們計算殘差 ® 和趨勢 (d) 變化的預測。 y 的最終值是這兩個量的總和。
3. 三重平滑(Holt-Winters 模型)
三重平滑也考慮了季節性變化。
三重平滑的公式。
ARIMA 和 SARIMA 演算法
使用 ARIMA 的時間序列的特殊性是過去值與目前值和未來值之間的連結。
SARIMA – 具有季節性成分的系列的擴展。 SARIMAX 是一個包含外部迴歸元件的擴充。
ARIMA 模型可讓您模擬積分或差分平穩時間序列。
ARIMA 時間序列方法首先評估序列的平穩性。
接下來,透過取適當階數的差值來變換級數,並為變換後的模型構造ARMA模型。
ARMA 是一個線性多元迴歸模型。
重要的是該序列必須是平穩的,即均值和變異數沒有改變。 如果序列是非平穩的,則應將其轉換為平穩形式。
XGBoost – 沒有它我們會怎麼樣?
如果一個系列沒有內部表達結構,但有外部影響因素(經理、天氣等),那麼你可以安全地使用機器學習模型,如boosting、隨機森林、回歸、神經網路和SVM。
從團隊的經驗來看 數據4、時間序列預測,主要任務之一是解決倉庫成本、人員成本的最佳化,優化ATM網路、物流的維護、建構推薦系統。 SARIMA 等複雜模型可以提供高品質的結果,但非常耗時且僅適用於特定範圍的任務。
在下一篇文章中,我們將介紹搜尋異常的主要方法。
為了確保這些文章與您的興趣相關,請參加下面的調查,或在評論中寫下下一篇文章要寫的主題。
只有註冊用戶才能參與調查。
您對什麼主題有興趣的文章?
-
推薦系統
-
圖像識別
-
語音和文字處理
-
DNN 中的新架構
-
時間序列和異常搜尋
-
商業中的機器學習、用例
17 位用戶投票。 3 名用戶棄權。
來源: www.habr.com