この記事では、時系列の適用分野、解決すべき問題、および使用されるアルゴリズムについて説明します。 時系列予測は、需要、コンタクト センターの負荷、道路やインターネット トラフィックの予測、レコメンダー システムのコールド スタート問題の解決、機器やユーザーの動作の異常の検索などのタスクに使用されます。
タスクをさらに詳しく見てみましょう。
1) 需要予測。
目標: 倉庫コストを削減し、スタッフの作業スケジュールを最適化します。
それを解決する方法: 商品の購入と顧客の数を予測し、倉庫内の商品の量を最小限に抑え、指定された期間内に購入されるのと同じだけの量を保管します。 常にクライアントの数を把握し、最小限のコストで十分な数のスタッフを確保できるように最適な作業スケジュールを作成します。
2) 配送サービスの負荷予測
目標: 負荷のピーク時の物流崩壊を防ぐこと。
解決方法: 注文数を予測し、最適な数の車両と宅配業者をラインに投入します。
3) コンタクトセンターの負荷予測
目標: 賃金基金のコストを最小限に抑えながら、コンタクト センターの必要な可用性を確保すること。
解決方法: 時間の経過に伴う通話数を予測し、オペレーターに最適なスケジュールを作成します。
4) 交通量予測
目標: 安定した動作のためのサーバーの数と帯域幅を予測します。 人気のテレビシリーズやフットボールの試合のプレミア公開日にサービスがクラッシュしないように 😉
5)ATM回収の最適時期の予測
目標: ATM ネットワークに保管される現金の量を最小限に抑える
6) レコメンデーションシステムにおけるコールドスタート問題の解決策
目標: 新規ユーザーに関連する製品を推奨します。
ユーザーが複数の購入を行った場合、協調フィルタリング アルゴリズムを構築して推奨することができますが、ユーザーに関する情報がない場合は、最も人気のある製品を推奨するのが最適です。
解決策: 製品の人気は、推奨が行われる時間によって異なります。 時系列予測を使用すると、任意の時点で関連する製品を特定できます。
レコメンダー システムを構築するためのライフハックを検討しました。
7) 異常の検索
目標: 機器の操作上の問題とビジネス上の非標準的な状況を特定する
解決策: 測定値が予測信頼区間の外にある場合は、異常が検出されています。 これが原子力発電所なら、距離の二乗を増やす時が来ます 😉
問題を解決するためのアルゴリズム
1) 移動平均
最も単純なアルゴリズムは移動平均です。 最後のいくつかの要素の平均値を計算して予測してみましょう。 10 日を超える天気予報の場合も、同様のアプローチが使用されます。
系列の最後の値がより多くの重みに寄与することが重要な場合は、日付の距離に応じて係数を導入し、重み付けされたモデルを取得します。
したがって、最後の 2 日とエントリー日に最大の重みがかかるように W 係数を設定できます。
景気循環要因を考慮する
レコメンデーションの品質は、曜日、日付、前の休日などとの一致などの周期的要因の影響を受ける可能性があります。
米。 1. トレンド、季節成分、ノイズへの時系列分解の例
指数平滑化は、周期的要因を考慮するためのソリューションです。
3つの基本的なアプローチを見てみましょう
1. 簡易スムージング(ブラウンモデル)
系列の最後の 2 つの要素に対する加重平均の計算を表します。
2. 二重平滑化(ホルトモデル)
トレンドの変化と、このトレンドを中心とした残価の変動を考慮します。
残差 ® とトレンド (d) の変化の予測を計算します。 y の最終値は、これら XNUMX つの量の合計です。
3. 三重平滑化 (Holt-Winters モデル)
三重平滑化では、季節変動もさらに考慮されます。
三重平滑化の公式。
ARIMA および SARIMA アルゴリズム
ARIMA を使用する場合の時系列の特徴は、現在および将来の値に関連する過去の値の間のつながりです。
SARIMA – 季節要素を含むシリーズの拡張機能。 SARIMAX は、外部回帰コンポーネントを含む拡張機能です。
ARIMA モデルを使用すると、統合時系列または差分定常時系列をシミュレートできます。
時系列に対する ARIMA のアプローチは、まず時系列の定常性を評価することです。
次に、適切な次数の差を取ることによって系列が変換され、変換されたモデルに対して ARMA モデルが構築されます。
ARMA は線形重回帰モデルです。
系列が静止していることが重要です。 平均と分散は変わりませんでした。 系列が非定常である場合は、定常形式にする必要があります。
XGBoost – これがなかったらどうなるでしょうか?
シリーズに内部的に表現された構造がなくても、外部の影響要因 (マネージャー、天候など) がある場合は、ブースティング、ランダム フォレスト、回帰、ニューラル ネットワーク、SVM などの機械学習モデルを安全に使用できます。
チームの経験から データ4、時系列予測、倉庫コスト、人件費の最適化、ATMネットワークのメンテナンスの最適化、物流、推奨システムの構築を解決するための主要なタスクのXNUMXつです。 SARIMA などの複雑なモデルは高品質の結果をもたらしますが、時間がかかり、特定の範囲のタスクにのみ適しています。
次の記事では、異常を検索するための主なアプローチについて説明します。
記事があなたの興味に関連していることを確認するには、以下のアンケートに回答するか、次の記事でどのようなトピックについて書くかをコメントに書き込んでください。
登録ユーザーのみがアンケートに参加できます。
どのようなトピックに関する記事に興味がありますか?
-
推薦システム
-
画像認識
-
音声およびテキスト処理
-
DNN の新しいアーキテクチャ
-
時系列と異常の検索
-
ビジネスにおける ML、ユースケース
17 人のユーザーが投票しました。 3名のユーザーが棄権した。
出所: habr.com