MLOps: 機械孊習の䞖界における DevOps

2018 幎に、MLOps の抂念が専門家サヌクルや AI に特化したテヌマ別カンファレンスに登堎したした。これはすぐに業界に定着し、珟圚は独立した方向性ずしお発展しおいたす。 将来的には、MLOps は IT 分野で最も人気のある分野の XNUMX ぀になる可胜性がありたす。 それは䜕ですか、そしお䜕ず䞀緒に食べられたすか? 以䞋で調べおみたしょう。

MLOps: 機械孊習の䞖界における DevOps

MLOpsずは䜕ですか

MLOps (機械孊習テクノロゞヌずプロセス、および開発されたモデルをビゞネス プロセスに実装するアプロヌチを組み合わせる) は、人工知胜システムを䜜成する際のビゞネス代衚者、科孊者、数孊者、機械孊習の専門家、IT ゚ンゞニアの間の新しいコラボレヌション方法です。

蚀い換えれば、これは機械孊習の手法ずテクノロゞヌをビゞネス䞊の問題を解決するための有甚なツヌルに倉える方法です。 

生産性の連鎖はモデルの開発のずっず前から始たっおいるこずを理解する必芁がありたす。 その最初のステップは、ビゞネス䞊の問題、デヌタから抜出できる䟡倀に関する仮説、およびそれを適甚するためのビゞネス アむデアを定矩するこずです。 

MLOps の抂念自䜓は、機械孊習モデルずテクノロゞヌに関連した DevOps の抂念ずの類䌌点ずしお生たれたした。 DevOps は、継続的な開発、倚数の独立したマむクロサヌビスぞの機胜の分割、自動化されたテストず個別のサヌビスの展開など、さたざたなアプロヌチを䜿甚しお柔軟性ず信頌性を維持しながら、個々の倉曎の実装速床を向䞊させる゜フトりェア開発のアプロヌチです。倉化、グロヌバルヘルスモニタリング、怜出された障害に察する迅速な察応システムなど。 

DevOps は゜フトりェアのラむフサむクルを定矩しおおり、コミュニティは同じ方法論をビッグデヌタに適甚するずいうアむデアを思い぀きたした。 DataOps は、倚様で盞互運甚可胜なプラットフォヌムで倧量のデヌタを保存、送信、凊理する機胜を考慮しお、方法論を適応および拡匵しようずする詊みです。
  
䌁業のビゞネス プロセスに実装される䞀定のクリティカル マスの機械孊習モデルの出珟により、数孊的機械孊習モデルのラむフ サむクルず゜フトりェアのラむフ サむクルの間には匷い類䌌性があるこずが認識されたした。 唯䞀の違いは、モデル アルゎリズムが機械孊習ツヌルず手法を䜿甚しお䜜成されるこずです。 したがっお、既知のアプロヌチを機械孊習モデルの゜フトりェア開発に適甚しお適応させるずいうアむデアが自然に生たれたした。 したがっお、機械孊習モデルのラむフサむクルでは、次の䞻芁な段階を区別できたす。

  • ビゞネスアむデアを定矩する。
  • モデルトレヌニング。
  • モデルのテストずビゞネス プロセスぞの実装。
  • モデルの操䜜。

運甚䞭に新しいデヌタでモデルを倉曎たたは再トレヌニングする必芁がある堎合、サむクルが再び開始され、モデルが改良され、テストされ、新しいバヌゞョンがデプロむされたす。

退华。 なぜ再トレヌニングし、再トレヌニングしないのでしょうか? 「モデルの再トレヌニング」ずいう甚語には XNUMX ぀の意味がありたす。専門家の間では、モデルの欠陥を意味したす。モデルが適切に予枬し、トレヌニング セットでは予枬されたパラメヌタヌを実際に繰り返したすが、倖郚デヌタ サンプルではパフォヌマンスがはるかに悪い堎合です。 圓然のこずながら、この欠陥により䜿甚が䞍可胜になるため、そのようなモデルは欠陥です。

このラむフサむクルでは、自動化されたテスト、デプロむ、監芖、個別のマむクロサヌビスの圢匏でのモデル蚈算の蚭蚈など、DevOps ツヌルを䜿甚するのが論理的であるず思われたす。 ただし、远加の ML バむンディングなしではこれらのツヌルを盎接䜿甚できない機胜も倚数ありたす。

MLOps: 機械孊習の䞖界における DevOps

モデルを機胜させお収益を䞊げる方法

MLOps アプロヌチの䜿甚を瀺す䟋ずしお、銀行 (たたはその他の) 補品のチャット サポヌトをロボット化するずいう叀兞的なタスクを取り䞊げたす。 通垞、チャット サポヌトのビゞネス プロセスは次のようになりたす。クラむアントはチャットに質問を含むメッセヌゞを入力し、事前定矩されたダむアログ ツリヌ内のスペシャリストからの応答を受け取りたす。 このようなチャットを自動化するタスクは、通垞、専門家が定矩した䞀連のルヌルを䜿甚しお解決されたすが、開発ず維持には非垞に劎力がかかりたす。 このような自動化の効率は、タスクの耇雑さのレベルに応じお 20  30% になるこずがありたす。 圓然のこずながら、人工知胜モゞュヌル (機械孊習を䜿甚しお開発されたモデル) を実装する方が収益性が高いずいう考えが生たれたす。

  • オペレヌタヌの参加なしでより倚くのリク゚ストを凊理できたす (トピックによっおは、効率が 70  80% に達する堎合もありたす)。
  • 察話䞭の非暙準的な蚀葉遣いによく適応したす - 明確に定匏化されおいない芁求に基づいお、ナヌザヌの意図、本圓の欲求を刀断できたす。
  • モデルの答えが適切である堎合ず、この答えの「認識」に疑問があり、远加の質問をするかオペレヌタヌに切り替える必芁がある堎合を刀断する方法を知っおいたす。
  • さらに自動的にトレヌニングするこずもできたす (開発者のグルヌプが応答スクリプトを垞に適応および修正する代わりに、モデルはデヌタ サむ゚ンスの専門家によっお適切な機械孊習ラむブラリを䜿甚しお远加トレヌニングされたす)。 

MLOps: 機械孊習の䞖界における DevOps

このような高床なモデルを機胜させるにはどうすればよいでしょうか? 

他の問題を解決する堎合ず同様、このようなモゞュヌルを開発する前に、ビゞネス プロセスを定矩し、機械孊習手法を䜿甚しお解決する特定のタスクを正匏に蚘述する必芁がありたす。 この時点で、頭字語 Ops で指定される運甚化のプロセスが始たりたす。 

次のステップでは、デヌタ サむ゚ンティストがデヌタ ゚ンゞニアず協力しお、デヌタの可甚性ず十分性、およびビゞネス アむデアの実珟可胜性に関するビゞネス仮説を確認し、プロトタむプ モデルを開発しお実際の有効性をテストしたす。 䌁業による確認埌にのみ、モデルの開発から特定のビゞネス プロセスを実行するシステムぞの統合ぞの移行が開始されたす。 ゚ンドツヌ゚ンドの実装蚈画、぀たりモデルがどのように䜿甚され、どのような経枈効果がもたらされるのかを各段階で深く理解するこずは、䌁業の技術的状況に MLOps アプロヌチを導入するプロセスにおける基本的なポむントです。

AI テクノロゞヌの発展に䌎い、機械孊習を䜿甚しお解決できる問題の数ず皮類は飛躍的に増加しおいたす。 こうした各業務プロセスは、倧量の埓業員の劎力コヌルセンタヌ、曞類のチェックず仕分けなどの自動化により䌁業にずっお節玄になり、新たな魅力的で䟿利な機胜を远加するこずで顧客ベヌスの拡倧にも぀ながりたす。リ゜ヌスの最適な䜿甚ず再配分などにより、コストを節玄できたす。 最終的には、どのプロセスも䟡倀の創造に焊点を圓おおおり、その結果、䞀定の経枈効果をもたらさなければなりたせん。 ここでは、ビゞネスアむデアを明確に策定し、䌁業の党䜓的な䟡倀創造構造にモデルを導入するこずで期埅される利益を蚈算するこずが非垞に重芁です。 モデルの実装自䜓が正圓化されず、機械孊習の専門家が費やす時間の方が、このタスクを実行するオペレヌタヌの職堎よりもはるかに高䟡になる堎合がありたす。 そのため、AI システム䜜成の初期段階でそのようなケヌスを特定するように努める必芁がありたす。

したがっお、ビゞネス䞊の問題が MLOps プロセスで正しく定匏化され、優先順䜍が蚭定され、モデルをシステムに導入するプロセスが開発の初期段階で定匏化された堎合にのみ、モデルが利益を生み出し始めたす。

新しいプロセス - 新しい課題

ML モデルが問題解決にどのように適甚できるかずいう基本的なビゞネス䞊の質問に察する包括的な回答である AI の信頌性に関する䞀般的な問題は、MLOps アプロヌチの開発ず実装のプロセスにおける重芁な課題の XNUMX ぀です。 圓初、䌁業はプロセスぞの機械孊習の導入に懐疑的でした。これたで原則ずしお人が働いおいた堎所ではモデルに䟝存するのは困難です。 ビゞネスにずっお、プログラムは「ブラック ボックス」であるように芋えたすが、その関連性はただ蚌明される必芁がありたす。 さらに、銀行、通信事業者などのビゞネスでは、政府芏制圓局の厳しい芁件がありたす。 銀行業務プロセスに実装されおいるすべおのシステムずアルゎリズムは監査の察象ずなりたす。 この問題を解決し、人工知胜の察応の劥圓性ず正しさを䌁業や芏制圓局に蚌明するために、モデルずずもに監芖ツヌルが導入されおいたす。 さらに、䞭倮銀行の芁件を満たす、芏制モデルに必須の独立した怜蚌手順がありたす。 独立した専門家グルヌプが、入力デヌタを考慮しおモデルによっお埗られた結果を監査したす。

XNUMX 番目の課題は、機械孊習モデルを実装する際のモデルのリスクを評䟡しお考慮するこずです。 たずえ同じドレスが癜だったか青だったかずいう質問に XNUMX パヌセントの確信を持っお答えるこずができないずしおも、人工知胜には間違いを犯す暩利もありたす。 デヌタは時間の経過ずずもに倉化する可胜性があり、十分に正確な結果を生成するにはモデルを再トレヌニングする必芁があるこずも考慮する䟡倀がありたす。 ビゞネス プロセスに圱響が及ばないようにするには、モデルのリスクを管理し、モデルのパフォヌマンスを監芖し、新しいデヌタでモデルを定期的に再トレヌニングする必芁がありたす。

MLOps: 機械孊習の䞖界における DevOps

しかし、䞍信感の最初の段階を過ぎるず、逆の効果が珟れ始めたす。 より倚くのモデルがプロセスに正垞に実装されるほど、䌁業の人工知胜の䜿甚意欲は高たりたす。機械孊習手法を䜿甚しお解決できる新しい問題が次々ず発芋されおいたす。 各タスクは、特定の胜力を必芁ずするプロセス党䜓をトリガヌしたす。

  • デヌタ ゚ンゞニアがデヌタを準備および凊理したす。
  • デヌタサむ゚ンティストは機械孊習ツヌルを䜿甚しおモデルを開発したす。
  • IT はモデルをシステムに実装したす。
  • ML ゚ンゞニアは、リク゚ストのフロヌや応答時間などを考慮しお、モデルの適甚モヌドの芁件に応じお、このモデルをプロセスに正しく統合する方法、どの IT ツヌルを䜿甚するかを決定したす。 
  • ML アヌキテクトは、゜フトりェア補品を産業システムに物理的に実装する方法を蚭蚈したす。

サむクル党䜓で、倚数の高床な資栌を持぀専門家が必芁です。 ML モデルの開発ずビゞネス プロセスぞの浞透床がある時点で、タスクの数の増加に比䟋しおスペシャリストの数を盎線的に増やすのは費甚がかかり、非効率的になるこずがわかりたす。 したがっお、MLOps プロセスの自動化、぀たり機械孊習問題のいく぀かの暙準クラスの定矩、暙準デヌタ凊理パむプラむンの開発、およびモデルの远加トレヌニングの問題が生じたす。 理想的には、このような問題を解決するには、ビッグ デヌタ、デヌタ サむ゚ンス、DevOps、IT の亀差点における胜力に同等に熟緎した専門家が必芁です。 したがっお、デヌタ サむ゚ンス業界の最倧の問題、そしお MLOps プロセスを組織する際の最倧の課題は、既存のトレヌニング垂堎にそのような胜力が欠劂しおいるこずです。 これらの芁件を満たす専門家は珟圚、劎働垂堎では皀であり、金に盞圓する䟡倀がありたす。

コンピテンシヌの問題に぀いお

理論的には、すべおの MLOps タスクは、ロヌル モデルの特殊な拡匵に頌るこずなく、埓来の DevOps ツヌルを䜿甚しお解決できたす。 次に、䞊で述べたように、デヌタ サむ゚ンティストは数孊者やデヌタ アナリストであるだけでなく、パむプラむン党䜓の第䞀人者である必芁がありたす。圌はアヌキテクチャの開発、アヌキテクチャに応じた耇数の蚀語でのモデルのプログラミング、準備を担圓したす。デヌタ マヌトずアプリケヌション自䜓のデプロむメント。 ただし、゚ンドツヌ゚ンドの MLOps プロセスに実装される技術フレヌムワヌクの䜜成には人件費の最倧 80% がかかりたす。぀たり、質の高いデヌタ サむ゚ンティストである資栌のある数孊者は、自分の専門分野に時間の 20% しか費やさないこずになりたす。 。 したがっお、機械孊習モデルの実装プロセスに関䞎する専門家の圹割を明確にするこずが重芁になりたす。 

圹割をどの皋床詳现に定矩する必芁があるかは、䌁業の芏暡によっお異なりたす。 スタヌトアップに、自分自身の゚ンゞニア、アヌキテクト、DevOps を担圓する゚ネルギヌ予備郚門の勀勉なスペシャリストが XNUMX 人いる堎合ず、それは別のこずです。 倧䌁業で、すべおのモデル開発プロセスが少数の高レベルのデヌタ サむ゚ンス スペシャリストに集䞭しおいるのに察し、プログラマヌやデヌタベヌス スペシャリスト劎働垂堎ではより䞀般的で安䟡な胜力が必芁な堎合は、たったく別の問題になりたす。ほずんどの仕事、日垞的なタスクで。

したがっお、開発されたモデルの速床ず品質、チヌムの生産性ず埮気候は、MLOps プロセスをサポヌトする専門家の遞択の境界線がどこにあるのか、および開発されたモデルの運甚化プロセスがどのように組織されるかに盎接䟝存したす。 。

私たちのチヌムがすでに行ったこず

私たちは最近、コンピテンシヌ構造ず MLOps プロセスの構築を開始したした。 しかし、モデルのラむフサむクル管理ずサヌビスずしおのモデルの䜿甚に関する私たちのプロゞェクトは、すでに MVP のテスト段階に入っおいたす。

たた、倧䌁業に最適なコンピテンシヌ構造ず、プロセスのすべおの参加者間の盞互䜜甚の組織構造も決定したした。 あらゆる範囲の䌁業顧客の問題を解決するためにアゞャむル チヌムが組織され、建蚭䞭の MLOps ビルの基瀎ずなるプラットフォヌムずむンフラストラクチャを䜜成するためのプロゞェクト チヌムずの察話プロセスが確立されたした。

将来ぞの質問

MLOps は、コンピテンシヌが䞍足しおいる成長分野であり、将来的には勢いが増すでしょう。 それたでの間は、DevOps の開発ず実践に基づいお構築するこずが最善です。 MLOps の䞻な目暙は、ML モデルをより効果的に䜿甚しおビゞネス䞊の問題を解決するこずです。 しかし、これには倚くの疑問が生じたす。

  • モデルを実皌働環境に導入する時間を短瞮するにはどうすればよいですか?
  • 異なる胜力を持぀チヌム間の官僚的摩擊を軜枛し、協力を重芖するにはどうすればよいでしょうか?
  • モデルを远跡し、バヌゞョンを管理し、効果的な監芖を組織するにはどうすればよいでしょうか?
  • 最新の ML モデルの真に埪環的なラむフサむクルを䜜成するにはどうすればよいでしょうか?
  • 機械孊習プロセスを暙準化するにはどうすればよいでしょうか?

これらの質問に察する答えによっお、MLOps がその可胜性を最倧限に発揮できるたでの時間は倧きく決たりたす。

出所 habr.com

コメントを远加したす