MLOps: 機械孊習の䞖界における DevOps

2018 幎に、MLOps の抂念が専門家の間で、たた AI に特化したテヌマ別カンファレンスで登堎し、急速に業界での地䜍を確立し、珟圚では独立した方向性ずしお発展しおいたす。将来、MLOps は IT で最も需芁の高い分野の XNUMX ぀になる可胜性がありたす。それが䜕であるか、そしおそれをどのように䜿甚するかに぀いおは、以䞋で説明したす。

MLOps: 機械孊習の䞖界における DevOps

MLOpsずは

MLOps (機械孊習光孊およびモデリング) は、人工知胜システムを䜜成する際に、ビゞネス担圓者、科孊者、数孊者、機械孊習の専門家、IT ゚ンゞニアが協力する新しい方法です。

蚀い換えれば、機械孊習の方法ずテクノロゞヌを、ビゞネス䞊の問題を解決するための䟿利なツヌルに倉える方法です。 

生産性向䞊の連鎖はモデルの開発よりずっず前から始たっおいるこずを理解するこずが重芁です。最初のステップは、ビゞネス䞊の問題、デヌタから抜出できる䟡倀に関する仮説、そしおそれを適甚するためのビゞネス アむデアを定矩するこずです。 

MLOps の抂念そのものは、機械孊習モデルずテクノロゞヌに適甚される DevOps の抂念の類掚ずしお生たれたした。 DevOps は、継続的な開発、耇数の独立したマむクロサヌビスぞの機胜の分割、個々の倉曎の自動テストず展開、グロヌバルなパフォヌマンス監芖、特定された障害に察する迅速な察応システムなど、さたざたなアプロヌチを䜿甚しお、柔軟性ず信頌性を維持しながら個々の倉曎を迅速に実装できるようにする゜フトりェア開発のアプロヌチです。 

DevOps は゜フトりェアのラむフサむクルを定矩し、コミュニティはビッグデヌタに同じ方法論を䜿甚するずいうアむデアを思い぀きたした。 DataOps は、倚様で盞互䜜甚するプラットフォヌムで倧量のデヌタを保存、転送、凊理する際の特殊性を考慮しお方法論を適応および拡匵する詊みです。
  
䌁業のビゞネスプロセスに実装された機械孊習モデルの䞀定の臚界質量の出珟により、数孊的機械孊習モデルのラむフサむクルず゜フトりェアのラむフサむクルの間に匷い類䌌性が芋られるようになりたした。唯䞀の違いは、モデルアルゎリズムが機械孊習のツヌルず方法を䜿甚しお䜜成されるこずです。したがっお、機械孊習モデルの゜フトりェア開発に既知のアプロヌチを適甚および適応するずいうアむデアが自然に生たれたした。したがっお、機械孊習モデルのラむフサむクルは、次の䞻芁な段階に分けられたす。

  • ビゞネスアむデアの定矩
  • モデルのトレヌニング。
  • モデルのビゞネス プロセスぞのテストず実装。
  • モデルの操䜜。

運甚䞭に、新しいデヌタでモデルを倉曎たたは再トレヌニングする必芁がある堎合、サむクルが再開され、モデルが改良され、テストされ、新しいバヌゞョンが展開されたす。

埌退。なぜ再蚓緎するのか、なぜ再蚓緎しないのか? 「モデルの過剰適合」ずいう甚語には 2 ぀の意味がありたす。専門家の間では、モデルの予枬がうたくいき、トレヌニング サンプルでは予枬されたパラメヌタを実際に繰り返すものの、倖郚デヌタ サンプルでは予枬結果がはるかに悪くなる堎合のモデル欠陥を意味したす。圓然、このようなモデルは欠陥であり、この欠陥により䜿甚できなくなりたす。

このラむフサむクルでは、自動テスト、デプロむメントず監芖、モデル蚈算の蚭蚈を個別のマむクロサヌビスずしお行う DevOps ツヌルを䜿甚するのが理にかなっおいるようです。ただし、远加の ML バむンディングなしではこれらのツヌルを盎接䜿甚できないようにする機胜もいく぀かありたす。

MLOps: 機械孊習の䞖界における DevOps

モデルを機胜させお利益を䞊げる方法

MLOps アプロヌチの適甚䟋を瀺すために、銀行 (たたはその他の) 補品のサポヌト チャットをロボット化するずいう、今では叀兞的なタスクを取り䞊げたす。通垞、チャット サポヌトのビゞネス プロセスは次のようになりたす。クラむアントはチャットで質問を含むメッセヌゞを入力し、事前に定矩されたダむアログ ツリヌ内でスペシャリストからの応答を受け取りたす。このようなチャットを自動化するタスクは通垞、専門家が定矩した䞀連のルヌルの助けを借りお解決されたすが、その開発ず維持には非垞に手間がかかりたす。このような自動化の効率は、タスクの耇雑さのレベルに応じお 2030% になりたす。圓然、機械孊習を䜿甚しお開発されたモデルである人工知胜モゞュヌルを実装する方が収益性が高いずいう考えが浮かびたす。

  • オペレヌタの介入なしに倧量のリク゚ストを凊理できたすトピックによっおは、効率が 7080% に達する堎合もありたす。
  • 察話における非暙準的な蚀い回しにうたく適応したす - 明確に衚珟されおいない芁求に察するナヌザヌの意図や本圓の芁望を刀断できたす。
  • モデルの応答が適切である堎合ず、この応答の「認識」に疑問がある堎合に、远加の明確な質問をしたり、オペレヌタに切り替えたりする必芁があるかどうかを刀断できたす。
  • さらに自動的にトレヌニングできたす (開発者のグルヌプが応答シナリオを垞に適応および調敎する代わりに、モデルは適切な機械孊習ラむブラリを䜿甚しおデヌタ サむ゚ンスの専門家によっおさらにトレヌニングされたす)。 

MLOps: 機械孊習の䞖界における DevOps

このような高床なモデルをどのように機胜させるのでしょうか? 

他のあらゆる問題ず同様に、このようなモゞュヌルを開発する前に、ビゞネス プロセスを定矩し、機械孊習手法を䜿甚しお解決する特定の問題を正匏に蚘述する必芁がありたす。この時点で、Ops ず略される運甚化のプロセスが始たりたす。 

次のステップでは、デヌタ サむ゚ンティストがデヌタ ゚ンゞニアず連携しお、プロトタむプ モデルを開発し、その実際の有効性をテストするこずで、デヌタの可甚性ず十分性、およびビゞネス アむデアの実珟可胜性に関するビゞネス仮説を確認したす。ビゞネスによる確認が行われた埌にのみ、モデルの開発から特定のビゞネス プロセスを実行するシステムぞの統合ぞの移行を開始できたす。各段階でモデルがどのように䜿甚され、どのような経枈効果がもたらされるかを深く理解した䞊での゚ンドツヌ゚ンドの実装蚈画は、䌁業の技術環境に MLOps アプロヌチを実装するプロセスにおける基本的な段階です。

AI技術の発展に䌎い、機械孊習を䜿甚しお解決できる問題の数ず皮類は飛躍的に増加しおいたす。このような各ビゞネス プロセスは、倧量の職務 (コヌル センタヌ、文曞の確認ず分類など) の埓業員の䜜業を自動化するこずによる䌚瀟の節玄、魅力的で䟿利な新しい機胜の远加による顧客ベヌスの拡倧、リ゜ヌスの最適な䜿甚ず再配分による節玄など、䌁業にずっおの節玄になりたす。結局のずころ、あらゆるプロセスは䟡倀の創造を目的ずしおおり、その結果、䞀定の経枈効果をもたらさなければなりたせん。ここでは、ビゞネスアむデアを明確に定匏化し、䌁業の䟡倀創造の党䜓的な構造の䞭でモデルを実装するこずから期埅される利益を蚈算するこずが非垞に重芁です。モデルの実装が正圓化されず、機械孊習の専門家が費やす時間が、このタスクを実行するオペレヌタヌのワヌクステヌションよりもはるかに高䟡になる堎合がありたす。そのため、AI システムを䜜成する初期段階で、このようなケヌスを特定するように努める必芁がありたす。

したがっお、ビゞネスの問題が MLOps プロセスで正しく定匏化され、優先順䜍が蚭定され、モデルをシステムに実装するプロセスが開発の初期段階で定匏化された堎合にのみ、モデルが利益を生み出し始めたす。

新しいプロセス – 新しい課題

ML モデルが問題解決に適甚できるかどうかずいう基本的なビゞネス䞊の疑問、぀たり AI に察する信頌の䞀般的な疑問に察する包括的な答えは、MLOps アプロヌチの開発ず実装のプロセスにおける重芁な課題の 1 ぀です。圓初、䌁業はプロセスぞの機械孊習の導入に懐疑的でした。これたで人が働いおいた堎所でモデルに頌るのは難しいからです。䌁業にずっお、プログラムは「ブラック ボックス」であり、その答えが関連性があるこずがただ蚌明される必芁があるようです。さらに、銀行業や通信事業者などの事業では、州の芏制圓局による厳しい芁件がありたす。銀行業務プロセスに実装されおいるすべおのシステムずアルゎリズムは監査の察象ずなりたす。この問題を解決するために、䌁業や芏制圓局に人工知胜の応答の有効性ず正確性を蚌明するために、モデルずずもに監芖ツヌルが導入されおいたす。さらに、䞭倮銀行の芁件に準拠した、芏制モデルに必須の独立した怜蚌手順がありたす。独立した専門家グルヌプが、入力デヌタを考慮しおモデルによっお埗られた結果を監査したす。

2 番目の課題は、機械孊習モデルを実装する際にモデルのリスクを評䟡し、考慮するこずです。人間ですらドレスが癜だったか青だったかを100確実に答えられないのであれば、人工知胜にも間違いを犯す暩利がある。たた、時間の経過ずずもにデヌタが倉化する可胜性があり、十分に正確な結果を生成するにはモデルをさらにトレヌニングする必芁があるこずも考慮する䟡倀がありたす。ビゞネス プロセスに支障がないようにするには、モデルのリスクを管理し、モデルのパフォヌマンスを監芖しお、新しいデヌタで定期的に再トレヌニングする必芁がありたす。

MLOps: 機械孊習の䞖界における DevOps

しかし、䞍信の最初の段階を過ぎるず、逆の効果が珟れ始めたす。プロセスにモデルがうたく実装されるほど、䌁業の人工知胜の利甚意欲が高たり、機械孊習手法を䜿甚しお解決できる新しいタスクがたすたす倚く芋぀かりたす。各タスクは、特定の胜力を必芁ずするプロセス党䜓を開始したす。

  • デヌタ ゚ンゞニアはデヌタを準備および凊理したす。
  • デヌタ サむ゚ンティストは機械孊習ツヌルを適甚しおモデルを開発したす。
  • IT はモデルをシステムに実装したす。
  • ML ゚ンゞニアは、リク゚ストのフロヌや応答時間などを考慮しながら、モデル適甚モヌドの芁件に応じおこのモデルをプロセスに正しく統合する方法、䜿甚する IT ツヌルを決定したす。 
  • ML アヌキテクトは、゜フトりェア補品を産業システムに物理的に実装する方法を蚭蚈したす。

サむクル党䜓には、高床な資栌を持぀専門家が倚数必芁です。 ML モデルの開発ずビゞネス プロセスぞの浞透の特定の時点で、タスク数の増加に比䟋しおスペシャリストの数を盎線的に増やすず、コストがかかり、非効率的になるこずがわかりたす。したがっお、機械孊習タスクのいく぀かの暙準クラスを定矩し、䞀般的なデヌタ凊理パむプラむンを開発し、モデルを再トレヌニングする、MLOps プロセスを自動化するずいう問題が生じたす。理想的には、このような問題を解決するには、ビッグデヌタ、デヌタサむ゚ンス、DevOps、IT の亀差点における胜力に同等に粟通した専門家が必芁です。したがっお、デヌタ サむ゚ンス業界における最倧の問題、そしお MLOps プロセスを組織化する䞊での最倧の課題は、既存のトレヌニング垂堎におけるそのような胜力の欠劂です。このような芁件を満たす専門家は珟圚、劎働垂堎では皀であり、非垞に貎重です。

胜力の問題に぀いお

理論的には、ロヌルモデルの特殊な拡匵に頌るこずなく、埓来の DevOps ツヌルを䜿甚しおすべおの MLOps タスクを解決できたす。そしお、すでに䞊で述べたように、デヌタ サむ゚ンティストは数孊者やデヌタ分析の専門家であるだけでなく、パむプラむン党䜓の第䞀人者でなければなりたせん。その責任は、アヌキテクチャの開発、アヌキテクチャに応じた耇数の蚀語でのモデルのプログラミング、デヌタ マヌトの準備、アプリケヌション自䜓の展開にありたす。しかし、゚ンドツヌ゚ンドの MLOps プロセスに実装される技術的フレヌムワヌクの䜜成には最倧 80% の人件費がかかりたす。぀たり、優秀なデヌタ サむ゚ンティストである有胜な数孊者が専門分野に割ける時間は 20% にしかならないこずになりたす。したがっお、機械孊習モデルの実装プロセスを実行する専門家の圹割を明確にするこずが重芁になりたす。 

圹割をどの皋床詳现に定矩する必芁があるかは、䌁業の芏暡によっお異なりたす。スタヌトアップに、電力゚ンゞニアの予備芁員ずしお、゚ンゞニア、アヌキテクト、DevOps を兌任するスペシャリストが 1 人いる堎合は、問題ありたせん。倧䌁業で、すべおのモデル開発プロセスが少数の高床なデヌタサむ゚ンスの専門家に集䞭し、劎働垂堎でより䞀般的で安䟡なスキルであるプログラマヌやデヌタベヌスの専門家が日垞的なタスクのほずんどを担えるようになるず、状況はたったく異なりたす。

したがっお、開発されたモデルの速床ず品質、チヌムの生産性、チヌム内の埮気候は、MLOps プロセスを確実に実行するための専門家の遞択においお境界線がどこに匕かれるか、および開発されたモデルの運甚化のプロセスがどのように線成されるかに盎接䟝存したす。

私たちのチヌムがすでにやったこず

圓瀟は最近、コンピテンシヌ構造ず MLOps プロセスの構築を開始したした。しかし、珟圚すでに、モデルのラむフサむクル管理ずサヌビスずしおのモデルの䜿甚に関するプロゞェクトは、MVP テスト段階にありたす。

たた、倧䌁業にずっお最適な胜力構造ず、プロセスに参加するすべおの参加者間の盞互䜜甚の組織構造も決定したした。あらゆるビゞネス カスタマヌの問題を解決するためにアゞャむル チヌムが線成され、プロゞェクト チヌムずの察話プロセスが確立され、構築䞭の MLOps ビルの基盀ずなるプラットフォヌムずむンフラストラクチャが䜜成されたした。

将来ぞの疑問

MLOps はスキルギャップが生じおいる成長分野であり、今埌勢いを増すでしょう。それたでの間は、DevOps の開発ず実践に基づいお構築するのが最善です。 MLOps の䞻な目的は、ML モデルをより効果的に䜿甚しおビゞネス䞊の問題を解決するこずです。しかし、これには倚くの疑問が生じたす。

  • モデルを本番環境に投入するたでの時間を短瞮するにはどうすればよいでしょうか?
  • 異なる胜力を持぀チヌム間の官僚的な摩擊を軜枛し、協力に重点を眮くにはどうすればよいでしょうか?
  • モデルを远跡し、バヌゞョンを管理し、効果的な監芖を組織化するにはどうすればよいですか?
  • 最新の ML モデルに真に埪環的なラむフサむクルを䜜成するにはどうすればよいでしょうか?
  • 機械孊習のプロセスを暙準化するにはどうすればよいでしょうか?

これらの質問ぞの答えによっお、MLOps がどれだけ早くその朜圚胜力を最倧限に発揮できるかが倧きく決たりたす。

出所 habr.com

DDoS 保護機胜を備えた信頌性の高いサむト甚ホスティング、VPS VDS サヌバヌを賌入する 🔥 DDoS攻撃察策付きの信頌性の高いりェブサむトホスティング、VPS/VDSサヌバヌを賌入したしょう | ProHoster