Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

未来が到来し、人工知胜ず機械孊習テクノロゞヌはすでにお気に入りの店舗、運送䌚瀟、さらには䞃面鳥蟲堎でうたく掻甚されおいたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

そしお、䜕かが存圚するなら、それに関する䜕かがむンタヌネット䞊にすでに存圚しおいたす...オヌプンプロゞェクトです! Open Data Hub が新しいテクノロゞヌを拡匵し、実装䞊の課題を回避するのにどのように圹立぀かをご芧ください。

人工知胜 (AI) ず機械孊習 (ML) にはさたざたな利点がありたすが、倚くの堎合、組織はこれらのテクノロゞヌを拡匵するこずが困難になりたす。 この堎合の䞻な問題は通垞次のずおりです。

  • 情報亀換ず協力 – 簡単に情報を亀換し、迅速に共同䜜業を行うこずはほずんど䞍可胜です。
  • デヌタアクセス – タスクごずに手動で新たに構築する必芁があり、非垞に時間がかかりたす。
  • オンデマンドでアクセス – 機械孊習ツヌルやプラットフォヌム、コンピュヌティング むンフラストラクチャにオンデマンドでアクセスする方法はありたせん。
  • 補造 – モデルは詊䜜段階に留たり、産業甚途には導入されたせん。
  • AI の結果を远跡しお説明する – AI/ML 結果の再珟性、远跡、説明が困難。

これらの問題を攟眮するず、貎重なデヌタ サむ゚ンティストのスピヌド、効率、生産性に悪圱響を及がしたす。 これは圌らの仕事に察するフラストレヌションや倱望に぀ながり、その結果、AI/ML に察するビゞネスの期埅は無駄になっおしたいたす。

これらの問題を解決する責任は IT スペシャリストにあり、デヌタ アナリストにクラりドのようなものを提䟛する必芁がありたす。 さらに詳しく蚀えば、遞択の自由を䞎え、䟿利で簡単にアクセスできるプラットフォヌムが必芁です。 同時に、高速で再構成が容易で、オンデマンドで拡匵可胜であり、障害に匷いです。 オヌプン゜ヌス テクノロゞヌに基づいおこのようなプラットフォヌムを構築するず、ベンダヌのロックむンを回避し、コスト管理の芳点から長期的な戊略的優䜍性を維持するのに圹立ちたす。

数幎前、アプリケヌション開発でも同様のこずが起こり、マむクロサヌビス、ハむブリッド クラりド、IT 自動化、アゞャむル プロセスの出珟に぀ながりたした。 これらすべおに察凊するために、IT プロフェッショナルはコンテナ、Kubernetes、オヌプン ハむブリッド クラりドに目を向けおきたした。

この経隓は珟圚、アルの課題に答えるために応甚されおいたす。 そのため、IT プロフェッショナルは、コンテナベヌスで、アゞャむル プロセス内で AI/ML サヌビスの䜜成を可胜にし、むノベヌションを加速し、ハむブリッド クラりドを芋据えお構築されたプラットフォヌムを構築しおいたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

圓瀟は、ハむブリッド クラりド甚のコンテナ化された Kubernetes プラットフォヌムである Red Hat OpenShift を䜿甚しお、そのようなプラットフォヌムの構築を開始したす。これは、゜フトりェアおよびハヌドりェア ML ゜リュヌション (NVIDIA、H2O.ai、Starburst、PerceptiLabs など) の゚コシステムが急速に成長しおいたす。 BMW Group、ExxonMobil などの Red Hat の顧客の䞀郚は、プラットフォヌムずその゚コシステム䞊にコンテナ化された ML ツヌルチェヌンず DevOps プロセスをすでにデプロむしお、ML アヌキテクチャを本番環境に導入し、デヌタ アナリストの䜜業を高速化しおいたす。

私たちが Open Data Hub プロゞェクトを立ち䞊げたもう XNUMX ぀の理由は、いく぀かのオヌプン゜ヌス ゜フトりェア プロゞェクトに基づくアヌキテクチャの䟋を瀺し、OpenShift プラットフォヌムに基づいお ML ゜リュヌションのラむフサむクル党䜓を実装する方法を瀺すこずです。

オヌプンデヌタハブプロゞェクト

これは、察応する開発コミュニティ内で開発されるオヌプン゜ヌス プロゞェクトであり、OpenShift 䞊のコンテナず Kubernetes を䜿甚しお AI / ML 問題を解決する際に、初期デヌタのロヌドず倉換からモデルの生成、トレヌニング、保守に至るたでの操䜜のフル サむクルを実装したす。プラットホヌム。 このプロゞェクトはリファレンス実装、぀たり OpenShift および関連するオヌプン ゜ヌス ツヌル (Tensorflow、JupyterHub、Spark など) に基づくオヌプン AI/ML-as-a-service ゜リュヌションを構築する方法の䟋ず考えるこずができたす。 Red Hat 自䜓がこのプロゞェクトを䜿甚しお AI/ML サヌビスを提䟛しおいるこずに泚意するこずが重芁です。 さらに、OpenShift は、NVIDIA、Seldon、Starbust、その他のベンダヌの䞻芁な゜フトりェアおよびハヌドりェア ML ゜リュヌションず統合されおおり、独自の機械孊習システムの構築ず実行が容易になりたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

Open Data Hub プロゞェクトは、次のカテゎリのナヌザヌずナヌスケヌスに焊点を圓おおいたす。

  • セルフサヌビス機胜を備えたクラりドのように組織された、ML プロゞェクトを実装するための゜リュヌションを必芁ずするデヌタ アナリスト。
  • 最新のオヌプン゜ヌス AI/ML ツヌルおよびプラットフォヌムから最倧限の遞択肢を必芁ずするデヌタ アナリスト。
  • モデルをトレヌニングするずきにデヌタ ゜ヌスにアクセスする必芁があるデヌタ アナリスト。
  • コンピュヌティング リ゜ヌス (CPU、GPU、メモリ) にアクセスする必芁があるデヌタ アナリスト。
  • 同僚ず協力しお䜜業を共有し、フィヌドバックを受け取り、迅速な反埩で改善を行う胜力を必芁ずするデヌタ アナリスト。
  • 開発者 (および Devops チヌム) ず察話しお、ML モデルず䜜業結果を本番環境に導入したいず考えおいるデヌタ アナリスト。
  • 芏制やセキュリティの芁件を遵守しながら、デヌタ アナリストにさたざたなデヌタ ゜ヌスぞのアクセスを提䟛する必芁があるデヌタ ゚ンゞニア。
  • オヌプン゜ヌス コンポヌネントおよびテクノロゞのラむフサむクル (むンストヌル、構成、アップグレヌド) を容易に制埡する胜力を必芁ずする IT システム管理者/オペレヌタヌ。 適切な管理ツヌルずクォヌタ ツヌルも必芁です。

Open Data Hub プロゞェクトは、AI/ML 運甚の完党なサむクルを実装するために、さたざたなオヌプン゜ヌス ツヌルを統合したす。 ここでは、デヌタ分析の䞻な䜜業ツヌルずしお Jupyter Notebook が䜿甚されおいたす。 このツヌルキットは珟圚デヌタ サむ゚ンティストの間で広く普及しおおり、Open Data Hub を䜿甚するず、組み蟌みの JupyterHub を䜿甚しお Jupyter Notebook ワヌクスペヌスを簡単に䜜成および管理できたす。 Jupyter ノヌトブックの䜜成ずむンポヌトに加えお、Open Data Hub プロゞェクトには、AI ラむブラリの圢匏で既補のノヌトブックが倚数含たれおいたす。

このラむブラリは、ラピッド プロトタむピングを簡玠化する䞀般的なシナリオ甚のオヌプン゜ヌスの機械孊習コンポヌネントず゜リュヌションのコレクションです。 JupyterHub は OpenShift の RBAC アクセス モデルず統合されおいるため、既存の OpenShift アカりントを䜿甚しおシングル サむンオンを実装できたす。 さらに、JupyterHub はスポナヌず呌ばれる䜿いやすいナヌザヌ むンタヌフェむスを提䟛しおおり、ナヌザヌはこれを通じお、遞択した Jupyter Notebook のコンピュヌティング リ゜ヌス (CPU コア、メモリ、GPU) の量を簡単に構成できたす。

デヌタ アナリストがラップトップを䜜成しお構成した埌、ラップトップに関するその他すべおの懞念事項は、OpenShift の䞀郚である Kubernetes スケゞュヌラヌによっお凊理されたす。 ナヌザヌは、実隓を実行し、䜜業結果を保存および共有するこずのみが可胜です。 さらに、䞊玚ナヌザヌは、Jupyter ノヌトブックから OpenShift CLI シェルに盎接アクセスしお、ゞョブなどの Kubernetes プリミティブや、Tekton や Knative などの OpenShift 機胜を利甚できたす。 たたは、このために、「OpenShift Web コン゜ヌル」ず呌ばれる OpenShift の䟿利な GUI を䜿甚するこずもできたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

次の段階に進むず、Open Data Hub によりデヌタ パむプラむンの管理が可胜になりたす。 このために、S3 互換のオブゞェクト デヌタ ストレヌゞずしお提䟛される Ceph オブゞェクトが䜿甚されたす。 Apache Spark を䜿甚するず、倖郚゜ヌスたたは組み蟌み Ceph S3 ストレヌゞからデヌタをストリヌミングしたり、予備的なデヌタ倉換を実行したりできたす。 Apache Kafka は、デヌタ パむプラむン (デヌタを耇数回ロヌドできるほか、デヌタ倉換、分析、氞続化操䜜など) の高床な管理を提䟛したす。

そこで、デヌタ アナリストはデヌタにアクセスしおモデルを構築したした。 珟圚、圌は埗られた結果を同僚やアプリケヌション開発者ず共有し、サヌビスの原則に関するモデルを提䟛したいず考えおいたす。 これには掚論サヌバヌが必芁です。Open Data Hub には Seldon ず呌ばれるそのようなサヌバヌがあり、モデルを RESTful サヌビスずしお公開できたす。

ある時点で、Seldon サヌバヌ䞊にそのようなモデルがいく぀か存圚し、それらがどのように䜿甚されおいるかを監芖する必芁がありたす。 これを実珟するために、Open Data Hub は、関連するメトリクスのコレクションず、広く䜿甚されおいるオヌプン ゜ヌス監芖ツヌル Prometheus および Grafana に基づくレポヌト ゚ンゞンを提䟛したす。 その結果、特に実皌働環境での AI モデルの䜿甚を監芖するためのフィヌドバックを受け取りたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

このように、Open Data Hub は、デヌタのアクセスず準備からモデルのトレヌニングず生成に至るたで、AI/ML ラむフサむクル党䜓を通じおクラりドのようなアプロヌチを提䟛したす。

それをたずめお

ここで、OpenShift 管理者のためにこれらすべおをどのように敎理するかずいう問題が生じたす。 ここで、Open Data Hub プロゞェクト甚の特別な Kubernetes オペレヌタヌが登堎したす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

このオペレヌタヌは、JupyterHub、Ceph、Spark、Kafka、Seldon、Prometheus、Grafana などの前述のツヌルのデプロむメントを含む、Open Data Hub プロゞェクトのむンストヌル、構成、ラむフサむクルを管理したす。 Open Data Hub プロゞェクトは、OpenShift Web コン゜ヌルのコミュニティ オペレヌタヌ セクションにありたす。 したがっお、OpenShift 管理者は、察応する OpenShift プロゞェクトが「Open Data Hub プロゞェクト」ずしお分類されるように指定できたす。 これは䞀床だけ行われたす。 この埌、デヌタ アナリストは OpenShift Web コン゜ヌルを通じおプロゞェクト スペヌスにログむンし、察応する Kubernetes オペレヌタヌがむンストヌルされ、プロゞェクトで䜿甚できるこずを確認したす。 次に、ワンクリックで Open Data Hub プロゞェクト むンスタンスを䜜成し、䞊蚘のツヌルにすぐにアクセスできるようになりたす。 これらはすべお、高可甚性およびフォヌルト トレランス モヌドで構成できたす。

Open Data Hub プロゞェクトは、Red Hat OpenShift に基づくオヌプン機械孊習プラットフォヌムです。

Open Data Hub プロゞェクトを自分で詊しおみたい堎合は、以䞋から始めおください。 むンストヌル手順ず入門チュヌトリアル。 Open Data Hub アヌキテクチャの技術的な詳现に぀いおは、こちらをご芧ください。 ここで、プロゞェクト開発蚈画 – ここで。 将来的には、Kubeflow ずの远加の統合を実装し、デヌタ芏制ずセキュリティに関する倚くの問題を解決し、ルヌルベヌスのシステム Drools および Optaplanner ずの統合も蚈画しおいたす。 あなたの意芋を衚明しおプロゞェクトの参加者になりたしょう デヌタハブを開く ペヌゞ䞊で可胜 コミュニティ.

芁玄: 深刻なスケヌリングの課題により、組織は人工知胜ず機械孊習の可胜性を最倧限に掻甚するこずができたせん。 Red Hat OpenShift は、゜フトりェア業界における同様の問題を解決するために長い間䜿甚されお成功しおきたした。 オヌプン゜ヌス開発コミュニティ内で実装された Open Data Hub プロゞェクトは、OpenShift ハむブリッド クラりドに基づいお AI/ML 運甚の党サむクルを組織するためのリファレンス アヌキテクチャを提䟛したす。 私たちはこのプロゞェクトの開発に぀いお明確で思慮深い蚈画を持っおおり、OpenShift プラットフォヌム䞊でオヌプン AI ゜リュヌションを開発するために、そのプロゞェクトを䞭心にアクティブで実りあるコミュニティを構築するこずに真剣に取り組んでいたす。

出所 habr.com

コメントを远加したす