JetBrainsはモデルをオープンしました メルム2ソフトウェア開発用AIツールでの使用を目的として設計されています。このモデルはライセンスに基づいて公開されています。 Apacheの2.0重みデータはHugging Faceで入手可能です。JetBrainsは、Mellum2はゼロからトレーニングされており、マルチモーダルタスク向けではなく、テキストとコードを扱うための設計になっていることを強調しています。具体的には、リクエストルーティング、RAGパイプライン、要約、補助エージェント、および企業インフラ内でのプライベートデプロイメントなどです。
Mellum2は、 専門家の混合総面積は 12億のパラメータ トークン1つにつき、有効化されるのは約1000個のみです。 2.5億のパラメータこれにより、推論時の計算コストとレイテンシが削減されるはずです。JetBrainsによると、このモデルのベンチマーク性能は同規模のオープンソースモデルと同等ですが、推論速度は2倍以上向上しています。
JetBrainsは、Mellum2を、当初コード補完のために開発されたオリジナルのMellumモデルの進化版と位置付けています。新バージョンでは、プログラムコードと自然言語の両方を扱う必要のある、より幅広いタスクに対応できるようになりました。同社はMellum2を「特化型」モデルとして位置付けており、大規模な汎用言語モデル(LLM)の代替となるものではなく、複雑なAIシステムにおける頻繁な中間処理のための、高速で専門的なコンポーネントであるとしています。
提案されているユースケースには以下のようなものがある。 と呼ばれる モデルとツール間のリクエストの分類とルーティング、RAGシステムにおけるコンテキストの圧縮と処理、エージェントのためのデータの準備、スケジューリング、中間結果の検証、およびソースコードや内部データを外部APIに送信できない環境でのローカル実行。
抱きしめる顔について 出版された コレクション メルム2これには、Thinking、Instruct、Thinking-SFT、Instruct-SFT、Base、Base-Pretrainといった複数のモデルバリアントが含まれます。これらのモデルは、Apache 2.0ライセンスの下、Safetensors形式で配布されます。
Transformers、vLLM、SGLang、およびDocker Model Runnerを使用した起動例が提供されています。
技術的にさらに興味深いのは、新たなオープンソースモデルの出現ではなく、JetBrainsが選んだニッチ市場だ。同社は、最大規模の汎用モデルとの競争に注力するのではなく、IDE、社内アシスタント、企業向けRAGシステム、エージェントパイプラインに直接統合できる、低コストで高速なコンポーネントに重点を置いている。開発者や企業にとって、これはコード、データ、推論コストを管理しながら、AIロジックの一部をローカルまたは自社サーバー上で実行できることを意味する。
出所: linux.org.ru




