JetBrains parantos muka modél Mellum2, dirancang pikeun dianggo dina alat AI pikeun pamekaran parangkat lunak. Modél ieu diterbitkeun dina lisénsi Apache 2.0Beuratna sayogi dina Hugging Face. JetBrains nekenkeun yén Mellum2 dilatih ti mimiti sareng dirancang sanés pikeun tugas multimodal, tapi pikeun damel sareng téks sareng kode: routing pamundut, pipa RAG, summarization, agén bantu, sareng panyebaran pribadi dina infrastruktur perusahaan.
Mellum2 diwangun dumasar kana arsitékturna Campuran-of-AhliKalayan ukuran total 12 milyar parameter Ngan sakitar 1000 anu diaktipkeun per token 2.5 milyar parameter, anu sakuduna ngirangan biaya komputasi sareng latency nalika inferensi. Numutkeun JetBrains, kinerja patokan modél ieu tiasa dibandingkeun sareng modél sumber terbuka anu ukuranana sami, tapi ngahasilkeun langkung ti dua kali lipat percepatan inferensi.
JetBrains ngagambarkeun Mellum2 salaku évolusi tina modél Mellum asli, anu mimitina didamel pikeun ngalengkepan kode. Vérsi anyar ieu ngalegaan ka kelas tugas anu langkung lega anu meryogikeun damel sareng kode program sareng basa alami. Perusahaan nempatkeun Mellum2 salaku modél "fokus" — sanés gaganti pikeun LLM anu ageung sareng tujuan umum, tapi komponén anu gancang sareng khusus pikeun operasi panengah anu sering dina sistem AI anu rumit.
Di antara conto panggunaan anu diusulkeun nyaéta disebut Klasifikasi sareng routing pamundut antara modél sareng alat, komprési sareng pamrosésan kontéks dina sistem RAG, persiapan data pikeun agén, penjadwalan, validasi hasil antara, sareng palaksanaan lokal dina lingkungan dimana teu mungkin pikeun ngirim kode sumber atanapi data internal ka API éksternal.
Dina raray nu keur ngarangkul diterbitkeun koléksi Mellum 2, anu ngawengku sababaraha varian modél: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base, sareng Base-Pretrain. Modél-modél ieu disebarkeun dina format Safetensors dina lisénsi Apache 2.0.
Conto panggunaan via Transformers, vLLM, SGLang, sareng Docker Model Runner disayogikeun pikeun dijalankeun.
Anu langkung pikaresepeun sacara téknis sanés munculna modél sumber terbuka anu sanés, tapi niche anu dipilih ku JetBrains. Perusahaan ieu henteu fokus kana bersaing sareng modél tujuan umum anu panggedéna, tapi kana komponén anu murah sareng gancang anu tiasa diintegrasikeun langsung kana IDE, asisten internal, sistem RAG perusahaan, sareng saluran agén. Pikeun pamekar sareng perusahaan, ieu hartosna kamampuan pikeun ngajalankeun sababaraha logika AI sacara lokal atanapi dina server sorangan, bari ngajaga kontrol kana kode, data, sareng biaya inferensi.
sumber: linux.org.ru




