JetBrains tezkor sun'iy intellekt ssenariylarini ishlab chiqish uchun MoE modeli bo'lgan Mellum2 ni ochdi









JetBrains modelini ochdi Mellum2, dasturiy ta'minotni ishlab chiqish uchun AI vositalarida foydalanish uchun mo'ljallangan. Model litsenziya asosida nashr etilgan. Apache 2.0Og'irliklar Hugging Face’da mavjud. JetBrains Mellum2 noldan boshlab o'qitilganligini va multimodal vazifalar uchun emas, balki matn va kod bilan ishlash uchun mo'ljallanganligini ta'kidlaydi: so'rovlarni marshrutizatsiya qilish, RAG quvurlari, umumlashtirish, yordamchi agentlar va kompaniya infratuzilmasida shaxsiy joylashtirish.

Mellum2 arxitektura asosida qurilgan Mutaxassislar aralashmasiUmumiy hajmi bilan 12 milliard parametr Har bir token uchun atigi 1000 ta faollashtirilgan 2.5 milliard parametr, bu hisoblash xarajatlarini va xulosa chiqarish vaqtidagi kechikishni kamaytirishi kerak. JetBrains ma'lumotlariga ko'ra, modelning etalon ishlashi shunga o'xshash o'lchamdagi ochiq kodli modellar bilan taqqoslanadi, ammo xulosa chiqarish tezligidan ikki baravar ko'proqni ta'minlaydi.

JetBrains Mellum2 ni dastlab kodni to'ldirish uchun yaratilgan asl Mellum modelining evolyutsiyasi sifatida ta'riflaydi. Yangi versiya dastur kodi va tabiiy til bilan ishlashni talab qiladigan kengroq vazifalar sinfiga kengayadi. Kompaniya Mellum2 ni "yo'naltirilgan" model sifatida joylashtiradi - bu katta, umumiy maqsadli LLMlarning o'rnini bosuvchi emas, balki murakkab AI tizimlarida tez-tez oraliq operatsiyalar uchun tezkor, ixtisoslashgan komponent.

Taklif qilinayotgan foydalanish holatlari orasida quyidagilar mavjud deyiladi Modellar va vositalar o'rtasida so'rovlarni tasniflash va yo'naltirish, RAG tizimlarida kontekstni siqish va qayta ishlash, agentlar uchun ma'lumotlarni tayyorlash, jadval tuzish, oraliq natijalarni tasdiqlash va manba kodini yoki ichki ma'lumotlarni tashqi API-larga yuborishning iloji bo'lmagan muhitlarda mahalliy bajarish.

Quchoqlash yuzida e'lon qilindi To'plam Mellum 2, bir nechta model variantlarini o'z ichiga oladi: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base va Base-Pretrain. Modellar Safetensors formatida Apache 2.0 litsenziyasi ostida tarqatiladi.
Transformers, vLLM, SGLang va Docker Model Runner orqali foydalanish misollari ishga tushirish uchun keltirilgan.

Texnik jihatdan qiziqarliroq narsa yana bir ochiq kodli modelning paydo bo'lishi emas, balki JetBrains tanlagan yo'nalishdir. Kompaniya eng yirik umumiy maqsadli modellar bilan raqobatlashishga emas, balki to'g'ridan-to'g'ri IDE, ichki yordamchilar, korporativ RAG tizimlari va agent quvurlariga integratsiya qilinishi mumkin bo'lgan arzon va tezkor komponentlarga e'tibor qaratmoqda. Ishlab chiquvchilar va kompaniyalar uchun bu kod, ma'lumotlar va xulosalar xarajatlari ustidan nazoratni saqlab qolgan holda, ba'zi AI mantig'ini mahalliy yoki o'z serverlarida ishga tushirish imkoniyatini anglatadi.

Manba: linux.org.ru

DDoS himoyasi, VPS VDS serverlari bo'lgan saytlar uchun ishonchli hosting sotib oling 🔥 DDoS himoyasi, VPS VDS serverlari bilan ishonchli veb-sayt xostingini sotib oling | ProHoster