JetBrains відкрила Mellum2 - MoE-модель для швидких AI-сценаріїв у розробці









Компанія JetBrains відкрила модель Mellum2, призначену для використання в AI-інструментах розробки ПЗ. Модель опублікована під ліцензією Apache 2.0, ваги доступні Hugging Face. У JetBrains підкреслюють, що Mellum2 навчалася з нуля і розрахована не на мультимодальні завдання, а на роботу з текстом та кодом: маршрутизацію запитів, RAG-конвеєри, сумаризацію, допоміжних агентів та приватне розгортання в інфраструктурі компаній.

Mellum2 побудована за архітектурою Суміш-експертів. При загальному розмірі 12 млрд параметрів на кожен токен активується тільки близько 2.5 млрд параметрівщо має знижувати обчислювальні витрати та затримки при інференсі. За твердженням JetBrains, за продуктивністю на бенчмарках модель можна порівняти з відкритими моделями близького розміру, але забезпечує більш ніж дворазове прискорення інференсу.

У JetBrains називають Mellum2 розвитком першої моделі Mellum, яка спочатку створювалася для автодоповнення коду. Нова версія розширена до ширшого класу завдань, де потрібно працювати як із програмним кодом, так і з природною мовою. Компанія позиціонує Mellum2 як "фокусну" модель - не заміну великим універсальним LLM, а швидкий спеціалізований компонент для частих проміжних операцій усередині складних AI-систем.

Серед передбачуваних сценаріїв використання називаються класифікація та маршрутизація запитів між моделями та інструментами, стиснення та обробка контексту в RAG-системах, підготовка даних для агентів, планування, перевірка проміжних результатів та локальний запуск у середовищах, де не можна надсилати вихідний код або внутрішні дані у зовнішні API.

На Hugging Face опубліковано колекція Mellum 2, Що включає кілька варіантів моделі: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base та Base-Pretrain. Моделі розповсюджуються у форматі Safetensors за ліцензією Apache 2.0.
Для запуску наведено приклади використання через Transformers, vLLM, SGLang та Docker Model Runner.

Технічно цікавішим виглядає не сам факт появи чергової відкритої моделі для коду, а обрана JetBrains ніша. Компанія робить ставку не на конкуренцію з найбільшими універсальними моделями, а на дешеві та швидкі компоненти, які можна вбудувати прямо в IDE, внутрішні помічники, корпоративні RAG-системи та агентні конвеєри. Для розробників та компаній це означає можливість запускати частину AI-логіки локально або на власних серверах, зберігаючи контроль над кодом, даними та вартістю інференсу.

Джерело: linux.org.ru

Купити надійний хостинг для сайтів із захистом від DDoS, VPS VDS сервери 🔥 Купити надійний хостинг для сайтів із захистом від DDoS, VPS VDS сервери | ProHoster