JetBrains je odprl model Mellum2, zasnovan za uporabo v orodjih umetne inteligence za razvoj programske opreme. Model je objavljen pod licenco Apache 2.0Uteži so na voljo na Hugging Face. JetBrains poudarja, da je bil Mellum2 usposobljen iz nič in ni zasnovan za multimodalne naloge, temveč za delo z besedilom in kodo: usmerjanje zahtev, RAG cevovodi, povzemanje, pomožni agenti in zasebno uvajanje v infrastrukturo podjetja.
Mellum2 je zgrajen na arhitekturi Mešanica strokovnjakovS skupno velikostjo 12 milijarde parametrov Na žeton se aktivira le približno 1000 2.5 milijarde parametrov, kar bi moralo zmanjšati računske stroške in zakasnitev med sklepanjem. Po podatkih JetBrains je uspešnost modela v referenčnih testih primerljiva z odprtokodnimi modeli podobne velikosti, vendar zagotavlja več kot dvakratno hitrost sklepanja.
JetBrains opisuje Mellum2 kot razvoj prvotnega modela Mellum, ki je bil prvotno ustvarjen za dokončanje kode. Nova različica se razširja na širši razred nalog, ki zahtevajo delo tako s programsko kodo kot z naravnim jezikom. Podjetje Mellum2 postavlja kot "osredotočen" model – ne kot nadomestilo za velike, splošne LLM-je, temveč kot hitro, specializirano komponento za pogoste vmesne operacije znotraj kompleksnih sistemov umetne inteligence.
Med predlaganimi primeri uporabe so kličejo Klasifikacija in usmerjanje zahtev med modeli in orodji, stiskanje in obdelava konteksta v RAG sistemih, priprava podatkov za agente, razporejanje, validacija vmesnih rezultatov in lokalno izvajanje v okoljih, kjer ni mogoče poslati izvorne kode ali notranjih podatkov zunanjim API-jem.
Na objemnem obrazu objavljeno zbirka Mellum 2, ki vključuje več različic modela: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base in Base-Pretrain. Modeli so distribuirani v formatu Safetensors pod licenco Apache 2.0.
Za zagon so na voljo primeri uporabe prek Transformerjev, vLLM, SGLang in Docker Model Runner.
Tehnično zanimivejši ni pojav še enega odprtokodnega modela, temveč niša, ki si jo je izbral JetBrains. Podjetje se ne osredotoča na tekmovanje z največjimi modeli splošnega namena, temveč na cenovno ugodne in hitre komponente, ki jih je mogoče neposredno integrirati v integrirana razvojna okolja (IDE), interne asistente, korporativne sisteme RAG in cevovode agentov. Za razvijalce in podjetja to pomeni možnost izvajanja neke logike umetne inteligence lokalno ali na lastnih strežnikih, hkrati pa ohranja nadzor nad stroški kode, podatkov in sklepanja.
Vir: linux.org.ru




