JetBrains Mellum2-ро, модели MoE барои сенарияҳои зуди зеҳни сунъӣ дар рушд, мекушояд









JetBrains модели худро ифтитоҳ кард Меллум2, барои истифода дар абзорҳои зеҳни сунъӣ барои таҳияи нармафзор тарҳрезӣ шудааст. Модел тибқи иҷозатнома нашр шудааст. Apache 2.0Вазнҳо дар Hugging Face дастрасанд. JetBrains таъкид мекунад, ки Mellum2 аз сифр омӯзонида шудааст ва на барои вазифаҳои мултимодалӣ, балки барои кор бо матн ва рамз тарҳрезӣ шудааст: роҳнамоии дархостҳо, лӯлаҳои RAG, ҷамъбаст, агентҳои ёрирасон ва ҷойгиркунии хусусӣ дар инфрасохтори ширкат.

Mellum2 бар пояи меъморӣ сохта шудааст Омезиши коршиносонБо ҳаҷми умумии 12 миллиард параметр Танҳо тақрибан 1000 токен барои як токен фаъол карда мешаванд 2.5 миллиард параметр, ки бояд хароҷоти ҳисоббарорӣ ва таъхирро ҳангоми хулосабарорӣ кам кунад. Мувофиқи JetBrains, иҷрои нишондиҳандаи модел бо моделҳои кушодаасос бо андозаи монанд қобили муқоиса аст, аммо суръати хулосабарориро беш аз ду баробар зиёд мекунад.

JetBrains Mellum2-ро ҳамчун таҳаввулоти модели аслии Mellum тавсиф мекунад, ки дар аввал барои анҷом додани рамз сохта шуда буд. Нусхаи нав ба синфи васеътари вазифаҳое, ки кор бо ҳам рамзи барнома ва ҳам забони табииро талаб мекунанд, васеъ мешавад. Ширкат Mellum2-ро ҳамчун модели "нигаронидашуда" ҷойгир мекунад - на ивазкунандаи LLM-ҳои калон ва умумӣ, балки як ҷузъи зуд ва махсус барои амалиётҳои зуд-зуд мобайнӣ дар дохили системаҳои мураккаби зеҳни сунъӣ.

Дар байни ҳолатҳои пешниҳодшудаи истифода инҳоянд: даъват карда мешаванд Тасниф ва роҳнамоии дархостҳо байни моделҳо ва абзорҳо, фишурдан ва коркарди контекст дар системаҳои RAG, омода кардани маълумот барои агентҳо, банақшагирӣ, тасдиқи натиҷаҳои мобайнӣ ва иҷрои маҳаллӣ дар муҳитҳое, ки фиристодани рамзи сарчашма ё маълумоти дохилӣ ба API-ҳои беруна имконнопазир аст.

Дар рӯи оғӯш нашр шудааст маҷмӯа Меллум 2, ки якчанд вариантҳои моделро дар бар мегирад: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base ва Base-Pretrain. Моделҳо дар формати Safetensors тибқи иҷозатномаи Apache 2.0 паҳн карда мешаванд.
Намунаҳои истифода тавассути Transformers, vLLM, SGLang ва Docker Model Runner барои оғоз оварда шудаанд.

Чизи аз ҷиҳати техникӣ ҷолибтар пайдоиши як модели дигари кушодаасос нест, балки самти интихобкардаи JetBrains мебошад. Ширкат на ба рақобат бо бузургтарин моделҳои умумӣ, балки ба ҷузъҳои арзон ва зуд, ки метавонанд мустақиман ба IDE, ёварони дохилӣ, системаҳои RAG корпоративӣ ва лӯлаҳои агентӣ муттаҳид карда шаванд, тамаркуз мекунад. Барои таҳиягарон ва ширкатҳо, ин маънои қобилияти иҷрои баъзе мантиқи зеҳни сунъӣ дар маҳал ё дар серверҳои худ ва ҳамзамон нигоҳ доштани назорати рамз, маълумот ва хароҷоти хулосаро дорад.

Манбаъ: linux.org.ru

Хостинги боэътимодро барои сайтҳо бо муҳофизати DDoS, серверҳои VPS VDS харед 🔥 Харидани хостинги боэътимоди вебсайт бо муҳофизати DDoS, серверҳои VPS VDS | ProHoster