JetBrains-ը բացել է մոդել Մելում2, որը նախատեսված է ծրագրային ապահովման մշակման համար արհեստական բանականության գործիքներում օգտագործելու համար։ Մոդելը հրապարակվում է լիցենզիայի ներքո։ Apache 2.0Կշիռները հասանելի են Hugging Face-ում: JetBrains-ը ընդգծում է, որ Mellum2-ը մարզվել է զրոյից և նախատեսված է ոչ թե բազմամոդալ առաջադրանքների, այլ տեքստի և կոդի հետ աշխատելու համար՝ հարցումների ուղղորդում, RAG խողովակաշարեր, ամփոփում, օժանդակ գործակալներ և ընկերության ենթակառուցվածքներում մասնավոր տեղակայում:
Mellum2-ը կառուցված է ճարտարապետության վրա Փորձագետների խառնուրդԸնդհանուր չափսերով՝ 12 միլիարդ պարամետր Յուրաքանչյուր թոքենի համար ակտիվանում է ընդամենը մոտ 1000 թոքեն 2.5 միլիարդ պարամետր, որը պետք է նվազեցնի հաշվողական ծախսերը և եզրակացության ընթացքում լատենտությունը: JetBrains-ի տվյալներով՝ մոդելի չափանիշային կատարողականությունը համեմատելի է նմանատիպ չափի բաց կոդով մոդելների հետ, բայց ապահովում է եզրակացության արագության կրկնակիից ավելի արագություն:
JetBrains-ը Mellum2-ը նկարագրում է որպես Mellum մոդելի էվոլյուցիա, որը սկզբնապես ստեղծվել էր կոդի լրացման համար: Նոր տարբերակը ընդլայնվում է և ներառում է առաջադրանքների ավելի լայն դաս, որոնք պահանջում են աշխատանք և՛ ծրագրային կոդի, և՛ բնական լեզվի հետ: Ընկերությունը Mellum2-ը ներկայացնում է որպես «կենտրոնացված» մոդել՝ ոչ թե մեծ, ընդհանուր նշանակության LLM-ների փոխարինող, այլ արագ, մասնագիտացված բաղադրիչ բարդ արհեստական ինտելեկտի համակարգերում հաճախակի միջանկյալ գործողությունների համար:
Առաջարկվող օգտագործման դեպքերի շարքում են՝ կոչվում են Հարցումների դասակարգում և ուղղորդում մոդելների և գործիքների միջև, համատեքստի սեղմում և մշակում RAG համակարգերում, տվյալների պատրաստում գործակալների համար, ժամանակացույց կազմել, միջանկյալ արդյունքների վավերացում և տեղական կատարում այն միջավայրերում, որտեղ հնարավոր չէ ելակետային կոդը կամ ներքին տվյալները ուղարկել արտաքին API-ներին։
Գրկախառնվող դեմքի վրա հրատարակված հավաքածու Մելում 2, որը ներառում է մոդելի մի քանի տարբերակներ՝ Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base և Base-Pretrain: Մոդելները տարածվում են Safetensors ձևաչափով՝ Apache 2.0 լիցենզիայի ներքո:
Տրված են Transformers, vLLM, SGLang և Docker Model Runner ծրագրերի գործարկման օրինակներ։
Տեխնիկապես ավելի հետաքրքիրը ոչ թե ևս մեկ բաց կոդով մոդելի ի հայտ գալն է, այլ JetBrains-ի ընտրած խորշը: Ընկերությունը չի կենտրոնանում խոշորագույն ընդհանուր նշանակության մոդելների հետ մրցակցելու վրա, այլ ցածրարժեք և արագ բաղադրիչների վրա, որոնք կարող են անմիջապես ինտեգրվել IDE-ների, ներքին օգնականների, կորպորատիվ RAG համակարգերի և գործակալների խողովակաշարերի մեջ: Մշակողների և ընկերությունների համար սա նշանակում է որոշակի արհեստական բանականության տրամաբանություն տեղական կամ սեփական սերվերների վրա աշխատեցնելու հնարավորություն՝ միաժամանակ պահպանելով կոդի, տվյալների և եզրակացությունների ծախսերի վերահսկողությունը:
Source: linux.org.ru




