JetBrains opnar Mellum2, MoE líkan fyrir hraðvirkar gervigreindarsviðsmyndir í þróun









JetBrains hefur opnað líkan Mellum2, hannað til notkunar í gervigreindartólum fyrir hugbúnaðarþróun. Líkanið er gefið út með leyfi Apache 2.0Þyngdin er aðgengileg á Hugging Face. JetBrains leggur áherslu á að Mellum2 var þjálfað frá grunni og er ekki hannað fyrir fjölþætt verkefni, heldur til að vinna með texta og kóða: beiðnaleiðsögn, RAG-leiðir, samantekt, hjálparforrit og einkauppsetning í innviðum fyrirtækisins.

Mellum2 er byggt á arkitektúrnum Blanda af sérfræðingumMeð heildarstærð upp á 12 milljarðar breytur Aðeins um 1000 eru virkjaðir á hvert tákn 2.5 milljarðar breytur, sem ætti að draga úr útreikningskostnaði og seinkun við ályktun. Samkvæmt JetBrains er viðmiðunarafköst líkansins sambærileg við opin hugbúnaðarlíkön af svipaðri stærð, en skilar meira en tvöföldum hraða við ályktun.

JetBrains lýsir Mellum2 sem þróun upprunalegu Mellum líkansins, sem upphaflega var búið til fyrir kóðun. Nýja útgáfan nær yfir breiðari flokk verkefna sem krefjast vinnu með bæði forritunarkóða og náttúrulegt tungumál. Fyrirtækið setur Mellum2 fram sem „markvissa“ líkan - ekki í stað stórra, almennra LLM-kerfa, heldur sem hraðan, sérhæfðan íhlut fyrir tíðar millistigsaðgerðir innan flókinna gervigreindarkerfa.

Meðal fyrirhugaðra notkunartilvika eru eru kölluð Flokkun og leiðsögn beiðna milli líkana og tækja, þjöppun og vinnsla samhengis í RAG kerfum, undirbúningur gagna fyrir umboðsmenn, áætlanagerð, staðfesting á milliniðurstöðum og staðbundin keyrsla í umhverfum þar sem ekki er hægt að senda frumkóða eða innri gögn til ytri API.

Á faðmandi andliti birt safn Mellum 2, sem inniheldur nokkrar líkanafbrigði: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base og Base-Pretrain. Líkönin eru dreift í Safetensors sniði undir Apache 2.0 leyfinu.
Dæmi um notkun í gegnum Transformers, vLLM, SGLang og Docker Model Runner eru gefin fyrir ræsingu.

Það sem er tæknilega áhugaverðara er ekki tilkoma enn einnar opinnar hugbúnaðarlíkans, heldur sá sérstaða sem JetBrains hefur valið. Fyrirtækið einbeitir sér ekki að því að keppa við stærstu almennu gerðirnar, heldur að ódýrum og hraðvirkum íhlutum sem hægt er að samþætta beint í IDE, innri aðstoðarmenn, RAG-kerfi fyrirtækja og umboðsmannakerfi. Fyrir forritara og fyrirtæki þýðir þetta möguleikann á að keyra einhverja gervigreindarrökfræði staðbundið eða á eigin netþjónum, en samt sem áður viðhalda stjórn á kóða, gögnum og ályktunarkostnaði.

Heimild: linux.org.ru

Kauptu áreiðanlega hýsingu fyrir síður með DDoS vernd, VPS VDS netþjónum 🔥 Kauptu áreiðanlega vefhýsingu með DDoS vörn, VPS VDS netþjónum | ProHoster