Mae JetBrains wedi agor model Mellum2, wedi'i gynllunio i'w ddefnyddio mewn offer AI ar gyfer datblygu meddalwedd. Cyhoeddir y model o dan drwydded Apache 2.0Mae'r pwysau ar gael ar Hugging Face. Mae JetBrains yn pwysleisio bod Mellum2 wedi'i hyfforddi o'r dechrau ac wedi'i gynllunio nid ar gyfer tasgau amlfoddol, ond ar gyfer gweithio gyda thestun a chod: llwybro ceisiadau, piblinellau RAG, crynhoi, asiantau ategol, a defnyddio preifat yn seilwaith y cwmni.
Mae Mellum2 wedi'i adeiladu ar y bensaernïaeth Cymysgedd-o-ArbenigwyrGyda chyfanswm maint o 12 biliwn o baramedrau Dim ond tua 1000 sy'n cael eu actifadu fesul tocyn 2.5 biliwn o baramedrau, a ddylai leihau costau cyfrifiadurol ac oedi yn ystod casgliad. Yn ôl JetBrains, mae perfformiad meincnod y model yn gymharol â modelau ffynhonnell agored o faint tebyg, ond mae'n darparu mwy na dwbl y cyflymder casglu.
Mae JetBrains yn disgrifio Mellum2 fel esblygiad o'r model Mellum gwreiddiol, a grëwyd yn wreiddiol ar gyfer cwblhau cod. Mae'r fersiwn newydd yn ehangu i ddosbarth ehangach o dasgau sy'n gofyn am weithio gyda chod rhaglen ac iaith naturiol. Mae'r cwmni'n gosod Mellum2 fel model "canolbwyntiedig"—nid yn lle LLMs mawr, at ddibenion cyffredinol, ond yn gydran gyflym, arbenigol ar gyfer gweithrediadau canolradd mynych o fewn systemau AI cymhleth.
Ymhlith yr achosion defnydd arfaethedig mae yn cael eu galw Dosbarthu a llwybro ceisiadau rhwng modelau ac offer, cywasgu a phrosesu cyd-destun mewn systemau RAG, paratoi data ar gyfer asiantau, amserlennu, dilysu canlyniadau canolradd, a gweithredu lleol mewn amgylcheddau lle nad yw'n bosibl anfon cod ffynhonnell na data mewnol i APIs allanol.
Ar Wyneb Cofleidio cyhoeddwyd casgliad Mellum 2, sy'n cynnwys sawl amrywiad model: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base, a Base-Pretrain. Mae'r modelau wedi'u dosbarthu yn y fformat Safetensors o dan drwydded Apache 2.0.
Darperir enghreifftiau o ddefnydd trwy Transformers, vLLM, SGLang, a Docker Model Runner ar gyfer lansio.
Yr hyn sy'n fwy diddorol yn dechnegol yw nid ymddangosiad model ffynhonnell agored arall, ond y niche y mae JetBrains wedi'i ddewis. Nid yw'r cwmni'n canolbwyntio ar gystadlu â'r modelau pwrpas cyffredinol mwyaf, ond ar gydrannau cost isel a chyflym y gellir eu hintegreiddio'n uniongyrchol i IDEs, cynorthwywyr mewnol, systemau RAG corfforaethol, a phiblinellau asiantau. I ddatblygwyr a chwmnïau, mae hyn yn golygu'r gallu i redeg rhywfaint o resymeg AI yn lleol neu ar eu gweinyddion eu hunain, gan gynnal rheolaeth dros y cod, y data, a chostau casglu.
Ffynhonnell: linux.org.ru




