JetBrains, Sürətli Süni İntellekt Ssenariləri üçün MoE Modeli olan Mellum2-ni Açır









JetBrains bir model təqdim etdi Mellum2, proqram təminatının hazırlanması üçün süni intellekt alətlərində istifadə üçün nəzərdə tutulmuşdur. Model lisenziya altında dərc olunub Apache 2.0Çəkilər Hugging Face-də mövcuddur. JetBrains vurğulayır ki, Mellum2 sıfırdan öyrədilib və multimodal tapşırıqlar üçün deyil, mətn və kodla işləmək üçün nəzərdə tutulub: sorğu marşrutlaşdırması, RAG boru kəmərləri, xülasə, köməkçi agentlər və şirkət infrastrukturunda özəl yerləşdirmə.

Mellum2 arxitektura üzərində qurulub Ekspertlərin QarışığıÜmumi ölçüsü ilə 12 milyard parametr Hər token üçün yalnız 1000-ə yaxın aktivləşdirilir 2.5 milyard parametr, bu da hesablama xərclərini və nəticə çıxarma zamanı gecikməni azaltmalıdır. JetBrains-ə görə, modelin etalon performansı oxşar ölçülü açıq mənbəli modellərlə müqayisə edilə bilər, lakin nəticə çıxarma sürətini ikiqatdan çox təmin edir.

JetBrains, Mellum2-ni əvvəlcə kod tamamlama üçün yaradılmış orijinal Mellum modelinin təkamülü kimi təsvir edir. Yeni versiya həm proqram kodu, həm də təbii dil ilə işləməyi tələb edən daha geniş tapşırıq sinfinə qədər genişlənir. Şirkət Mellum2-ni "fokuslanmış" model kimi təqdim edir - böyük, ümumi təyinatlı LLM-lərin əvəzi deyil, mürəkkəb süni intellekt sistemləri daxilində tez-tez ara əməliyyatlar üçün sürətli, ixtisaslaşmış bir komponent.

Təklif olunan istifadə halları arasında bunlar var çağırılır Modellər və alətlər arasında sorğuların təsnifatı və yönləndirilməsi, RAG sistemlərində kontekstin sıxılması və işlənməsi, agentlər üçün məlumatların hazırlanması, cədvəlləşdirmə, aralıq nəticələrin təsdiqlənməsi və mənbə kodunun və ya daxili məlumatların xarici API-lərə göndərilməsinin mümkün olmadığı mühitlərdə yerli icra.

Qucaqlaşan Üzdə nəşr olundu bir kolleksiya Mellum 2, bir neçə model variantını əhatə edir: Thinking, Instruct, Thinking-SFT, Instruct-SFT, Base və Base-Pretrain. Modellər Apache 2.0 lisenziyası altında Safetensors formatında paylanır.
Transformers, vLLM, SGLang və Docker Model Runner vasitəsilə istifadə nümunələri işə salınmaq üçün təqdim olunur.

Texniki cəhətdən daha maraqlı olan başqa bir açıq mənbə modelinin ortaya çıxması deyil, JetBrains-in seçdiyi nişdir. Şirkət ən böyük ümumi təyinatlı modellərlə rəqabət aparmağa deyil, birbaşa IDE-lərə, daxili köməkçilərə, korporativ RAG sistemlərinə və agent boru kəmərlərinə inteqrasiya edilə bilən aşağı qiymətli və sürətli komponentlərə diqqət yetirir. Tərtibatçılar və şirkətlər üçün bu, kod, məlumatlar və nəticə çıxarma xərcləri üzərində nəzarəti saxlayarkən bəzi süni intellekt məntiqini yerli və ya öz serverlərində işlətmək imkanı deməkdir.

Mənbə: linux.org.ru

DDoS mühafizəsi, VPS VDS serverləri olan saytlar üçün etibarlı hostinq alın 🔥 DDoS qorunması, VPS VDS serverləri ilə etibarlı veb sayt hostinqi alın | ProHoster