🥇 JetBrains မှ ဖွံ့ဖြိုးတိုးတက်မှုတွင် မြန်ဆန်သော AI အခြေအနေများအတွက် MoE မော်ဒယ်တစ်ခုဖြစ်သည့် Mellum2 ကို ဖွင့်လှစ်

JetBrains က မော်ဒယ်တစ်ခုကို ဖွင့်လှစ်လိုက်ပါပြီ မယ်လမ် ၂ဆော့ဖ်ဝဲလ် ဖွံ့ဖြိုးတိုးတက်ရေးအတွက် AI ကိရိယာများတွင် အသုံးပြုရန် ဒီဇိုင်းထုတ်ထားသည်။ မော်ဒယ်ကို လိုင်စင်အောက်တွင် ထုတ်ဝေထားသည်။ Apache ကို 2.0အလေးချိန်များကို Hugging Face တွင် ရရှိနိုင်ပါသည်။ JetBrains က Mellum2 ကို သုညမှစတင်၍ လေ့ကျင့်သင်ကြားပေးထားပြီး multimodal tasks များအတွက်မဟုတ်ဘဲ စာသားနှင့် code များဖြင့် အလုပ်လုပ်ရန် ဒီဇိုင်းထုတ်ထားခြင်းဖြစ်သည်- request routing၊ RAG pipelines၊ summarization၊ auxiliary agent များနှင့် ကုမ္ပဏီအခြေခံအဆောက်အအုံတွင် private deployment။

Mellum2 ကို ဗိသုကာပညာဖြင့် တည်ဆောက်ထားသည် ရောနှော-ကျွမ်းကျင်ပညာရှင်များစုစုပေါင်းအရွယ်အစားဖြင့် ကန့်သတ်ချက်များ 12 ဘီလီယံ တိုကင်တစ်ခုလျှင် ၁၀၀၀ ခန့်သာ အသက်သွင်းနိုင်သည် ကန့်သတ်ချက်များ 2.5 ဘီလီယံ၊ ၎င်းသည် တွက်ချက်မှုကုန်ကျစရိတ်များနှင့် ကောက်ချက်ချစဉ်အတွင်း နှောင့်နှေးမှုကို လျှော့ချပေးသင့်သည်။ JetBrains ၏ အဆိုအရ မော်ဒယ်၏ benchmark စွမ်းဆောင်ရည်သည် အလားတူအရွယ်အစားရှိသော open-source မော်ဒယ်များနှင့် နှိုင်းယှဉ်နိုင်သော်လည်း ကောက်ချက်ချမှုအမြန်နှုန်းကို နှစ်ဆကျော် ပေးစွမ်းနိုင်သည်။

JetBrains က Mellum2 ကို မူလက ကုဒ်ဖြည့်စွက်ရန်အတွက် ဖန်တီးခဲ့သော မူရင်း Mellum မော်ဒယ်၏ တိုးတက်ပြောင်းလဲမှုတစ်ခုအဖြစ် ဖော်ပြထားသည်။ ဗားရှင်းအသစ်သည် ပရိုဂရမ်ကုဒ်နှင့် သဘာဝဘာသာစကား နှစ်မျိုးလုံးဖြင့် အလုပ်လုပ်ရန် လိုအပ်သည့် ပိုမိုကျယ်ပြန့်သော အလုပ်အမျိုးအစားအထိ တိုးချဲ့ထားသည်။ ကုမ္ပဏီသည် Mellum2 ကို "အာရုံစိုက်ထားသော" မော်ဒယ်တစ်ခုအဖြစ် နေရာချထားသည် - ကြီးမားသော၊ အထွေထွေရည်ရွယ်ချက် LLM များအတွက် အစားထိုးရန်မဟုတ်ဘဲ ရှုပ်ထွေးသော AI စနစ်များအတွင်း မကြာခဏ အလယ်အလတ်လုပ်ဆောင်မှုများအတွက် မြန်ဆန်ပြီး အထူးပြုထားသော အစိတ်အပိုင်းတစ်ခုအဖြစ်။

အဆိုပြုထားသော အသုံးပြုမှုကိစ္စရပ်များထဲတွင် ဟုခေါ်ကြသည် မော်ဒယ်များနှင့်ကိရိယာများအကြား တောင်းဆိုမှုများကို အမျိုးအစားခွဲခြားခြင်းနှင့် လမ်းကြောင်းသတ်မှတ်ခြင်း၊ RAG စနစ်များတွင် နောက်ခံအခြေအနေကို ချုံ့ခြင်းနှင့် လုပ်ဆောင်ခြင်း၊ အေးဂျင့်များအတွက် အချက်အလက်ပြင်ဆင်ခြင်း၊ အချိန်ဇယားဆွဲခြင်း၊ အလယ်အလတ်ရလဒ်များ၏ အတည်ပြုခြင်းနှင့် ပြင်ပ API များသို့ source code သို့မဟုတ် internal data ပေးပို့ရန် မဖြစ်နိုင်သည့်ပတ်ဝန်းကျင်များတွင် ဒေသတွင်းလုပ်ဆောင်ခြင်း။

ဖက်ထားသော မျက်နှာပေါ်တွင် ပုံနှိပ်ထုတ်ဝေ စုဆောင်းမှု မယ်လမ် ၂တွင် မော်ဒယ်မျိုးကွဲများစွာပါဝင်သည်- Thinking၊ Instruct၊ Thinking-SFT၊ Instruct-SFT၊ Base နှင့် Base-Pretrain။ မော်ဒယ်များကို Apache 2.0 လိုင်စင်အောက်တွင် Safetensors ဖော်မတ်ဖြင့် ဖြန့်ဝေထားသည်။
Transformers၊ vLLM၊ SGLang နှင့် Docker Model Runner မှတစ်ဆင့် အသုံးပြုမှု ဥပမာများကို စတင်ရန်အတွက် ပေးထားပါသည်။

နည်းပညာပိုင်းအရ ပိုစိတ်ဝင်စားစရာကောင်းတာက နောက်ထပ် open source မော်ဒယ်တစ်ခု ပေါ်ထွက်လာတာ မဟုတ်ဘဲ JetBrains ရွေးချယ်ခဲ့တဲ့ နယ်ပယ်ပါ။ ကုမ္ပဏီဟာ အကြီးဆုံး အထွေထွေရည်ရွယ်ချက် မော်ဒယ်တွေနဲ့ ယှဉ်ပြိုင်ဖို့ အာရုံစိုက်နေတာ မဟုတ်ဘဲ IDE တွေ၊ internal assistant တွေ၊ corporate RAG system တွေနဲ့ agent pipelines တွေထဲကို တိုက်ရိုက်ပေါင်းစပ်နိုင်တဲ့ ကုန်ကျစရိတ်နည်းပြီး မြန်ဆန်တဲ့ အစိတ်အပိုင်းတွေကို အာရုံစိုက်နေတာပါ။ developer တွေနဲ့ ကုမ္ပဏီတွေအတွက် ဒါက code၊ data နဲ့ inference ကုန်ကျစရိတ်တွေကို ထိန်းချုပ်ထားရင်း AI logic အချို့ကို ဒေသတွင်းမှာ ဒါမှမဟုတ် သူတို့ရဲ့ကိုယ်ပိုင် server တွေမှာ run နိုင်စွမ်းကို ဆိုလိုပါတယ်။

source: linux.org.ru