chatbots တည်ဆောက်ခြင်းအတွက် ကိရိယာအစုံဖြစ်သော OpenChatKit ကို ထုတ်ဝေခဲ့သည်။

အထူးပြုနှင့် အထွေထွေအပလီကေးရှင်းများအတွက် chatbots ဖန်တီးမှုကို ရိုးရှင်းစေရန် ရည်ရွယ်၍ OpenChatKit ၏ open toolkit ကို မိတ်ဆက်ခဲ့သည်။ မေးခွန်းများဖြေဆိုခြင်း၊ ဇာတ်ခုံပေါင်းများစွာ ဆွေးနွေးမှုများပြုလုပ်ခြင်း၊ အကျဉ်းချုပ်ခြင်း၊ အချက်အလက်ထုတ်နုတ်ခြင်း၊ စာသားအမျိုးအစားခွဲခြားခြင်းစသည့် လုပ်ငန်းတာဝန်များကို လုပ်ဆောင်ရန် စနစ်အား လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်ထားသည်။ ကုဒ်ကို Python ဖြင့်ရေးသားထားပြီး Apache 2.0 လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။ ပရောဂျက်တွင် အဆင်သင့်လုပ်ထားသော မော်ဒယ်၊ သင့်မော်ဒယ်ကို လေ့ကျင့်ရန် ကုဒ်၊ မော်ဒယ်၏ ရလဒ်များကို စမ်းသပ်ရန် အသုံးဝင်မှုများ၊ ပြင်ပအညွှန်းမှ အကြောင်းအရာတစ်ခုဖြင့် မော်ဒယ်ကို ဖြည့်စွက်ရန်နှင့် သင့်ကိုယ်ပိုင်ပြဿနာများကို ဖြေရှင်းရန်အတွက် အခြေခံမော်ဒယ်ကို လိုက်လျောညီထွေဖြစ်အောင် လုပ်ဆောင်ရန် ပရောဂျက်တွင် ပါဝင်သည်။

ဘော့တ်သည် အခြေခံ စက်သင်ယူမှုပုံစံ (GPT-NeoXT-Chat-Base-20B) ကို အခြေခံထားပြီး ကန့်သတ်ဘောင်ပေါင်း 20 ဘီလီယံခန့်ကို လွှမ်းခြုံထားသော ဘာသာစကားမော်ဒယ်ကို အသုံးပြု၍ တည်ဆောက်ထားပြီး စကားပြောဆိုဆက်ဆံရေးအတွက် အကောင်းဆုံးဖြစ်သည်။ LAION၊ Together နှင့် Ontocord.ai ပရောဂျက်များစုစည်းမှုမှရရှိသောဒေတာကိုအသုံးပြု၍ မော်ဒယ်ကိုလေ့ကျင့်သင်ကြားပေးခဲ့ပါသည်။

ရှိပြီးသား အသိပညာအခြေခံကို ချဲ့ထွင်ရန်၊ ပြင်ပသိုလှောင်ရာနေရာများ၊ API များနှင့် အခြားရင်းမြစ်များမှ ထပ်လောင်းအချက်အလက်များကို ထုတ်ယူနိုင်သည့် စနစ်တစ်ခုကို အဆိုပြုထားသည်။ ဥပမာအားဖြင့်၊ Wikipedia နှင့် news feeds တို့မှ အချက်အလက်များကို အသုံးပြု၍ အချက်အလက်များကို အပ်ဒိတ်လုပ်နိုင်သည်။ ထို့အပြင်၊ GPT-JT မော်ဒယ်အပေါ် အခြေခံ၍ ကန့်သတ်ချက်များ 6 ဘီလီယံဖြင့် လေ့ကျင့်သင်ကြားထားသည့် ထိန်းညှိမှုပုံစံကို ရရှိနိုင်ပြီး မသင့်လျော်သောမေးခွန်းများကို စစ်ထုတ်ရန် သို့မဟုတ် အချို့သောအကြောင်းအရာများအတွက် ဆွေးနွေးမှုများကို ကန့်သတ်ရန် ဒီဇိုင်းထုတ်ထားသည်။

သီးခြားအားဖြင့်၊ ChatLLaMA ပရောဂျက်ကို မှတ်သားနိုင်ပြီး ChatGPT နှင့် ဆင်တူသော အသိဉာဏ်ရှိသော လက်ထောက်များကို ဖန်တီးရန် စာကြည့်တိုက်တစ်ခု ပေးဆောင်သည်။ ပရောဂျက်သည် ၎င်း၏ကိုယ်ပိုင်စက်ကိရိယာများပေါ်တွင် လည်ပတ်နိုင်ခြေကို မျက်စိကျကာ ကျဉ်းမြောင်းသော အသိပညာနယ်ပယ်များ (ဥပမာ၊ ဆေးပညာ၊ ဥပဒေ၊ ဂိမ်းများ၊ သိပ္ပံသုတေသန စသည်) ကို လွှမ်းခြုံနိုင်ရန် ဒီဇိုင်းထုတ်ထားသော စိတ်ကြိုက်ဖြေရှင်းနည်းများကို ဖန်တီးနေပါသည်။ ChatLLaMA ကုဒ်သည် GPLv3 အောက်တွင် လိုင်စင်ရထားသည်။

အဆိုပါပရောဂျက်သည် Meta မှအဆိုပြုထားသော LLaMA (Large Language Model Meta AI) ဗိသုကာကိုအခြေခံ၍ မော်ဒယ်များအသုံးပြုခြင်းကို ပံ့ပိုးပေးပါသည်။ LLaMA မော်ဒယ်အပြည့်အစုံသည် ကန့်သတ်ဘောင် 65 ဘီလီယံကို အကျုံးဝင်သော်လည်း ChatLLaMA အတွက် ကန့်သတ်ဘောင် 7 နှင့် 13 ဘီလီယံ သို့မဟုတ် GPTJ (6 ဘီလီယံ)၊ GPTNeoX (1.3 ဘီလီယံ)၊ 20BOPT (13 ဘီလီယံ)၊ BLOOM (7.1 ဘီလီယံ) နှင့် အမျိုးအစားများကို အသုံးပြုရန် အကြံပြုထားသည်။ နှင့် Galactica (6.7 ဘီလီယံ) မော်ဒယ်များ။ အစပိုင်းတွင်၊ LLaMA မော်ဒယ်များကို သုတေသီများထံ အထူးတောင်းဆိုချက်ဖြင့်သာ ပံ့ပိုးပေးခဲ့သော်လည်း ဒေတာပေးပို့ရန် torrent များကို အသုံးပြုထားသောကြောင့် ဝါသနာရှင်များသည် မည်သူမဆို မော်ဒယ်ကို ဒေါင်းလုဒ်လုပ်ခွင့်ပြုမည့် script တစ်ခုကို ပြင်ဆင်ထားပါသည်။

source: opennet.ru

မှတ်ချက် Add