OpenNMT 2.28.0 စက်ဘာသာပြန်စနစ် ဖြန့်ချိသည်။

စက်သင်ယူမှုနည်းလမ်းများကိုအသုံးပြုထားသည့် OpenNMT 0.28.0 (Open Neural Machine Translation) စက်ဘာသာပြန်ဆိုခြင်းစနစ်အား ထုတ်ဝေလိုက်ပါသည်။ အာရုံကြောကွန်ရက်တစ်ခုတည်ဆောက်ရန်၊ ပရောဂျက်သည် TensorFlow နက်နဲသောစက်သင်ယူမှုစာကြည့်တိုက်၏စွမ်းရည်များကိုအသုံးပြုသည်။ OpenNMT ပရောဂျက်မှ ဖန်တီးထားသော မော်ဂျူးများ၏ကုဒ်ကို Python ဖြင့် ရေးသားထားပြီး MIT လိုင်စင်အောက်တွင် ဖြန့်ဝေထားသည်။ အဆင်သင့်လုပ်ထားသော မော်ဒယ်များကို အင်္ဂလိပ်၊ ဂျာမန်နှင့် ကာတာလန်ဘာသာစကားများအတွက် ပြင်ဆင်ထားပြီး၊ အခြားဘာသာစကားများအတွက် OPUS ပရောဂျက်မှ ဒေတာအစုံကို အခြေခံ၍ မော်ဒယ်တစ်ခုကို လွတ်လပ်စွာ ဖန်တီးနိုင်သည် (သင်တန်းအတွက်၊ ဖိုင်နှစ်ခုကို စနစ်သို့ လွှဲပြောင်းပေးသည် - တစ်ခုမှာ စာကြောင်းပါသော စာကြောင်းများပါရှိသော အရင်းအမြစ်ဘာသာစကားနှင့် ဒုတိယမှာ ဤစာကြောင်းများ၏ အရည်အသွေးမြင့် ဘာသာပြန်ဆိုမှုဖြင့် ပစ်မှတ်ဘာသာစကားသို့)။

စက်ဘာသာပြန်ကိရိယာများဖန်တီးရာတွင် အထူးပြုသည့် ကုမ္ပဏီတစ်ခုဖြစ်သည့် SYSTRAN ၏ ပူးပေါင်းပါဝင်မှုဖြင့် ပရောဂျက်ကို ဟားဗတ်သုတေသီအဖွဲ့တစ်ဖွဲ့က စက်သင်ယူမှုစနစ်များအတွက် လူသားဘာသာစကားပုံစံများကို တီထွင်လျက်ရှိသည်။ အသုံးပြုသူ အင်တာဖေ့စ်ကို တတ်နိုင်သမျှ ရိုးရှင်းအောင် ပြုလုပ်ထားပြီး ဘာသာပြန်ရလဒ်ကို သိမ်းဆည်းရန် စာသားနှင့် ဖိုင်တစ်ခု ထည့်သွင်းရန် ဖိုင်တစ်ခု သတ်မှတ်ရန် လိုအပ်သည်။ တိုးချဲ့မှုစနစ်သည် ဥပမာအားဖြင့် OpenNMT၊ အလိုအလျောက် အကျဉ်းချုပ်ခြင်း၊ စာသားအမျိုးအစားခွဲခြားခြင်းနှင့် စာတန်းထိုးထုတ်လုပ်ခြင်းတို့ကို အခြေခံ၍ ထပ်လောင်းလုပ်ဆောင်နိုင်စွမ်းကို အကောင်အထည်ဖော်နိုင်စေပါသည်။

TensorFlow ကိုအသုံးပြုခြင်းသည် သင့်အား GPU ၏စွမ်းရည်များကိုအသုံးပြုရန်ခွင့်ပြုသည် (အာရုံကြောကွန်ရက်ကိုလေ့ကျင့်ခြင်းလုပ်ငန်းစဉ်ကိုအရှိန်မြှင့်ရန်။ ထုတ်ကုန်၏ဖြန့်ဖြူးမှုကိုရိုးရှင်းစေရန်၊ ပရောဂျက်သည် C++ တွင်ဘာသာပြန်သူ၏ဖူလုံသောဗားရှင်းကိုလည်းဖန်တီးနေသည် - CTranslate2 ထပ်လောင်းမှီခိုမှုအား အကိုးအကားမရှိဘဲ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်များကို အသုံးပြုသည်။

ဗားရှင်းအသစ်သည် initial_learning_rate ကန့်သတ်ဘောင်ကို ပေါင်းထည့်ကာ Transformer မော်ဒယ် ဂျင်နရေတာအား ပြင်ဆင်သတ်မှတ်ရန် အကြောင်းပြချက်အသစ်များစွာ (mha_bias နှင့် output_layer_bias) ကို အကောင်အထည်ဖော်သည်။ ကျန်တာကို bug ပြင်ဆင်မှုများဖြင့် အမှတ်အသားပြုပါသည်။

source: opennet.ru

မှတ်ချက် Add