IBM သည် ကုဒ်ကို ဘာသာပြန်ပြီး အတည်ပြုသည့် စက်သင်ယူမှုစနစ်များအတွက် CodeNet ကို ဖွင့်သည်။

IBM သည် သုတေသီများအား ပရိုဂရမ်းမင်းဘာသာစကား ဘာသာပြန်သူများ၊ ကုဒ်ထုတ်လုပ်သူများနှင့် ခွဲခြမ်းစိတ်ဖြာသူများ ဖန်တီးရန် စက်သင်ယူမှုနည်းပညာများကို စမ်းသပ်အသုံးပြုခြင်းဖြင့် စမ်းသပ်နိုင်စေမည့် ဒေတာအစုံကို ပေးဆောင်နိုင်ရန် ရည်ရွယ်သည့် ၎င်း၏ CodeNet ပဏာမခြေလှမ်းကို ထုတ်ဖော်ပြသခဲ့သည်။ CodeNet တွင် အဖြစ်များသော ပရိုဂရမ်းမင်းပြဿနာ 14 ကိုဖြေရှင်းပေးသည့် ကုဒ်နမူနာ 4053 သန်း၏ စုစည်းမှု ပါဝင်သည်။ စုစုပေါင်း၊ စုစည်းမှုတွင် ကုဒ်လိုင်းပေါင်း သန်း 500 ခန့်ပါ၀င်ပြီး C++၊ Java၊ Python နှင့် Go ကဲ့သို့သော ခေတ်မီဘာသာစကားနှစ်မျိုးလုံးနှင့် COBOL၊ Pascal နှင့် FORTRAN အပါအဝင် ပရိုဂရမ်ဘာသာစကား 55 ခု ပါဝင်သည်။ ပရောဂျက်၏တိုးတက်မှုများကို Apache 2.0 လိုင်စင်အောက်တွင် ဖြန့်ဝေထားပြီး ဒေတာအစုံများကို အများသူငှာ ဒိုမိန်းပုံစံဖြင့် ဖြန့်ဝေရန် စီစဉ်ထားပါသည်။

နမူနာများကို မှတ်သားထားပြီး မတူညီသော ပရိုဂရမ်းမင်းဘာသာစကားများဖြင့် ထပ်တူထပ်မျှသော အယ်လဂိုရီသမ်များကို အကောင်အထည်ဖော်သည်။ အဆိုပြုထားသောအစုံသည် စက်သင်ယူမှုစနစ်များကိုလေ့ကျင့်ပေးပြီး ImageNet အမှတ်အသားပြုပုံဒေတာဘေ့စ်သည် ပုံသဏ္ဍာန်မှတ်သားမှုနှင့် ကွန်ပျူတာအမြင်စနစ်များဖွံ့ဖြိုးတိုးတက်စေရန် ကူညီပေးပုံကဲ့သို့ ဘာသာပြန်ခြင်းနှင့် စက်ကုဒ်ခွဲခြမ်းစိတ်ဖြာခြင်းနယ်ပယ်တွင် ဆန်းသစ်တီထွင်မှုများကို ဖွံ့ဖြိုးတိုးတက်လာစေမည်ဟု မျှော်လင့်ရသည်။ အမျိုးမျိုးသော ပရိုဂရမ်ပြိုင်ပွဲများကို စုစည်းဖွဲ့စည်းခြင်း၏ အဓိကအရင်းအမြစ်များထဲမှ တစ်ခုအဖြစ် ကိုးကားဖော်ပြကြသည်။

ဘာသာပြန်စည်းမျဉ်းများကိုအခြေခံ၍ အကောင်အထည်ဖော်သည့် ရိုးရာဘာသာပြန်သူများနှင့်မတူဘဲ၊ စက်သင်ယူမှုစနစ်များသည် ကုဒ်အသုံးပြုမှု၏အကြောင်းအရာကို ဖမ်းယူပြီး ထည့်သွင်းစဉ်းစားနိုင်သည်။ ပရိုဂရမ်းမင်းဘာသာစကားတစ်ခုမှ အခြားဘာသာစကားတစ်ခုသို့ ပြောင်းသောအခါ၊ လူ့ဘာသာစကားတစ်ခုမှ အခြားဘာသာစကားတစ်ခုသို့ ဘာသာပြန်ဆိုရာတွင် အကြောင်းအရာသည် အရေးကြီးပါသည်။ ဤအကြောင်းအရာ ထည့်သွင်းစဉ်းစားမှု မရှိခြင်းသည် ကုဒ်ကို COBOL ကဲ့သို့သော အမွေအနှစ်ဘာသာစကားများမှ ကူးပြောင်းခြင်းမှ တားဆီးပေးပါသည်။

မတူညီသောဘာသာစကားများတွင် အယ်လဂိုရီသမ်အကောင်အထည်ဖော်မှုများ၏ ကြီးမားသောဒေတာဘေ့စ်ရှိခြင်းသည် သီးခြားဘာသာစကားများကြား တိုက်ရိုက်ဘာသာပြန်ခြင်းအစား၊ သီးခြားပရိုဂရမ်းမင်းဘာသာစကားများမပါဘဲ ကုဒ်၏ပိုမိုနက်နဲသောကိုယ်စားပြုမှုကို ကြိုးကိုင်သည့် universal machine learning စနစ်များကိုဖန်တီးရန် အထောက်အကူဖြစ်စေမည်ဖြစ်သည်။ ထိုသို့သောစနစ်အား ဘာသာပြန်ဆိုသူအဖြစ် အသုံးပြုနိုင်ပြီး၊ ပံ့ပိုးပေးထားသော ဘာသာစကားတစ်ခုခုတွင် ပို့လွှတ်သောကုဒ်ကို ၎င်း၏အတွင်းပိုင်း စိတ္တဇကိုယ်စားပြုမှုအဖြစ် ဘာသာပြန်ဆိုနိုင်ပြီး၊ ထိုကုဒ်ကို ဘာသာစကားများစွာဖြင့် ထုတ်ပေးနိုင်သည်။

စနစ်သည် bidirectional transformations ကိုလည်း လုပ်ဆောင်နိုင်မည်ဖြစ်သည်။ ဥပမာအားဖြင့်၊ ဘဏ်များနှင့် အစိုးရအေဂျင်စီများသည် ခေတ်မမီတော့သော COBOL ဘာသာစကားဖြင့် ပရောဂျက်များကို ဆက်လက်အသုံးပြုကြသည်။ စက်သင်ယူမှုအခြေခံဘာသာပြန်သူသည် COBOL ကုဒ်ကို Java ကိုယ်စားပြုအဖြစ်သို့ ပြောင်းနိုင်မည်ဖြစ်ပြီး လိုအပ်ပါက Java အပိုင်းအစကို COBOL ကုဒ်သို့ ပြန်ဆိုနိုင်သည်။

ဘာသာစကားများကြားတွင် ဘာသာပြန်ခြင်းအပြင်၊ စမတ်ကုဒ်ရှာဖွေမှုစနစ်များ ဖန်တီးခြင်းနှင့် ကုဒ်ရှာဖွေခြင်း၏ အလိုအလျောက်လုပ်ဆောင်ခြင်းများ၊ ပိုမိုကောင်းမွန်အောင်လုပ်ဆောင်မှုများနှင့် အလိုအလျောက်ကုဒ်အမှားပြင်ဆင်ခြင်းစနစ်များ ဖန်တီးခြင်းကဲ့သို့သော နယ်ပယ်များကို ဖော်ပြထားပါသည်။ အထူးသဖြင့်၊ CodeNet တွင်ပြသထားသောနမူနာများတွင် စွမ်းဆောင်ရည်စမ်းသပ်ခြင်း၏ရလဒ်များ၊ ရရှိလာသောပရိုဂရမ်အရွယ်အစား၊ မှတ်ဉာဏ်သုံးစွဲမှုနှင့် အခြေအနေတို့ကိုဖော်ပြသည့် မက်တာဒေတာများ တပ်ဆင်ထားပြီး၊ ကျွန်ုပ်တို့အား ကုဒ်မှမှန်ကန်သောကုဒ်အား အမှားများဖြင့် ခွဲခြားနိုင်စေသည် (မှန်ကန်သောကုဒ်ကို မှားယွင်းသောကုဒ်ကို ခွဲခြားရန်၊ စုစည်းမှုတွင် အမှားအယွင်းများပါသော ဥပမာများ ပါ၀င်ပြီး မျှဝေမှုမှာ 29.5%) ဖြစ်သည်။ စက်သင်ယူမှုစနစ်တစ်ခုသည် အကောင်းမွန်ဆုံးကုဒ်ကိုထုတ်လုပ်ရန် သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာထားသောကုဒ်တွင် ဆုတ်ယုတ်မှုများကို ခွဲခြားသတ်မှတ်ရန် ဤမက်တာဒေတာကို ထည့်သွင်းတွက်ချက်နိုင်သည် (တင်ပြထားသည့်ကုဒ်ရှိ အယ်လဂိုရီသမ်ကို အကောင်းဆုံးအကောင်အထည်မဖော်နိုင်ပါ သို့မဟုတ် အမှားအယွင်းများပါရှိသည်)။

source: opennet.ru

မှတ်ချက် Add