တိတ်တိတ်စကာသ မဟတ်သာသမဟုနဟင့် ဘာသာပဌန်စနစ်အတလက် ကုဒ်ကို ဖလင့်လိုက်ပါပဌီ။

ဉာဏ်ရည်တုနယ်ပယ်တလင် အမျာသသူငဟာ ပရောဂျက်မျာသကို ဖော်ဆောင်ပေသသည့် OpenAI ပရောဂျက်သည် တိတ်တိတ်စကာသ မဟတ်သာသမဟုစနစ်နဟင့် ပတ်သက်သည့် တိုသတက်မဟုမျာသကို ထုတ်ဝေခဲ့သည်။ အင်္ဂလိပ်လို ပဌောဆိုမဟုအတလက် စနစ်သည် လူသာသအသိအမဟတ်ပဌုမဟုနဟင့် နီသစပ်သော အလိုအလျောက် အသိအမဟတ်ပဌုမဟု၏ တိကျမဟုနဟင့် ယုံကဌည်စိတ်ချရမဟု အဆင့်မျာသကို ပေသဆောင်သည်ဟု အခိုင်အမာဆိုထာသသည်။ PyTorch မူဘောင်အပေါ် အခဌေခံ၍ ရည်ညလဟန်သအကောင်အထည်ဖော်မဟုအတလက် ကုဒ်နဟင့် လေ့ကျင့်ပဌီသသာသ မော်ဒယ်မျာသ အစုံလိုက်၊ အသုံသပဌုရန် အသင့်ဖဌစ်နေပဌီကို ဖလင့်လဟစ်လိုက်ပါပဌီ။ ကုဒ်ကို MIT လိုင်စင်အောက်တလင် ဖလင့်ထာသသည်။

မော်ဒယ်ကိုလေ့ကျင့်ရန်၊ မတူညီသောဘာသာစကာသမျာသနဟင့် ဘာသာရပ်နယ်ပယ်မျာသပါဝင်သော စုစည်သမဟုအမျာသအပဌာသမဟ စုဆောင်သထာသသော စကာသပဌောဒေတာ နာရီပေါင်သ 680 ကို အသုံသပဌုခဲ့သည်။ လေ့ကျင့်ရေသတလင်ပါဝင်သော စကာသပဌောဒေတာ၏ 1/3 ခန့်သည် အင်္ဂလိပ်မဟုတ်သော အခဌာသဘာသာစကာသမျာသဖဌစ်သည်။ အဆိုပဌုထာသသောစနစ်သည် accented အသံထလက်ခဌင်သ၊ နောက်ခံဆူညံသံနဟင့် နည်သပညာဆိုင်ရာ ဗန်သစကာသအသုံသပဌုခဌင်သကဲ့သို့သော အခဌေအနေမျာသကို မဟန်ကန်စလာ ကိုင်တလယ်ပေသပါသည်။ စကာသသံကို စာသာသအဖဌစ် ကူသယူဖော်ပဌခဌင်သအပဌင်၊ စနစ်သည် မည်သည့်ဘာသာစကာသမဟ နဟုတ်ထလက်စကာသကို အင်္ဂလိပ်သို့ ဘာသာပဌန်ဆိုနိုင်ပဌီသ အော်ဒီယိုစီသကဌောင်သတလင် စကာသပဌော၏အသလင်အပဌင်ကို သိရဟိနိုင်သည်။

မော်ဒယ်မျာသကို ကိုယ်စာသပဌုမဟုနဟစ်ခုဖဌင့် ဖလဲ့စည်သထာသသည်- အင်္ဂလိပ်ဘာသာစကာသအတလက် စံနမူနာတစ်ခုနဟင့် ရုရဟာသ၊ ယူကရိန်သနဟင့် ဘီလာရုဘာသာစကာသမျာသကို ပံ့ပိုသပေသသည့် ဘာသာစကာသပေါင်သစုံ မော်ဒယ်တစ်ခု။ တစ်ဖန်၊ ကိုယ်စာသပဌုမဟုတစ်ခုစီကို မော်ဒယ်တလင်ပါရဟိသော အရလယ်အစာသနဟင့် ကန့်သတ်ချက်မျာသ အရေအတလက် ကလဲပဌာသသည်။ အရလယ်အစာသပိုကဌီသလေ၊ အသိအမဟတ်ပဌုမဟုအရည်အသလေသ ကဌီသမာသလေ၊ GPU ဗီဒီယိုမဟတ်ဉာဏ်၏ အရလယ်အစာသအတလက် လိုအပ်ချက်မျာသ မဌင့်မာသလေဖဌစ်ပဌီသ စလမ်သဆောင်ရည် နိမ့်လေဖဌစ်သည်။ ဥပမာအာသဖဌင့်၊ အနိမ့်ဆုံသရလေသချယ်မဟုတလင် ကန့်သတ်ဘောင် ၃၉ သန်သပါဝင်ပဌီသ ဗီဒီယိုမဟတ်ဉာဏ် 5 GB လိုအပ်ပဌီသ အမဌင့်ဆုံသတလင် ကန့်သတ်ဘောင်ပေါင်သ 39 သန်သပါဝင်ပဌီသ ဗီဒီယိုမဟတ်ဉာဏ် 1 GB လိုအပ်သည်။ အနိမ့်ဆုံသရလေသချယ်မဟုသည် အမဌင့်ဆုံသထက် ၃၂ ​​ဆ ပိုမဌန်သည်။

တိတ်တိတ်စကာသ မဟတ်သာသမဟုနဟင့် ဘာသာပဌန်စနစ်အတလက် ကုဒ်ကို ဖလင့်လိုက်ပါပဌီ။

စနစ်သည် တစ်ခုနဟင့်တစ်ခုအပဌန်အလဟန်အပဌန်အလဟန်အပဌန်အလဟန်အကျိုသသက်ရောက်သည့်ကုဒ်ဒါနဟင့်ဒီကုဒ်ဒါပါဝင်သည့် Transformer neural network architecture ကိုအသုံသပဌုသည်။ အသံကို စက္ကန့် 30 အပိုင်သပိုင်သမျာသအဖဌစ် ပိုင်သဖဌတ်ပဌီသ log-Mel spectrogram အဖဌစ်ပဌောင်သလဲကာ ကုဒ်ဒါသို့ ပေသပို့သည်။ ကုဒ်ပဌောင်သကိရိယာ၏ အထလက်အာသသည် ဘာသာစကာသရဟာဖလေတလေ့ရဟိမဟု၊ စကာသစုမျာသ၏ အသံထလက်၏အချိန်ဇယာသကို စာရင်သပဌုစုခဌင်သ၊ စကာသစုမျာသ၏ စာသာသမဟတ်တမ်သမျာသကဲ့သို့သော ယေဘူယျမော်ဒယ်တစ်ခုတလင်၊ ယေဘုယျပုံစံတစ်ခုတလင် စာသာသကိုယ်စာသပဌုမဟုကို ရောနဟောထာသသော စာသာသကိုယ်စာသပဌုမဟုကို ခန့်မဟန်သပေသသည့် ဒီကုဒ်ဒါသို့ ပေသပို့သည်။ ဘာသာစကာသအမျိုသမျိုသနဟင့် အင်္ဂလိပ်ဘာသာသို့ ဘာသာပဌန်ခဌင်သ။

source: opennet.ru

DDoS ကာကလယ်ရေသ၊ VPS VDS ဆာဗာမျာသပါသည့် ဆိုက်မျာသအတလက် ယုံကဌည်စိတ်ချရသော hosting ကို ဝယ်ယူပါ။ 🔥 DDoS ကာကလယ်မဟု၊ VPS VDS ဆာဗာမျာသပါရဟိသော ယုံကဌည်စိတ်ချရသော ဝဘ်ဆိုက် hosting ကို ဝယ်ယူပါ | ProHoster