အသံများကို ပိုင်းခြားရန်အတွက် Google သည် ဒေတာနှင့် စက်သင်ယူမှုပုံစံကို ထုတ်ပြန်ခဲ့သည်။

Google ထုတ်ဝေခဲ့သည် ၎င်းတို့၏ အစိတ်အပိုင်းတစ်ခုချင်းစီသို့ မထင်သလို ရောစပ်ထားသော အသံများကို ခွဲခြားရန် အသုံးပြုသည့် စက်သင်ယူမှုစနစ်များတွင် အသုံးပြုနိုင်သည့် ရည်ညွှန်းရောစပ်သော အသံများ၏ မှတ်သားထားသည့် ဒေတာဘေ့စ်တစ်ခု။ အသံများကို ခွဲခြားရန် Tensorflow တွင် အသုံးပြုနိုင်သည့် ယေဘူယျနက်နဲသော စက်သင်ယူမှုပုံစံ (TDCN++) ကို ထုတ်ဝေထားပါသည်။ စုစည်းမှုအပေါ်အခြေခံ၍ ပြင်ဆင်ထားသော အချက်အလက် freesound.org и ထုတ်ဝေခဲ့သည် CC BY 4.0 အောက်တွင် လိုင်စင်ရှိသည်။

တင်ပြထားသော ပရောဂျက် FUSS (Free Universal Sound Separation) သည် ကြိုတင်မသိနိုင်သော မည်မျှသော အသံများကို ခွဲထုတ်ခြင်းဆိုင်ရာ ပြဿနာကို ဖြေရှင်းရန်အတွက် ရည်ရွယ်ပါသည်။ အခြားသော အလားတူစနစ်များသည် ယေဘုယျအားဖြင့် အချို့သောအသံများဖြစ်သည့် အသံများနှင့် အသံမဟုတ်သော၊ သို့မဟုတ် မတူညီသောလူများ ပြောဆိုနေကြသည့် အသံများကြားတွင် ခွဲခြားသတ်မှတ်ခြင်းအတွက် ယေဘုယျအားဖြင့် ကန့်သတ်ထားသည်။

ဒေတာဘေ့စ်တွင် ရောစပ်မှုပေါင်း 20 ခန့်ပါရှိသည်။ စက်ကိရိယာတွင် နံရံတွင် ရောင်ပြန်ဟပ်မှု၊ အသံရင်းမြစ်တည်နေရာနှင့် မိုက်ခရိုဖုန်းတည်နေရာတို့ကို ထည့်သွင်းစဉ်းစားသည့် စိတ်ကြိုက်တည်ဆောက်ထားသော အခန်းတွင်း simulator ကို အသုံးပြု၍ ကြိုတင်တွက်ချက်ထားသော အခန်းတွင်း လှုံ့ဆော်မှုတုံ့ပြန်မှုများလည်း ပါဝင်သည်။

source: opennet.ru

မှတ်ချက် Add