ශබ්ද වෙන් කිරීම සඳහා Google දත්ත සහ යන්ත්‍ර ඉගෙනුම් ආකෘතිය නිකුත් කරයි

ගූගල් පළ කර ඇත අත්තනෝමතික මිශ්‍ර ශබ්ද ඒවායේ තනි සංරචක වලට වෙන් කිරීමට භාවිතා කරන යන්ත්‍ර ඉගෙනුම් පද්ධතිවල භාවිතා කළ හැකි යොමු මිශ්‍ර ශබ්ද පිළිබඳ විවරණ දත්ත සමුදායක්. සාමාන්‍ය ගැඹුරු යන්ත්‍ර ඉගෙනුම් ආකෘතියක් (TDCN++) ද ප්‍රකාශයට පත් කර ඇති අතර එය ශබ්ද වෙන් කිරීමට Tensorflow භාවිතා කළ හැක. එකතු කිරීම මත පදනම්ව සකස් කරන ලද දත්ත freesound.org и ප්‍රකාශයට පත් කරන ලදි CC BY 4.0 යටතේ බලපත්‍ර ලබා ඇත.

ඉදිරිපත් කරන ලද ව්‍යාපෘතිය FUSS (Free Universal Sound Separation) අරමුණු කර ඇත්තේ ඕනෑම අත්තනෝමතික ශබ්ද සංඛ්‍යාවක් වෙන් කිරීමේ ගැටලුව විසඳීම සඳහා වන අතර, එහි ස්වභාවය කල්තියා නොදනී. වෙනත් සමාන පද්ධති සාමාන්‍යයෙන් සීමා වී ඇත්තේ කටහඬ සහ කටහඬ නොවන හෝ විවිධ පුද්ගලයන් කතා කිරීම වැනි ඇතැම් ශබ්ද අතර වෙනස හඳුනාගැනීමේ කාර්යයටය.

දත්ත සමුදායේ මිශ්ර කිරීම් 20 ක් පමණ අඩංගු වේ. බිත්ති පරාවර්තනය, ශබ්ද ප්‍රභව ස්ථානය සහ මයික්‍රෆෝන ස්ථානය සැලකිල්ලට ගන්නා අභිරුචි-සාදන ලද කාමර සිමියුලේටරයක් ​​භාවිතයෙන් පෙර-ගණනය කරන ලද කාමර ආවේග ප්‍රතිචාර කට්ටලයට ඇතුළත් වේ.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න