Google ድምጾችን ለመከፋፈል የውሂብ እና የማሽን መማሪያ ሞዴልን ይለቃል

በጉግል መፈለግ ታትሟል የዘፈቀደ ድብልቅ ድምፆችን ወደ ግል ክፍሎቻቸው ለመለየት በማሽን መማሪያ ስርዓቶች ውስጥ ሊያገለግል የሚችል የማጣቀሻ ድብልቅ ድምጾች የተብራራ የውሂብ ጎታ። በ Tensorflow ውስጥ ድምጾችን ለመለየት የሚያገለግል አጠቃላይ ጥልቅ የማሽን መማሪያ ሞዴል (TDCN++) ታትሟል። በስብስቡ ላይ ተመስርቶ የተዘጋጀ መረጃ freesound.org и ታተመ በ CC BY 4.0 ፈቃድ ያለው።

የቀረበው ፕሮጀክት FUSS (ነፃ ዩኒቨርሳል ድምፅ መለያየት) ማንኛውንም የዘፈቀደ ድምፆች የመለየት ችግርን ለመፍታት ያለመ ነው, ባህሪው አስቀድሞ የማይታወቅ ነው. ሌሎች ተመሳሳይ ስርዓቶች እንደ ድምጾች እና ድምጽ ያልሆኑ ድምፆች ወይም የተለያዩ ሰዎች የሚናገሩትን ድምፆች የመለየት ስራ ላይ ብቻ የተገደቡ ናቸው.

የውሂብ ጎታው ወደ 20 ሺህ የሚጠጉ ድብልቆችን ይዟል. በተጨማሪም ኪቱ የግድግዳ ነጸብራቅን፣ የድምጽ ምንጭ መገኛን እና የማይክሮፎን አካባቢን ግምት ውስጥ ያስገባ በብጁ-የተሰራ ክፍል ማስመሰያ በመጠቀም ቀድሞ-የተሰላ የክፍል ግፊት ምላሾችን ያካትታል።

ምንጭ: opennet.ru

አስተያየት ያክሉ