Google-ը թողարկում է տվյալներ և մեքենայական ուսուցման մոդել՝ ձայները առանձնացնելու համար

Google- ը опубликовала հղումային խառը հնչյունների ծանոթագրված տվյալների բազա, որը կարող է օգտագործվել մեքենայական ուսուցման համակարգերում, որոնք օգտագործվում են կամայական խառը հնչյունները իրենց առանձին բաղադրիչների բաժանելու համար: Հրապարակվել է նաև խորը մեքենայական ուսուցման ընդհանուր մոդել (TDCN++), որը կարող է օգտագործվել Tensorflow-ում ձայները առանձնացնելու համար։ Հավաքածուի հիման վրա պատրաստված տվյալները freesound.org и հրատարակված լիցենզավորված համաձայն CC BY 4.0.

Ներկայացված FUSS (Free Universal Sound Separation) նախագիծը միտված է լուծելու ցանկացած թվով կամայական հնչյունների առանձնացման խնդիրը, որոնց բնույթը նախապես հայտնի չէ։ Նմանատիպ այլ համակարգեր, ընդհանուր առմամբ, սահմանափակվում են որոշակի հնչյուններ տարբերելու առաջադրանքով, ինչպիսիք են ձայները և ոչ ձայները, կամ խոսող տարբեր մարդիկ:

Տվյալների բազան պարունակում է մոտ 20 հազար խառնուրդներ։ Հավաքածուն ներառում է նաև սենյակի իմպուլսների նախապես հաշվարկված պատասխաններ՝ օգտագործելով հատուկ կառուցված սենյակի սիմուլյատորը, որը հաշվի է առնում պատի արտացոլումը, ձայնի աղբյուրի գտնվելու վայրը և խոսափողի գտնվելու վայրը:

Source: opennet.ru

Добавить комментарий