Кампанія Google адкрыла адсутныя зыходныя тэксты для аўдыёкодэка Lyra

Кампанія Google апублікавала абнаўленне аўдыёкодэка Lyra 0.0.2, аптымізаванага для дасягнення максімальнай якасці перадачы прамовы пры выкарыстанні вельмі павольных каналаў сувязі. Кодэк быў адкрыты ў пачатку красавіка, але пастаўляўся ў прывязцы да прапрыетарнай матэматычнай бібліятэкі. У версіі 0.0.2 дадзены недахоп ухілены і для паказанай бібліятэкі створана адчыненая замена — sparse_matmul, якая як і сам кодэк распаўсюджваецца пад ліцэнзіяй Apache 2.0. З іншых паляпшэнняў можна адзначыць магчымасць выкарыстання зборачнай сістэмы Bazel з кампілятарам GCC і выкарыстанне дадзенага звязка па змаўчанні ў Linux замест Bazel+Clang.

Нагадаем, што па якасці перадаюцца галасавых дадзеных на нізкіх хуткасцях Lyra істотна пераўзыходзіць традыцыйныя кодэкі, у якіх выкарыстоўваюцца метады лічбавай апрацоўкі сігналаў. Для дасягнення высокай якасці перадачы голасу ва ўмовах абмежаванага аб'ёму перадаваемай інфармацыі, акрамя звычайных метадаў сціску гуку і пераўтварэнні сігналаў, у Lyra ужываецца моўная мадэль на базе сістэмы машыннага навучання, якая дазваляе ўзнавіць неабходную інфармацыю на аснове тыпавых характарыстык гаворкі. Задзейнічаная для генерацыі гуку мадэль навучана з выкарыстаннем некалькіх тысяч гадзін з запісамі галасоў на больш чым 70 мовах. Прадукцыйнасці прапанаванай рэалізацыі дастаткова для кадавання і дэкадавання прамовы ў рэжыме рэальнага часу на смартфонах сярэдняга коштавага дыяпазону, з затрымкай перадачы сігналу на ўзроўні 90 мілісекунд.

Крыніца: opennet.ru

Дадаць каментар