Кампанія Google апублікавала абнаўленне аўдыёкодэка Lyra 0.0.2, аптымізаванага для дасягнення максімальнай якасці перадачы прамовы пры выкарыстанні вельмі павольных каналаў сувязі. Кодэк быў адкрыты ў пачатку красавіка, але пастаўляўся ў прывязцы да прапрыетарнай матэматычнай бібліятэкі. У версіі 0.0.2 дадзены недахоп ухілены і для паказанай бібліятэкі створана адчыненая замена — sparse_matmul, якая як і сам кодэк распаўсюджваецца пад ліцэнзіяй Apache 2.0. З іншых паляпшэнняў можна адзначыць магчымасць выкарыстання зборачнай сістэмы Bazel з кампілятарам GCC і выкарыстанне дадзенага звязка па змаўчанні ў Linux замест Bazel+Clang.
Нагадаем, што па якасці перадаюцца галасавых дадзеных на нізкіх хуткасцях Lyra істотна пераўзыходзіць традыцыйныя кодэкі, у якіх выкарыстоўваюцца метады лічбавай апрацоўкі сігналаў. Для дасягнення высокай якасці перадачы голасу ва ўмовах абмежаванага аб'ёму перадаваемай інфармацыі, акрамя звычайных метадаў сціску гуку і пераўтварэнні сігналаў, у Lyra ужываецца моўная мадэль на базе сістэмы машыннага навучання, якая дазваляе ўзнавіць неабходную інфармацыю на аснове тыпавых характарыстык гаворкі. Задзейнічаная для генерацыі гуку мадэль навучана з выкарыстаннем некалькіх тысяч гадзін з запісамі галасоў на больш чым 70 мовах. Прадукцыйнасці прапанаванай рэалізацыі дастаткова для кадавання і дэкадавання прамовы ў рэжыме рэальнага часу на смартфонах сярэдняга коштавага дыяпазону, з затрымкай перадачы сігналу на ўзроўні 90 мілісекунд.
Крыніца: opennet.ru