Компанія Google опублікувала оновлення аудіокодека Lyra 0.0.2, оптимізованого для досягнення максимальної якості передачі мови під час використання дуже повільних каналів зв'язку. Кодек було відкрито на початку квітня, але постачався у прив'язці до пропрієтарної математичної бібліотеки. У версії 0.0.2 цей недолік усунений і для зазначеної бібліотеки створена відкрита заміна - sparse_matmul, яка, як і сам кодек, поширюється під ліцензією Apache 2.0. З інших покращень можна відзначити можливість використання складальної системи Bazel з компілятором GCC та використання цієї зв'язки за замовчуванням у Linux замість Bazel+Clang.
Нагадаємо, що за якістю переданих голосових даних на низьких швидкостях Lyra істотно перевершує традиційні кодеки, в яких використовуються методи цифрової обробки сигналів. Для досягнення високої якості передачі голосу в умовах обмеженого об'єму інформації, що передається, крім звичайних методів стиснення звуку і перетворення сигналів, в Lyra застосовується мовна модель на базі системи машинного навчання, що дозволяє відтворити відсутню інформацію на основі типових характеристик мови. Задіяна для генерації звуку модель навчена з використанням кількох тисяч годин з записами голосів більш ніж 70 мовами. Продуктивності запропонованої реалізації достатньо для кодування та декодування мови в режимі реального часу на смартфонах середнього цінового діапазону із затримкою передачі сигналу на рівні 90 мілісекунд.
Джерело: opennet.ru