Компанія Google відкрила вихідні тексти для аудіокодека Lyra

Компанія Google опублікувала оновлення аудіокодека Lyra 0.0.2, оптимізованого для досягнення максимальної якості передачі мови під час використання дуже повільних каналів зв'язку. Кодек було відкрито на початку квітня, але постачався у прив'язці до пропрієтарної математичної бібліотеки. У версії 0.0.2 цей недолік усунений і для зазначеної бібліотеки створена відкрита заміна - sparse_matmul, яка, як і сам кодек, поширюється під ліцензією Apache 2.0. З інших покращень можна відзначити можливість використання складальної системи Bazel з компілятором GCC та використання цієї зв'язки за замовчуванням у Linux замість Bazel+Clang.

Нагадаємо, що за якістю переданих голосових даних на низьких швидкостях Lyra істотно перевершує традиційні кодеки, в яких використовуються методи цифрової обробки сигналів. Для досягнення високої якості передачі голосу в умовах обмеженого об'єму інформації, що передається, крім звичайних методів стиснення звуку і перетворення сигналів, в Lyra застосовується мовна модель на базі системи машинного навчання, що дозволяє відтворити відсутню інформацію на основі типових характеристик мови. Задіяна для генерації звуку модель навчена з використанням кількох тисяч годин з записами голосів більш ніж 70 мовами. Продуктивності запропонованої реалізації достатньо для кодування та декодування мови в режимі реального часу на смартфонах середнього цінового діапазону із затримкою передачі сигналу на рівні 90 мілісекунд.

Джерело: opennet.ru

Додати коментар або відгук