Оновлення відкритого аудіокодеку Lyra 1.3

Компанія Google опублікувала випуск аудіокодека Lyra 1.3, націленого досягнення високої якості передачі голосу в умовах обмеженого обсягу інформації, що передається. Якість мови на бітрейтах 3.2 kbps, 6 kbps та 9.2 kbps при використанні кодеку Lyra приблизно відповідає бітрейтам 10 kbps, 13 kbps та 14 kbps при використанні кодека Opus. Для вирішення поставленої задачі крім звичайних методів стиснення звуку і перетворення сигналів, в Lyra застосовується мовна модель на базі системи машинного навчання, що дозволяє відтворити відсутню інформацію на основі типових характеристик мови. Еталонна реалізація коду написана на C++ та поширюється під ліцензією Apache 2.0.

На відміну від запропонованого у жовтні кардинально переробленого випуску Lyra 1.2, переведеного на нову архітектуру нейронної мережі, у версії 1.3 проведено оптимізацію моделі машинного навчання без архітектурних змін. У новій версії для зберігання ваги та виконання арифметичних операцій замість 32-розрядних чисел з плаваючою комою задіяні 8-розрядні цілі числа, що призвело до скорочення розміру моделі на 43% та прискорення роботи з моделлю на 20% при тестуванні на смартфоні Pixel 6 Pro. Якість мови при цьому вдалося зберегти на тому ж рівні, але формат даних, що передаються, змінився і не сумісний з минулими випусками.

Джерело: opennet.ru

Додати коментар або відгук