Обновление открытого аудиокодека Lyra 1.3

Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0.

В отличие от предложенного в октябре кардинально переработанного выпуска Lyra 1.2, переведённого на новую архитектуру нейронной сети, в версии 1.3 проведена оптимизация модели машинного обучения без архитектурных изменений. В новой версии для хранения весов и выполнения арифметических операций вместо 32-разрядных чисел с плавающей запятой задействованы 8-разрядные целые числа, что привело к сокращению размера модели на 43% и ускорению работы с моделью на 20% при тестировании на смартфоне Pixel 6 Pro. Качество речи при этом удалось сохранить на том же уровне, но формат передаваемых данных изменился и не совместим с прошлыми выпусками.

Источник: opennet.ru

Добавить комментарий