Actualización del códec de audio abierto Lyra 1.3

Google ha publicado el lanzamiento del códec de audio Lyra 1.3, cuyo objetivo es lograr una alta calidad de voz en una cantidad limitada de información transmitida. La calidad de la voz a velocidades de bits de 3.2 kbps, 6 kbps y 9.2 kbps utilizando el códec Lyra corresponde aproximadamente a velocidades de bits de 10 kbps, 13 kbps y 14 kbps utilizando el códec Opus. Para solucionar este problema, además de los métodos habituales de compresión de sonido y conversión de señales, Lyra utiliza un modelo de voz basado en un sistema de aprendizaje automático que permite recrear la información faltante basándose en las características típicas del habla. La implementación del código de referencia está escrita en C++ y distribuida bajo la licencia Apache 2.0.

A diferencia de la versión Lyra 1.2 radicalmente rediseñada propuesta en octubre, que se transfirió a una nueva arquitectura de red neuronal, la versión 1.3 optimizó el modelo de aprendizaje automático sin cambios arquitectónicos. La nueva versión utiliza enteros de 32 bits en lugar de números de punto flotante de 8 bits para almacenar pesos y realizar operaciones aritméticas, lo que da como resultado una reducción del 43 % en el tamaño del modelo y una aceleración del 20 % en el rendimiento del modelo cuando se prueba en un teléfono inteligente Pixel 6 Pro. . Al mismo tiempo, la calidad de la voz se mantuvo al mismo nivel, pero el formato de los datos transmitidos cambió y no es compatible con versiones anteriores.

Fuente: opennet.ru

Añadir un comentario