Google ha abierto las fuentes faltantes para el códec de audio Lyra

Google ha publicado una actualización del códec de audio Lyra 0.0.2, que está optimizado para lograr la máxima calidad de voz cuando se utilizan canales de comunicación muy lentos. El códec se abrió a principios de abril, pero se suministró junto con una biblioteca matemática patentada. En la versión 0.0.2, este inconveniente se eliminó y se creó un reemplazo abierto para la biblioteca especificada: sparse_matmul, que, como el códec en sí, se distribuye bajo la licencia Apache 2.0. Otras mejoras incluyen la capacidad de utilizar el sistema de compilación Bazel con el compilador GCC y el uso de este paquete de forma predeterminada en Linux en lugar de Bazel+Clang.

Recordemos que en términos de calidad de los datos de voz transmitidos a bajas velocidades, Lyra es significativamente superior a los códecs tradicionales que utilizan métodos de procesamiento de señales digitales. Para lograr una transmisión de voz de alta calidad en condiciones de una cantidad limitada de información transmitida, además de los métodos convencionales de compresión de audio y conversión de señal, Lyra utiliza un modelo de voz basado en un sistema de aprendizaje automático, que le permite recrear la información faltante basándose en Características típicas del habla. El modelo utilizado para generar el sonido se entrenó utilizando varios miles de horas de grabaciones de voz en más de 70 idiomas. El rendimiento de la implementación propuesta es suficiente para la codificación y decodificación de voz en tiempo real en teléfonos inteligentes de precio medio, con un retraso en la transmisión de la señal de 90 milisegundos.

Fuente: opennet.ru

Añadir un comentario