O Google abriu as fontes ausentes do codec de áudio Lyra

O Google publicou uma atualização para o codec de áudio Lyra 0.0.2, que é otimizado para atingir a máxima qualidade de voz ao usar canais de comunicação muito lentos. O codec foi inaugurado no início de abril, mas foi fornecido em conjunto com uma biblioteca matemática proprietária. Na versão 0.0.2, essa desvantagem foi eliminada e um substituto aberto para a biblioteca especificada foi criado - sparse_matmul, que, como o próprio codec, é distribuído sob a licença Apache 2.0. Outras melhorias incluem a capacidade de usar o sistema de compilação Bazel com o compilador GCC e o uso deste pacote por padrão no Linux em vez do Bazel+Clang.

Lembremos que em termos de qualidade dos dados de voz transmitidos em baixas velocidades, o Lyra é significativamente superior aos codecs tradicionais que utilizam métodos de processamento digital de sinais. Para obter transmissão de voz de alta qualidade em condições de quantidade limitada de informações transmitidas, além dos métodos convencionais de compressão de áudio e conversão de sinal, Lyra utiliza um modelo de fala baseado em um sistema de aprendizado de máquina, que permite recriar as informações faltantes com base em características típicas da fala. O modelo usado para gerar o som foi treinado usando milhares de horas de gravações de voz em mais de 70 idiomas. O desempenho da implementação proposta é suficiente para codificação e decodificação de voz em tempo real em smartphones de preço médio, com atraso de transmissão de sinal de 90 milissegundos.

Fonte: opennet.ru

Adicionar um comentário