Atualização do codec de áudio aberto Lyra 1.3

O Google publicou o lançamento do codec de áudio Lyra 1.3, que visa obter transmissão de voz de alta qualidade em condições de quantidade limitada de informações transmitidas. A qualidade da fala em taxas de bits de 3.2 kbps, 6 kbps e 9.2 kbps ao usar o codec Lyra é aproximadamente equivalente às taxas de bits de 10 kbps, 13 kbps e 14 kbps ao usar o codec Opus. Para resolver esse problema, além dos métodos convencionais de compressão de áudio e conversão de sinal, Lyra utiliza um modelo de fala baseado em um sistema de aprendizado de máquina, que permite recriar as informações que faltam com base em características típicas da fala. A implementação do código de referência é escrita em C++ e distribuída sob a licença Apache 2.0.

Ao contrário do lançamento radicalmente redesenhado do Lyra 1.2 proposto em outubro, traduzido para uma nova arquitetura de rede neural, a versão 1.3 otimiza o modelo de aprendizado de máquina sem alterações arquiteturais. A nova versão usa números inteiros de 32 bits em vez de números de ponto flutuante de 8 bits para armazenar pesos e realizar operações aritméticas, resultando em uma redução de 43% no tamanho do modelo e uma aceleração de 20% ao testar em um smartphone Pixel 6 Pro. A qualidade da fala foi mantida no mesmo nível, mas o formato dos dados transmitidos mudou e não é compatível com versões anteriores.

Fonte: opennet.ru

Adicionar um comentário