Aggiornamento del codec audio aperto Lyra 1.3

Google ha pubblicato il rilascio del codec audio Lyra 1.3, volto a ottenere una trasmissione vocale di alta qualità in condizioni di quantità limitata di informazioni trasmesse. La qualità della voce a velocità in bit di 3.2 kbps, 6 kbps e 9.2 kbps quando si utilizza il codec Lyra è approssimativamente equivalente a velocità in bit di 10 kbps, 13 kbps e 14 kbps quando si utilizza il codec Opus. Per risolvere questo problema, oltre ai metodi convenzionali di compressione audio e conversione del segnale, Lyra utilizza un modello vocale basato su un sistema di apprendimento automatico, che consente di ricreare le informazioni mancanti in base alle caratteristiche tipiche del parlato. L'implementazione del codice di riferimento è scritta in C++ e distribuita sotto la licenza Apache 2.0.

A differenza della versione radicalmente riprogettata di Lyra 1.2 proposta in ottobre, tradotta in una nuova architettura di rete neurale, la versione 1.3 ottimizza il modello di apprendimento automatico senza modifiche architetturali. La nuova versione utilizza numeri interi a 32 bit anziché numeri in virgola mobile a 8 bit per memorizzare pesi ed eseguire operazioni aritmetiche, con una conseguente riduzione del 43% delle dimensioni del modello e un aumento della velocità del 20% durante i test su uno smartphone Pixel 6 Pro. La qualità della voce è stata mantenuta allo stesso livello, ma il formato dei dati trasmessi è cambiato e non è compatibile con le versioni precedenti.

Fonte: opennet.ru

Aggiungi un commento