Google ha aperto le fonti mancanti per il codec audio Lyra

Google ha pubblicato un aggiornamento del codec audio Lyra 0.0.2, ottimizzato per ottenere la massima qualità vocale quando si utilizzano canali di comunicazione molto lenti. Il codec è stato aperto all'inizio di aprile, ma è stato fornito insieme a una libreria matematica proprietaria. Nella versione 0.0.2 questo inconveniente è stato eliminato ed è stata creata una sostituzione aperta per la libreria specificata: sparse_matmul, che, come il codec stesso, è distribuita sotto la licenza Apache 2.0. Altri miglioramenti includono la possibilità di utilizzare il sistema di compilazione Bazel con il compilatore GCC e l'uso di questo bundle per impostazione predefinita in Linux invece di Bazel+Clang.

Ricordiamo che in termini di qualità dei dati vocali trasmessi a basse velocità, Lyra è significativamente superiore ai codec tradizionali che utilizzano metodi di elaborazione del segnale digitale. Per ottenere una trasmissione vocale di alta qualità in condizioni di una quantità limitata di informazioni trasmesse, oltre ai metodi convenzionali di compressione audio e conversione del segnale, Lyra utilizza un modello vocale basato su un sistema di apprendimento automatico, che consente di ricreare le informazioni mancanti in base a caratteristiche tipiche del parlato. Il modello utilizzato per generare il suono è stato addestrato utilizzando diverse migliaia di ore di registrazioni vocali in più di 70 lingue. Le prestazioni dell'implementazione proposta sono sufficienti per la codifica e decodifica vocale in tempo reale su smartphone di fascia media, con un ritardo di trasmissione del segnale di 90 millisecondi.

Fonte: opennet.ru

Aggiungi un commento