Actualització del còdec d'àudio obert Lyra 1.3

Google ha publicat el llançament del còdec d'àudio Lyra 1.3, destinat a aconseguir una transmissió de veu d'alta qualitat en condicions d'una quantitat limitada d'informació transmesa. La qualitat de la parla a velocitats de bits de 3.2 kbps, 6 kbps i 9.2 kbps quan s'utilitza el còdec Lyra és aproximadament equivalent a velocitats de bits de 10 kbps, 13 kbps i 14 kbps quan s'utilitza el còdec Opus. Per resoldre aquest problema, a més dels mètodes convencionals de compressió d'àudio i conversió de senyal, Lyra utilitza un model de parla basat en un sistema d'aprenentatge automàtic, que permet recrear la informació que falta en funció de les característiques típiques de la parla. La implementació del codi de referència està escrita en C++ i distribuïda sota la llicència Apache 2.0.

A diferència del llançament radicalment redissenyat de Lyra 1.2 proposat a l'octubre, traduït a una nova arquitectura de xarxa neuronal, la versió 1.3 optimitza el model d'aprenentatge automàtic sense canvis arquitectònics. La nova versió utilitza nombres enters de 32 bits en comptes de nombres de coma flotant de 8 bits per emmagatzemar pesos i realitzar operacions aritmètiques, el que resulta en una reducció del 43% de la mida del model i una acceleració del 20% quan es prova en un telèfon intel·ligent Pixel 6 Pro. La qualitat de la parla es va mantenir al mateix nivell, però el format de les dades transmeses ha canviat i no és compatible amb versions anteriors.

Font: opennet.ru

Afegeix comentari