Google ha obert les fonts que falten per al còdec d'àudio Lyra

Google ha publicat una actualització del còdec d'àudio Lyra 0.0.2, que està optimitzat per aconseguir la màxima qualitat de veu quan s'utilitzen canals de comunicació molt lents. El còdec es va obrir a principis d'abril, però es va subministrar juntament amb una biblioteca matemàtica propietària. A la versió 0.0.2, aquest inconvenient s'ha eliminat i s'ha creat un reemplaçament obert per a la biblioteca especificada: sparse_matmul, que, com el propi còdec, es distribueix sota la llicència Apache 2.0. Altres millores inclouen la possibilitat d'utilitzar el sistema de compilació Bazel amb el compilador GCC i l'ús d'aquest paquet de manera predeterminada a Linux en lloc de Bazel+Clang.

Recordem que pel que fa a la qualitat de les dades de veu transmeses a baixes velocitats, Lyra és significativament superior als còdecs tradicionals que utilitzen mètodes de processament de senyal digital. Per aconseguir una transmissió de veu d'alta qualitat en condicions d'una quantitat limitada d'informació transmesa, a més dels mètodes convencionals de compressió d'àudio i conversió de senyal, Lyra utilitza un model de parla basat en un sistema d'aprenentatge automàtic, que permet recrear la informació que falta a partir de característiques típiques de la parla. El model utilitzat per generar el so es va entrenar amb milers d'hores d'enregistraments de veu en més de 70 idiomes. El rendiment de la implementació proposada és suficient per a la codificació i descodificació de veu en temps real en telèfons intel·ligents de preu mitjà, amb un retard de transmissió del senyal de 90 mil·lisegons.

Font: opennet.ru

Afegeix comentari