Google a deschis sursele lipsă pentru codecul audio Lyra

Google a publicat o actualizare a codec-ului audio Lyra 0.0.2, care este optimizat pentru a obține o calitate maximă a vocii atunci când se utilizează canale de comunicare foarte lente. Codecul a fost deschis la începutul lunii aprilie, dar a fost furnizat împreună cu o bibliotecă matematică proprietară. În versiunea 0.0.2, acest dezavantaj a fost eliminat și a fost creată o înlocuire deschisă pentru biblioteca specificată - sparse_matmul, care, ca și codecul în sine, este distribuită sub licența Apache 2.0. Alte îmbunătățiri includ capacitatea de a utiliza sistemul de compilare Bazel cu compilatorul GCC și utilizarea implicită a acestui pachet în Linux în loc de Bazel+Clang.

Să reamintim că în ceea ce privește calitatea datelor de voce transmise la viteze mici, Lyra este semnificativ superioară codec-urilor tradiționale care utilizează metode de procesare a semnalului digital. Pentru a realiza o transmisie vocală de înaltă calitate în condițiile unei cantități limitate de informații transmise, pe lângă metodele convenționale de compresie audio și conversie a semnalului, Lyra utilizează un model de vorbire bazat pe un sistem de învățare automată, care vă permite să recreați informațiile lipsă pe baza caracteristici tipice de vorbire. Modelul folosit pentru a genera sunetul a fost antrenat folosind câteva mii de ore de înregistrări vocale în peste 70 de limbi. Performanța implementării propuse este suficientă pentru codificarea și decodarea vorbirii în timp real pe smartphone-uri cu preț mediu, cu o întârziere de transmisie a semnalului de 90 de milisecunde.

Sursa: opennet.ru

Adauga un comentariu