Google je odprl manjkajoče vire za zvočni kodek Lyra

Google je objavil posodobitev zvočnega kodeka Lyra 0.0.2, ki je optimiziran za doseganje največje kakovosti zvoka pri uporabi zelo počasnih komunikacijskih kanalov. Kodek je bil odprt v začetku aprila, vendar je bil dobavljen v povezavi z lastniško matematično knjižnico. V različici 0.0.2 je bila ta pomanjkljivost odpravljena in za navedeno knjižnico je bila ustvarjena odprta zamenjava - sparse_matmul, ki se tako kot sam kodek distribuira pod licenco Apache 2.0. Druge izboljšave vključujejo možnost uporabe sistema gradnje Bazel s prevajalnikom GCC in privzeto uporabo tega svežnja v Linuxu namesto Bazel+Clang.

Spomnimo se, da je glede kakovosti prenesenih govornih podatkov pri nizkih hitrostih Lyra bistveno boljša od tradicionalnih kodekov, ki uporabljajo metode digitalne obdelave signalov. Da bi dosegli visoko kakovost prenosa govora v pogojih omejene količine prenesenih informacij, Lyra poleg običajnih metod stiskanja zvoka in pretvorbe signala uporablja govorni model, ki temelji na sistemu strojnega učenja, ki vam omogoča ponovno ustvarjanje manjkajočih informacij na podlagi tipične govorne značilnosti. Model, uporabljen za ustvarjanje zvoka, je bil usposobljen z uporabo več tisoč ur glasovnih posnetkov v več kot 70 jezikih. Zmogljivost predlagane izvedbe zadostuje za kodiranje in dekodiranje govora v realnem času na pametnih telefonih srednjega cenovnega razreda z zakasnitvijo prenosa signala 90 milisekund.

Vir: opennet.ru

Dodaj komentar