Odprta posodobitev zvočnega kodeka Lyra 1.3

Google je objavil izdajo zvočnega kodeka Lyra 1.3, namenjenega doseganju visokokakovostnega prenosa glasu v pogojih omejene količine prenesenih informacij. Kakovost govora pri bitnih hitrostih 3.2 kbps, 6 kbps in 9.2 kbps pri uporabi kodeka Lyra je približno enakovredna bitnim hitrostim 10 kbps, 13 kbps in 14 kbps pri uporabi kodeka Opus. Za rešitev te težave Lyra poleg običajnih metod stiskanja zvoka in pretvorbe signala uporablja govorni model, ki temelji na sistemu strojnega učenja, ki vam omogoča, da poustvarite manjkajoče informacije na podlagi tipičnih govornih značilnosti. Izvedba referenčne kode je napisana v C++ in se distribuira pod licenco Apache 2.0.

Za razliko od radikalno prenovljene izdaje Lyre 1.2, predlagane oktobra, prevedene v novo arhitekturo nevronske mreže, različica 1.3 optimizira model strojnega učenja brez arhitekturnih sprememb. Nova različica uporablja 32-bitna cela števila namesto 8-bitnih števil s plavajočo vejico za shranjevanje uteži in izvajanje aritmetičnih operacij, kar ima za posledico 43-odstotno zmanjšanje velikosti modela in 20-odstotno pospešitev pri testiranju na pametnem telefonu Pixel 6 Pro. Kakovost govora je bila ohranjena na enaki ravni, vendar se je format prenesenih podatkov spremenil in ni združljiv s prejšnjimi izdajami.

Vir: opennet.ru

Dodaj komentar