Lyra 1.3 Open Audio Codec Update

Google on julkaissut Lyra 1.3 -äänikoodekin julkaisun, jonka tavoitteena on saavuttaa korkealaatuinen äänensiirto olosuhteissa, joissa siirrettävä määrä on rajoitettu. Puheen laatu bittinopeuksilla 3.2 kbps, 6 kbps ja 9.2 kbps käytettäessä Lyra-koodekkia vastaa suunnilleen bittinopeuksia 10 kbps, 13 kbps ja 14 kbps käytettäessä Opus-koodekkia. Tämän ongelman ratkaisemiseksi Lyra käyttää perinteisten äänenpakkaus- ja signaalimuunnosmenetelmien lisäksi koneoppimisjärjestelmään perustuvaa puhemallia, jonka avulla voit luoda uudelleen puuttuvan tiedon tyypillisten puheominaisuuksien perusteella. Viitekoodin toteutus on kirjoitettu C++-kielellä ja jaettu Apache 2.0 -lisenssillä.

Toisin kuin lokakuussa ehdotettu radikaalisti uudistettu Lyra 1.2 -julkaisu, joka käännettiin uudeksi hermoverkkoarkkitehtuuriksi, versio 1.3 optimoi koneoppimismallin ilman arkkitehtonisia muutoksia. Uusi versio käyttää 32-bittisiä kokonaislukuja 8-bittisten liukulukujen sijaan painojen tallentamiseen ja aritmeettisten toimintojen suorittamiseen, mikä johtaa 43 %:n pienenemiseen mallin kokoon ja 20 %:n nopeuttamiseen Pixel 6 Pro -älypuhelimella testattaessa. Puheen laatu pidettiin samalla tasolla, mutta lähetetyn datan muoto on muuttunut eikä ole yhteensopiva aikaisempien julkaisujen kanssa.

Lähde: opennet.ru

Lisää kommentti