A Google megnyitotta a hiányzó forrásokat a Lyra audiokodek számára

A Google frissítést tett közzé a Lyra 0.0.2 audiokodekhez, amelyet úgy optimalizáltak, hogy nagyon lassú kommunikációs csatornák használatakor maximális hangminőséget érjen el. A kodeket április elején nyitották meg, de egy szabadalmaztatott matematikai könyvtárral együtt szállították. A 0.0.2-es verzióban ezt a hátrányt kiküszöbölték, és egy nyílt helyettesítést hoztak létre a megadott könyvtár számára - sparse_matmul, amely, akárcsak maga a kodek, az Apache 2.0 licenc alatt kerül terjesztésre. A további fejlesztések közé tartozik a Bazel build rendszer használata a GCC fordítóval, valamint ennek a csomagnak a használata alapértelmezés szerint Linuxban a Bazel+Clang helyett.

Emlékezzünk vissza, hogy az alacsony sebességgel továbbított hangadatok minőségét tekintve a Lyra jelentősen felülmúlja a hagyományos, digitális jelfeldolgozási módszereket alkalmazó kodekeket. A jó minőségű hangátvitel elérése érdekében korlátozott mennyiségű továbbított információ mellett a hagyományos hangtömörítési és jelátalakítási módszerek mellett a Lyra gépi tanulási rendszeren alapuló beszédmodellt használ, amely lehetővé teszi a hiányzó információk újbóli létrehozását. tipikus beszédjellemzők. A hang generálására használt modellt több ezer órányi hangfelvétel segítségével képezték ki több mint 70 nyelven. A javasolt megvalósítás teljesítménye elegendő a valós idejű beszédkódoláshoz és dekódoláshoz közepes árú okostelefonokon, 90 ezredmásodperces jelátviteli késleltetés mellett.

Forrás: opennet.ru

Hozzászólás