Lyra 1.3 nyílt audiokodek frissítés

A Google közzétette a Lyra 1.3 audiokodek kiadását, amelynek célja a kiváló minőségű hangátvitel, korlátozott mennyiségű továbbított információ mellett. A beszédminőség 3.2 kbps, 6 kbps és 9.2 kbps bitsebességgel a Lyra kodek használata esetén megközelítőleg megegyezik a 10 kbps, 13 kbps és 14 kbps bitsebességgel az Opus kodek használatakor. A probléma megoldására a hagyományos hangtömörítési és jelátalakítási módszerek mellett a Lyra egy gépi tanulási rendszeren alapuló beszédmodellt használ, amely lehetővé teszi a hiányzó információk újrateremtését a tipikus beszédjellemzők alapján. A referenciakód implementációja C++ nyelven íródott, és az Apache 2.0 licenc alatt terjeszthető.

A Lyra 1.2 gyökeresen áttervezett, októberben javasolt kiadásától eltérően, amelyet új neurális hálózati architektúrára fordítottak, az 1.3-as verzió architektúra változtatások nélkül optimalizálja a gépi tanulási modellt. Az új verzió 32 bites egész számokat használ a 8 bites lebegőpontos számok helyett a súlyok tárolására és az aritmetikai műveletek végrehajtására, ami 43%-kal csökkenti a modell méretét és 20%-kal gyorsítja a Pixel 6 Pro okostelefonon végzett tesztelést. A beszéd minősége változatlan maradt, de a továbbított adatok formátuma megváltozott, és nem kompatibilis a korábbi kiadásokkal.

Forrás: opennet.ru

Hozzászólás