Aktualizace otevřeného zvukového kodeku Lyra 1.3

Google zveřejnil vydání zvukového kodeku Lyra 1.3, jehož cílem je dosáhnout vysoce kvalitního přenosu hlasu v podmínkách omezeného množství přenášených informací. Kvalita řeči při datových tocích 3.2 kbps, 6 kbps a 9.2 kbps při použití kodeku Lyra je přibližně ekvivalentní datovým tokům 10 kbps, 13 kbps a 14 kbps při použití kodeku Opus. K vyřešení tohoto problému kromě konvenčních metod komprese zvuku a převodu signálu používá Lyra model řeči založený na systému strojového učení, který umožňuje znovu vytvořit chybějící informace na základě typických vlastností řeči. Implementace referenčního kódu je napsána v C++ a distribuována pod licencí Apache 2.0.

Na rozdíl od radikálně přepracovaného vydání Lyry 1.2 navržené v říjnu, převedeného na novou architekturu neuronové sítě, verze 1.3 optimalizuje model strojového učení bez architektonických změn. Nová verze používá k ukládání vah a provádění aritmetických operací 32bitová celá čísla namísto 8bitových čísel s plovoucí desetinnou čárkou, což má za následek 43% zmenšení velikosti modelu a 20% zrychlení při testování na smartphonu Pixel 6 Pro. Kvalita řeči byla zachována na stejné úrovni, ale formát přenášených dat se změnil a není kompatibilní s předchozími verzemi.

Zdroj: opennet.ru

Přidat komentář