Google otevřel chybějící zdroje pro zvukový kodek Lyra

Google zveřejnil aktualizaci zvukového kodeku Lyra 0.0.2, který je optimalizován pro dosažení maximální kvality hlasu při použití velmi pomalých komunikačních kanálů. Kodek byl otevřen na začátku dubna, ale byl dodán ve spojení s vlastní matematickou knihovnou. Ve verzi 0.0.2 byl tento nedostatek odstraněn a pro uvedenou knihovnu byla vytvořena otevřená náhrada - sparse_matmul, která je stejně jako samotný kodek šířena pod licencí Apache 2.0. Mezi další vylepšení patří možnost používat systém sestavení Bazel s kompilátorem GCC a použití tohoto balíčku ve výchozím nastavení v Linuxu namísto Bazel+Clang.

Připomeňme, že z hlediska kvality přenášených hlasových dat při nízkých rychlostech Lyra výrazně předčí tradiční kodeky využívající metody digitálního zpracování signálu. Pro dosažení vysoce kvalitního přenosu hlasu v podmínkách omezeného množství přenášených informací, kromě konvenčních metod komprese zvuku a převodu signálu, používá Lyra model řeči založený na systému strojového učení, který umožňuje znovu vytvořit chybějící informace na základě typické řečové vlastnosti. Model použitý ke generování zvuku byl trénován pomocí několika tisíc hodin hlasových nahrávek ve více než 70 jazycích. Výkon navrhované implementace je dostatečný pro kódování a dekódování řeči v reálném čase na chytrých telefonech střední ceny se zpožděním přenosu signálu 90 milisekund.

Zdroj: opennet.ru

Přidat komentář