Google otvoril chýbajúce zdroje pre zvukový kodek Lyra

Google zverejnil aktualizáciu zvukového kodeku Lyra 0.0.2, ktorý je optimalizovaný na dosiahnutie maximálnej kvality hlasu pri použití veľmi pomalých komunikačných kanálov. Kodek bol otvorený začiatkom apríla, ale bol dodaný v spojení s proprietárnou matematickou knižnicou. Vo verzii 0.0.2 bol tento nedostatok odstránený a bola vytvorená otvorená náhrada pre špecifikovanú knižnicu - sparse_matmul, ktorá je rovnako ako samotný kodek šírená pod licenciou Apache 2.0. Medzi ďalšie vylepšenia patrí možnosť používať zostavovací systém Bazel s kompilátorom GCC a štandardné používanie tohto balíka v Linuxe namiesto Bazel+Clang.

Pripomeňme, že z hľadiska kvality prenášaných hlasových dát pri nízkych rýchlostiach Lyra výrazne prevyšuje tradičné kodeky, ktoré využívajú metódy digitálneho spracovania signálu. Na dosiahnutie vysokej kvality prenosu hlasu v podmienkach obmedzeného množstva prenášaných informácií, okrem konvenčných metód kompresie zvuku a konverzie signálu, Lyra používa rečový model založený na systéme strojového učenia, ktorý vám umožňuje znovu vytvoriť chýbajúce informácie na základe typické rečové vlastnosti. Model použitý na generovanie zvuku bol trénovaný pomocou niekoľkých tisíc hodín hlasových nahrávok vo viac ako 70 jazykoch. Výkon navrhovanej implementácie je dostatočný na kódovanie a dekódovanie reči v reálnom čase na smartfónoch strednej ceny s oneskorením prenosu signálu 90 milisekúnd.

Zdroj: opennet.ru

Pridať komentár