Google Lyra аудио кодекінің жетіспейтін көздерін ашты

Google өте баяу байланыс арналарын пайдаланған кезде максималды дауыс сапасына қол жеткізу үшін оңтайландырылған Lyra 0.0.2 аудио кодек жаңартуын жариялады. Кодек сәуір айының басында ашылды, бірақ меншікті математикалық кітапханамен бірге жеткізілді. 0.0.2 нұсқасында бұл кемшілік жойылды және көрсетілген кітапхана үшін ашық ауыстыру жасалды - sparse_matmul, ол кодектің өзі сияқты Apache 2.0 лицензиясы бойынша таратылады. Басқа жақсартулар GCC компиляторымен Bazel құрастыру жүйесін пайдалану мүмкіндігін және Bazel+Clang орнына Linux жүйесінде әдепкі бойынша осы топтаманы пайдалануды қамтиды.

Еске салайық, төмен жылдамдықта берілетін дауыстық деректердің сапасы бойынша Lyra цифрлық сигналдарды өңдеу әдістерін қолданатын дәстүрлі кодектерден айтарлықтай жоғары. Жіберілетін ақпараттың шектеулі көлемі жағдайында жоғары сапалы дауысты жіберуге қол жеткізу үшін дыбысты сығудың және сигналды түрлендірудің әдеттегі әдістеріне қосымша, Lyra машиналық оқыту жүйесіне негізделген сөйлеу моделін пайдаланады, ол жетіспейтін ақпаратты қайта құруға мүмкіндік береді. типтік сөйлеу ерекшеліктері. Дыбысты генерациялау үшін қолданылатын модель 70-тен астам тілде бірнеше мың сағаттық дауыстық жазбаларды қолдану арқылы оқытылды. Ұсынылған енгізудің өнімділігі сигнал беру кідірісі 90 миллисекунд болатын орташа бағалы смартфондарда нақты уақыт режимінде сөйлеуді кодтау және декодтау үшін жеткілікті.

Ақпарат көзі: opennet.ru

пікір қалдыру