Google udostępnił brakujące źródła kodeka audio Lyra

Google opublikowało aktualizację kodeka audio Lyra 0.0.2, który jest zoptymalizowany pod kątem osiągnięcia maksymalnej jakości głosu przy korzystaniu z bardzo wolnych kanałów komunikacji. Kodek został otwarty na początku kwietnia, ale był dostarczany w połączeniu z zastrzeżoną biblioteką matematyczną. W wersji 0.0.2 ta wada została wyeliminowana i stworzono otwarty zamiennik dla wskazanej biblioteki - sparse_matmul, który podobnie jak sam kodek rozpowszechniany jest na licencji Apache 2.0. Inne ulepszenia obejmują możliwość korzystania z systemu kompilacji Bazel z kompilatorem GCC i domyślne użycie tego pakietu w systemie Linux zamiast Bazel+Clang.

Przypomnijmy, że pod względem jakości przesyłanych danych głosowych przy małych prędkościach Lyra znacząco przewyższa tradycyjne kodeki wykorzystujące metody cyfrowego przetwarzania sygnału. Aby osiągnąć wysoką jakość transmisji głosu w warunkach ograniczonej ilości przesyłanych informacji, oprócz konwencjonalnych metod kompresji dźwięku i konwersji sygnału, Lyra wykorzystuje model mowy oparty na systemie uczenia maszynowego, który pozwala na odtworzenie brakujących informacji na podstawie typowe cechy mowy. Model wykorzystany do generowania dźwięku został wytrenowany na podstawie kilku tysięcy godzin nagrań głosowych w ponad 70 językach. Wydajność proponowanej implementacji jest wystarczająca do kodowania i dekodowania mowy w czasie rzeczywistym na smartfonach ze średniej półki cenowej, przy opóźnieniu transmisji sygnału wynoszącym 90 milisekund.

Źródło: opennet.ru

Dodaj komentarz