Aktualizacja otwartego kodeka audio Lyra 1.3

Firma Google opublikowała wydanie kodeka audio Lyra 1.3, którego celem jest osiągnięcie wysokiej jakości głosu w ograniczonej ilości przesyłanych informacji. Jakość mowy przy przepływnościach 3.2 kbps, 6 kbps i 9.2 kbps przy użyciu kodeka Lyra odpowiada w przybliżeniu przepływnościom 10 kbps, 13 kbps i 14 kbps przy użyciu kodeka Opus. Aby rozwiązać ten problem, oprócz zwykłych metod kompresji dźwięku i konwersji sygnału, Lyra wykorzystuje model mowy oparty na systemie uczenia maszynowego, który pozwala odtworzyć brakujące informacje w oparciu o typowe cechy mowy. Implementacja kodu referencyjnego jest napisana w języku C++ i rozpowszechniana na licencji Apache 2.0.

W przeciwieństwie do radykalnie przeprojektowanej wersji Lyry 1.2 zaproponowanej w październiku, przetłumaczonej na nową architekturę sieci neuronowej, wersja 1.3 zoptymalizowała model uczenia maszynowego bez zmian architektonicznych. Nowa wersja wykorzystuje 32-bitowe liczby całkowite zamiast 8-bitowych liczb zmiennoprzecinkowych do przechowywania wag i wykonywania działań arytmetycznych, co skutkuje zmniejszeniem rozmiaru modelu o 43% i zwiększeniem wydajności modelu o 20% podczas testowania na smartfonie Pixel 6 Pro. Jednocześnie jakość mowy została utrzymana na tym samym poziomie, jednak format przesyłanych danych uległ zmianie i nie jest kompatybilny z poprzednimi wydaniami.

Źródło: opennet.ru

Dodaj komentarz