Ažuriranje otvorenog audio kodeka Lyra 1.3

Google je objavio izdanje audio kodeka Lyra 1.3 s ciljem postizanja visokokvalitetnog prijenosa glasa u uvjetima ograničene količine prenesenih informacija. Kvaliteta govora pri brzinama prijenosa od 3.2 kbps, 6 kbps i 9.2 kbps pri korištenju kodeka Lyra približno je ekvivalentna brzinama prijenosa od 10 kbps, 13 kbps i 14 kbps pri korištenju kodeka Opus. Kako bi riješio ovaj problem, uz konvencionalne metode kompresije zvuka i konverzije signala, Lyra koristi govorni model temeljen na sustavu strojnog učenja, koji vam omogućuje ponovno stvaranje informacija koje nedostaju na temelju tipičnih govornih karakteristika. Implementacija referentnog koda napisana je u C++ i distribuirana pod licencom Apache 2.0.

Za razliku od radikalno redizajniranog izdanja Lyre 1.2 predloženog u listopadu, prevedenog na novu arhitekturu neuronske mreže, verzija 1.3 optimizira model strojnog učenja bez arhitektonskih promjena. Nova verzija koristi 32-bitne cijele brojeve umjesto 8-bitnih brojeva s pomičnim zarezom za pohranjivanje težina i izvođenje aritmetičkih operacija, što je rezultiralo smanjenjem veličine modela od 43% i ubrzanjem od 20% pri testiranju na pametnom telefonu Pixel 6 Pro. Kvaliteta govora je zadržana na istoj razini, ali je format prenesenih podataka promijenjen i nije kompatibilan s prethodnim izdanjima.

Izvor: opennet.ru

Dodajte komentar