Lyra 1.3 atvērtā audio kodeka atjauninājums

Google ir publicējis Lyra 1.3 audio kodeka izlaidumu, kura mērķis ir panākt augstas kvalitātes balss pārraidi ierobežota pārraidītās informācijas daudzuma apstākļos. Runas kvalitāte ar bitu pārraides ātrumu 3.2 kb/s, 6 kb/s un 9.2 kb/s, izmantojot Lyra kodeku, ir aptuveni līdzvērtīga bitu pārraides ātrumam 10 kb/s, 13 kb/s un 14 kb/s, izmantojot Opus kodeku. Lai atrisinātu šo problēmu, papildus parastajām audio saspiešanas un signāla pārveidošanas metodēm Lyra izmanto runas modeli, kura pamatā ir mašīnmācīšanās sistēma, kas ļauj atjaunot trūkstošo informāciju, pamatojoties uz tipiskām runas īpašībām. Atsauces koda ieviešana ir rakstīta C++ valodā un tiek izplatīta saskaņā ar Apache 2.0 licenci.

Atšķirībā no oktobrī ierosinātā Lyra 1.2 radikāli pārveidotā laidiena, kas pārveidota jaunā neironu tīkla arhitektūrā, versija 1.3 optimizē mašīnmācīšanās modeli bez arhitektūras izmaiņām. Jaunajā versijā tiek izmantoti 32 bitu veseli skaitļi, nevis 8 bitu peldošā komata skaitļi, lai saglabātu svarus un veiktu aritmētiskās darbības, kā rezultātā modeļa izmērs tiek samazināts par 43% un, pārbaudot viedtālrunī Pixel 20 Pro, paātrināts par 6%. Runas kvalitāte tika saglabāta tādā pašā līmenī, taču pārsūtīto datu formāts ir mainījies un nav savietojams ar iepriekšējiem izlaidumiem.

Avots: opennet.ru

Pievieno komentāru