Google ir atvērusi trūkstošos avotus Lyra audio kodekam

Google ir publicējis Lyra 0.0.2 audio kodeka atjauninājumu, kas ir optimizēts, lai sasniegtu maksimālu balss kvalitāti, izmantojot ļoti lēnus sakaru kanālus. Kodeks tika atvērts aprīļa sākumā, bet tika piegādāts kopā ar patentētu matemātisko bibliotēku. Versijā 0.0.2 šis trūkums ir novērsts un norādītajai bibliotēkai ir izveidota atvērta nomaiņa - sparse_matmul, kas, tāpat kā pats kodeks, tiek izplatīta ar Apache 2.0 licenci. Citi uzlabojumi ietver iespēju izmantot Bazel būvēšanas sistēmu ar GCC kompilatoru un šī paketes izmantošanu pēc noklusējuma operētājsistēmā Linux, nevis Bazel+Clang.

Atgādināsim, ka zemā ātrumā pārraidīto balss datu kvalitātes ziņā Lyra ir ievērojami pārāka par tradicionālajiem kodekiem, kas izmanto ciparu signālu apstrādes metodes. Lai sasniegtu augstas kvalitātes balss pārraidi ierobežota pārraidītās informācijas daudzuma apstākļos, papildus parastajām audio saspiešanas un signāla konvertēšanas metodēm Lyra izmanto runas modeli, kura pamatā ir mašīnmācīšanās sistēma, kas ļauj atjaunot trūkstošo informāciju, pamatojoties uz tipiskas runas īpašības. Skaņas ģenerēšanai izmantotais modelis tika apmācīts, izmantojot vairākus tūkstošus stundu balss ierakstus vairāk nekā 70 valodās. Piedāvātās ieviešanas veiktspēja ir pietiekama reāllaika runas kodēšanai un dekodēšanai vidējas cenas viedtālruņos ar signāla pārraides aizkavi 90 milisekundes.

Avots: opennet.ru

Pievieno komentāru