Google je otvorio izvore koji nedostaju za Lyra audio kodek

Google je objavio ažuriranje Lyra 0.0.2 audio kodeka, koji je optimiziran za postizanje maksimalnog kvaliteta glasa pri korištenju vrlo sporih kanala komunikacije. Kodek je otvoren početkom aprila, ali je isporučen zajedno sa vlasničkom matematičkom bibliotekom. U verziji 0.0.2 ovaj nedostatak je eliminisan i kreirana je otvorena zamena za navedenu biblioteku - sparse_matmul, koja se, kao i sam kodek, distribuira pod licencom Apache 2.0. Ostala poboljšanja uključuju mogućnost korištenja Bazel build sistema sa GCC kompajlerom i korištenje ovog paketa po defaultu u Linuxu umjesto Bazel+Clang.

Podsjetimo da je po kvaliteti prenošenih glasovnih podataka pri malim brzinama Lyra značajno superiornija od tradicionalnih kodeka koji koriste metode digitalne obrade signala. Za postizanje visokog kvaliteta prijenosa glasa u uvjetima ograničene količine prenesenih informacija, pored konvencionalnih metoda audio kompresije i konverzije signala, Lyra koristi model govora zasnovan na sistemu mašinskog učenja, koji vam omogućava da ponovo kreirate informacije koje nedostaju na osnovu tipične karakteristike govora. Model koji se koristi za generiranje zvuka je obučen korištenjem nekoliko hiljada sati glasovnih snimaka na više od 70 jezika. Performanse predložene implementacije dovoljne su za kodiranje i dekodiranje govora u realnom vremenu na pametnim telefonima srednje cijene, sa kašnjenjem prijenosa signala od 90 milisekundi.

izvor: opennet.ru

Dodajte komentar