Google je otvorio nedostajuće izvore za Lyra audio kodek

Google je objavio ažuriranje audio kodeka Lyra 0.0.2, koji je optimiziran za postizanje maksimalne kvalitete glasa pri korištenju vrlo sporih komunikacijskih kanala. Kodek je otvoren početkom travnja, ali je isporučen u kombinaciji s vlasničkom matematičkom bibliotekom. U verziji 0.0.2 ovaj nedostatak je eliminiran i stvorena je otvorena zamjena za navedenu biblioteku - sparse_matmul, koja se, kao i sam kodek, distribuira pod licencom Apache 2.0. Ostala poboljšanja uključuju mogućnost korištenja sustava za izgradnju Bazel s GCC kompajlerom i korištenje ovog paketa prema zadanim postavkama u Linuxu umjesto Bazel+Clang.

Podsjetimo, u pogledu kvalitete prijenosa glasovnih podataka pri malim brzinama, Lyra je znatno superiornija od tradicionalnih kodeka koji koriste metode digitalne obrade signala. Kako bi se postigla visoka kvaliteta prijenosa glasa u uvjetima ograničene količine odaslanih informacija, uz konvencionalne metode kompresije zvuka i konverzije signala, Lyra koristi govorni model temeljen na sustavu strojnog učenja, koji vam omogućuje ponovno stvaranje informacija koje nedostaju na temelju tipične karakteristike govora. Model korišten za generiranje zvuka je treniran pomoću nekoliko tisuća sati glasovnih snimaka na više od 70 jezika. Performanse predložene implementacije dovoljne su za kodiranje i dekodiranje govora u stvarnom vremenu na pametnim telefonima srednje cijene, s kašnjenjem prijenosa signala od 90 milisekundi.

Izvor: opennet.ru

Dodajte komentar