Google on avannut puuttuvat lähteet Lyra-äänikoodekille

Google on julkaissut päivityksen Lyra 0.0.2 -äänikoodekille, joka on optimoitu saavuttamaan maksimaalisen äänenlaadun käytettäessä erittäin hitaita viestintäkanavia. Pakkauksenhallinta avattiin huhtikuun alussa, mutta se toimitettiin yhdessä patentoidun matemaattisen kirjaston kanssa. Versiossa 0.0.2 tämä haittapuoli on poistettu ja määritetylle kirjastolle on luotu avoin korvaava - sparse_matmul, joka, kuten itse koodekki, on jaettu Apache 2.0 -lisenssillä. Muita parannuksia ovat mahdollisuus käyttää Bazel-rakennusjärjestelmää GCC-kääntäjän kanssa ja tämän paketin käyttö oletuksena Linuxissa Bazel+Clangin sijaan.

Muistetaan, että pienillä nopeuksilla lähetettävän puhedatan laadussa Lyra on huomattavasti parempi kuin perinteiset digitaalisia signaalinkäsittelymenetelmiä käyttävät koodekit. Laadukkaan äänensiirron saavuttamiseksi rajallisen tiedonsiirron olosuhteissa, tavanomaisten äänenpakkaus- ja signaalimuunnosmenetelmien lisäksi Lyra käyttää koneoppimisjärjestelmään perustuvaa puhemallia, jonka avulla voit luoda uudelleen puuttuvan tiedon tyypillisiä puheen ominaisuuksia. Äänen tuottamiseen käytetty malli opetettiin useiden tuhansien tuntien äänitallenteiden avulla yli 70 kielellä. Ehdotetun toteutuksen suorituskyky on riittävä reaaliaikaiseen puheen koodaukseen ja dekoodaukseen keskihintaisissa älypuhelimissa signaalin lähetysviiveellä 90 millisekuntia.

Lähde: opennet.ru

Lisää kommentti