Google heeft de ontbrekende bronnen voor de Lyra-audiocodec geopend

Google heeft een update gepubliceerd van de Lyra 0.0.2-audiocodec, die is geoptimaliseerd om maximale spraakkwaliteit te bereiken bij gebruik van zeer langzame communicatiekanalen. De codec werd begin april geopend, maar werd geleverd in combinatie met een eigen wiskundige bibliotheek. In versie 0.0.2 is dit nadeel geëlimineerd en is er een open vervanging gemaakt voor de opgegeven bibliotheek - sparse_matmul, die, net als de codec zelf, wordt gedistribueerd onder de Apache 2.0-licentie. Andere verbeteringen zijn onder meer de mogelijkheid om het Bazel-buildsysteem te gebruiken met de GCC-compiler en het gebruik van deze bundel standaard in Linux in plaats van Bazel+Clang.

Laten we niet vergeten dat Lyra qua kwaliteit van de verzonden spraakgegevens bij lage snelheden aanzienlijk superieur is aan traditionele codecs die gebruik maken van digitale signaalverwerkingsmethoden. Om spraakoverdracht van hoge kwaliteit te bereiken bij een beperkte hoeveelheid verzonden informatie, gebruikt Lyra, naast de conventionele methoden van audiocompressie en signaalconversie, een spraakmodel gebaseerd op een machinaal leersysteem, waarmee u de ontbrekende informatie opnieuw kunt creëren op basis van typische spraakkenmerken. Het model dat werd gebruikt om het geluid te genereren, werd getraind met behulp van duizenden uren aan stemopnames in meer dan 70 talen. De prestaties van de voorgestelde implementatie zijn voldoende voor realtime spraakcodering en -decodering op smartphones uit het middensegment, met een signaaloverdrachtsvertraging van 90 milliseconden.

Bron: opennet.ru

Voeg een reactie