Lyra 1.3 open audiocodec-update

Google heeft de release gepubliceerd van de Lyra 1.3-audiocodec, gericht op het bereiken van spraakoverdracht van hoge kwaliteit onder omstandigheden van een beperkte hoeveelheid verzonden informatie. De spraakkwaliteit bij bitrates van 3.2 kbps, 6 kbps en 9.2 kbps bij gebruik van de Lyra-codec is ongeveer gelijk aan bitrates van 10 kbps, 13 kbps en 14 kbps bij gebruik van de Opus-codec. Om dit probleem op te lossen, gebruikt Lyra, naast conventionele methoden voor audiocompressie en signaalconversie, een spraakmodel gebaseerd op een machine learning-systeem, waarmee u de ontbrekende informatie opnieuw kunt creΓ«ren op basis van typische spraakkenmerken. De implementatie van de referentiecode is geschreven in C++ en gedistribueerd onder de Apache 2.0-licentie.

In tegenstelling tot de radicaal opnieuw ontworpen release van Lyra 1.2 die in oktober werd voorgesteld en vertaald naar een nieuwe neurale netwerkarchitectuur, optimaliseert versie 1.3 het machine learning-model zonder architectonische veranderingen. De nieuwe versie gebruikt 32-bit gehele getallen in plaats van 8-bit drijvende-kommagetallen om gewichten op te slaan en rekenkundige bewerkingen uit te voeren, wat resulteert in een verkleining van de modelgrootte met 43% en een versnelling van 20% bij testen op een Pixel 6 Pro-smartphone. De spraakkwaliteit bleef op hetzelfde niveau, maar het formaat van de verzonden gegevens is veranderd en is niet compatibel met eerdere releases.

Bron: opennet.ru

Voeg een reactie