Lyra 1.3 maak oudio-kodek-opdatering oop

Google het die vrystelling van die Lyra 1.3-oudio-kodek gepubliseer, wat daarop gemik is om hoΓ« kwaliteit stemversending te bewerkstellig in toestande van 'n beperkte hoeveelheid oorgedra inligting. Spraakkwaliteit teen bitsnelhede van 3.2 kbps, 6 kbps en 9.2 kbps wanneer die Lyra-kodek gebruik word, is ongeveer gelykstaande aan bitsnelhede van 10 kbps, 13 kbps en 14 kbps wanneer die Opus-kodek gebruik word. Om hierdie probleem op te los, bykomend tot konvensionele metodes van klankkompressie en seinomskakeling, gebruik Lyra 'n spraakmodel gebaseer op 'n masjienleerstelsel, wat jou toelaat om die ontbrekende inligting te herskep op grond van tipiese spraakkenmerke. Die verwysingskode-implementering is in C++ geskryf en onder die Apache 2.0-lisensie versprei.

Anders as die radikaal herontwerpte vrystelling van Lyra 1.2 wat in Oktober voorgestel is, vertaal na 'n nuwe neurale netwerkargitektuur, optimaliseer weergawe 1.3 die masjienleermodel sonder argitektoniese veranderinge. Die nuwe weergawe gebruik 32-bis-heelgetalle in plaas van 8-bis-swaaipuntgetalle om gewigte te stoor en rekenkundige bewerkings uit te voer, wat lei tot 'n 43% vermindering in modelgrootte en 'n 20% versnelling wanneer dit op 'n Pixel 6 Pro-slimfoon getoets word. Die spraakkwaliteit is op dieselfde vlak gehandhaaf, maar die formaat van die oorgedra data het verander en is nie versoenbaar met vorige vrystellings nie.

Bron: opennet.ru

Voeg 'n opmerking