Lyra 1.3 open audio codec update

Inilathala ng Google ang paglabas ng Lyra 1.3 audio codec, na naglalayong makamit ang mataas na kalidad na pagpapadala ng boses sa mga kondisyon ng limitadong halaga ng ipinadalang impormasyon. Ang kalidad ng pagsasalita sa mga bitrate na 3.2 kbps, 6 kbps at 9.2 kbps kapag ginagamit ang Lyra codec ay tinatayang katumbas ng bitrate na 10 kbps, 13 kbps at 14 kbps kapag ginagamit ang Opus codec. Upang malutas ang problemang ito, bilang karagdagan sa mga nakasanayang pamamaraan ng audio compression at conversion ng signal, gumagamit si Lyra ng isang modelo ng pagsasalita batay sa isang machine learning system, na nagbibigay-daan sa iyong muling likhain ang nawawalang impormasyon batay sa mga tipikal na katangian ng pagsasalita. Ang pagpapatupad ng reference code ay nakasulat sa C++ at ipinamahagi sa ilalim ng lisensya ng Apache 2.0.

Hindi tulad ng radically redesigned release ng Lyra 1.2 na iminungkahi noong Oktubre, na isinalin sa isang bagong neural network architecture, ang bersyon 1.3 ay nag-o-optimize sa machine learning model nang walang mga pagbabago sa arkitektura. Gumagamit ang bagong bersyon ng mga 32-bit na integer sa halip na 8-bit na mga floating point na numero upang mag-imbak ng mga timbang at magsagawa ng mga pagpapatakbo ng arithmetic, na nagreresulta sa 43% na pagbawas sa laki ng modelo at 20% na speedup kapag sinusubukan sa isang Pixel 6 Pro na smartphone. Ang kalidad ng pagsasalita ay pinananatili sa parehong antas, ngunit ang format ng ipinadalang data ay nagbago at hindi tugma sa mga nakaraang release.

Pinagmulan: opennet.ru

Magdagdag ng komento