Binuksan ng Google ang mga nawawalang source para sa Lyra audio codec

Nag-publish ang Google ng update sa Lyra 0.0.2 audio codec, na na-optimize upang makamit ang pinakamataas na kalidad ng boses kapag gumagamit ng napakabagal na mga channel ng komunikasyon. Binuksan ang codec noong unang bahagi ng Abril, ngunit ibinigay kasabay ng isang proprietary mathematical library. Sa bersyon 0.0.2, ang disbentaha na ito ay inalis at isang bukas na kapalit ay ginawa para sa tinukoy na library - sparse_matmul, na, tulad ng mismong codec, ay ipinamamahagi sa ilalim ng Apache 2.0 na lisensya. Kasama sa iba pang mga pagpapabuti ang kakayahang gamitin ang Bazel build system kasama ang GCC compiler at ang paggamit ng bundle na ito bilang default sa Linux sa halip na Bazel+Clang.

Alalahanin natin na sa mga tuntunin ng kalidad ng ipinadalang data ng boses sa mababang bilis, ang Lyra ay higit na nakahihigit sa mga tradisyonal na codec na gumagamit ng mga digital signal processing method. Upang makamit ang mataas na kalidad na pagpapadala ng boses sa mga kundisyon ng limitadong dami ng ipinadalang impormasyon, bilang karagdagan sa mga kumbensyonal na pamamaraan ng audio compression at conversion ng signal, gumagamit si Lyra ng speech model batay sa isang machine learning system, na nagbibigay-daan sa iyong muling likhain ang nawawalang impormasyon batay sa tipikal na katangian ng pagsasalita. Ang modelong ginamit upang makabuo ng tunog ay sinanay gamit ang ilang libong oras ng pag-record ng boses sa higit sa 70 mga wika. Ang pagganap ng iminungkahing pagpapatupad ay sapat para sa real-time na speech encoding at decoding sa mid-price na mga smartphone, na may pagkaantala sa paghahatid ng signal na 90 milliseconds.

Pinagmulan: opennet.ru

Magdagdag ng komento