Google-k Lyra audio-kodeka argitaratu du ahots-transmisiorako konexio-kalitate eskasean

Google-k Lyra izeneko audio kodek berri bat aurkeztu du, sareko konexio oso moteletan ere ahotsaren kalitate maximoa lortzeko optimizatua. Lyraren inplementazioa C++-n idatzita dago eta Apache 2.0 lizentziapean kode irekikoa da, baina liburutegi jabedun bat behar du, libsparse_inference.so, kalkulu matematikoko motor nagusi bat ezartzen duena. Jabedun liburutegi hau aldi baterakoa dela adierazten da; Google-k kode irekiko ordezko bat garatuko duela eta etorkizunean hainbat plataformatarako laguntza emango duela agintzen du.

Ahots-datuen kalitateari dagokionez, bit-tasa baxuetan, Lyrak seinale digitalaren prozesamendua erabiltzen duten kodek tradizionalak baino emaitza hobeak lortzen ditu. Banda-zabalera mugatuarekin ahots-transmisioaren kalitate handia lortzeko, audio-konpresio eta seinale-bihurketa metodo konbentzionalak ez ezik, Lyrak ikaskuntza automatikoan oinarritutako ahots-eredu bat erabiltzen du, ahots-ezaugarri tipikoetan oinarrituta falta den informazioa berreraikitzen duena. Audioa sortzeko erabilitako eredua 70 hizkuntza baino gehiagotan egindako milaka orduko ahots-grabaketak erabiliz entrenatu zen.

Google-k Lyra audio-kodeka argitaratu du ahots-transmisiorako konexio-kalitate eskasean

Kodekak kodetzaile bat eta deskodetzaile bat ditu. Kodetzailearen algoritmoak ahots-datuen parametroak ateratzen ditu 40 milisegundoro, konprimitzen ditu eta sarearen bidez hartzaileari transmititzen dizkio. Segundoko 3 kilobiteko abiadura duen komunikazio-kanal bat nahikoa da datuak transmititzeko. Ateratako audio-parametroen artean, melogramen espektrograma logaritmikoak daude, maiztasun-tarte desberdinetako ahots-energiaren ezaugarriak kontuan hartzen dituztenak eta gizakiaren entzumen-pertzepzioaren eredu bat erabiliz prestatzen direnak.

Google-k Lyra audio-kodeka argitaratu du ahots-transmisiorako konexio-kalitate eskasean

Deskodetzaileak transmisioko audio-parametroetan oinarritutako ahots-seinalea berreraikitzen duen eredu sortzaile bat erabiltzen du. Konputazio-konplexutasuna murrizteko, sare neuronal errepikakor batean oinarritutako eredu arin bat erabiltzen da. Eredu hau WaveRNN ahots-sintesi ereduaren aldaera bat da, laginketa-tasa txikiagoa erabiltzen duena, baina aldi berean maiztasun-tarte desberdinetan seinale anitz sortzen dituena. Ondoren, ondoriozko seinaleak gainjarri egiten dira zehaztutako laginketa-tasari dagokion irteera-seinale bakarra sortzeko.

64 biteko ARM prozesadoreetan eskuragarri dauden prozesadore-argibide espezializatuak ere erabiltzen dira azeleraziorako. Ondorioz, ikaskuntza automatikoa erabili arren, Lyra kodeka erabil daiteke denbora errealeko ahotsa kodetzeko eta deskodetzeko gama ertaineko telefonoetan, 90 milisegundoko seinale-transmisioaren latentzia erakutsiz.

Iturria: opennet.ru

Erosi hosting fidagarria DDoS babesa duten guneetarako, VPS VDS zerbitzariak 🔥 Erosi webguneentzako ostatu fidagarria DDoS babesarekin, VPS VDS zerbitzariak | ProHoster