Tha Google air codec claisneachd Lyra fhoillseachadh airson sgaoileadh cainnt ann an droch chàileachd ceangail

Tha Google air codec claisneachd ùr, Lyra, a thoirt a-steach gus an ìre guth as àirde a choileanadh eadhon nuair a bhios iad a’ cleachdadh seanalan conaltraidh gu math slaodach. Tha còd buileachaidh Lyra sgrìobhte ann an C ++ agus fosgailte fo chead Apache 2.0, ach am measg nan eisimeileachd a tha riatanach airson obrachadh tha leabharlann seilbh libsparse_inference.so le buileachadh kernel airson àireamhachadh matamataigeach. Tha e air a thoirt fa-near gu bheil an leabharlann seilbh sealach - san àm ri teachd tha Google a’ gealltainn àite fosgailte a leasachadh agus taic a thoirt do dhiofar àrd-ùrlaran.

A thaobh càileachd dàta guth tar-chuir aig astaran ìosal, tha Lyra gu math nas fheàrr na codecs traidiseanta a bhios a’ cleachdadh dòighean giullachd chomharran didseatach. Gus tar-chuir guth àrd-inbhe a choileanadh ann an suidheachaidhean glè bheag de dh’ fhiosrachadh a chaidh a ghluasad, a bharrachd air dòighean àbhaisteach airson teannachadh claisneachd agus tionndadh chomharran, bidh Lyra a ’cleachdadh modal cainnt stèidhichte air siostam ionnsachaidh inneal, a leigeas leat am fiosrachadh a tha a dhìth ath-chruthachadh stèidhichte air. feartan cainnt àbhaisteach. Chaidh am modail a chaidh a chleachdadh airson fuaim a ghineadh a thrèanadh le bhith a’ cleachdadh grunn mhìltean uairean de chlàraidhean guth ann an còrr air 70 cànan.

Tha Google air codec claisneachd Lyra fhoillseachadh airson sgaoileadh cainnt ann an droch chàileachd ceangail

Tha an codec a’ toirt a-steach encoder agus decoder. Bidh algorithm an encoder a’ goil sìos gu bhith a ’toirt a-mach paramadairean dàta guth a h-uile 40 milliseconds, gan teannachadh, agus gan cur chun neach a gheibh e thairis air an lìonra. Tha sianal conaltraidh le astar de 3 kilobits gach diog gu leòr airson sgaoileadh dàta. Tha na paramadairean claisneachd a chaidh a thoirt a-mach a’ toirt a-steach spectrograman mel logarithmic a bheir aire do fheartan lùth cainnt ann an diofar raointean tricead agus a tha air an ullachadh a ’toirt aire don mhodail de bheachd èisteachd daonna.

Tha Google air codec claisneachd Lyra fhoillseachadh airson sgaoileadh cainnt ann an droch chàileachd ceangail

Bidh an decoder a’ cleachdadh modal ginealach a bhios, stèidhichte air na paramadairean claisneachd tar-chuir, ag ath-chruthachadh a’ chomharra cainnt. Gus iom-fhillteachd àireamhachadh a lughdachadh, chaidh modal aotrom stèidhichte air lìonra neural ath-chuairteach a chleachdadh, a tha na chaochladh de mhodal synthesis cainnt WaveRNN, a bhios a’ cleachdadh tricead samplachaidh nas ìsle, ach a ghineas grunn chomharran aig an aon àm ann an diofar raointean tricead. Tha na comharran a thig às an uairsin air an cuir thairis gus aon chomharra toraidh a thoirt gu buil a rèir na h-ìre samplachaidh ainmichte.

Thathas cuideachd a’ cleachdadh stiùireadh pròiseasar sònraichte a tha ri fhaighinn ann am pròiseasairean ARM 64-bit airson luathachadh. Mar thoradh air an sin, a dh ’aindeoin a bhith a’ cleachdadh ionnsachadh innealan, faodar an codec Lyra a chleachdadh airson còdachadh cainnt fìor-ùine agus dì-chòdachadh air fònaichean sgairteil meadhan-raon, a ’nochdadh latency tar-chuir chomharran de 90 milliseconds.

Source: fosgailtenet.ru

Cuir beachd ann