Tha Google air codec claisneachd ùr, Lyra, a thoirt a-steach gus an ìre guth as àirde a choileanadh eadhon nuair a bhios iad a’ cleachdadh seanalan conaltraidh gu math slaodach. Tha còd buileachaidh Lyra sgrìobhte ann an C ++ agus fosgailte fo chead Apache 2.0, ach am measg nan eisimeileachd a tha riatanach airson obrachadh tha leabharlann seilbh libsparse_inference.so le buileachadh kernel airson àireamhachadh matamataigeach. Tha e air a thoirt fa-near gu bheil an leabharlann seilbh sealach - san àm ri teachd tha Google a’ gealltainn àite fosgailte a leasachadh agus taic a thoirt do dhiofar àrd-ùrlaran.
A thaobh càileachd dàta guth tar-chuir aig astaran ìosal, tha Lyra gu math nas fheàrr na codecs traidiseanta a bhios a’ cleachdadh dòighean giullachd chomharran didseatach. Gus tar-chuir guth àrd-inbhe a choileanadh ann an suidheachaidhean glè bheag de dh’ fhiosrachadh a chaidh a ghluasad, a bharrachd air dòighean àbhaisteach airson teannachadh claisneachd agus tionndadh chomharran, bidh Lyra a ’cleachdadh modal cainnt stèidhichte air siostam ionnsachaidh inneal, a leigeas leat am fiosrachadh a tha a dhìth ath-chruthachadh stèidhichte air. feartan cainnt àbhaisteach. Chaidh am modail a chaidh a chleachdadh airson fuaim a ghineadh a thrèanadh le bhith a’ cleachdadh grunn mhìltean uairean de chlàraidhean guth ann an còrr air 70 cànan.
Tha an codec a’ toirt a-steach encoder agus decoder. Bidh algorithm an encoder a’ goil sìos gu bhith a ’toirt a-mach paramadairean dàta guth a h-uile 40 milliseconds, gan teannachadh, agus gan cur chun neach a gheibh e thairis air an lìonra. Tha sianal conaltraidh le astar de 3 kilobits gach diog gu leòr airson sgaoileadh dàta. Tha na paramadairean claisneachd a chaidh a thoirt a-mach a’ toirt a-steach spectrograman mel logarithmic a bheir aire do fheartan lùth cainnt ann an diofar raointean tricead agus a tha air an ullachadh a ’toirt aire don mhodail de bheachd èisteachd daonna.
Bidh an decoder a’ cleachdadh modal ginealach a bhios, stèidhichte air na paramadairean claisneachd tar-chuir, ag ath-chruthachadh a’ chomharra cainnt. Gus iom-fhillteachd àireamhachadh a lughdachadh, chaidh modal aotrom stèidhichte air lìonra neural ath-chuairteach a chleachdadh, a tha na chaochladh de mhodal synthesis cainnt WaveRNN, a bhios a’ cleachdadh tricead samplachaidh nas ìsle, ach a ghineas grunn chomharran aig an aon àm ann an diofar raointean tricead. Tha na comharran a thig às an uairsin air an cuir thairis gus aon chomharra toraidh a thoirt gu buil a rèir na h-ìre samplachaidh ainmichte.
Thathas cuideachd a’ cleachdadh stiùireadh pròiseasar sònraichte a tha ri fhaighinn ann am pròiseasairean ARM 64-bit airson luathachadh. Mar thoradh air an sin, a dh ’aindeoin a bhith a’ cleachdadh ionnsachadh innealan, faodar an codec Lyra a chleachdadh airson còdachadh cainnt fìor-ùine agus dì-chòdachadh air fònaichean sgairteil meadhan-raon, a ’nochdadh latency tar-chuir chomharran de 90 milliseconds.
Source: fosgailtenet.ru