Bidh Facebook a’ foillseachadh codec claisneachd EnCodec a’ cleachdadh ionnsachadh innealan

Thug Meta/Facebook (toirmisgte ann an Caidreachas na Ruis) a-steach codec claisneachd ùr, EnCodec, a bhios a’ cleachdadh dhòighean ionnsachaidh innealan gus an co-mheas teannachaidh àrdachadh gun a bhith a’ call càileachd. Faodar an codec a chleachdadh an dà chuid airson sruthadh claisneachd ann an àm fìor agus airson còdachadh airson sàbhaladh ann am faidhlichean nas fhaide air adhart. Tha buileachadh iomraidh EnCodec air a sgrìobhadh ann am Python a’ cleachdadh frèam PyTorch agus tha e ceadaichte fo chead CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial) airson cleachdadh neo-mhalairteach a-mhàin.

Tha dà mhodail deiseil air an tabhann airson an luchdachadh sìos:

  • Modail adhbharach a’ cleachdadh ìre samplachaidh 24 kHz, a’ toirt taic do chlaistinn monophonic a-mhàin, agus air a thrèanadh air dàta claisneachd eadar-mheasgte (freagarrach airson còdadh cainnt). Faodar am modail a chleachdadh gus dàta claisneachd a phacadh airson a chraoladh aig ìrean bit de 1.5, 3, 6, 12 agus 24 kbps.
  • Modail neo-adhbharach a’ cleachdadh ìre samplachaidh de 48 kHz, a’ toirt taic do chlaistinn stereo agus air a thrèanadh a-mhàin air ceòl. Tha am modail a 'toirt taic do bitrates de 3, 6, 12 agus 24 kbps.

Airson gach modail, chaidh modal cànain a bharrachd ullachadh, a leigeas leat àrdachadh mòr a choileanadh anns a ’cho-mheas teannachaidh (suas gu 40%) gun a bhith a’ call càileachd. Eu-coltach ri pròiseactan a chaidh a leasachadh roimhe a’ cleachdadh dòighean ionnsachaidh inneal airson teannachadh claisneachd, faodar EnCodec a chleachdadh chan ann a-mhàin airson pacadh cainnt, ach cuideachd airson teannachadh ciùil le ìre samplachaidh de 48 kHz, a rèir ìre CDan claisneachd. A rèir luchd-leasachaidh an codec ùr, nuair a bha iad a’ tar-chuir le bitrate de 64 kbps an coimeas ri cruth MP3, bha e comasach dhaibh an ìre de dhlùthadh claisneachd àrdachadh timcheall air deich tursan fhad ‘s a bha iad a’ cumail an aon ìre de chàileachd (mar eisimpleir, nuair a bha iad a ’cleachdadh Tha feum air MP3, leud-bann de 64 kbps, airson a chraoladh leis an aon chàileachd ann an EnCodec gu leòr 6 kbps).

Tha an ailtireachd codec air a thogail air lìonra neural le ailtireachd “cruth-atharrachaidh” agus tha e stèidhichte air ceithir ceanglaichean: encoder, quantizer, decoder agus leth-bhreith. Bidh an encoder a’ toirt a-mach crìochan an dàta guth agus ag atharrachadh an t-sruth pacaichte gu ìre frèam nas ìsle. Bidh an tomhas-lìonaidh (RVQ, Residual Vector Quantizer) ag atharrachadh toradh an t-sruth leis a’ chòdadair gu seataichean de phasganan, a’ teannachadh fiosrachadh stèidhichte air a’ bitrate taghte. Tha toradh a’ tomhasaire na riochdachadh teann den dàta, a tha freagarrach airson a chuir thairis air lìonra no a shàbhaladh gu diosc.

Bidh an decoder a’ dì-chòdachadh riochdachadh teann an dàta agus ag ath-chruthachadh an tonn fuaim tùsail. Bidh an leth-bhreith a’ leasachadh càileachd nan sampallan a chaidh a chruthachadh, a’ toirt aire don mhodail de bheachd èisteachd daonna. Ge bith dè an ìre càileachd agus bitrate, tha na modailean a thathas a’ cleachdadh airson còdachadh agus dì-chòdachadh air an comharrachadh le riatanasan stòrais caran beag (tha na h-àireamhaidhean a tha riatanach airson obrachadh fìor-ùine air an coileanadh air aon chridhe CPU).

Bidh Facebook a’ foillseachadh codec claisneachd EnCodec a’ cleachdadh ionnsachadh innealan


Source: fosgailtenet.ru

Cuir beachd ann