Foilsíonn Facebook codec fuaime EnCodec ag ​​baint úsáide as meaisínfhoghlaim

Thug Meta/Facebook (toirmeasc i gCónaidhm na Rúise) isteach codec fuaime nua, EnCodec, a úsáideann modhanna meaisínfhoghlama chun an cóimheas comhbhrú a mhéadú gan cáilíocht a chailleadh. Is féidir an CODEC a úsáid le haghaidh sruthú fuaime i bhfíor-am agus le haghaidh ionchódú chun comhaid a shábháil níos déanaí. Tá cur i bhfeidhm tagartha EnCodec scríofa i Python ag baint úsáide as an gcreat PyTorch agus tá sé ceadúnaithe faoi cheadúnas CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial) le haghaidh úsáide neamhthráchtála amháin.

Tá dhá mhúnla réamhdhéanta ar fáil le híoslódáil:

  • Múnla cúiseach a úsáideann ráta samplála 24 kHz, ag tacú le fuaim mhonafónach amháin, agus oiliúint ar shonraí fuaime éagsúla (oiriúnach do chódú cainte). Is féidir an tsamhail a úsáid chun sonraí fuaime a phacáistiú le tarchur ag rátaí giotán 1.5, 3, 6, 12 agus 24 kbps.
  • Múnla neamh-chúiseach a úsáideann ráta samplála 48 kHz, ag tacú le fuaim steirió agus oilte ar cheol amháin. Tacaíonn an tsamhail le giotán 3, 6, 12 agus 24 kbps.

I gcás gach múnla, ullmhaíodh múnla teanga breise, rud a ligeann duit méadú suntasach a bhaint amach ar an gcóimheas comhbhrúite (suas le 40%) gan chailliúint cáilíochta. Murab ionann agus tionscadail a forbraíodh roimhe seo ag baint úsáide as modhanna meaisínfhoghlama le haghaidh comhbhrú fuaime, is féidir EnCodec a úsáid, ní hamháin le haghaidh pacáistiú cainte, ach freisin le haghaidh comhbhrú ceoil le ráta samplála de 48 kHz, a fhreagraíonn do leibhéal na dlúthdhioscaí fuaime. De réir fhorbróirí an CODEC nua, nuair a bhí siad ag tarchur le ráta giotán 64 kbps i gcomparáid leis an bhformáid MP3, bhí siad in ann an méid comhbhrú fuaime a mhéadú thart ar dheich n-uaire agus an leibhéal céanna cáilíochta a choinneáil (mar shampla, nuair a úsáidtear iad. MP3, tá bandaleithead de 64 kbps ag teastáil, le haghaidh tarchur leis sin is leor an cháilíocht chéanna in EnCodec 6 kbps).

Tá ailtireacht an chódóra bunaithe ar líonra néarúil le hailtireacht “claochladán” agus tá sé bunaithe ar cheithre nasc: ionchódóir, cainníochtóir, díchódóir agus idirdhealaitheoir. Sliocht an t-ionchódóir paraiméadair na sonraí gutha agus athraíonn an sruth pacáilte go ráta fráma níos ísle. Tiontaíonn an cainníochtóir (RVQ, Quantizer Veicteoir Iarmharach) aschur an tsrutha ag an ionchódóir ina thacair de phaicéid, ag comhbhrú faisnéis bunaithe ar an ráta giotán roghnaithe. Is léiriú comhbhrúite de na sonraí é aschur an chainníochta, atá oiriúnach le tarchur thar líonra nó le coigilt ar dhiosca.

Díchódaíonn an díchódóir léiriú comhbhrúite na sonraí agus athchruthaíonn sé an tonn fuaime bunaidh. Feabhsaíonn an t-idirdhealúoir cáilíocht na samplaí ginte, ag cur san áireamh an tsamhail de dearcadh éisteachta daonna. Beag beann ar an leibhéal cáilíochta agus ráta giotán, déantar idirdhealú idir na samhlacha a úsáidtear le haghaidh ionchódú agus díchódaithe ag riachtanais acmhainne measartha (déantar na ríomhanna is gá le haghaidh oibriú fíor-ama ar chroílár LAP amháin).

Foilsíonn Facebook codec fuaime EnCodec ag ​​baint úsáide as meaisínfhoghlaim


Foinse: oscailtenet.ru

Add a comment