Ko te kaiwhakarewa o QEMU me FFmpeg i whakaputa te TSAC audio codec

Ko Fabrice Bellard te tohunga pangarau Wīwī, nāna i whakatū ngā kaupapa QEMU, FFmpeg, BPG, QuickJS, TinyGL me TinyCC, i whakaputa i te whakatakotoranga whakawaehere ororongo TSAC me nga taputapu e hono ana mo te kopiri me te whakakore i nga konae oro. Ko te whakatakotoranga e arotahi ana ki te tuku raraunga i nga reiti iti rawa, hei tauira, 5.5 kb/s mo te mono me te 7.5 kb/s mo te stereo, me te pupuri i te kounga pai o te puoro me te korero. Ma te whakamahi i te TSAC ka taea e koe te kiki i tetahi titonga puoro me te roanga o te 3.5 meneti me te auau tauira o te 44.1 kHz (tereo) ki roto i te konae 192 KB, kare e tino rerekee mai i te taketake ki te taringa o te tangata reimana tauhou. Ka tohatohahia te waehere kaupapa i raro i te raihana MIT.

Ko te Descript audio codec i whakamahia hei turanga mo te hanga TSAC, i whakawhänuihia hei tautoko i te oro stereo me te whakawhiti ki te whakamahi i tetahi atu tauira ako miihini i runga i te whatunga neural me te hoahoanga "transformer", i taea ai te whakanui ake i te pupuhi. ōwehenga mā te hanga anō i ngā kōrero ngaro me te whakaaro ki te tauira o te tirohanga a te tangata. Ka noho te tauira ki te 200 MB i roto i te ahua kōpeke, ka whakahōputuhia i roto i te tohu whakatau, e whakamana ana i te hua kotahi ahakoa te PTM/GPU i whakamahia me te maha o nga miro e uru ana ki nga tatauranga.

Ka taea e te encoder te whakahaere ma te whakamahi i te PTM anake mo nga tatauranga (kei te tautokohia nga tohutohu AVX2 mo te whakatere), engari ki te whakatutuki i nga mahi teitei ka tūtohu kia whakamahia te GPU. I roto i tona ahua o naianei, ka taea te whakamahi i te CUDA API mo te whakatere ma te whakamahi i nga NVIDIA GPU i runga i te Ampere, ADA me Hopper microarchitectures (RTX 3090, RTX 4090, RTX A6000, A100 me H100) me te iti rawa o te 4 GB o te mahara ataata. Ka whakamahia te FFmpeg ki te huri i nga konae oro i mua i te whakawaehere.

taketaketīwharawhara 6.21 kb/skotahi 4.71 kb/stīwharawhara 2.57 kb/s

I tua atu, ka taea e tatou te kite i te whakahou o te whaipainga ts_zip i hangaia e Bellar, i hangaia mo te pai o te kopiri o nga raraunga kuputuhi ma te whakamahi i te tohu tohu tohu i runga i te punaha ako miihini me te tauira reo nui RWKV 169M v4. I te wa e kopeke ana i te puranga Wikipedia, na te taputapu ts_zip i taea te kopiri i nga raraunga ma te 7.3 nga wa, a i te wa e kopeke ana te waehere kernel Linux 1.2 - ma te 7.8 nga wa. Hei whakataurite, ko nga taumata kōpeketanga i te whakamahi i te whaipainga xz he 4.7 me te 5.5 nga wa, ia. Ko te utu o te kaha o te kaha o te pupuhi he iti te tere o te pupuhi me nga whakaritenga rauemi teitei (te iti rawa o te 4 GB o RAM). I runga i te punaha whai RTX 4090 GPU, tata ki te 1 MB/s te mahinga kōpeketanga.

Source: opennet.ru

Tāpiri i te kōrero