Facebook ayaa daabacday codec maqal ah oo EnCodec ah iyadoo la adeegsanayo barashada mashiinka

Meta/Facebook (oo laga mamnuucay Xiriirka Ruushka) ayaa soo bandhigay codec cusub oo maqal ah, EnCodec, kaas oo adeegsada hababka barashada mashiinka si loo kordhiyo saamiga isku xidhka iyada oo aan tayada lumin. Codec-ka waxa loo isticmaali karaa baahinta codka wakhtiga dhabta ah iyo in koodka lagu kaydiyo galalka dambe. Hirgelinta tixraaca EnCodec waxay ku qoran tahay Python iyadoo la adeegsanayo qaab dhismeedka PyTorch waxaana lagu shatiyeysan yahay CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial) shatiga isticmaalka aan ganacsi ahayn oo keliya.

Laba nooc oo diyaarsan ayaa loo soo bandhigay si loo soo dejiyo:

  • Qaabka sababa ee isticmaala xadiga muunad ee 24 kHz, taageera kaliya codka monophonic, oo lagu tababaray xogta maqalka ee kala duwan (ku haboon codaynta hadalka). Qaabka waxa loo isticmaali karaa in lagu xidho xogta maqalka ah ee gudbinta ee heerarka yara ee 1.5, 3, 6, 12 iyo 24 kbps.
  • Nooc aan sabab lahayn oo isticmaalaya heerka muunad ee 48 kHz, taageeraya codka stereo oo lagu tababaray muusiga oo kaliya. Qaabku waxa uu taageeraa bitrates 3, 6, 12 iyo 24 kbps

Nooc kasta, qaab luqadeed oo dheeraad ah ayaa la diyaariyey, kaas oo kuu ogolaanaya inaad si weyn u kordhiso saamiga cadaadiska (ilaa 40%) iyada oo aan lumin tayada. Si ka duwan mashaariicda hore loo sameeyay ee loo isticmaalo hababka barashada mashiinka loogu talagalay isku-buufinta maqalka, EnCodec waxaa loo isticmaali karaa ma aha oo kaliya baakadaha hadalka, laakiin sidoo kale riixitaanka muusikada oo leh cabbir muunad ah 48 kHz, oo u dhiganta heerka CD-yada maqalka ah. Sida laga soo xigtay kuwa soo saaray codec-ka cusub, marka la gudbinayo bitrate of 64 kbps marka la barbar dhigo qaabka MP3, waxay awoodeen inay kordhiyaan heerka cadaadiska maqalka qiyaastii toban jeer iyagoo ilaalinaya isla heerka tayada (tusaale, marka la isticmaalayo. MP3, bandwidth ah 64 kbps ayaa loo baahan yahay, gudbinta tayada isku midka ah ee EnCodec ayaa ku filan 6 kbps).

Nashqada codec-ka waxa lagu dhisay shabakad neural ah oo leh qaab dhismeedka β€œtransformer” wuxuuna ku salaysan yahay afar xiriiriye: codeer, quantizer, decoder iyo takooriye. Codeeyuhu wuxuu soosaaraa cabbirrada xogta codka wuxuuna u beddelaa qulqulka la buuxiyay heer hoose. Quantizer-ku (RVQ, Residual Vector Quantizer) waxa uu u beddelaa soo-saarka qulqulka cod-bixiyaha oo u beddela xidhmo xidhmo ah, isaga oo ku cadaadinaya macluumaadka ku salaysan bitrate-ka la doortay. Wax-soo-saarka quantizer-ku waa xog-uruurinta xogta, oo ku habboon gudbinta shabakadda ama kaydinta saxanka.

Decoder-ku wuxuu dejiyaa matalaadda la cufiday ee xogta wuxuuna dib u dhisaa mowjadda dhawaaqa asalka ah. Takoorku wuxuu wanaajiyaa tayada shaybaarrada la soo saaray, isagoo tixgelinaya qaabka aragtida maqalka ee bini'aadamka. Iyadoo aan loo eegin heerka tayada iyo bitrate-ka, moodooyinka loo isticmaalo codaynta iyo dejinta waxaa lagu kala soocaa shuruudaha kheyraadka ee dhexdhexaadka ah ( xisaabaadka lagama maarmaanka u ah hawlgalka waqtiga-dhabta ah waxaa lagu sameeyaa hal xudunta CPU).

Facebook ayaa daabacday codec maqal ah oo EnCodec ah iyadoo la adeegsanayo barashada mashiinka


Source: opennet.ru

Add a comment