இயந்திர கற்றலைப் பயன்படுத்தி பேஸ்புக் என்கோடெக் ஆடியோ கோடெக்கை வெளியிடுகிறது

மெட்டா/பேஸ்புக் (ரஷ்ய கூட்டமைப்பில் தடைசெய்யப்பட்டுள்ளது) என்கோடெக் என்ற புதிய ஆடியோ கோடெக்கை அறிமுகப்படுத்தியது, இது தரத்தை இழக்காமல் சுருக்க விகிதத்தை அதிகரிக்க இயந்திர கற்றல் முறைகளைப் பயன்படுத்துகிறது. நிகழ்நேரத்தில் ஆடியோவை ஸ்ட்ரீமிங் செய்வதற்கும், பின்னர் கோப்புகளில் சேமிப்பதற்கு குறியாக்கம் செய்வதற்கும் கோடெக் பயன்படுத்தப்படலாம். என்கோடெக் குறிப்பு செயல்படுத்தல் பைடார்ச் கட்டமைப்பைப் பயன்படுத்தி பைத்தானில் எழுதப்பட்டது மற்றும் வணிகரீதியான பயன்பாட்டிற்காக மட்டுமே CC BY-NC 4.0 (கிரியேட்டிவ் காமன்ஸ் அட்ரிபியூஷன்-வணிகமற்ற) உரிமத்தின் கீழ் உரிமம் பெற்றது.

பதிவிறக்கம் செய்ய இரண்டு ஆயத்த மாதிரிகள் வழங்கப்படுகின்றன:

  • 24 கிலோஹெர்ட்ஸ் மாதிரி விகிதத்தைப் பயன்படுத்தி, மோனோபோனிக் ஆடியோவை மட்டுமே ஆதரிக்கிறது, மேலும் பலதரப்பட்ட ஆடியோ தரவுகளில் பயிற்சியளிக்கப்பட்டது (பேச்சு குறியீட்டுக்கு ஏற்றது). 1.5, 3, 6, 12 மற்றும் 24 kbps பிட் விகிதங்களில் ஒலிபரப்புக்கான ஆடியோ தரவை தொகுக்க இந்த மாதிரியைப் பயன்படுத்தலாம்.
  • 48 கிலோஹெர்ட்ஸ் மாதிரி விகிதத்தைப் பயன்படுத்தி, ஸ்டீரியோ ஆடியோவை ஆதரிக்கும் மற்றும் இசையில் மட்டுமே பயிற்சியளிக்கப்பட்ட ஒரு காரணமற்ற மாதிரி. மாடல் 3, 6, 12 மற்றும் 24 kbps பிட்ரேட்டுகளை ஆதரிக்கிறது.

ஒவ்வொரு மாதிரிக்கும், கூடுதல் மொழி மாதிரி தயாரிக்கப்பட்டுள்ளது, இது தரத்தை இழக்காமல் சுருக்க விகிதத்தில் (40% வரை) குறிப்பிடத்தக்க அதிகரிப்பு அடைய உங்களை அனுமதிக்கிறது. ஆடியோ சுருக்கத்திற்கான இயந்திர கற்றல் முறைகளைப் பயன்படுத்தி முன்னர் உருவாக்கப்பட்ட திட்டங்களைப் போலல்லாமல், என்கோடெக் பேச்சு பேக்கேஜிங்கிற்கு மட்டுமல்ல, ஆடியோ சிடிகளின் நிலைக்கு ஒத்த 48 kHz மாதிரி விகிதத்துடன் இசை சுருக்கத்திற்கும் பயன்படுத்தப்படலாம். புதிய கோடெக்கின் டெவலப்பர்களின் கூற்றுப்படி, MP64 வடிவத்துடன் ஒப்பிடும்போது 3 kbps பிட்ரேட்டுடன் பரிமாற்றும்போது, ​​அதே தரத்தை பராமரிக்கும் போது ஆடியோ சுருக்கத்தின் அளவை சுமார் பத்து மடங்கு அதிகரிக்க முடிந்தது (எடுத்துக்காட்டாக, பயன்படுத்தும் போது MP3, 64 kbps அலைவரிசை தேவை, என்கோடெக்கில் உள்ள அதே தரம் 6 kbps இருந்தால் போதும்).

கோடெக் கட்டமைப்பு "மின்மாற்றி" கட்டமைப்பைக் கொண்ட ஒரு நரம்பியல் நெட்வொர்க்கில் கட்டமைக்கப்பட்டுள்ளது மற்றும் நான்கு இணைப்புகளை அடிப்படையாகக் கொண்டது: குறியாக்கி, குவாண்டிசர், டிகோடர் மற்றும் பாகுபாடு. குறியாக்கி குரல் தரவின் அளவுருக்களை பிரித்தெடுத்து பேக் செய்யப்பட்ட ஸ்ட்ரீமை குறைந்த பிரேம் வீதத்திற்கு மாற்றுகிறது. குவாண்டிசர் (RVQ, Residual Vector Quantizer) குறியாக்கி மூலம் ஸ்ட்ரீம் வெளியீட்டை பாக்கெட்டுகளின் தொகுப்பாக மாற்றுகிறது, தேர்ந்தெடுக்கப்பட்ட பிட்ரேட்டின் அடிப்படையில் தகவலை சுருக்குகிறது. குவாண்டிசரின் வெளியீடு என்பது தரவுகளின் சுருக்கப்பட்ட பிரதிநிதித்துவமாகும், இது பிணையத்தில் பரிமாற்றம் அல்லது வட்டில் சேமிக்க ஏற்றது.

டிகோடர் தரவுகளின் சுருக்கப்பட்ட பிரதிநிதித்துவத்தை டிகோட் செய்து அசல் ஒலி அலையை மறுகட்டமைக்கிறது. மனிதனின் செவிப்புல உணர்வின் மாதிரியை கணக்கில் எடுத்துக்கொண்டு, உருவாக்கப்பட்ட மாதிரிகளின் தரத்தை பாரபட்சம் காட்டுபவர் மேம்படுத்துகிறார். தரம் மற்றும் பிட்ரேட்டின் அளவைப் பொருட்படுத்தாமல், குறியாக்கம் மற்றும் டிகோடிங்கிற்குப் பயன்படுத்தப்படும் மாதிரிகள் மிகவும் சாதாரணமான ஆதாரத் தேவைகளால் வேறுபடுகின்றன (நிகழ்நேர செயல்பாட்டிற்குத் தேவையான கணக்கீடுகள் ஒற்றை CPU மையத்தில் செய்யப்படுகின்றன).

இயந்திர கற்றலைப் பயன்படுத்தி பேஸ்புக் என்கோடெக் ஆடியோ கோடெக்கை வெளியிடுகிறது


ஆதாரம்: opennet.ru

கருத்தைச் சேர்