குறியீட்டை மொழிபெயர்த்து சரிபார்க்கும் இயந்திர கற்றல் அமைப்புகளுக்கு ஐபிஎம் கோட்நெட்டைத் திறக்கிறது

ஐபிஎம் தனது கோட்நெட் முன்முயற்சியை வெளியிட்டது, இது நிரலாக்க மொழி மொழிபெயர்ப்பாளர்கள், குறியீடு ஜெனரேட்டர்கள் மற்றும் பகுப்பாய்விகளை உருவாக்க இயந்திர கற்றல் நுட்பங்களைப் பயன்படுத்தி பரிசோதனை செய்ய அனுமதிக்கும் தரவுத்தொகுப்பை ஆராய்ச்சியாளர்களுக்கு வழங்குவதை நோக்கமாகக் கொண்டுள்ளது. 14 பொதுவான நிரலாக்க சிக்கல்களைத் தீர்க்கும் 4053 மில்லியன் குறியீடு எடுத்துக்காட்டுகளின் தொகுப்பை CodeNet கொண்டுள்ளது. மொத்தத்தில், சேகரிப்பில் சுமார் 500 மில்லியன் குறியீடுகள் உள்ளன மற்றும் 55 நிரலாக்க மொழிகளை உள்ளடக்கியது, C++, Java, Python மற்றும் Go போன்ற நவீன மொழிகள் மற்றும் COBOL, Pascal மற்றும் FORTRAN உள்ளிட்ட பாரம்பரிய மொழிகள். திட்டத்தின் வளர்ச்சிகள் Apache 2.0 உரிமத்தின் கீழ் விநியோகிக்கப்படுகின்றன, மேலும் தரவுத் தொகுப்புகள் பொது டொமைன் வடிவத்தில் விநியோகிக்க திட்டமிடப்பட்டுள்ளது.

எடுத்துக்காட்டுகள் சிறுகுறிப்பு செய்யப்பட்டு வெவ்வேறு நிரலாக்க மொழிகளில் ஒரே மாதிரியான அல்காரிதம்களை செயல்படுத்துகின்றன. முன்மொழியப்பட்ட தொகுப்பு இயந்திரக் கற்றல் அமைப்புகளைப் பயிற்றுவிப்பதற்கும், மொழிபெயர்ப்பு மற்றும் இயந்திரக் குறியீடு பாகுபடுத்தல் துறையில் புதுமைகளை உருவாக்குவதற்கும் உதவும் என்று எதிர்பார்க்கப்படுகிறது, இது இமேஜ்நெட் சிறுகுறிப்பு பட தரவுத்தளமானது வடிவ அங்கீகாரம் மற்றும் கணினி பார்வை அமைப்புகளின் வளர்ச்சிக்கு உதவியது. பல்வேறு நிரலாக்க போட்டிகள் சேகரிப்பு உருவாக்கத்தின் முக்கிய ஆதாரங்களில் ஒன்றாகக் குறிப்பிடப்படுகின்றன.

மொழிபெயர்ப்பு விதிகளின் அடிப்படையில் செயல்படுத்தப்படும் பாரம்பரிய மொழிபெயர்ப்பாளர்களைப் போலல்லாமல், இயந்திர கற்றல் அமைப்புகள் குறியீடு பயன்பாட்டின் சூழலைப் பிடிக்கலாம் மற்றும் கணக்கில் எடுத்துக்கொள்ளலாம். ஒரு நிரலாக்க மொழியிலிருந்து மற்றொரு மொழிக்கு மாற்றும் போது, ​​ஒரு மனித மொழியிலிருந்து மற்றொரு மொழிக்கு மொழி பெயர்க்கும்போது சூழல் முக்கியமானது. COBOL போன்ற மரபு மொழிகளிலிருந்து குறியீடு மாற்றப்படுவதிலிருந்து இந்த சூழல் கருத்தில் இல்லாதது தடுக்கிறது.

பல்வேறு மொழிகளில் அல்காரிதம் செயலாக்கங்களின் ஒரு பெரிய தரவுத்தளத்தை வைத்திருப்பது உலகளாவிய இயந்திர கற்றல் அமைப்புகளை உருவாக்க உதவும், அவை குறிப்பிட்ட மொழிகளுக்கு இடையே நேரடி மொழிபெயர்ப்பிற்கு பதிலாக, குறிப்பிட்ட நிரலாக்க மொழிகளிலிருந்து சுயாதீனமான குறியீட்டின் சுருக்கமான பிரதிநிதித்துவத்தை கையாளும். அத்தகைய அமைப்பு ஒரு மொழிபெயர்ப்பாளராகப் பயன்படுத்தப்படலாம், ஆதரிக்கப்படும் எந்த மொழியிலும் அனுப்பப்பட்ட குறியீட்டை அதன் உள் சுருக்க பிரதிநிதித்துவமாக மொழிபெயர்க்கலாம், அதிலிருந்து குறியீட்டை பல மொழிகளில் உருவாக்கலாம்.

இந்த அமைப்பு இருதரப்பு மாற்றங்களையும் செய்ய முடியும். எடுத்துக்காட்டாக, வங்கிகளும் அரசு நிறுவனங்களும் காலாவதியான COBOL மொழியில் திட்டங்களைத் தொடர்ந்து பயன்படுத்துகின்றன. ஒரு இயந்திர கற்றல் அடிப்படையிலான மொழிபெயர்ப்பாளர் COBOL குறியீட்டை ஜாவா பிரதிநிதித்துவமாக மாற்ற முடியும், மேலும் தேவைப்பட்டால், ஜாவா பகுதியை மீண்டும் COBOL குறியீட்டிற்கு மொழிபெயர்க்கலாம்.

மொழிகளுக்கிடையேயான மொழிபெயர்ப்புடன் கூடுதலாக, ஸ்மார்ட் குறியீடு தேடல் அமைப்புகளை உருவாக்குதல் மற்றும் குளோன் கண்டறிதலின் ஆட்டோமேஷன், அத்துடன் மேம்படுத்திகள் மற்றும் தானியங்கு குறியீடு திருத்த அமைப்புகளின் வளர்ச்சி போன்ற கோட்நெட்டின் பயன்பாட்டின் பகுதிகள் குறிப்பிடப்பட்டுள்ளன. குறிப்பாக, கோட்நெட்டில் வழங்கப்பட்ட எடுத்துக்காட்டுகள் செயல்திறன் சோதனையின் முடிவுகள், அதன் விளைவாக நிரல் அளவு, நினைவக நுகர்வு மற்றும் நிலை ஆகியவற்றை விவரிக்கும் மெட்டாடேட்டாவுடன் பொருத்தப்பட்டுள்ளன, இது சரியான குறியீட்டை பிழைகள் உள்ள குறியீட்டிலிருந்து வேறுபடுத்த அனுமதிக்கிறது (தவறான குறியீட்டிலிருந்து சரியான குறியீட்டை வேறுபடுத்துவதற்கு, சேகரிப்பில் குறிப்பாக பிழைகள் உள்ள எடுத்துக்காட்டுகள் உள்ளன, இதில் பங்கு 29.5% ஆகும்). ஒரு இயந்திர கற்றல் அமைப்பு இந்த மெட்டாடேட்டாவை மிகவும் உகந்த குறியீட்டை உருவாக்க அல்லது பகுப்பாய்வு செய்யப்பட்ட குறியீட்டில் உள்ள பின்னடைவைக் கண்டறியலாம் (சமர்ப்பிக்கப்பட்ட குறியீட்டில் உள்ள அல்காரிதம் சிறந்த முறையில் செயல்படுத்தப்படவில்லை அல்லது பிழைகளைக் கொண்டுள்ளது என்பதை கணினி புரிந்து கொள்ள முடியும்).

ஆதாரம்: opennet.ru

கருத்தைச் சேர்