IBM CodeNet-ро барои системаҳои омӯзиши мошинсозӣ мекушояд, ки кодро тарҷума ва тафтиш мекунанд

IBM ташаббуси CodeNet-ро муаррифӣ кард, ки ҳадафи он ба муҳаққиқон пешниҳод кардани маҷмӯаи додаҳо мебошад, ки ба онҳо имкон медиҳад бо истифода аз усулҳои омӯзиши мошинсозӣ барои эҷоди тарҷумонҳои забони барномасозӣ, генераторҳои кодҳо ва анализаторҳо озмоиш кунанд. CodeNet маҷмӯи 14 миллион мисолҳои кодро дар бар мегирад, ки 4053 мушкилоти маъмулии барномасозиро ҳал мекунанд. Дар маҷмӯъ, маҷмӯа тақрибан 500 миллион сатри кодро дар бар мегирад ва 55 забони барномасозӣ, ҳам забонҳои муосир ба монанди C++, Java, Python ва Go ва забонҳои кӯҳна, аз ҷумла COBOL, Pascal ва FORTRAN-ро дар бар мегирад. Таҳияҳои лоиҳа тибқи иҷозатномаи Apache 2.0 паҳн карда мешаванд ва маҷмӯи додаҳо ба нақша гирифта шудаанд, ки дар шакли домени ҷамъиятӣ паҳн карда шаванд.

Мисолҳо шарҳ дода шудаанд ва алгоритмҳои якхеларо бо забонҳои гуногуни барномасозӣ амалӣ мекунанд. Интизор меравад, ки маҷмӯаи пешниҳодшуда ба омӯзонидани системаҳои омӯзиши мошинсозӣ ва рушди навоварӣ дар соҳаи тарҷума ва таҳлили коди мошин кӯмак хоҳад кард, ба монанди он, ки пойгоҳи додаи тасвирҳои тасвирии ImageNet ба рушди шинохти намуна ва системаҳои биниши компютерӣ кӯмак кардааст. Яке аз сарчашмаҳои асосии ташаккули коллексия озмунҳои гуногуни барномасозӣ номида мешаванд.

Баръакси тарҷумонҳои анъанавӣ, ки дар асоси қоидаҳои тарҷума амалӣ карда мешаванд, системаҳои омӯзиши мошинсозӣ метавонанд контексти истифодаи кодро сабт ва ба назар гиранд. Ҳангоми гузариш аз як забони барномасозӣ ба забони дигар, контекст ҳамон қадар муҳим аст, ки ҳангоми тарҷума аз як забони инсонӣ ба забони дигар. Ин набудани баррасии контекст он чизест, ки кодро аз забонҳои кӯҳна ба монанди COBOL табдил медиҳад.

Доштани махзани бузурги амалисозии алгоритмҳо бо забонҳои гуногун барои эҷоди системаҳои омӯзиши универсалии мошинсозӣ кӯмак хоҳад кард, ки ба ҷои тарҷумаи мустақим байни забонҳои мушаххас, новобаста аз забонҳои мушаххаси барномасозӣ тасвири абстрактии кодро идора мекунанд. Чунин системаро метавон ҳамчун тарҷумон истифода бурд, ки рамзи интиқолшавандаро дар ҳама гуна забонҳои дастгирӣшаванда ба муаррифии абстрактии дохилии худ тарҷума мекунад, ки пас аз он кодро бо забонҳои гуногун тавлид кардан мумкин аст.

Система инчунин метавонад тағироти дуҷонибаро анҷом диҳад. Масалан, бонкҳо ва муассисаҳои давлатӣ истифодаи лоиҳаҳоро бо забони кӯҳнашудаи COBOL идома медиҳанд. Тарҷумоне, ки ба омӯзиши мошин асос ёфтааст, метавонад рамзи COBOL-ро ба муаррифии Java табдил диҳад ва агар лозим бошад, порчаи Java-ро дубора ба рамзи COBOL тарҷума кунад.

Илова ба тарҷума байни забонҳо, чунин самтҳои татбиқи CodeNet, аз қабили ташкили системаҳои ҷустуҷӯии кодҳои интеллектуалӣ ва автоматикунонии муайянкунии клонҳо, инчунин таҳияи оптимизаторҳо ва системаҳои ислоҳи автоматии кодҳо зикр шудаанд. Аз ҷумла, мисолҳои дар CodeNet овардашуда бо метамаълумотҳо муҷаҳҳаз шудаанд, ки натиҷаҳои санҷиши кор, андозаи барнома, масрафи хотира ва ҳолати тавсифшударо тавсиф мекунанд, ки ба мо имкон медиҳад, ки коди дурустро аз коди хатогиҳо фарқ кунем (барои фарқ кардани коди дуруст аз коди нодуруст, маҷмӯа махсусан мисолҳоеро дар бар мегирад, ки саҳми онҳо 29.5% -ро ташкил медиҳад. Системаи омӯзиши мошинсозӣ метавонад ин метамаълумотро барои тавлиди коди беҳтарин ё муайян кардани регрессияҳо дар коди таҳлилшуда ба инобат гирад (система метавонад фаҳмад, ки алгоритми коди пешниҳодшуда ба таври оптималӣ иҷро нашудааст ё дорои хатогиҳо мебошад).

Манбаъ: opennet.ru

Илова Эзоҳ