IBM Jiftaħ CodeNet għal Sistemi ta' Tagħlim tal-Magni li JiTraduċu u Jivverifikaw il-Kodiċi

IBM żvelat l-inizjattiva CodeNet tagħha, li għandha l-għan li tipprovdi lir-riċerkaturi sett ta’ dejta li jippermettilhom jesperimentaw bl-użu ta’ tekniki ta’ tagħlim bil-magni biex joħolqu tradutturi tal-lingwa ta’ programmar, ġeneraturi tal-kodiċi u analizzaturi. CodeNet jinkludi ġabra ta’ 14-il miljun eżempju ta’ kodiċi li jsolvu 4053 problema ta’ programmazzjoni komuni. B'kollox, il-kollezzjoni fiha madwar 500 miljun linja ta 'kodiċi u tkopri 55 lingwa ta' programmar, kemm lingwi moderni bħal C++, Java, Python u Go, u lingwi legacy inklużi COBOL, Pascal u FORTRAN. L-iżviluppi tal-proġett huma mqassma taħt il-liċenzja Apache 2.0, u s-settijiet tad-dejta huma ppjanati li jitqassmu fil-forma ta 'dominju pubbliku.

L-eżempji huma annotati u jimplimentaw algoritmi identiċi f'lingwi ta' programmar differenti. Huwa mistenni li s-sett propost se jgħin biex iħarreġ sistemi ta 'tagħlim tal-magni u jiżviluppa innovazzjonijiet fil-qasam tat-traduzzjoni u l-parsing tal-kodiċi tal-magni, simili għal kif id-database tal-immaġni annotata ImageNet għenet l-iżvilupp ta' sistemi ta 'rikonoxximent tal-mudell u viżjoni bil-kompjuter. Diversi kompetizzjonijiet ta' programmar huma kkwotati bħala wieħed mis-sorsi ewlenin tal-formazzjoni tal-ġbir.

B'differenza mit-tradutturi tradizzjonali, li huma implimentati abbażi tar-regoli tat-traduzzjoni, is-sistemi ta' tagħlim bil-magni jistgħu jaqbdu u jqisu l-kuntest tal-użu tal-kodiċi. Meta tikkonverti minn lingwa ta' programmazzjoni għal oħra, il-kuntest huwa importanti daqs meta jittraduċi minn lingwa umana għal oħra. Dan in-nuqqas ta’ konsiderazzjoni tal-kuntest huwa dak li jipprevjeni l-kodiċi milli jiġi kkonvertit minn lingwi legacy bħal COBOL.

Li jkollok database kbira ta 'implimentazzjonijiet ta' algoritmi f'lingwi differenti se jgħin biex jinħolqu sistemi universali ta 'tagħlim tal-magni li, minflok traduzzjoni diretta bejn lingwi speċifiċi, jimmanipulaw rappreżentazzjoni aktar astratta tal-kodiċi, indipendenti minn lingwi ta' programmar speċifiċi. Tali sistema tista 'tintuża bħala traduttur, tittraduċi l-kodiċi trażmess fi kwalunkwe waħda mil-lingwi appoġġjati fir-rappreżentazzjoni astratta interna tagħha, li minnha kodiċi jista' mbagħad jiġi ġġenerat f'diversi lingwi.

Is-sistema tkun kapaċi wkoll twettaq trasformazzjonijiet bidirezzjonali. Pereżempju, il-banek u l-aġenziji tal-gvern ikomplu jużaw proġetti fil-lingwa COBOL skaduta. Traduttur ibbażat fuq it-tagħlim tal-magni se jkun jista’ jikkonverti kodiċi COBOL f’rappreżentazzjoni Java, u, jekk meħtieġ, jittraduċi l-framment Java lura f’kodiċi COBOL.

Minbarra t-traduzzjoni bejn il-lingwi, jissemmew oqsma ta 'applikazzjoni ta' CodeNet bħall-ħolqien ta 'sistemi ta' tfittxija ta 'kodiċi intelliġenti u awtomazzjoni ta' skoperta ta 'kloni, kif ukoll l-iżvilupp ta' ottimizzaturi u sistemi awtomatiċi ta 'korrezzjoni ta' kodiċi. B'mod partikolari, l-eżempji ppreżentati f'CodeNet huma mgħammra b'metadejta li tiddeskrivi r-riżultati tal-ittestjar tal-prestazzjoni, id-daqs tal-programm li jirriżulta, il-konsum tal-memorja u l-istat, li jippermettilna niddistingwu kodiċi korrett minn kodiċi bi żbalji (biex tiddistingwi kodiċi korrett minn kodiċi mhux korrett, il- il-ġbir jinkludi speċifikament eżempji bi żbalji, li s-sehem tagħhom huwa 29.5 %. Sistema ta’ tagħlim bil-magni tista’ tqis din il-metadejta biex tiġġenera l-iktar kodiċi ottimali jew biex tidentifika rigressjonijiet fil-kodiċi analizzat (is-sistema tista’ tifhem li l-algoritmu fil-kodiċi sottomess mhuwiex implimentat bl-aħjar mod jew fih żbalji).

Sors: opennet.ru

Żid kumment