IBM dia manokatra CodeNet ho an'ny rafitra fianarana milina izay mandika sy manamarina kaody

IBM dia nanambara ny hetsika CodeNet, izay mikendry ny hanome ny mpikaroka amin'ny angon-drakitra ahafahan'izy ireo manandrana mampiasa teknika fianarana milina hamoronana mpandika teny amin'ny fiteny fandaharana, mpamorona kaody ary mpandinika. CodeNet dia ahitana fitambarana ohatra kaody 14 tapitrisa izay mamaha olana 4053 mahazatra amin'ny fandaharana. Amin'ny fitambarany, ny famoriam-bola dia misy tsipika 500 tapitrisa eo ho eo ary mandrakotra fiteny fandaharana 55, samy fiteny maoderina toa ny C ++, Java, Python ary Go, ary ireo fiteny lova anisan'izany ny COBOL, Pascal ary FORTRAN. Ny fivoaran'ny tetikasa dia zaraina amin'ny alΓ lan'ny lisansa Apache 2.0, ary ny angon-drakitra dia kasaina hozaraina amin'ny endrika sehatra ho an'ny daholobe.

Ny ohatra dia misy annotated ary mampihatra algorithm mitovy amin'ny fiteny fandaharana samihafa. Antenaina fa hanampy amin'ny fanofanana ny rafi-pianarana milina sy hampivelatra fanavaozana eo amin'ny sehatry ny fandikan-teny sy fanaparitahana kaody milina ilay andiany naroso, mitovy amin'ny nanampian'ny angon-drakitra sary misy sary an-tsoratra ImageNet amin'ny fampivoarana ny famantarana ny lamina sy ny rafitra fahitana solosaina. Fifaninanana fandaharana isan-karazany no voatonona ho iray amin'ireo loharanon'ny fananganana fanangonana.

Tsy toy ny mpandika teny nentim-paharazana, izay ampiharina mifototra amin'ny fitsipiky ny fandikan-teny, ny rafitra fianarana milina dia afaka maka sy mandinika ny tontolon'ny fampiasana kaody. Rehefa mamadika avy amin'ny fiteny fandaharana iray mankany amin'ny iray hafa, ny contexte dia manan-danja toy ny rehefa mandika avy amin'ny fiteny iray mankany amin'ny iray hafa. Ity tsy fahampian'ny fiheverana ny teny manodidina ity no manakana ny kaody tsy hiova fo amin'ny fiteny lova toy ny COBOL.

Ny fananana angon-drakitra lehibe momba ny fampiharana algorithm amin'ny fiteny samihafa dia hanampy amin'ny famoronana rafitra fianarana milina manerantany izay, raha tokony ho fandikana mivantana eo amin'ny fiteny manokana, dia manodinkodina fanehoana misimisy kokoa momba ny kaody, tsy miankina amin'ny fiteny fandaharana manokana. Ny rafitra toy izany dia azo ampiasaina ho mpandika teny, mandika ny kaody ampitaina amin'ny fiteny tohanana rehetra amin'ny endrika abstract anatiny, izay ahafahan'ny kaody mamorona amin'ny fiteny maro.

Ny rafitra ihany koa dia afaka manatanteraka fanovana roa tonta. Ohatra, mbola mampiasa tetikasa amin'ny fiteny COBOL efa lany andro ny banky sy ny sampan-draharaham-panjakana. Ny mpandika teny mifototra amin'ny masinina dia afaka mamadika kaody COBOL ho solontena Java, ary, raha ilaina, dia mandika ny sombin-java-tsavony ho lasa kaody COBOL.

Ho fanampin'ny fandikan-teny eo amin'ny samy fiteny, dia voalaza ihany koa ny sehatra fampiharana ny CodeNet toy ny famoronana rafitra fikarohana kaody maranitra sy automatique amin'ny fitadiavana clone, ary koa ny fampivoarana ny optimizers sy ny rafitra fanitsiana kaody mandeha ho azy. Indrindra indrindra, ireo ohatra aseho ao amin'ny CodeNet dia manana metadata mamaritra ny valin'ny fitsapana fampisehoana, ny haben'ny programa, ny fanjifana fahatsiarovana ary ny fanjakana, izay ahafahantsika manavaka ny kaody marina amin'ny kaody misy hadisoana (mba hanavahana ny kaody marina amin'ny kaody diso, ny Ny fanangonana manokana dia ahitana ohatra misy hadisoana, ny anjarany dia 29.5%). Ny rafitra fianarana milina dia afaka mandray an'io metadata io mba hamoronana kaody faran'izay tsara indrindra na hamantarana ny fihemorana ao amin'ny kaody nodinihina (ny rafitra dia afaka mahatakatra fa ny algorithm ao amin'ny code natolotra dia tsy ampiharina tsara na misy hadisoana).

Source: opennet.ru

Add a comment