GitHub dia nanokatra fivoarana amin'ny fampiasana fianarana milina ho an'ny fikarohana sy famakafakana kaody

GitHub nanaiky tetikasa CodeSearchNet, izay nanomana modely fianarana milina sy angon-drakitra ilaina amin'ny fanasokajiana, fanasokajiana ary famakafakana kaody amin'ny fiteny fandaharana isan-karazany. CodeSearchNet, mitovy amin'ny IMAGEnet, dia ahitana fitambarana sombin-kaody be dia be miaraka amin'ny fanamarihana izay manara-penitra ny ataon'ilay kaody. Ny singa ho an'ny modely fanofanana sy ny ohatra amin'ny fampiasana CodeSearchNet dia nosoratana tamin'ny Python mampiasa ny rafitra Tensorflow sy nozarain'i eo ambanin'ny lisansa MIT.

Rehefa namorona ny CodeSearchNet, dia nampiasaina ny teknolojia famakiam-boky amin'ny fiteny voajanahary, ahafahan'ny rafitra fianarana milina mandinika tsy ny endri-tsoratra syntactic ihany, fa koa ny dikan'ny hetsika ataon'ny fehezan-dalΓ na. Ny rafitra GitHub Applied amin'ny andrana amin'ny fandaminana fikarohana kaody semantika amin'ny fampiasana fanontaniana amin'ny fiteny voajanahary (ohatra, rehefa mangataka "fandaminana lisitry ny tady", dia aseho ny code miaraka amin'ny fampiharana ny algorithm mifanaraka amin'izany).

Ahitana rohy fanehoan-kevitra kaody maherin'ny 2 tapitrisa, voaomana mifototra amin'ny lahatsoratra loharanon'ny tranomboky misokatra efa misy ny angona naroso. Ny kaody dia mandrakotra ny lahatsoratra loharano feno amin'ny fiasa na fomba tsirairay, ary ny fanehoan-kevitra dia mamaritra ny hetsika ataon'ny asa (misy antontan-taratasy amin'ny antsipiriany). Amin'izao fotoana izao, ny angona dia voaomana ho an'ny Python, JavaScript, Ruby, Go, Java ary PHP. Misy ohatra ny amin'ny fampiasana ny angona naroso hanofanana karazana tambajotra neural isan-karazany, ao anatin'izany Neural-Bag-of-Words, RNN, Saina (BERT) ary 1D-CNN+Savorovoro.

Mba hamolavolana fomba fikarohana amin'ny fiteny voajanahary, misy andiana CodeSearchNet Challenge nomanina fanampiny, anisan'izany
99 mahazatra fanontaniana miaraka amin'ny fanamarihan'ny manampahaizana 4 arivo eo ho eo mamaritra ny famatorana kaody azo inoana indrindra ao amin'ny angon-drakitra CodeSearchNet Corpus, mandrakotra fomba sy fiasa 6 tapitrisa (habe napetraka manodidina ny 20 GB). Ny fanamby CodeSearchNet dia mety ho mari-pamantarana amin'ny fanombanana ny fahombiazan'ny fomba sasany amin'ny fikarohana fehezan-dalΓ na momba ny fiteny voajanahary. Mampiasa fitaovana KubeFlow vonona
ohatra milina fikarohana kaody.

Source: opennet.ru

Add a comment