GitHub waxay furtay horumarinta isticmaalka barashada mashiinka raadinta koodka iyo falanqaynta

GitHub soo bandhigay qabyo-qorid CodeSearchNet, kaas oo diyaariyey moodooyinka barashada mashiinka iyo xogta xogta lagama maarmaanka u ah falanqaynta, kala soocida iyo falanqaynta code ee luuqadaha barnaamijyada kala duwan. CodeSearchNet, la mid ah ImageNet, waxa ku jira ururin badan oo qaybo kood ah oo ay ku jiraan tilmaamo si rasmi ah u dhigaya waxa koodku sameeyo. Qaybaha moodooyinka tababarka iyo tusaalooyinka isticmaalka CodeSearchNet waxay ku qoran yihiin Python iyadoo la adeegsanayo qaabka Tensorflow iyo qaybiyey hoos shatiga MIT.

Markii la abuurayay CodeSearchNet, tignoolajiyada falanqaynta qoraalka luqadda dabiiciga ah ayaa la isticmaalay, taasoo awood u siisay nidaamyada barashada mashiinka inay ku xisaabtamaan ma aha oo kaliya astaamaha isku dhafan, laakiin sidoo kale macnaha ficilada uu sameeyay koodka. Nidaamka GitHub codsatay Tijaabo ku saabsan abaabulka kood raadinta semantic iyadoo la adeegsanayo su'aalo ku saabsan luqadda dabiiciga ah (tusaale ahaan, marka la codsanayo "kala-soocida liiska xargaha", code leh hirgelinta algorithms u dhigma ayaa la soo bandhigayaa).

Xogta la soo jeediyay waxaa ka mid ah in ka badan 2 milyan oo xiriiriye-code-falo, oo la diyaariyay iyadoo lagu salaynayo qoraallada isha ee maktabadaha furan ee jira. Xeerku wuxuu daboolayaa qoraalka isha dhamaystiran ee shaqooyinka ama hababka shakhsi ahaaneed, iyo faallooyinka ayaa qeexaya ficillada ay sameeyeen shaqada (dokumentiyo faahfaahsan ayaa la bixiyaa). Hadda, xog-ururinta waxaa loo diyaariyey Python, JavaScript, Ruby, Go, Java iyo PHP. Tusaalooyinka waxaa la bixiyaa isticmaalka xog-ururinta la soo jeediyay ee tababarka noocyada kala duwan ee shabakadaha neerfaha, oo ay ku jiraan Bacda-Neural-Ereyada, RNN, Feejignaanta Nafta (BERT) iyo Isku-dhafka 1D-CNN+Nafta-Feejignaanta.

Si loo horumariyo hababka raadinta luqadda dabiiciga ah, waxaa intaa dheer oo la diyaariyay tiro CodeSearchNet Challenge ah, oo ay ku jiraan
99 caadiga ah Weydiimaha leh ilaa 4 kun oo tafaasiil khabiiro ah oo qeexaya xidhidhiyaha kood ee ugu macquulsan ee ku jira xog-ururinta CodeSearchNet Corpus, oo daboolaya ilaa 6 milyan oo hab iyo hawlo ah (cabbirka go'an ilaa 20 GB). CodkaSearchNet Challenge wuxuu u adeegi karaa halbeeg lagu qiimeeyo waxtarka hababka qaarkood ee raadinta code-ka luqadda dabiiciga ah. Isticmaalka qalabka KubeFlow diyaariyay
Tusaale mashiinka raadinta code.

Source: opennet.ru

Add a comment