DeepMind esitles masinõppesüsteemi ülesande tekstikirjeldusest koodi genereerimiseks

Ettevõte DeepMind, mis on tuntud oma tehisintellekti valdkonna arenduste ning inimtasandil arvuti- ja lauamänge mängima võimeliste närvivõrkude ehitamise poolest, esitles projekti AlphaCode, mis arendab masinõppesüsteemi koodi genereerimiseks, mis suudab osaleda. programmeerimisvõistlustel Codeforcesi platvormil ja näidata keskmist tulemust. Arenduse põhiomaduseks on võime genereerida koodi Pythonis või C++ keeles, võttes sisendiks ingliskeelse probleemiavaldusega teksti.

Süsteemi testimiseks valiti välja 10 uut Codeforcesi võistlust enam kui 5000 osalejaga, mis peeti pärast masinõppe mudeli koolituse lõpetamist. Ülesannete täitmise tulemused võimaldasid AlphaCode süsteemil siseneda nende võistluste reitingu ligikaudu keskele (54.3%). AlphaСode prognoositud üldhinnang oli 1238 punkti, mis tagab pääsu Top 28% hulka kõigi Codeforcesi osalejate seas, kes on viimase 6 kuu jooksul vähemalt korra võistlustel osalenud. Märgitakse, et projekt on alles algstaadiumis ning edaspidi on plaanis parandada genereeritava koodi kvaliteeti, samuti arendada AlphaCode koodi kirjutamisel abistavate süsteemide või rakenduste arendustööriistade suunas, mida saab mida kasutavad programmeerimisoskusteta inimesed.

Projekt kasutab Transformeri närvivõrgu arhitektuuri koos diskreetimis- ja filtreerimistehnikatega, et genereerida erinevaid ettearvamatuid koodivariante, mis vastavad loomuliku keele tekstile. Pärast filtreerimist, rühmitamist ja järjestamist elimineeritakse genereeritud valikute voost kõige optimaalsem töötav kood, mida seejärel kontrollitakse, et saada õige tulemus (iga võistluse ülesande puhul on näidatud sisendandmete näide ja sellele näitele vastav tulemus , mis tuleks hankida pärast programmi käivitamist).

DeepMind esitles masinõppesüsteemi ülesande tekstikirjeldusest koodi genereerimiseks

Masinõppesüsteemi ligikaudseks koolitamiseks kasutasime avalikes GitHubi hoidlates saadaolevat koodibaasi. Pärast esialgse mudeli koostamist viidi läbi optimeerimisetapp, mis põhines Codeforcesi, CodeChefi, HackerEarthi, AtCoderi ja Aizu võistlustel osalejate pakutud probleemide ja lahenduste näidetega koodikogul. Kokku kasutati treeninguteks 715 GB GitHubi koodi ja enam kui miljon näidet tüüpiliste võistlusprobleemide lahendustest. Enne koodi genereerimisele liikumist läbis ülesande tekst normaliseerimisfaasi, mille käigus elimineeriti kõik ebavajalik ja alles jäid vaid olulised osad.

DeepMind esitles masinõppesüsteemi ülesande tekstikirjeldusest koodi genereerimiseks


Allikas: opennet.ru

Lisa kommentaar