A DeepMind bemutatott egy gépi tanulási rendszert, amely egy feladat szöveges leírásából kódot generál

A mesterséges intelligencia területén végzett fejlesztéseiről, valamint az emberi szinten számítógépes és társasjátékozásra alkalmas neurális hálózatok kiépítéséről ismert DeepMind cég bemutatta az AlphaCode projektet, amely egy olyan gépi tanulási rendszert fejleszt, amely képes részt venni a kód előállításában. programozási versenyeken a Codeforces platformon, és mutasson átlagos eredményt. A fejlesztés egyik kulcsfontosságú jellemzője, hogy Python vagy C++ nyelven lehet kódot generálni, bemenetként egy szöveget veszünk fel angol problémafelvetéssel.

A rendszer tesztelésére 10 új Codeforces versenyt választottak ki több mint 5000 résztvevővel, amelyeket a gépi tanulási modell képzésének befejezése után tartottak. A feladatok teljesítésének eredménye lehetővé tette, hogy az AlphaCode rendszer ezen versenyek értékelésének megközelítőleg a közepébe kerüljön (54.3%). Az AlphaСode előre jelzett összesített értékelése 1238 pont volt, ami biztosítja a bejutást a Top 28%-ba azon Codeforces résztvevők között, akik az elmúlt 6 hónapban legalább egyszer részt vettek versenyeken. Megjegyzendő, hogy a projekt még a fejlesztés kezdeti szakaszában van, és a jövőben tervezik a generált kód minőségének javítását, valamint az AlphaCode fejlesztését olyan rendszerek felé, amelyek segítik a kódírást, vagy alkalmazásfejlesztő eszközöket programozási ismeretekkel nem rendelkező emberek használják.

A projekt a Transformer neurális hálózati architektúrát használja mintavételi és szűrési technikákkal kombinálva, hogy különféle, a természetes nyelvű szövegnek megfelelő, előre nem látható kódváltozatokat generáljon. Szűrés, klaszterezés és rangsorolás után a legoptimálisabb működő kód kikerül a generált opciófolyamból, amelyet ezután ellenőrzünk, hogy megbizonyosodjunk a helyes eredményről (minden versenyfeladaton szerepel egy példa a bemeneti adatokra és a példának megfelelő eredményre , amelyet a program végrehajtása után kell beszerezni).

A DeepMind bemutatott egy gépi tanulási rendszert, amely egy feladat szöveges leírásából kódot generál

A gépi tanulási rendszer nagyjából betanításához nyilvános GitHub-tárolókban elérhető kódbázist használtunk. A kezdeti modell elkészítése után egy optimalizálási fázisra került sor, amely a Codeforces, CodeChef, HackerEarth, AtCoder és Aizu versenyek résztvevői által javasolt problémák és megoldási példákat tartalmazó kódgyűjtemény alapján történt. Összességében 715 GB GitHub kódot és több mint egymillió példát használtak a tipikus versenyproblémák megoldására az edzésekhez. A kódgenerálásra való átállás előtt a feladatszöveg egy normalizálási fázison ment keresztül, melynek során minden felesleges kikerült, és csak jelentős részek maradtak meg.

A DeepMind bemutatott egy gépi tanulási rendszert, amely egy feladat szöveges leírásából kódot generál


Forrás: opennet.ru

Hozzászólás