DeepMind Agent57 AI sigrar Atari leiki betur en menn

Að láta taugakerfi keyra í gegnum einfalda tölvuleiki er tilvalin leið til að prófa skilvirkni þjálfunar þess, þökk sé einföldu hæfileikanum til að meta niðurstöður þess. Viðmið 2012 helgimynda Atari 57 leikja, sem var þróað árið 2600 af DeepMind (hluti af Alphabet), varð litmuspróf til að prófa getu sjálfsnámskerfa. Og hér Agent57, háþróaður RL umboðsmaður (Reinforcement Learning) DeepMind, nýlega sýndi mikið stökk frá fyrri kerfum og var fyrsta endurtekning gervigreindar sem fór yfir grunnlínu mannlegs leikmanns.

DeepMind Agent57 AI sigrar Atari leiki betur en menn

Agent57 AI tekur mið af reynslu fyrri kerfa fyrirtækisins og sameinar reiknirit fyrir skilvirka könnun á umhverfinu með meta-stýringu. Sérstaklega hefur Agent57 sannað ofurmannlega hæfileika sína í Pitfall, Montezuma's Revenge, Solaris og Skiing - leikjum sem hafa reynt alvarlega fyrri taugakerfi. Samkvæmt rannsóknum þvinga Pitfall og Montezuma's Revenge gervigreindina til að gera fleiri tilraunir til að ná betri árangri. Solaris og skíði eru erfið fyrir taugakerfi vegna þess að það eru ekki mörg merki um árangur - gervigreind veit ekki í langan tíma hvort það er að gera rétt. DeepMind byggði á eldri gervigreindum umboðsmönnum sínum til að leyfa Agent57 að taka betri ákvarðanir um að kanna umhverfið og meta frammistöðu leikja, auk þess að fínstilla skiptinguna milli skammtíma- og langtímahegðunar í leikjum eins og skíði.

Árangurinn er glæsilegur en gervigreind á enn langt í land. Þessi kerfi geta aðeins séð um einn leik í einu, sem, samkvæmt þróunaraðilum, er andstætt mannlegri getu: „Hinn sanni sveigjanleiki sem kemur svo auðveldlega fyrir mannsheilann er enn utan seilingar gervigreindar.



Heimild: 3dnews.ru

Bæta við athugasemd