DeepMind Agent57 AI slår Atari-spil bedre end et menneske

At få et neuralt netværk til at køre gennem simple videospil er en ideel måde at teste effektiviteten af ​​dets træning på, takket være den enkle evne til at evaluere resultaterne af færdiggørelsen. Udviklet i 2012 af DeepMind (en del af Alphabet), blev benchmarken af ​​57 ikoniske Atari 2600-spil en lakmustest til at teste mulighederne for selvlærende systemer. Og her Agent57, en avanceret RL-agent (Reinforcement Learning) DeepMind, for nylig viste et stort spring fra tidligere systemer og var den første iteration af AI, der oversteg den menneskelige spillers baseline.

DeepMind Agent57 AI slår Atari-spil bedre end et menneske

Agent57 AI tager højde for erfaringerne fra virksomhedens tidligere systemer og kombinerer algoritmer til effektiv udforskning af miljøet med meta-kontrol. Især Agent57 har bevist sine overmenneskelige færdigheder i Pitfall, Montezuma's Revenge, Solaris og Skiing – spil, der har testet tidligere neurale netværk alvorligt. Ifølge forskning tvinger Pitfall og Montezuma's Revenge AI til at eksperimentere mere for at opnå bedre resultater. Solaris og skiløb er vanskelige for neurale netværk, fordi der ikke er mange tegn på succes - AI'en ved ikke i lang tid, om den gør det rigtige. DeepMind byggede på sine gamle AI-agenter for at give Agent57 mulighed for at træffe bedre beslutninger om at udforske miljøet og vurdere spils ydeevne, samt optimere afvejningen mellem kortsigtet og langsigtet adfærd i spil som Skiløb.

Resultaterne er imponerende, men AI har stadig lang vej igen. Disse systemer kan kun håndtere et spil ad gangen, hvilket ifølge udviklerne er i modstrid med menneskelige evner: "Den sande fleksibilitet, der kommer så let til den menneskelige hjerne, er stadig uden for AI's rækkevidde."



Kilde: 3dnews.ru

Tilføj en kommentar