DeepMind Agent57 AI įveikia Atari žaidimus geriau nei žmogus

Neuroninio tinklo paleidimas naudojant paprastus vaizdo žaidimus yra idealus būdas patikrinti jo mokymo efektyvumą dėl paprastos galimybės įvertinti užbaigimo rezultatus. 2012 m. sukurtas DeepMind (Alphabet dalis), 57 ikoninių Atari 2600 žaidimų etalonas tapo lakmuso popierėliu išbandant savarankiško mokymosi sistemų galimybes. Ir štai Agent57, pažangus RL agentas (Reinforcement Learning) DeepMind, neseniai parodė didžiulis šuolis nuo ankstesnių sistemų ir buvo pirmoji AI iteracija, viršijusi žmogaus žaidėjo bazinę liniją.

DeepMind Agent57 AI įveikia Atari žaidimus geriau nei žmogus

Agent57 AI atsižvelgia į ankstesnių įmonės sistemų patirtį ir sujungia efektyvaus aplinkos tyrinėjimo algoritmus su metakontrole. Visų pirma, Agent57 įrodė savo antžmogiškus įgūdžius Pitfall, Montezuma's Revenge, Solaris ir Skiing žaidimuose, kurie rimtai išbandė ankstesnius neuroninius tinklus. Remiantis tyrimais, Pitfall ir Montezuma's Revenge verčia dirbtinį intelektą daugiau eksperimentuoti, kad pasiektų geresnių rezultatų. „Solaris“ ir „Skiing“ yra sudėtingi neuroniniams tinklams, nes nėra daug sėkmės ženklų – AI ilgą laiką nežino, ar elgiasi teisingai. „DeepMind“ sukūrė savo senus AI agentus, kad „Agent57“ galėtų priimti geresnius sprendimus tyrinėjant aplinką ir įvertinant žaidimus, taip pat optimizuojant trumpalaikio ir ilgalaikio elgesio, pvz., slidinėjimo, elgseną.

Rezultatai įspūdingi, tačiau dirbtinis intelektas dar turi daug ką nuveikti. Šios sistemos vienu metu gali valdyti tik vieną žaidimą, o tai, pasak kūrėjų, prieštarauja žmogaus galimybėms: „Tikrasis lankstumas, kuris taip lengvai patenka į žmogaus smegenis, vis dar nepasiekiamas AI“.



Šaltinis: 3dnews.ru

Добавить комментарий