DeepMind Agent57 AI lîstikên Atari ji mirovan çêtir dixe

Amadekirina torgilokek neuralî ku bi lîstikên vîdyoyê yên hêsan ve tê meşandin rêyek îdeal e ji bo ceribandina bandorkeriya perwerdehiya wê, ji ber şiyana hêsan a nirxandina encamên qedandinê. Di sala 2012-an de ji hêla DeepMind (beşek ji Alphabet) ve hatî pêşve xistin, pîvana 57 lîstikên sembolîk ên Atari 2600 ji bo ceribandina kapasîteyên pergalên xwe-hînbûnê bû ceribandinek lîtmusê. Û li vir Agent57, nûnerek pêşkeftî ya RL (Fêrbûna Hêzdar) DeepMind, vê dawiyê nîşan da gavek mezin ji pergalên berê û yekem dubarekirina AI-ê bû ku ji xeta bingehîn a lîstikvanê mirovan derbas bû.

DeepMind Agent57 AI lîstikên Atari ji mirovan çêtir dixe

Agent57 AI ezmûna pergalên berê yên pargîdaniyê dihesibîne û algorîtmayan ji bo keşfkirina bikêr a jîngehê bi meta-kontrolê re berhev dike. Bi taybetî, Agent57 di Pitfall, Montezuma's Revenge, Solaris û Skiing de jêhatîyên xwe yên sermirovî îsbat kiriye - lîstikên ku torên neuralî yên berê bi tundî ceribandine. Li gorî lêkolînê, Pitfall û Montezuma's Revenge AI-ê neçar dike ku bêtir ceribandinê bike da ku encamên çêtir bi dest bixe. Solaris û Skiing ji bo torên neuralî dijwar in ji ber ku gelek nîşanên serketinê nîn in - AI ji bo demek dirêj nizane ka ew tiştê rast dike. DeepMind li ser mîrateyên xwe yên AI-ê ava kir da ku destûrê bide Agent57 ku di derbarê vekolîna jîngehê û nirxandina performansa lîstokan de biryarên çêtir bide, û her weha di lîstikên mîna Skiing de danûstendina di navbera tevgerên kurt-kurt û demdirêj de xweşbîn bike.

Encam balkêş in, lê AI hîn jî rêyek dirêj heye ku biçe. Van pergal tenê dikarin yek carê lîstikek bi rê ve bibin, ku, li gorî pêşdebiran, berevajî kapasîteyên mirovî ye: "Rewşa rastîn a ku ew qas bi hêsanî di mêjiyê mirovan de tê hîn jî ji AI-ê dûr e."



Source: 3dnews.ru

Add a comment