Mae DeepMind Agent57 AI yn curo gemau Atari yn well na bod dynol

Mae gwneud rhwydwaith niwral yn rhedeg trwy gemau fideo syml yn ffordd ddelfrydol o brofi effeithiolrwydd ei hyfforddiant oherwydd y gallu syml i werthuso canlyniadau'r darn. Wedi'i ddatblygu yn 2012 gan DeepMind (rhan o ddaliad yr Wyddor), mae meincnod 57 o gemau eiconig Atari 2600 wedi dod yn brawf litmws ar gyfer profi galluoedd systemau hunan-ddysgu. A dyma Agent57, asiant RL datblygedig (Atgyfnerthu Dysgu) DeepMind, y diwrnod o'r blaen dangosodd naid enfawr o systemau blaenorol a hwn oedd yr iteriad AI cyntaf i berfformio'n well na llinell sylfaen chwaraewr dynol.

Mae DeepMind Agent57 AI yn curo gemau Atari yn well na bod dynol

Mae Agent57 AI yn ystyried profiad systemau blaenorol y cwmni ac yn cyfuno algorithmau ar gyfer archwilio amgylcheddol effeithlon gyda meta-reolaeth. Yn benodol, mae Agent57 wedi profi ei sgiliau goruwchddynol yn Pitfall, Montezuma's Revenge, Solaris a Skiing - gemau sydd wedi bod yn brawf difrifol ar gyfer rhwydweithiau niwral blaenorol. Yn Γ΄l ymchwil, mae Pitfall a Montezuma's Revenge yn gorfodi'r AI i arbrofi mwy i gyflawni canlyniadau gwell. Mae Solaris a SgΓ―o yn anodd i rwydweithiau niwral oherwydd nid oes llawer o arwyddion o lwyddiant - nid yw AI yn gwybod am amser hir a yw'n gwneud y peth iawn. Adeiladodd DeepMind ar ei hen asiantau AI fel y gallai Asiant57 wneud gwell penderfyniadau ynghylch archwilio amgylcheddol a gwerthuso perfformiad mewn gemau, yn ogystal Γ’ gwneud y gorau o'r cyfaddawd rhwng ymddygiad tymor byr a thymor hir mewn gemau fel SgΓ―o.

Mae'r canlyniadau'n drawiadol, ond mae gan AI ffordd bell i fynd eto. Dim ond un gΓͺm ar y tro y gall y systemau hyn ei thrin, y mae'r datblygwyr yn dweud sy'n mynd yn groes i alluoedd dynol: "Mae'r gwir hyblygrwydd sy'n dod mor hawdd i'r ymennydd dynol yn dal i fod y tu hwnt i gyrraedd AI."



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw