DeepMind Agent57 AI මිනිසෙකුට වඩා Atari ක්‍රීඩා පරදවයි

සරල වීඩියෝ ක්‍රීඩා හරහා ස්නායු ජාලයක් ක්‍රියාත්මක කිරීම එහි පුහුණුවේ සඵලතාවය පරීක්ෂා කිරීම සඳහා කදිම ක්‍රමයකි, සම්පූර්ණ කිරීමේ ප්‍රතිඵල ඇගයීමට ඇති සරල හැකියාවට ස්තුති වන්න. 2012 දී DeepMind (Alphabet හි කොටසක්) විසින් වැඩි දියුණු කරන ලද, Iconic Atari 57 ක්‍රීඩා 2600 ක මිණුම් ලකුණ ස්වයං ඉගෙනුම් පද්ධතිවල හැකියාවන් පරීක්ෂා කිරීම සඳහා ලිට්මස් පරීක්ෂණයක් බවට පත් විය. සහ මෙහි Agent57, උසස් RL නියෝජිත (Reinforcement Learning) DeepMind, මෑතකදී පෙන්නුවා පෙර පැවති පද්ධති වලින් විශාල පිම්මක් සහ මානව ක්‍රීඩකයාගේ මූලික සීමාව ඉක්මවා ගිය AI හි පළමු පුනරාවර්තනය විය.

DeepMind Agent57 AI මිනිසෙකුට වඩා Atari ක්‍රීඩා පරදවයි

Agent57 AI විසින් සමාගමේ පෙර පද්ධතිවල අත්දැකීම් සැලකිල්ලට ගන්නා අතර මෙටා පාලනය සමඟ පරිසරය කාර්යක්ෂමව ගවේෂණය කිරීම සඳහා ඇල්ගොරිතම ඒකාබද්ධ කරයි. විශේෂයෙන්ම, Agent57 විසින් Pitfall, Montezuma's Revenge, Solaris සහ Skiing - පෙර ස්නායුක ජාල දැඩි ලෙස පරීක්ෂා කර ඇති ක්‍රීඩා වල ඔහුගේ අධිමානුෂික කුසලතා ඔප්පු කර ඇත. පර්යේෂණයට අනුව, Pitfall සහ Montezuma's Revenge වඩා හොඳ ප්රතිඵල ලබා ගැනීම සඳහා AI හට තවත් අත්හදා බැලීම් කිරීමට බල කරයි. Solaris සහ Skiing ස්නායු ජාල සඳහා දුෂ්කර වන්නේ සාර්ථකත්වයේ බොහෝ සලකුණු නොමැති බැවිනි - AI එය නිවැරදි දේ කරන්නේ දැයි දිගු කලක් නොදනී. DeepMind එහි පැරණි AI නියෝජිතයන් මත ගොඩනඟා Agent57 පරිසරය ගවේෂණය කිරීම සහ ක්‍රීඩා වල කාර්ය සාධනය තක්සේරු කිරීම පිළිබඳව වඩා හොඳ තීරණ ගැනීමට මෙන්ම Skiing වැනි ක්‍රීඩා වල කෙටි කාලීන සහ දිගු කාලීන හැසිරීම් අතර ගනුදෙනුව ප්‍රශස්ත කිරීමට ඉඩ සලසයි.

ප්‍රතිඵල සිත් ඇදගන්නා සුළුය, නමුත් AI හට තව බොහෝ දුර යා යුතුව ඇත. මෙම පද්ධතිවලට එකවර හැසිරවිය හැක්කේ එක් ක්‍රීඩාවක් පමණි, එය සංවර්ධකයින්ට අනුව මානව හැකියාවන්ට පටහැනි ය: “මිනිස් මොළයට ඉතා පහසුවෙන් පැමිණෙන සැබෑ නම්‍යශීලීභාවය තවමත් AI වෙත ළඟා විය නොහැක.”



මූලාශ්රය: 3dnews.ru

අදහස් එක් කරන්න