Yaxshi eski uslubdagi bekinmachoq o'yini sun'iy intellekt (AI) botlari uchun ular qanday qaror qabul qilishlarini va bir-birlari va ularning atrofidagi turli xil ob'ektlar bilan qanday munosabatda bo'lishlarini namoyish qilish uchun ajoyib sinov bo'lishi mumkin.
Uning ichida
Olimlar uzoq vaqtdan beri shuhrat qozongan usuldan foydalanganlar
Olimlar sun'iy intellektni bekinmachoq o'ynashga o'rgatish uchun "Yo'naltirilmagan qidiruv" deb nomlangan yondashuvdan foydalanganlar, bunda agentlar o'yin dunyosi haqidagi tushunchalarini rivojlantirish va g'alaba qozonish strategiyalarini ishlab chiqish uchun to'liq erkinlikka ega edilar. Bu DeepMind tadqiqotchilari bir nechta sun'iy intellekt tizimlarida qo'llagan ko'p agentli o'rganish yondashuviga o'xshaydi.
Bekinmachoq o'yinida, ishi yashiringan bir nechta agentlar qidiruv agentlari guruhi harakatsiz qolganda, biroz boshdan keyin raqiblarini ko'rish chizig'idan qochishlari kerak edi. Bundan tashqari, bu kontekstda "ko'rish chizig'i" individual bot oldida 135 daraja konusdir. Agentlar o'yin maydonidan juda uzoqqa chiqa olmadilar va tasodifiy yaratilgan xonalarni aylanib o'tishga majbur bo'lishdi va atrofga sochilgan ba'zi tashqi ob'ektlardan (qutilar, harakatlanuvchi devorlar, maxsus rampalar) foydalanish imkoniyatiga ega bo'lishdi, ular ham qopqoq yaratish, ham ularga infiltratsiya qilish uchun ishlatilishi mumkin edi. .
Uzoq davom etgan o'quv jarayoni orqali AI agentlari oltita noyob strategiyani o'rgandilar, ularning har biri ularga o'yinning keyingi bosqichiga o'tishga yordam berdi. Avvaliga izlovchi va yashiruvchi guruhlar shunchaki qochib ketishdi va bir-birlarini quvishdi, ammo 25 millionga yaqin o'yindan so'ng yashiringan guruh qutilar bilan o'tish joylarini to'sib, ulardan boshpana qurishni o'rgandi. Yana 75 million o'yindan so'ng, jamoa bu yashirinish joylariga kirish uchun rampalardan foydalanish yo'llarini topdi. Yana 10 million raunddan so'ng, yashirinuvchilar rampalarni o'yin maydonining chetiga tortib, raqiblar ulardan foydalanishiga yo'l qo'ymaslik uchun ularni joyida qulflashni o'rgandilar.
388 million gugurtdan so'ng, qidiruvchilar o'zlariga olib kelingan sandiqlarga chiqish uchun blokirovka qilingan rampalardan foydalanishni o'rgandilar, so'ngra to'g'ridan-to'g'ri ularga o'tib, ko'chma devorlardan yaratilgan dushman yashirinish joylariga kirib borishdi. Va nihoyat, 458 million o'yindan so'ng, yashiringan jamoa ular barcha ob'ektlarni to'sib qo'yishlari va keyin boshpana qurishlari kerak degan xulosaga kelishdi va bu ularning yakuniy g'alabasiga olib keldi.
Eng ta'sirli tomoni shundaki, 22 million o'yindan so'ng agentlar o'z harakatlarini muvofiqlashtirishni o'rgandilar va ularning hamkorlik samaradorligi kelajakda oshadi, masalan, har biri boshpana yaratish uchun o'z qutisini yoki devorini olib keldi va ob'ektlarning o'z ulushini tanladi. blokirovka qilish, qiyin o'yinni raqiblarga qiyinlashtirish.
Olimlar, shuningdek, o'quv ob'ektlari sonining (neyron tarmog'i orqali o'tadigan ma'lumotlar miqdori - "Paket hajmi") o'rganish tezligiga ta'siri bilan bog'liq muhim nuqtani ta'kidladilar. Yashirin jamoa rampalarni to'sib qo'yishni o'rgangan nuqtaga erishish uchun standart model 132,3 soat davomida 34 million o'yinni talab qildi, ko'proq ma'lumotlar esa mashg'ulot vaqtini sezilarli darajada qisqartirishga olib keldi. Misol uchun, parametrlar sonini (butun o'quv jarayonida olingan ma'lumotlarning bir qismi) 0,5 milliondan 5,8 milliongacha oshirish namuna olish samaradorligini 2,2 barobarga oshirdi va kiritilgan ma'lumotlar hajmini 64 KB dan 128 KB ga oshirish o'qitishni qisqartirdi. vaqt deyarli bir yarim marta.
O'z ishining oxirida tadqiqotchilar o'yin ichidagi mashg'ulotlar agentlarga o'yindan tashqari shunga o'xshash vazifalarni engishga qanchalik yordam berishi mumkinligini sinab ko'rishga qaror qilishdi. Hammasi bo'lib beshta test o'tkazildi: ob'ektlar sonidan xabardorlik (ob'ekt ko'zdan uzoqda bo'lsa va foydalanilmasa ham mavjud bo'lishini tushunish); "qulflash va qaytarish" - o'zining asl holatini eslab qolish va qo'shimcha topshiriqni bajargandan so'ng unga qaytish qobiliyati; "ketma-ket blokirovka qilish" - 4 ta quti tasodifiy uchta eshiksiz xonada joylashgan edi, lekin ichkariga kirish uchun rampalar bor, agentlar ularning barchasini topib, blokirovka qilishlari kerak edi; qutilarni oldindan belgilangan saytlarga joylashtirish; silindr shaklida ob'ekt atrofida boshpana yaratish.
Natijada, beshta topshiriqdan uchtasida o‘yinda dastlabki tayyorgarlikdan o‘tgan botlar muammolarni noldan yechishga o‘rgatilgan sun’iy intellektga qaraganda tezroq o‘rgandi va yaxshi natijalar ko‘rsatdi. Ular topshiriqni bajarish va boshlang'ich pozitsiyasiga qaytish, yopiq xonalarda qutilarni ketma-ket to'sib qo'yish va berilgan maydonlarga qutilarni joylashtirishda biroz yaxshiroq ishladilar, lekin ob'ektlar sonini tanib olish va boshqa ob'ekt atrofida qopqoq yaratishda biroz zaifroq ishladilar.
Tadqiqotchilar aralash natijalarni AI qanday o'rganishi va ma'lum ko'nikmalarni eslab qolishiga bog'laydi. "Biz o'ylaymizki, o'yindan oldingi mashg'ulotlar eng yaxshi bajarilgan vazifalar ilgari o'rganilgan ko'nikmalarni tanish usulda qayta ishlatishni o'z ichiga oladi, qolgan vazifalarni noldan o'rgatilgan AIga qaraganda yaxshiroq bajarish ularni boshqacha tarzda qo'llashni talab qiladi. qiyinroq”, deb yozadi asar hammualliflari. "Ushbu natija o'qitish orqali olingan ko'nikmalarni bir muhitdan boshqasiga o'tkazishda ularni samarali qayta ishlatish usullarini ishlab chiqish zarurligini ta'kidlaydi."
Bajarilgan ish haqiqatan ham ta'sirli, chunki ushbu o'qitish usulidan foydalanish istiqbollari har qanday o'yin chegarasidan ancha uzoqdir. Tadqiqotchilarning ta'kidlashicha, ularning ishi kasalliklarga tashxis qo'yish, murakkab oqsil molekulalarining tuzilishini bashorat qilish va kompyuter tomografiyasini tahlil qilish imkonini beradigan "fizikaga asoslangan" va "odamga o'xshash" xatti-harakatlarga ega sun'iy intellekt yaratish yo'lidagi muhim qadamdir.
Quyidagi videoda siz butun o'quv jarayoni qanday kechganini, AI qanday qilib jamoaviy ishlashni o'rganganini va uning strategiyalari tobora ayyor va murakkab bo'lib qolganini aniq ko'rishingiz mumkin.
Manba: 3dnews.ru