OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

Kyakkyawan wasan da aka yi na ɓoye da nema na iya zama babban gwaji ga bots na wucin gadi (AI) don nuna yadda suke yanke shawara da hulɗa da juna da abubuwa daban-daban da ke kewaye da su.

A cikin nasa sabon labarin, wanda masu bincike daga OpenAI suka buga, ƙungiyar bincike mai zaman kanta ta wucin gadi wacce ta shahara nasara akan zakarun duniya a cikin wasan kwamfuta Dota 2, masana kimiyya sun bayyana yadda aka horar da jami'an da ke sarrafa bayanan sirri don su kasance masu ƙwarewa wajen bincike da ɓoyewa daga juna a cikin yanayi mai kama da juna. Sakamakon binciken ya nuna cewa ƙungiyar bots biyu suna koyo sosai da sauri fiye da kowane wakili ɗaya ba tare da abokan tarayya ba.

OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

Masana kimiyya sun yi amfani da hanyar da ta daɗe da samun shahara koyon inji tare da ƙarfafawa, wanda ake sanya hankali na wucin gadi a cikin yanayin da ba a san shi ba, tare da samun wasu hanyoyin mu'amala da shi, da kuma tsarin lada da tara ga wani ko wani sakamakon ayyukansa. Wannan hanyar tana da inganci sosai saboda ikon AI don aiwatar da ayyuka daban-daban a cikin yanayin kama-da-wane a cikin babban sauri, sau miliyoyi cikin sauri fiye da yadda mutum zai iya tsammani. Wannan yana ba da damar gwaji da kuskure don nemo dabarun mafi inganci don warware matsalar da aka bayar. Amma wannan hanyar kuma tana da wasu iyakoki, alal misali, ƙirƙirar yanayi da kuma gudanar da darussan horo da yawa na buƙatar albarkatun ƙididdiga masu yawa, kuma tsarin da kansa yana buƙatar ingantaccen tsari don kwatanta sakamakon ayyukan AI tare da manufarsa. Bugu da ƙari, ƙwarewar da wakili ya samu ta wannan hanyar yana iyakance ga aikin da aka kwatanta kuma, da zarar AI ta koyi jimre da shi, ba za a sami ƙarin ci gaba ba.

Don horar da AI don yin wasa da ɓoye da nema, masana kimiyya sun yi amfani da hanyar da ake kira "Bincike ba tare da kai tsaye ba," wanda shine inda wakilai ke da cikakkiyar 'yanci don haɓaka fahimtar su game da duniyar wasan da haɓaka dabarun nasara. Wannan yayi kama da tsarin ilmantarwa na wakilai da yawa waɗanda masu bincike a DeepMind suka yi amfani da su lokacin da tsarin hankali na wucin gadi da yawa An horar da su don kunna yanayin kama tutar a cikin Quake III Arena. Kamar yadda yake a cikin wannan yanayin, ba a horar da wakilan AI a baya a cikin dokokin wasan ba, amma bayan lokaci sun koyi dabarun asali kuma sun iya ba masu bincike mamaki tare da mafita marasa mahimmanci.

A wasan buya, an bukaci wasu jami’ai da dama da aikinsu ya boye su kaurace wa layin abokan hamayyar su bayan da aka fara wani dan wasa yayin da tawagar jami’an binciken ta kasa motsi. Bugu da ƙari, "layin gani" a cikin wannan mahallin shine mazugi na digiri 135 a gaban mutum bot. Wakilai ba za su iya yin nisa sosai a wajen wurin wasan ba kuma an tilasta musu yin kewaya dakunan da aka samar da kayyade tare da ikon yin amfani da wasu abubuwa na waje (akwatuna, bangon motsi, ramuka na musamman) da aka warwatse waɗanda za a iya amfani da su duka don ƙirƙirar murfin da kutsawa a cikinsu. .

OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

Ta hanyar dogon tsari na koyo, wakilan AI sun koyi dabaru na musamman guda shida, kowannensu ya taimaka musu ci gaba zuwa mataki na gaba na wasan. Da farko dai kungiyoyin masu neman mafaka ne kawai suka gudu suka bi junansu, amma bayan wasan kusan miliyan 25, kungiyar maboyar ta koyi yadda ake toshe hanyoyin da kwalaye da gina matsuguni daga cikinsu. Bayan wasu wasanni miliyan 75, kungiyar ta gano hanyoyin amfani da tudu don shiga cikin wadannan maboya. Bayan wani zagaye na miliyan 10, masu ɓoye sun koyi ja da ramuka zuwa gefen filin wasan tare da kulle su a wuri don hana abokan hamayya amfani da su.

OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

Bayan wasanni miliyan 388, masu neman sun koyi yin amfani da tarkace da aka toshe don hawa akwatunan da aka kawo musu, sannan, su shiga kai tsaye, su kutsa kai cikin maboyar abokan gaba da aka kirkira daga katanga masu motsi. Kuma a ƙarshe, bayan wasanni miliyan 458, ƙungiyar ɓoye ta yanke shawarar cewa suna buƙatar toshe duk wani abu sannan su gina matsuguni, wanda da alama ya kai ga nasara ta ƙarshe.

Wani abin burgewa shi ne, bayan wasanni miliyan 22, jami’an sun koyi yadda za su daidaita ayyukansu kuma ingancin hadin gwiwarsu ya karu ne kawai a nan gaba, alal misali, kowannensu ya kawo akwatinsa ko bangon kansa don ƙirƙirar matsuguni kuma ya zaɓi nasa rabon abubuwa. toshe, don dagula wasan wahala ga abokan hamayya.

OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

Har ila yau, masana kimiyya sun lura da wani muhimmin batu da ke da alaka da tasirin adadin abubuwan horo (yawan bayanan da ke wucewa ta hanyar sadarwar jijiyoyi - "Batch Size") akan saurin koyo. Tsarin da aka saba yana buƙatar ashana miliyan 132,3 sama da awoyi 34 na horo don isa wurin da ƙungiyar ɓoyayyiyar ta koyi toshe ramps, yayin da ƙarin bayanai suka haifar da raguwar lokacin horo. Misali, haɓaka adadin sigogi (ɓangare na bayanan da aka samu a duk lokacin horon) daga miliyan 0,5 zuwa miliyan 5,8 ya haɓaka ingancin samfurin da sau 2,2, kuma ƙara girman bayanan shigarwa daga 64 KB zuwa 128 KB ya rage horo. lokaci kusan sau daya da rabi.

OpenAI yana koyar da haɗin gwiwar AI a cikin wasan ɓoye da nema

A ƙarshen aikin su, masu binciken sun yanke shawarar gwada yawan horo a cikin wasan zai iya taimaka wa wakilai su jimre da irin wannan ayyuka a waje da wasan. An yi gwaje-gwaje guda biyar gabaɗaya: sanin adadin abubuwa (fahimtar cewa abu yana ci gaba da wanzuwa ko da ba a gani ba kuma ba a amfani da shi); "kulle da dawowa" - ikon tunawa da ainihin matsayin mutum kuma komawa zuwa gare ta bayan kammala wani ƙarin aiki; "Tsarin toshewa" - akwatuna 4 sun kasance ba tare da izini ba a cikin dakuna uku ba tare da kofofin ba, amma tare da ramuka don shiga ciki, wakilai suna buƙatar nemo su tare da toshe su duka; sanya kwalaye a kan wuraren da aka ƙayyade; ƙirƙirar tsari a kusa da wani abu a cikin nau'i na silinda.

A sakamakon haka, a cikin uku daga cikin ayyuka biyar, bots da suka sami horo na farko a wasan sun koyi sauri kuma sun nuna sakamako mafi kyau fiye da AI wanda aka horar da su don magance matsalolin daga karce. Sun yi dan kadan mafi kyau wajen kammala aikin da komawa wurin farawa, bi da bi tare da toshe kwalaye a cikin rufaffiyar dakuna, da kuma sanya kwalaye a wuraren da aka ba su, amma sun yi rauni kaɗan wajen gane adadin abubuwa da ƙirƙirar murfin kewaye da wani abu.

Masu bincike sun danganta gaurayawan sakamako ga yadda AI ke koyo da tunawa da wasu ƙwarewa. "Muna tunanin cewa ayyukan da aka yi kafin horon wasan sun haɗa da sake yin amfani da ƙwarewar da aka koya a baya ta hanyar da aka sani, yayin aiwatar da sauran ayyukan fiye da AI da aka horar da su daga karce zai buƙaci amfani da su ta wata hanya dabam, wanda da yawa. mafi wahala,” rubuta mawallafin aikin. "Wannan sakamakon yana nuna buƙatar haɓaka hanyoyin da za a sake amfani da ƙwarewar da aka samu ta hanyar horarwa yayin canja su daga wannan yanayi zuwa wani."

Aikin da aka yi yana da ban sha'awa sosai, tun da begen amfani da wannan hanyar koyarwa ya wuce iyakar kowane wasa. Masu binciken sun ce aikinsu wani muhimmin mataki ne na samar da AI tare da "halayen kimiyyar lissafi" da "kamar mutum" wanda zai iya gano cututtuka, da tsinkaya tsarin kwayoyin sunadarai masu rikitarwa da kuma nazarin CT scans.

A cikin bidiyon da ke ƙasa za ku iya ganin yadda duk tsarin ilmantarwa ya faru, yadda AI ya koyi aikin haɗin gwiwa, da dabarunsa ya zama mafi wayo da rikitarwa.



source: 3dnews.ru

Add a comment