Sgioba Maighstirean DeepMind AI a ’cluich agus a’ coileanadh nas fheàrr na daoine ann an Quake III

Tha glacadh a’ bhratach na mhodh farpaiseach gu math sìmplidh a lorgar ann am mòran de luchd-seilg mòr-chòrdte. Tha comharradh aig gach sgioba aig a bhunait, agus is e an amas comharra na sgioba eile a ghlacadh agus a thoirt thuige fhèin gu soirbheachail. Ach, chan eil na tha furasta dha daoine a thuigsinn cho furasta dha innealan. Gus am bratach a ghlacadh, bidh caractaran neo-chluicheadair (botaichean) air am prògramadh gu traidiseanta a’ cleachdadh heuristics agus algorithms sìmplidh a bheir seachad saorsa roghainn cuibhrichte agus a tha gu math nas ìsle na daoine. Ach tha inntleachd fuadain agus ionnsachadh innealan a’ gealltainn gun atharraich an suidheachadh seo gu tur.

В artaigil, fhoillseachadh an t-seachdain seo anns an iris Science mu bhliadhna às deidh sin ro-chlò-bhualadha bharrachd air air do bhlog, tha luchd-rannsachaidh bho DeepMind, fo-bhuidheann stèidhichte ann an Lunnainn den Aibideil, a’ toirt cunntas air siostam a dh’ ionnsaich chan ann a-mhàin a bhith a’ cluich a’ bhratach air mapaichean Quake III Arena id Software, ach cuideachd a’ leasachadh ro-innleachdan sgioba gu tur ùr, ann an dòigh sam bith nas ìsle na mac an duine.

Sgioba Maighstirean DeepMind AI a ’cluich agus a’ coileanadh nas fheàrr na daoine ann an Quake III

“Cha do dh’ innis duine don AI mar a chluicheas e an geama seo, cha robh aige ach an toradh - ge bith an do rinn an AI a’ chùis air an neach-dùbhlain aige no nach robh. Is e bòidhchead a bhith a’ cleachdadh an dòigh-obrach seo nach bi fios agad dè an giùlan a thig am bàrr nuair a bhios tu a’ trèanadh riochdairean,” thuirt Max Jaderberg, neach-saidheans rannsachaidh aig DeepMind a bha roimhe ag obair air an t-siostam ionnsachaidh inneal AlphaStar (o chionn ghoirid). seachad sgioba daonna de phroifeiseantaich ann an StarCraft II). Mhìnich e cuideachd gur e am prìomh dhòigh air an obair ùr aca, an toiseach, ionnsachadh ath-neartaichte, a bhios a’ cleachdadh seòrsa de shiostam duais gus riochdairean bathar-bog a phutadh gus amasan suidhichte a choileanadh, agus dh’ obraich an siostam dhuaisean ge bith an do bhuannaich no nach do bhuannaich an sgioba AI. , ach ann an -secondly, chaidh riochdairean a thrèanadh ann am buidhnean, a thug air an AI eadar-obrachadh sgioba a mhaighstir bhon fhìor thoiseach.

“Bho shealladh rannsachaidh, is e rud ùr a tha seo airson dòigh-obrach algorithmach a tha gu math brosnachail," thuirt Max. “Tha an dòigh anns an do thrèanadh sinn ar AI a’ sealltainn gu math mar as urrainn dhut cuid de bheachdan mean-fhàs clasaigeach a sgèileadh agus a bhuileachadh. ”

Sgioba Maighstirean DeepMind AI a ’cluich agus a’ coileanadh nas fheàrr na daoine ann an Quake III

Air ainmeachadh gu brosnachail airson The Win (FTW), bidh riochdairean DeepMind ag ionnsachadh gu dìreach bho piogsail sgrion a’ cleachdadh lìonra neòil convolutional, seata de ghnìomhan matamataigeach (neurons) air an rèiteachadh ann an sreathan air an dealbhadh às deidh cortex lèirsinneach daonna. Tha an dàta a gheibhear air a ghluasad gu dà lìonra le ioma cuimhne geàrr-ùine (cuimhne geàrr-ùine Beurla - LSTM), comasach air eisimeileachd fad-ùine aithneachadh. Bidh aon dhiubh a’ riaghladh dàta obrachaidh le astar freagairt luath, agus am fear eile ag obair gu slaodach gus ro-innleachdan a mhion-sgrùdadh agus a dhealbhadh. Tha an dà chuid co-cheangailte ri cuimhne caochlaideach, a bhios iad a’ cleachdadh còmhla gus atharrachaidhean ann an saoghal a’ gheama a ro-innse agus gnìomhan a dhèanamh tro rianadair geama emulated.

Sgioba Maighstirean DeepMind AI a ’cluich agus a’ coileanadh nas fheàrr na daoine ann an Quake III

Gu h-iomlan, rinn DeepMind trèanadh do 30 àidseantan, thug e dhaibh raon de cho-bhuillichean sgioba agus luchd-dùbhlain airson cluich leotha, agus thagh iad cairtean geama air thuaiream gus casg a chuir air an AI bho bhith gan cuimhneachadh. Bha a chomharradh duais fhèin aig gach àidseant, a’ leigeil leis na h-amasan a-staigh aige fhèin a chruthachadh, leithid a’ bhratach a ghlacadh. Chluich gach AI leotha fhèin timcheall air 450 mìle geama de ghlacadh a ’bhratach, a tha co-ionann ri timcheall air ceithir bliadhna de eòlas cluich.

Tha riochdairean FTW làn-thrèanadh air ionnsachadh ro-innleachdan a tha cumanta do mhapa sam bith, roster sgioba, agus meud sgioba a chuir an sàs. Dh'ionnsaich iad giùlan daonna mar a bhith a 'leantainn luchd-sgioba, a' campachadh ann an ionad nàmhaid, agus a 'dìon a' bhunait bho luchd-ionnsaigh, agus mean air mhean chaill iad pàtrain nach robh cho buannachdail leithid a bhith a 'coimhead air càirdeas ro dhlùth.

Mar sin dè na toraidhean a chaidh a choileanadh? Ann am farpais 40-neach anns an robh daoine agus riochdairean a’ cluich air thuaiream an dà chuid còmhla agus an-aghaidh a chèile, rinn riochdairean FTW gu mòr na b’ fheàrr na ìre buannachaidh chluicheadairean daonna. Bha ìre Elo aig AI, a tha coltach ri buannachadh, aig 1600, an coimeas ri 1300 airson cluicheadairean daonna “làidir” agus 1050 airson cluicheadair daonna “cuibheasach”.

Sgioba Maighstirean DeepMind AI a ’cluich agus a’ coileanadh nas fheàrr na daoine ann an Quake III

Chan eil seo na iongnadh, leis gu bheil astar freagairt AI gu math nas àirde na astar daonna, a thug buannachd mhòr don chiad fhear anns na ciad dheuchainnean. Ach eadhon nuair a chaidh cruinneas nan riochdairean a lughdachadh agus an ùine freagairt air a dhol am meud le taing don latency 257 millisecond a chaidh a thogail a-steach, rinn an AI fhathast nas fheàrr na daoine. Cha do bhuannaich cluicheadairean adhartach agus cas ach 21% agus 12% de na geamannan iomlan, fa leth.

A bharrachd air an sin, às deidh foillseachadh an sgrùdaidh, cho-dhùin luchd-saidheans riochdairean deuchainn a dhèanamh air mapaichean làn-chuimseach Quake III Arena le ailtireachd ìre iom-fhillte agus nithean a bharrachd, leithid Future Crossings agus Ironwood, far an do thòisich an AI air dùbhlan a thoirt do dhaoine gu soirbheachail ann an geamannan deuchainn. . Nuair a choimhead an luchd-rannsachaidh air pàtrain gnìomhachaidh lìonra neural nan riochdairean, is e sin, gnìomhan nan neurons a tha an urra ri bhith a’ dearbhadh toradh stèidhichte air fiosrachadh a’ tighinn a-steach, lorg iad cruinneachaidhean a’ riochdachadh sheòmraichean, staid nam brataichean, faicsinneachd luchd-sgioba agus luchd-dùbhlain, agus làthaireachd no neo-làthaireachd àidseantan aig bunait an nàmhaid, no stèidhichte air sgioba, agus taobhan cudromach eile de chluicheadh-cluiche. Bha eadhon neurons anns na riochdairean ionnsaichte a bha a’ còdachadh suidheachaidhean sònraichte gu dìreach, leithid nuair a chaidh bratach a thogail le àidseant no nuair a bha caidreachas ga chumail.

“Tha mi a’ smaoineachadh gur e aon de na rudan air am feumar coimhead gu bheil na sgiobaidhean ioma-àidseant seo air leth cumhachdach, agus tha an sgrùdadh againn a ’sealltainn sin," thuirt Jaderberg. “Is e sin a tha sinn air a bhith ag ionnsachadh a dhèanamh nas fheàrr agus nas fheàrr thar nam beagan bhliadhnaichean a dh’ fhalbh - mar a dh ’fhuasglas sinn duilgheadas ionnsachadh ath-neartachaidh.” Agus dh’obraich an trèanadh leasaichte gu fìor mhath.”

Tha Thore Graepel, àrd-ollamh saidheans coimpiutair aig Colaiste Oilthigh Lunnainn agus neach-saidheans DeepMind, den bheachd gu bheil an obair aca a’ soilleireachadh comas ionnsachadh ioma-àidseant airson àm ri teachd AI. Faodaidh e cuideachd a bhith na bhunait airson rannsachadh air eadar-obrachadh daonna-inneal agus siostaman a tha a’ cur ri chèile no ag obair còmhla.

“Tha na co-dhùnaidhean againn a’ sealltainn gum faod ionnsachadh neartachaidh ioma-àidseant maighstireachd gu soirbheachail air geama iom-fhillte chun na h-ìre gu bheil cluicheadairean daonna eadhon a ’creidsinn gu bheil cluicheadairean coimpiutair a’ dèanamh luchd-sgioba nas fheàrr. Tha an sgrùdadh cuideachd a’ toirt seachad mion-sgrùdadh fìor inntinneach air mar a bhios riochdairean air an trèanadh gan giùlan fhèin agus ag obair còmhla, arsa Grapel. “Is e an rud a tha a’ dèanamh na toraidhean sin cho brosnachail gu bheil na riochdairean sin a ’faicinn an àrainneachd aca anns a’ chiad neach, [is e sin] dìreach mar chluicheadair daonna. Gus ionnsachadh mar a chluicheadh ​​​​iad gu innleachdach agus co-obrachadh leis an luchd-sgioba aca, bha aig na riochdairean sin ri bhith an urra ri fios air ais bho thoraidhean a’ gheama, gun tidsear no coidse sam bith a’ sealltainn dhaibh dè a bu chòir dhaibh a dhèanamh."



Source: 3d naidheachdan.ru

Cuir beachd ann