🥇 Bidh OpenAI a’ teagasg obair-sgioba AI ann an geama seiche is sireadh

Faodaidh geama seiche is sireadh seann-fhasanta a bhith na dheagh dheuchainn airson botaichean inntleachd fuadain (AI) gus sealltainn mar a bhios iad a’ dèanamh cho-dhùnaidhean agus ag eadar-obrachadh le chèile agus diofar nithean mun cuairt orra.

Anns na artaigil ùr, air fhoillseachadh le luchd-rannsachaidh bho OpenAI, buidheann rannsachaidh fiosrachaidh fuadain neo-phrothaideach a tha air fàs ainmeil buaidh thairis air curaidhean na cruinne anns a’ gheama coimpiutair Dota 2, tha luchd-saidheans a’ toirt cunntas air mar a chaidh riochdairean fo smachd innleachdas fuadain a thrèanadh gus a bhith nas ionnsaichte ann a bhith a’ lorg agus a’ falach bho chèile ann an àrainneachd bhrìgheil. Sheall toraidhean an sgrùdaidh gu bheil sgioba de dhà bhot ag ionnsachadh nas èifeachdaiche agus nas luaithe na aon àidseant gun charaidean.

Tha luchd-saidheans air dòigh a chleachdadh a tha air cliù a chosnadh o chionn fhada ionnsachadh inneal le daingneachadh, anns a bheil inntleachd fuadain air a chuir ann an àrainneachd neo-aithnichte dha, fhad ‘s a tha dòighean sònraichte ann airson eadar-obrachadh leis, a bharrachd air siostam de dhuaisean is chìsean airson toradh aon no eile de na gnìomhan aige. Tha an dòigh seo gu math èifeachdach air sgàth comas AI diofar ghnìomhan a dhèanamh ann an àrainneachd bhrìgheil aig astar mòr, milleanan de thursan nas luaithe na as urrainn dha duine smaoineachadh. Leigidh seo le deuchainn is mearachd na ro-innleachdan as èifeachdaiche a lorg airson fuasgladh fhaighinn air duilgheadas sònraichte. Ach tha cuid de chuingealachaidhean aig an dòigh-obrach seo cuideachd, mar eisimpleir, le bhith a’ cruthachadh àrainneachd agus a’ dèanamh grunn chuairtean trèanaidh tha feum air goireasan coimpiutaireachd mòr, agus tha feum aig a’ phròiseas fhèin air siostam ceart airson coimeas a dhèanamh eadar toraidhean gnìomhan AI leis an amas aige. A bharrachd air an sin, tha na sgilean a gheibh an neach-ionaid san dòigh seo cuingealaichte ris a’ ghnìomh a chaidh a mhìneachadh agus, cho luath ‘s a dh’ ionnsaicheas an AI gus dèiligeadh ris, cha bhi tuilleadh leasachaidhean ann.

Gus AI a thrèanadh gus seiche a chluich, chleachd luchd-saidheans dòigh-obrach ris an canar “Rannsachadh neo-stiùirichte,” far a bheil làn shaorsa aig riochdairean an tuigse air saoghal a’ gheama a leasachadh agus ro-innleachdan buannachaidh a leasachadh. Tha seo coltach ris an dòigh ionnsachaidh ioma-àidseant a chleachd luchd-rannsachaidh aig DeepMind nuair a bha ioma-shiostaman fiosrachaidh fuadain air an trèanadh gus modh na brataich a ghlacadh ann an Quake III Arena. Mar anns a 'chùis seo, cha robh na h-àidseantan AI air an trèanadh roimhe seo ann an riaghailtean a' gheama, ach thar ùine dh'ionnsaich iad ro-innleachdan bunaiteach agus bha iad eadhon comasach air iongnadh a dhèanamh air luchd-rannsachaidh le fuasglaidhean nach robh cho beag.

Ann an geama seiche is sireadh, bha aig grunn àidseantan aig an robh e mar dhleastanas falach sealladh an luchd-dùbhlain aca a sheachnadh às deidh beagan tòiseachaidh fhad ‘s a bha an sgioba de riochdairean sgrùdaidh air an gluasad. A bharrachd air an sin, tha an “loidhne seallaidh” sa cho-theacsa seo na chòn ceum 135 air beulaibh bot fa leth. Cha b’ urrainn do riochdairean a dhol air adhart ro fhada taobh a-muigh an raon-cluiche agus b’ fheudar dhaibh a dhol tro sheòmraichean air an cruthachadh air thuaiream leis a’ chomas cuid de nithean bhon taobh a-muigh a chleachdadh (bogsaichean, ballachan gluasadach, rampaichean sònraichte) sgapte mun cuairt a ghabhadh a chleachdadh an dà chuid airson còmhdach a chruthachadh agus a dhol a-steach annta. .

Tro phròiseas ionnsachaidh fada, dh’ ionnsaich na riochdairean AI sia ro-innleachdan gun samhail, agus chuidich gach fear dhiubh iad a dhol air adhart chun ath ìre den gheama. An toiseach, ruith na sgiobaidhean sireadh agus falaich air falbh agus ruith iad air a chèile, ach às deidh timcheall air 25 millean geama, dh’ ionnsaich an sgioba falaich casg a chuir air trannsaichean le bogsaichean agus fasgaidhean a thogail a-mach às. Às deidh 75 millean geama eile, lorg an sgioba dòighean air rampaichean a chleachdadh gus faighinn a-steach do na h-àiteachan falaich sin. Às deidh 10 millean cuairt eile, dh’ ionnsaich luchd-falaich rampaichean a shlaodadh gu oir an raon-cluiche agus an glasadh nan àite gus casg a chuir air luchd-dùbhlain an cleachdadh.

Às deidh 388 millean geama, tha luchd-siridh air ionnsachadh rampaichean dùinte a chleachdadh gus streap air cliathran a chaidh a thoirt thuca, agus an uairsin, a’ gluasad dìreach orra, a dhol a-steach do fhalach nàmhaid a chaidh a chruthachadh bho bhallachan so-ghiùlain. Agus mu dheireadh, às deidh 458 millean geama, cho-dhùin an sgioba falaich gum feumadh iad a h-uile nì a bhacadh agus an uairsin fasgadh a thogail, a thug gu buil a ’bhuaidh mu dheireadh aca.

Is e an rud a tha gu sònraichte drùidhteach, às deidh 22 millean geama, gun do dh’ ionnsaich na riochdairean na gnìomhan aca a cho-òrdanachadh agus nach do dh’ èirich èifeachdas an co-obrachaidh ach san àm ri teachd, mar eisimpleir, thug gach fear am bogsa no am balla aige fhèin gus fasgadh a chruthachadh agus thagh iad a chuibhreann de nithean gu bloc, gus an geama duilgheadas a dhèanamh nas duilghe dha luchd-dùbhlain.

Thug luchd-saidheans fa-near cuideachd puing chudromach co-cheangailte ri buaidh an àireamh de stuthan trèanaidh (an ìre de dhàta a chaidh a chuir tron lìonra neural - “Meud Baidse”) air an astar ionnsachaidh. Dh'fheumadh am modail bunaiteach 132,3 millean maidsean thairis air 34 uairean de thrèanadh gus an ìre a ruighinn far an do dh'ionnsaich an sgioba falaich casg a chuir air rampaichean, agus mar thoradh air barrachd dàta thàinig lùghdachadh follaiseach air an ùine trèanaidh. Mar eisimpleir, le bhith ag àrdachadh an àireamh de pharamadairean (pàirt den dàta a fhuaireadh tron phròiseas trèanaidh gu lèir) bho 0,5 millean gu 5,8 millean mheudaich èifeachdas samplachaidh 2,2 uair, agus le bhith ag àrdachadh meud an dàta cuir a-steach bho 64 KB gu 128 KB lughdaich trèanadh ùine cha mhòr uair gu leth.

Aig deireadh an cuid obrach, cho-dhùin an luchd-rannsachaidh deuchainn a dhèanamh air an ìre de thrèanadh in-gheam a dh’ fhaodadh riochdairean a chuideachadh gus dèiligeadh ri gnìomhan coltach ris taobh a-muigh a’ gheama. Bha còig deuchainnean ann gu h-iomlan: mothachadh air an àireamh de nithean (a 'tuigsinn gu bheil nì fhathast ann eadhon ged a tha e a-mach à sealladh agus nach eil e air a chleachdadh); "glasadh agus tilleadh" - an comas cuimhne a chumail air an t-suidheachadh tùsail agus tilleadh thuige an dèidh crìoch a chur air obair a bharrachd; “Bacadh sreathach” - chaidh 4 bogsaichean a chuir air thuaiream ann an trì seòmraichean gun dhorsan, ach le rampaichean airson faighinn a-steach, dh’ fheumadh riochdairean an lorg agus am bacadh uile; suidheachadh bhogsaichean air làraich ro-shuidhichte; cruthachadh fasgadh timcheall nì ann an cruth siolandair.

Mar thoradh air an sin, ann an trì a-mach à còig gnìomhan, dh'ionnsaich botaichean a bha air a dhol tro thrèanadh tòiseachaidh sa gheama nas luaithe agus sheall iad toraidhean nas fheàrr na AI a chaidh a thrèanadh gus fuasgladh fhaighinn air duilgheadasan bhon fhìor thoiseach. Rinn iad beagan na b’ fheàrr ann a bhith a’ crìochnachadh na h-obrach agus a’ tilleadh don t-suidheachadh tòiseachaidh, a’ bacadh bhogsaichean ann an seòmraichean dùinte, agus a’ cur bhogsaichean ann an ceàrnaidhean sònraichte, ach rinn iad beagan na bu laige ann a bhith ag aithneachadh an àireamh de nithean agus a’ cruthachadh còmhdach timcheall nì eile.

Bidh luchd-rannsachaidh a’ toirt buaidh air toraidhean measgaichte mar a bhios AI ag ionnsachadh agus a’ cuimhneachadh cuid de sgilean. “Tha sinn den bheachd gur e na gnìomhan far an do rinn ro-thrèanadh in-gheam na b’ fheàrr a bhith ag ath-chleachdadh sgilean a chaidh ionnsachadh roimhe ann an dòigh air a bheil sinn eòlach, agus aig an aon àm a bhith a’ coileanadh nan gnìomhan a bha air fhàgail nas fheàrr na an AI a chaidh a thrèanadh bhon fhìor thoiseach an cleachdadh ann an dòigh eadar-dhealaichte, rud a tha mòran. nas duilghe," sgrìobh co-ùghdaran na h-obrach. “Tha an toradh seo a’ soilleireachadh an fheum air dòighean a leasachadh gus na sgilean a chaidh fhaighinn tro thrèanadh ath-chleachdadh gu h-èifeachdach nuair a bhios iad gan gluasad bho aon àrainneachd gu àrainneachd eile."

Tha an obair a chaidh a dhèanamh fìor dhrùidhteach, leis gu bheil an dùil an dòigh teagaisg seo a chleachdadh fada nas fhaide na crìochan gheamannan sam bith. Tha an luchd-rannsachaidh ag ràdh gu bheil an obair aca na cheum cudromach a dh’ ionnsaigh cruthachadh AI le giùlan “stèidhichte air fiosaig” agus “coltach ri duine” as urrainn galairean a lorg, ro-innse structaran moileciuil pròtain iom-fhillte agus mion-sgrùdadh a dhèanamh air sganaidhean CT.

Anns a ’bhidio gu h-ìosal chì thu gu soilleir mar a thachair am pròiseas ionnsachaidh gu lèir, mar a dh’ ionnsaich AI obair-sgioba, agus dh’ fhàs na ro-innleachdan aige barrachd is barrachd seòlta agus iom-fhillte.

Source: 3d naidheachdan.ru

Bidh OpenAI a’ teagasg obair-sgioba AI ann an geama seiche is sireadh

Cuir beachd ann freagairt a chur dheth