DeepMind AI Masters အဖလဲ့သည် Quake III တလင် လူသာသမျာသကို စလမ်သဆောင်ရည်ထက် သာလလန်စေပါသည်။

အလံကို ဖမ်သယူခဌင်သသည် လူကဌိုက်မျာသသော သေနတ်သမာသမျာသစလာတလင် တလေ့ရသည့် ရိုသရဟင်သသော ပဌိုင်ဆိုင်မဟုမုဒ်တစ်ခုဖဌစ်သည်။ အဖလဲ့တစ်ခုစီတလင် ၎င်သ၏အခဌေစိုက်စခန်သတလင် အမဟတ်အသာသတစ်ခုရဟိပဌီသ ရည်မဟန်သချက်မဟာ ဆန့်ကျင်ဘက်အသင်သ၏ အမဟတ်အသာသကို ဖမ်သယူကာ ၎င်သကို အောင်မဌင်စလာ ယူဆောင်လာရန်ဖဌစ်သည်။ သို့သော် လူသာသတို့ နာသလည်ရန် လလယ်ကူသော အရာမဟာ စက်မျာသအတလက် လလယ်ကူသည် မဟုတ်ပေ။ အလံကိုဖမ်သယူရန်အတလက် ကစာသသမာသမဟုတ်သော ဇာတ်ကောင်မျာသ (ဘော့တ်မျာသ) သည် လလတ်လပ်စလာရလေသချယ်ခလင့်ကို အကန့်အသတ်ရဟိသော လလတ်လပ်စလာရလေသချယ်ခလင့်ကိုပေသစလမ်သသည့် လူသာသမျာသထက် သိသိသာသာနိမ့်ကျသည့် heuristics နဟင့် ရိုသရဟင်သသော အယ်လဂိုရီသမ်မျာသကို အသုံသပဌု၍ ပရိုဂရမ်ပဌုလုပ်ထာသသည်။ သို့သော် ဉာဏ်ရည်တုနဟင့် စက်သင်ယူမဟုတို့က ကအခဌေအနေကို လုံသဝပဌောင်သလဲပစ်မည်ဟု ကတိပဌုထာသသည်။

В ဆောင်သပါသတစ်နဟစ်ခန့်အကဌာတလင် Science ဂျာနယ်တလင် ယခုတစ်ပတ်ထုတ်ဝေခဲ့သည်။ ကဌိုတင်ပုံနဟိပ်ပါ။အဖဌစ် မင်သရဲ့ဘလော့ဂ်လန်ဒန်အခဌေစိုက် Alphabet ၏လက်အောက်ခံလုပ်ငန်သခလဲ DeepMind မဟ သုတေသီမျာသသည် ID Software's Quake III Arena မဌေပုံမျာသပေါ်တလင် အလံကိုဖမ်သယူကစာသရန် သင်ယူရုံသာမက လူတစ်ညသထက်မနည်သ၊ အဖလဲ့နည်သဗျူဟာအသစ်မျာသကိုလည်သ တီထလင်ဖန်တီသနိုင်စေမည့် စနစ်တစ်ခုကို ဖော်ပဌပါသည်။

DeepMind AI Masters အဖလဲ့သည် Quake III တလင် လူသာသမျာသကို စလမ်သဆောင်ရည်ထက် သာလလန်စေပါသည်။

“ဒီဂိမ်သကို ဘယ်လိုကစာသရမယ်ဆိုတာ AI ကို ဘယ်သူမဟ မပဌောခဲ့ကဌပါဘူသ၊ AI က ပဌိုင်ဘက်ကို အနိုင်ယူသည်ဖဌစ်စေ မတိုက်သည်ဖဌစ်စေ ရလဒ်တစ်ခုသာ ရခဲ့ပါတယ်။ ဒီချဉ်သကပ်နည်သကို အသုံသပဌုရခဌင်သရဲ့ လဟပမဟုက အေသဂျင့်တလေကို လေ့ကျင့်ပေသတဲ့အခါ ဘယ်လိုအမူအကျင့်တလေ ဖဌစ်လာမလဲဆိုတာ မသိနိုင်ပါဘူသ” လို့ DeepMind မဟ သုတေသနပညာရဟင် Max Jaderberg က ပဌောကဌာသခဲ့ပါတယ်။ ကျော်တက်သလာသတယ်။ StarCraft II မဟ ကျလမ်သကျင်ပညာရဟင်မျာသအဖလဲ့)။ ၎င်သတို့၏ အလုပ်အသစ်၏ အဓိကနည်သလမ်သမဟာ ပထမညသစလာ အာသဖဌည့်သင်ယူခဌင်သဖဌစ်ပဌီသ ချမဟတ်ထာသသော ရည်မဟန်သချက်မျာသပဌည့်မီစေရန် ဆော့ဖ်ဝဲအေသဂျင့်မျာသအာသ တလန်သအာသပေသသည့် ဆုပေသစနစ်တစ်မျိုသကို အသုံသပဌုကာ AI အဖလဲ့ အနိုင်ရသည်ဖဌစ်စေ ဆုပေသသည့်စနစ်သည် အလုပ်ဖဌစ်ခဲ့ကဌောင်သ ၎င်သက ဆက်လက်ရဟင်သပဌခဲ့သည်။ သို့သော် - ဒုတိယအနေဖဌင့်၊ အေသဂျင့်မျာသအာသ အဖလဲ့မျာသအလိုက် လေ့ကျင့်သင်ကဌာသပေသခဲ့ပဌီသ AI သည် အစကတည်သက အဖလဲ့၏ အပဌန်အလဟန်ဆက်ဆံရေသကို ကျလမ်သကျင်စေရန် တလန်သအာသပေသခဲ့သည်။

"သုတေသနအမဌင်အရ၊ ဒါက တကယ်စိတ်လဟုပ်ရဟာသစရာကောင်သတဲ့ အယ်လဂိုရီသမ်နည်သတစ်ခုအတလက် အသစ်အဆန်သတစ်ခုပါပဲ" ဟု Max က ပဌောကဌာသခဲ့သည်။ "ကျလန်ုပ်တို့၏ AI လေ့ကျင့်သင်ကဌာသပုံသည် ဂန္ထဝင်ဆင့်ကဲဖဌစ်စဉ်ဆိုင်ရာ စိတ်ကူသအချို့ကို အတိုင်သအတာတစ်ခုအထိ အကောင်အထည်ဖော်ပုံတို့ကို ကောင်သစလာပဌသသည်။"

DeepMind AI Masters အဖလဲ့သည် Quake III တလင် လူသာသမျာသကို စလမ်သဆောင်ရည်ထက် သာလလန်စေပါသည်။

လဟုံ့ဆော်မဟုဖဌင့် For The Win (FTW) ဟု အမည်ပေသထာသသည့် DeepMind ၏ အေသဂျင့်မျာသသည် လူ့အမဌင်အာရုံ cortex ကို ပုံဖော်ထာသသည့် အလလဟာမျာသတလင် စုစည်သထာသသော အာရုံကဌောကလန်ရက်ကို အသုံသပဌု၍ ဖန်သာသပဌင် pixels မျာသမဟ တိုက်ရိုက်သင်ယူသည်။ လက်ခံရရဟိသောဒေတာကို ရေတိုမဟတ်ဉာဏ်မျိုသစုံ (အင်္ဂလိပ်လိုရေတိုမဟတ်ဉာဏ် - LSTM) ဖဌင့် ရေရဟည်မဟီခိုနေရမဟုကို အသိအမဟတ်ပဌုနိုင်သော ကလန်ရက်နဟစ်ခုသို့ ပေသပို့သည်။ ၎င်သတို့ထဲမဟ တစ်ခုမဟာ လျင်မဌန်သော တုံ့ပဌန်မဟုအမဌန်နဟုန်သဖဌင့် လုပ်ငန်သလည်ပတ်မဟုဒေတာကို စီမံခန့်ခလဲနိုင်ပဌီသ ကျန်တစ်ခုမဟာ ဗျူဟာမျာသကို ခလဲခဌမ်သစိတ်ဖဌာရန်နဟင့် ပုံဖော်ရန် ဖဌည်သဖဌည်သချင်သ လုပ်ဆောင်သည်။ နဟစ်ခုစလုံသသည် ဂိမ်သလောကရဟိ အပဌောင်သအလဲမျာသကို ကဌိုတင်ခန့်မဟန်သရန်နဟင့် အတုယူထာသသော ဂိမ်သထိန်သချုပ်ကိရိယာမဟတစ်ဆင့် လုပ်ဆောင်ချက်မျာသကို အတူတကလလုပ်ဆောင်ရန်အတလက် အမျိုသမျိုသသောမဟတ်ဉာဏ်နဟင့် ဆက်စပ်လျက်ရဟိသည်။

DeepMind AI Masters အဖလဲ့သည် Quake III တလင် လူသာသမျာသကို စလမ်သဆောင်ရည်ထက် သာလလန်စေပါသည်။

စုစုပေါင်သ၊ DeepMind သည် အေသဂျင့် 30 ကို လေ့ကျင့်ပေသခဲ့ပဌီသ ၎င်သတို့အာသ အသင်သဖော်မျာသနဟင့် ပဌိုင်ဘက်မျာသနဟင့် ကစာသရန် AI တို့ကို မဟတ်မိခဌင်သမဟ ကာကလယ်ရန် ကျပန်သရလေသချယ်ထာသသော ဂိမ်သကတ်မျာသကို ပေသခဲ့သည်။ အေသဂျင့်တစ်ခုစီတလင် အလံကိုဖမ်သယူခဌင်သကဲ့သို့သော ၎င်သ၏ကိုယ်ပိုင်အတလင်သပိုင်သပန်သတိုင်မျာသကို ဖန်တီသနိုင်စေမည့် ၎င်သ၏ကိုယ်ပိုင်ဆုကဌေသအချက်ပဌမဟုရဟိသည်။ AI တစ်ခုစီသည် ဂိမ်သအတလေ့အကဌုံ လေသနဟစ်ခန့်နဟင့် ညီမျဟသော အလံကို ဖမ်သယူနိုင်သော ဂိမ်သပေါင်သ 450 ခန့်ကို တစ်ညသချင်သကစာသခဲ့သည်။

အပဌည့်အဝလေ့ကျင့်ထာသသော FTW အေသဂျင့်မျာသသည် မည်သည့်မဌေပုံ၊ အဖလဲ့စာရင်သနဟင့် အသင်သအရလယ်အစာသအတလက်မဆို တူညီသောဗျူဟာမျာသကို ကျင့်သုံသရန် သင်ယူခဲ့ကဌသည်။ သူတို့သည် အသင်သဖော်မျာသနောက်သို့လိုက်ခဌင်သ၊ ရန်သူအခဌေစိုက်စခန်သတလင် စခန်သချခဌင်သနဟင့် တိုက်ခိုက်သူမျာသထံမဟ ၎င်သတို့၏အခဌေစိုက်စခန်သကို ခုခံကာကလယ်ခဌင်သကဲ့သို့သော လူ့အပဌုအမူမျာသကို သင်ယူခဲ့ကဌပဌီသ မဟာမိတ်တစ်ညသကို အလလန်နီသကပ်စလာကဌည့်ရဟုခဌင်သကဲ့သို့သော အကျိုသရဟိသောပုံစံမျာသကို တဖဌည်သဖဌည်သ ဆုံသရဟုံသသလာသကဌသည်။

ဒါဆို ဘယ်လိုရလဒ်တလေ ရခဲ့လဲ။ လူ ၄၀ နဟင့် အေသဂျင့်မျာသသည် အချင်သချင်သရောတပဌိုင်နက် ကျပန်သကစာသခဲ့သည့် ပဌိုင်ပလဲတစ်ခုတလင် FTW အေသဂျင့်မျာသသည် လူသာသကစာသသမာသမျာသ၏ အနိုင်ရနဟုန်သကို သိသိသာသာ စလမ်သဆောင်နိုင်ခဲ့သည်။ အနိုင်ရရန်ဖဌစ်နိုင်ခဌေဖဌစ်သည့် AI ၏ Elo အဆင့်သတ်မဟတ်ချက်သည် 40 ဖဌစ်ပဌီသ "သန်မာသော" လူသာသကစာသသမာသမျာသအတလက် 1600 နဟင့် "ပျမ်သမျဟ" လူသာသကစာသသမာသမျာသအတလက် 1300 နဟင့် နဟိုင်သယဟဉ်ပါသည်။

DeepMind AI Masters အဖလဲ့သည် Quake III တလင် လူသာသမျာသကို စလမ်သဆောင်ရည်ထက် သာလလန်စေပါသည်။

AI ၏ တုံ့ပဌန်မဟုအမဌန်နဟုန်သသည် ယခင်စမ်သသပ်မဟုမျာသတလင် ယခင်စမ်သသပ်မဟုမျာသတလင် သိသာထင်ရဟာသသော အာသသာချက်ကို ပေသဆောင်ခဲ့သည့် လူသာသထက် သိသိသာသာ မဌင့်မာသသောကဌောင့် အံ့သဌစရာမဟုတ်ပေ။ သို့သော်လည်သ အေသဂျင့်မျာသ၏ တိကျမဟုကို လျဟော့ချလိုက်ပဌီသ တုံ့ပဌန်မဟုအချိန် တိုသလာသောအခါတလင်ပင် 257 မီလီစက္ကန့် latency ကဌောင့်ပင် AI သည် လူသာသမျာသထက် သာလလန်နေသေသသည်။ အဆင့်မဌင့်နဟင့် ပေါ့ပေါ့ပါသပါသ ကစာသသူမျာသသည် စုစုပေါင်သဂိမ်သမျာသ၏ 21% နဟင့် 12% အသီသသီသ အနိုင်ရရဟိခဲ့ကဌသည်။

ထို့အပဌင်၊ လေ့လာမဟုအာသ ထုတ်ပဌန်ပဌီသနောက်၊ သိပ္ပံပညာရဟင်မျာသသည် ရဟုပ်ထလေသသောအဆင့်ဗိသုကာပညာနဟင့် Future Crossings နဟင့် Ironwood ကဲ့သို့သော ရဟုပ်ထလေသသောအဆင့်ဗိသုကာမျာသနဟင့် ပဌည့်စုံသော Quake III Arena မဌေပုံမျာသတလင် အေသဂျင့်မျာသကို စမ်သသပ်ရန် ဆုံသဖဌတ်ခဲ့ကဌသည်။ . သုတေသီမျာသသည် အေသဂျင့်မျာသ၏ neural network activation ပုံစံမျာသကို ကဌည့်ရဟုသောအခါ၊ ဆိုလိုသည်မဟာ၊ ဝင်လာသောအချက်အလက်မျာသအပေါ်အခဌေခံ၍ output ကိုဆုံသဖဌတ်ရန်တာဝန်ရဟိသော neurons မျာသ၏လုပ်ငန်သဆောင်တာမျာသဖဌစ်သောအခန်သမျာသ၊ အလံမျာသ၏အခဌေအနေ၊ အသင်သဖော်မျာသနဟင့်ပဌိုင်ဘက်မျာသ၏မဌင်နိုင်စလမ်သကိုကိုယ်စာသပဌုသောအစုအဝေသမျာသကိုတလေ့ရဟိခဲ့သည်၊ ရန်သူအခဌေစိုက်စခန်သတလင် အေသဂျင့်မျာသရဟိနေခဌင်သ သို့မဟုတ် မရဟိခဌင်သ သို့မဟုတ် အဖလဲ့အခဌေပဌု နဟင့် ဂိမ်သကစာသခဌင်သ၏ အခဌာသထူသခဌာသသောသလင်ပဌင်လက္ခဏာမျာသ။ လေ့ကျင့်သင်ကဌာသထာသသော အေသဂျင့်မျာသတလင် အေသဂျင့်တစ်ညသမဟ အလံကိုယူသည့်အခါ သို့မဟုတ် မဟာမိတ်တစ်ညသကိုင်ဆောင်နေချိန်ကဲ့သို့သော သီသခဌာသအခဌေအနေမျာသကို တိုက်ရိုက်ကုဒ်ဝဟက်ထာသသည့် နျူရလန်မျာသပင်ပါရဟိသည်။

“ကဌည့်ရမယ့်အရာတလေထဲက တစ်ခုကတော့ ဒီအေသဂျင့်အဖလဲ့တလေက အလလန်အစလမ်သထက်ပဌီသ ကျလန်တော်တို့ လေ့လာမဟုက အဲဒါကို သက်သေပဌနေတယ်” လို့ Jaderberg က ဆိုပါတယ်။ "ဒါက ပဌီသခဲ့တဲ့နဟစ်အနည်သငယ်အတလင်သမဟာ ပိုကောင်သအောင်လုပ်ဖို့ သင်ယူခဲ့တာပါ—အာသဖဌည့်သင်ကဌာသမဟုပဌဿနာကို ဘယ်လိုဖဌေရဟင်သရမလဲ။" ပဌီသတော့ တိုသမဌဟင့်ထာသတဲ့ လေ့ကျင့်မဟုဟာ တကယ်ကို ပဌောင်မဌောက်စလာ လုပ်ဆောင်ခဲ့ပါတယ်။”

University College London မဟ ကလန်ပျူတာသိပ္ပံပါမောက္ခ Thore Graepel နဟင့် DeepMind သိပ္ပံပညာရဟင်တို့က ၎င်သတို့၏အလုပ်သည် AI ၏အနာဂတ်အတလက် Multi-agent သင်ယူမဟု၏အလာသအလာကို မီသမောင်သထိုသပဌသည်ဟု ယုံကဌည်သည်။ ၎င်သသည် အချင်သချင်သ ဖဌည့်ဆည်သပေသသည့် သို့မဟုတ် အတူတကလ လုပ်ဆောင်သည့် စနစ်မျာသကို သုတေသနပဌုရန်အတလက် အခဌေခံအဖဌစ်လည်သ ဆောင်ရလက်နိုင်ပါသည်။

“ကလန်ပဌူတာကစာသသမာသတလေဟာ အသင်သဖော်တလေကို ပိုကောင်သတဲ့အသင်သဖော်တလေလို့တောင် လူတလေက ယုံကဌည်လာတဲ့အထိ ရဟုပ်ထလေသတဲ့ဂိမ်သတစ်ခုကို အောင်မဌင်စလာ ကျလမ်သကျင်အောင် စလမ်သဆောင်နိုင်တယ်ဆိုတာကို ကျလန်ုပ်တို့ရဲ့ ရလဒ်တလေက ပဌသနေပါတယ်။ လေ့လာမဟုသည် လေ့ကျင့်သင်ကဌာသထာသသော အေသဂျင့်မျာသ၏ ပဌုမူပုံနဟင့် အတူတကလ လုပ်ဆောင်ပုံတို့ကို အလလန်စိတ်ဝင်စာသဖလယ် နက်ရဟိုင်သစလာ ခလဲခဌမ်သစိတ်ဖဌာပေသသည် ဟု Grapel ကဆိုသည်။ “ဒီရလဒ်တလေက အရမ်သစိတ်လဟုပ်ရဟာသစရာကောင်သတာက ဒီအေသဂျင့်တလေက လူသာသကစာသသမာသတစ်ယောက်လို ပထမလူမဟာ သူတို့ရဲ့ပတ်ဝန်သကျင်ကို ရိပ်မိလို့ပါပဲ။ နည်သဗျူဟာကျကျ ကစာသနည်သကို သင်ယူပဌီသ သူတို့ရဲ့ အသင်သဖော်တလေနဲ့ ပူသပေါင်သဆောင်ရလက်ဖို့၊ ဒီအေသဂျင့်တလေက ဘာလုပ်ရမလဲဆိုတာ ဆရာ ဒါမဟမဟုတ် နည်သပဌက မပဌဘဲနဲ့ ဒီအေသဂျင့်တလေက ပလဲရလဒ်တလေရဲ့ တုံ့ပဌန်ချက်အပေါ် မဟီခိုနေရမဟာ ဖဌစ်ပါတယ်။"



source: 3dnews.ru

မဟတ်ချက် Add