Мы не можам давяраць ІІ-сістэмам, пабудаваным на адным толькі глыбокім навучанні

Мы не можам давяраць ІІ-сістэмам, пабудаваным на адным толькі глыбокім навучанні

Гэты тэкст - не вынік навуковага даследавання, а адно з многіх меркаванняў адносна нашага бліжэйшага тэхналагічнага развіцця. І заадно запрашэнне да дыскусіі.

Гары Маркус, прафесар Нью-Йоркскага ўніверсітэта, упэўнены, што глыбокае навучанне гуляе важную ролю ў развіцці ІІ. Але ён таксама лічыць, што залішняе захапленне гэтай методыкай можа прывесці да яе дыскрэдытацыі.

У сваёй кнізе Rebooting AI: Building artificial intelligence we can trust Маркус, па адукацыі неўролаг, які пабудаваў кар'еру на перадавых даследаваннях у сферы ІІ, звяртаецца да тэхнічных і этычных аспектаў. З пункту гледжання тэхналогій, глыбокае навучанне можа паспяхова пераймаць рашэнню задач на ўспрыманне, якія выконвае наш мозг: напрыклад, распазнанне малюнкаў ці гаворкі. Але для рашэння іншых задач, накшталт разумення гутарак або азначэнні прычынна-выніковых сувязяў, глыбокае навучанне не падыходзіць. Каб стварыць больш прасунутыя інтэлектуальныя машыны, здольныя вырашаць шырэйшае кола задач - іх часта завуць агульным штучным інтэлектам - глыбокае навучанне неабходна камбінаваць з іншымі методыкамі.

Калі ІІ-сістэма на самой справе не разумее свае задачы або навакольны свет, гэта можа прывесці да небяспечных наступстваў. Нават найменшыя нечаканыя змены ў асяроддзі сістэмы могуць прывесці да яе памылковых паводзін. Такіх прыкладаў ужо было мноства: вызначальнікі выразных выразаў, якія лёгка падмануць; сістэмы для пошуку працы, якія стала дыскрымінуюць; беспілотныя аўтамабілі, якія трапляюць у аварыі і часам забіваюць кіроўцы ці пешахода. Стварэнне агульнага штучнага інтэлекту - гэта не проста цікавая даследчая праблема, у яе ёсць мноства цалкам практычных ужыванняў.

У сваёй кнізе Маркус і яго суаўтар Эрнэст Дэвіс вылучаюць выступаюць за іншы шлях. Яны лічаць, што мы яшчэ далёкія ад стварэння агульнага ІІ, але ўпэўненыя, што рана ці позна яго ўдасца стварыць.

Для чаго нам патрэбен агульны ІІ? Спецыялізаваныя версіі ўжо створаны і прыносяць нямала карысці.

Так, і карысці будзе яшчэ больш. Але ёсць шмат задач, якія спецыялізаваны ІІ проста не ў стане вырашыць. Напрыклад, разуменне звычайнай гаворкі, ці агульная дапамога ў віртуальным свеце, ці робат, які дапамагае ва ўборцы і падрыхтоўцы ежы. Такія задачы па-за магчымасцямі спецыялізаванага ІІ. Яшчэ адно цікавае практычнае пытанне: ці можна з дапамогай спецыялізаванага ІІ стварыць бяспечны аўтамабіль-беспілотнік? Вопыт паказвае, што ў такога ІІ да гэтага часу шмат праблем з паводзінамі ў анамальных сітуацыях, нават пры кіраванні, што вельмі ўскладняе сітуацыю.

Думаю, усе мы хацелі б атрымаць ІІ, які здольны дапамагчы нам зрабіць новыя маштабныя адкрыцці ў медыцыне. Няясна, ці падыдуць для гэтага бягучыя тэхналогіі, бо біялогія - сфера складаная. Трэба быць гатовым прачытаць нямала кніг. Навукоўцы разумеюць прычынна-выніковыя сувязі ва ўзаемадзеянні сетак і малекул, могуць распрацоўваць тэорыі аб планетах і гэтак далей. Аднак са спецыялізаваным ІІ мы не можам стварыць машыны, здольныя да такіх адкрыццяў. А з агульным ІІ мы змаглі б здзейсніць рэвалюцыю ў навуцы, тэхналогіях і медыцыне. На мой погляд, вельмі важна працягваць працу над стварэннем агульнага ІІ.

Падобна, пад "агульным" вы разумееце моцны ІІ?

Кажучы «агульны» я маю на ўвазе, што ІІ зможа на лёце абдумваць і самастойна вырашаць новыя задачы. У адрозненне ад, скажам, Го, у якім праблема не мянялася апошнія 2000 гадоў.

Агульны ІІ павінен умець прымаць рашэнні як у палітыцы, так і ў медыцыне. Гэта аналаг чалавечай здольнасці; любы разважны чалавек можа рабіць вельмі шмат. Бярэце неспрактыкаваных студэнтаў і праз некалькі дзён прымушаеце іх працаваць практычна над чым заўгодна, пачынаючы з юрыдычнай задачы і заканчваючы медыцынскай. Гэта дзякуючы таму, што яны маюць агульнае разуменне свету і ўмеюць чытаць, і таму могуць зрабіць свой унёсак у вельмі шырокі спектр заняткаў.

Узаемасувязь паміж такім інтэлектам і моцным складаецца ў тым, што не моцны інтэлект, верагодна, не зможа вырашаць агульныя задачы. Каб стварыць нешта досыць надзейнае, здольнае працаваць з увесь час зменлівым светам, вам, магчыма, запатрабуе прынамсі наблізіцца да агульнага інтэлекту.

Але зараз мы ад гэтага вельмі далёкія. AlphaGo можа выдатна гуляць на дошцы 19×19, але яго трэба перанавучаць для гульні на прастакутнай дошцы. Або вазьміце сярэднестатыстычную сістэму глыбокага навучання: яна здольная распазнаць слана, калі ён добра асветлены і бачная тэкстура яго скуры. А калі бачны толькі сілуэт слана, сістэма напэўна не зможа яго распазнаць.

У сваёй кнізе вы згадваеце, што глыбокае навучанне не здольнае дасягнуць магчымасцяў агульнага ІІ, паколькі яно не здольнае на глыбокае разуменне.

У кагнітывістыцы кажуць аб фармаванні розных кагнітыўных мадэляў. Я сяджу ў нумары гатэля і разумею, што вунь там шафа, там ложак, там тэлевізар, які незвычайна падвешаны. Я ведаю ўсе гэтыя прадметы, я не проста ідэнтыфікую іх. Таксама я разумею, як яны ўзаемазлучаныя сябар з сябрам. У мяне ёсць ідэі аб функцыянаванні навакольнага свету. Яны не ідэальныя. Яны могуць быць памылковымі, але яны вельмі добрыя. І на іх аснове я раблю нямала высноваў, якія становяцца кіраўніцтвам для маіх паўсядзённых дзеянняў.

Іншая крайнасць - нешта накшталт гульнявой сістэмы Atari, створанай DeepMind, у якой ён запамінаў, што яму трэба рабіць, калі бачыў пікселі ў пэўных месцах на экране. Калі вы атрымаеце дастаткова дадзеных, то можа здацца, што ў вас ёсць разуменне, але на справе яно вельмі павярхоўнае. Доказам таму з'яўляецца тое, што калі ссунуць аб'екты на тры пікселі, то ІІ гуляе значна горш. Перамены ставяць яго ў тупік. Гэта супрацьлегла глыбокаму разуменню.

Для вырашэння гэтай праблемы вы прапануеце вярнуцца да класічнага ІІ. Якія яго перавагі нам трэба паспрабаваць выкарыстаць?

Пераваг некалькі.

Па-першае, класічны ІІ насамрэч з'яўляецца фрэймворкам для стварэння кагнітыўных мадэляў свету, на аснове якіх можна потым рабіць высновы.

Па-другое, класічны ІІ ідэальна сумяшчальны з правіламі. Цяпер у сферы глыбокага навучання назіраецца дзіўная тэндэнцыя, калі спецыялісты імкнуцца пазбягаць правіл. Яны жадаюць усё рабіць на нейрасецях і не рабіць нічога такога, што выглядае як класічнае праграмаванне. Але ёсць задачы, якія былі спакойна вырашаны падобнай выявай, і на гэта ніхто не зважаў. Напрыклад, пабудова маршрутаў у Google Maps.

Насамрэч нам патрэбны абодва падыходы. Машыннае навучанне дазваляе добра вучыцца на дадзеных, але вельмі дрэнна дапамагае ў адлюстраванні абстракцыі, якую ўяўляе сабой камп'ютарная праграма. Класічны ІІ добра працуе з абстракцыямі, але яго цалкам трэба праграмаваць уручную, а ў свеце назапашана занадта шмат ведаў, каб усіх іх запраграмаваць. Відавочна, што нам трэба аб'яднаць абодва падыходы.

Гэта звязана з раздзелам, у якім вы расказваеце пра тое, чаму мы можам навучыцца ў чалавечага розуму. І ў першую чаргу аб канцэпцыі, якая базуецца на згаданай вышэй ідэі, што наша прытомнасць складаецца з мноства розных сістэм, якія працуюць па-рознаму.

Думаю, ёсць іншы спосаб растлумачыць гэта: кожная кагнітыўная сістэма, якая ў нас ёсць, сапраўды вырашае розныя задачы. Аналагічныя часткі ІІ павінны быць спраектаваны для вырашэння розных задач, якія маюць розныя характарыстыкі.

Цяпер мы спрабуем выкарыстоўваць нейкія ўсё-ў-адным тэхналогіі для рашэння задач, якія кардынальна адрозніваюцца сябар ад сябра. Зразумець прапанову - зусім не тое ж самае, што распазнаць аб'ект. Але людзі спрабуюць у абодвух выпадках выкарыстоўваць глыбокае навучанне. З кагнітыўнага пункта гледжання гэта якасна розныя задачы. Я проста ўражаны тым, як мала ў супольнасці спецыялістаў па глыбокім навучанні шануюць класічны ІІ. Навошта чакаць з'яўленні срэбнай кулі? Яна недасяжная, і бясплодныя пошукі не дазваляюць зразумець усю складанасць задачы стварэння ІІ.

Таксама вы згадваеце, што ІІ-сістэмы неабходныя для разумення прычынна-следчых сувязяў. Вы лічыце, што ў гэтым нам дапаможа глыбокае навучанне, класічны ІІ ці што-небудзь зусім новае?

Гэта яшчэ адна сфера, для якой глыбокае навучанне не надта падыходзіць. Яно не тлумачыць прычыны нейкіх падзей, а вылічае імавернасць падзеі ў зададзеных умовах.

Пра што мы гаворым? Вы гледзіце нейкія сцэнары, і вы разумееце, чаму гэта адбываецца і што можа адбыцца, калі нейкія акалічнасці зменяцца. Я магу паглядзець на падстаўку, на якой стаіць тэлевізар, і ўявіць, што калі я адрэжу ёй адну нагу, то падстаўка перавернецца і тэлевізар упадзе. Гэта прычынна-выніковая сувязь.

Класічны ІІ дае нам для гэтага нейкія інструменты. Ён можа ўявіць, напрыклад, што такое падтрымка і што такое падзенне. Але не буду перахвальваць. Праблема ў тым, што класічны ІІ па большай частцы залежыць ад паўнаты інфармацыі аб тым, што адбываецца, а я зрабіў выснову, усяго толькі паглядзеўшы на падстаўку. Я нейкім чынам магу абагульняць, уяўляць часткі падстаўкі, якія мне не бачныя. У нас пакуль няма інструментаў для рэалізацыі гэтай уласцівасці.

Яшчэ вы кажаце аб тым, што ў людзей ёсць прыроджанае веданне. Якім чынам гэта можна рэалізаваць у ІІ?

У момант нараджэння наш мозг ужо ўяўляе сабою вельмі старанна прадуманую сістэму. Яна не фіксаваная, прырода стварыла першы, грубіянскі чарнавік. А затым навучанне дапамагае нам пераглядаць гэты чарнавік на працягу ўсяго нашага жыцця.

Грубіянскі чарнавік мозгу ўжо валодае вызначанымі магчымасцямі. Нованароджаны горны казёл ужо праз некалькі гадзін здольны беспамылкова спускацца па схіле гары. Відавочна, што ў яго ўжо ёсць разуменне трохмернай прасторы, свайго цела і ўзаемасувязі паміж імі. Вельмі складаная сістэма.

Збольшага таму я лічу, што нам патрэбны гібрыды. Цяжка ўявіць, як можна стварыць робата, які добра функцыянуе ў свеце без аналагічных ведаў, з чаго яму пачынаць, замест таго, каб пачынаць з чыстага ліста і вучыцца на працяглым, велізарным досведзе.

Што да людзей, то наша прыроджанае веданне паходзіць з нашага геному, які эвалюцыянаваў доўгі час. А з ІІ-сістэмамі нам давядзецца пайсці іншым шляхам. Часткова гэта могуць быць правілы пабудовы нашых алгарытмаў. Часткова гэта могуць быць правілы стварэння структур дадзеных, якімі маніпулююць гэтыя алгарытмы. І часткова гэта могуць быць веды, якія мы наўпрост будзем укладваць у машыны.

Цікава, што ў кнізе вы падводзіце да ідэі даверу і стварэння даверных сістэм. Чаму вы выбралі менавіта гэты крытэрый?

Я лічу, што сёння ўсё гэта ўяўляе сабой гульню гульню ў мяч. Мне здаецца, мы пражываем дзіўны момант гісторыі, шмат у чым давяраючы ПЗ, якое не заслугоўвае даверу. Думаю, уласцівыя нам сёння турботы не будуць вечнымі. Праз сто гадоў ІІ апраўдае наш давер, а можа быць і раней.

Але сёння ІІ небяспечны. Не ў тым сэнсе, як баіцца Ілон Маск, а ў тым, што сістэмы сумоўя пры прыёме на працу дыскрымінуюць жанчын, прычым незалежна ад таго, што робяць праграмісты, таму што іх інструменты занадта простыя.

Я хацеў бы, каб у нас быў больш якасны ІІ. Не хачу, каб пачалася "зіма штучнага інтэлекту", калі людзі ўсведамляюць, што ІІ не працуе і проста небяспечны, і не захочуць гэта выпраўляць.

У некаторым сэнсе ваша кніга сапраўды здаецца вельмі аптымістычнай. Вы мяркуеце, што можна пабудаваць годны даверу ІІ. Проста нам трэба паглядзець у іншым накірунку.

Дакладна, кніга вельмі песімістычная ў кароткатэрміновай перспектыве і вельмі аптымістычная ў доўгатэрміновай. Мы лічым, што ўсе апісаныя намі праблемы могуць быць вырашаны, калі больш шырока паглядзець на тое, якімі павінны быць правільныя адказы. І мы думаем, што калі гэта адбудзецца, свет стане лепшым.

Крыніца: habr.com

Дадаць каментар