🥇Ми не можемо довіряти ІІ-системам, побудованим на одному лише глибокому навчанні

Цей текст — не результат наукового дослідження, а одна з багатьох думок щодо найближчого технологічного розвитку. І заразом запрошення до дискусії.

Гарі Маркус, професор Нью-Йоркського університету, впевнений, що глибоке навчання відіграє важливу роль у розвитку ІІ. Але він також вважає, що надмірне захоплення цією методикою може призвести до її дискредитації.

У своїй книзі Rebooting AI: Building artificial intelligence we can trust Маркус, за освітою невролог, який побудував кар'єру на передових дослідженнях у сфері ІІ, звертається до технічних та етичних аспектів. З погляду технологій, глибоке навчання може успішно наслідувати вирішення завдань на сприйняття, які виконує наш мозок: наприклад, розпізнавання зображень чи мови. Але для вирішення інших завдань, як розуміння розмов або визначення причинно-наслідкових зв'язків, глибоке навчання не годиться. Щоб створити просунутіші інтелектуальні машини, здатні вирішувати ширше коло завдань — їх часто називають загальним штучним інтелектом — глибоке навчання необхідно комбінувати з іншими методиками.

Якщо ІІ-система насправді не розуміє своїх завдань чи навколишнього світу, це може призвести до небезпечних наслідків. Навіть найменші несподівані зміни в оточенні системи можуть призвести до її хибної поведінки. Таких прикладів вже було безліч: визначники неналежних виразів, які легко обдурити; системи для пошуку роботи, які постійно дискримінують; безпілотні автомобілі, які потрапляють в аварії та іноді вбивають водія чи пішохода. Створення загального штучного інтелекту - це не просто цікава дослідницька проблема, вона має безліч абсолютно практичних застосувань.

У своїй книзі Маркус та його співавтор Ернест Девіс висувають виступають за інший шлях. Вони вважають, що ми ще далекі від створення спільного ІІ, але впевнені, що рано чи пізно його вдасться створити.

Навіщо нам потрібен загальний ІІ? Спеціалізовані версії вже створені та приносять чимало користі.

Правильно, і користі буде ще більше. Але є багато завдань, які спеціалізований ІІ просто не в змозі вирішити. Наприклад, розуміння звичайної мови, або загальна допомога у віртуальному світі, або робот, що допомагає у прибиранні та приготуванні їжі. Такі завдання поза можливостями спеціалізованого ІІ. Ще одне цікаве практичне питання: чи можна за допомогою спеціалізованого ІІ створити безпечний автомобіль-безпілотник? Досвід показує, що у такого ІІ досі багато проблем із поведінкою в аномальних ситуаціях, навіть при керуванні, що дуже ускладнює ситуацію.

Думаю, всі ми хотіли б отримати ІІ, який може допомогти нам зробити нові масштабні відкриття в медицині. Незрозуміло, чи підійдуть для цього поточні технології, адже біологія — складна сфера. Потрібно бути готовим прочитати чимало книг. Вчені розуміють причинно-наслідкові зв'язки у взаємодії мереж та молекул, можуть розробляти теорії про планети тощо. Однак зі спеціалізованим ІІ ми не можемо створити машини, здатні до таких відкриттів. А із загальним ІІ ми змогли б здійснити революцію в науці, технологіях та медицині. На мою думку, дуже важливо продовжувати роботу над створенням спільного ІІ.

Схоже, під «загальним» ви розумієте сильну ІІ?

Говорячи «загальний» я маю на увазі, що ІІ зможе на льоту обмірковувати та самостійно вирішувати нові завдання. На відміну від Го, в якому проблема не змінювалася останні 2000 років.

Загальний ІІ має вміти приймати рішення як у політиці, так і в медицині. Це аналог людської здатності; будь-яка розсудлива людина може робити дуже багато. Берете недосвідчених студентів і через кілька днів змушуєте їх працювати практично над чим завгодно, починаючи з юридичного завдання та закінчуючи медичним. Це завдяки тому, що вони мають спільне розуміння світу і вміють читати, і тому можуть зробити свій внесок у дуже широкий спектр занять.

Взаємозв'язок між таким і сильним інтелектом полягає в тому, що не сильний інтелект, ймовірно, не зможе вирішувати загальні завдання. Щоб створити щось досить надійне, здатне працювати зі світом, що постійно змінюється, вам, можливо, вимагатиме як мінімум наблизитися до спільного інтелекту.

Але зараз ми від цього дуже далекі. AlphaGo може чудово грати на дошці 19×19, але його потрібно перенавчати для гри на прямокутній дошці. Або візьміть середньостатистичну систему глибокого навчання: вона здатна розпізнати слона, якщо він добре освітлений і видно текстуру його шкіри. А якщо видно лише силует слона, система, напевно, не зможе його розпізнати.

У своїй книзі ви згадуєте, що глибоке навчання не здатне досягти можливостей загального ІІ, оскільки воно не здатне на глибоке розуміння.

У когнітивистиці говорять про формування різних когнітивних моделей. Я сиджу в номері готелю і розумію, що там шафа, там ліжко, там телевізор, який незвичайно підвішений. Я знаю усі ці предмети, я не просто ідентифікую їх. Також я розумію, як вони взаємопов'язані один з одним. У мене є ідеї щодо функціонування навколишнього світу. Вони не ідеальні. Вони можуть бути помилковими, але вони дуже хороші. І на їх основі я роблю чимало висновків, які стають керівництвом для моїх повсякденних дій.

Інша крайність — щось подібне до ігрової системи Atari, створеної DeepMind, в якій він запам'ятовував, що йому потрібно робити, коли бачив пікселі в певних місцях на екрані. Якщо ви отримаєте достатньо даних, то може здатися, що у вас є розуміння, але насправді воно дуже поверхове. Доказом цього є те, що якщо зрушити об'єкти на три пікселі, то ІІ грає набагато гірше. Зміни ставлять його в глухий кут. Це протилежно до глибокого розуміння.

Для вирішення цієї проблеми ви пропонуєте повернутися до класичного ІІ. Які його переваги нам потрібно постаратися використати?

Переваг кілька.

По-перше, класичний ІІ насправді є фреймворком для створення когнітивних моделей світу, на основі яких можна потім робити висновки.

По-друге, класичний ІІ ідеально сумісний із правилами. Нині у сфері глибокого навчання спостерігається дивна тенденція, коли фахівці намагаються уникати правил. Вони хочуть робити все на нейромережах і не робити нічого такого, що виглядає як класичне програмування. Але є завдання, які були спокійно вирішені так, і на це ніхто не звертав увагу. Наприклад, побудова маршрутів у Google Maps.

Насправді нам потрібні обидва підходи. Машинне навчання дозволяє добре вчитися на даних, але дуже погано допомагає у відображенні абстракції, яку є комп'ютерною програмою. Класичний ІІ добре працює з абстракціями, але його цілком потрібно програмувати вручну, а у світі накопичено дуже багато знань, щоб усіх їх запрограмувати. Очевидно, що нам потрібно об'єднати обидва підходи.

Це пов'язано з розділом, у якому ви розповідаєте про те, чого ми можемо навчитися у людського розуму. І насамперед про концепцію, що базується на згаданій вище ідеї, що наша свідомість складається з безлічі різних систем, які працюють по-різному.

Думаю, є інший спосіб пояснити це: кожна когнітивна система, яка у нас є, справді вирішує різні завдання. Аналогічні частини ІІ мають бути спроектовані для вирішення різних завдань, що мають різні характеристики.

Зараз ми намагаємося використовувати якісь все-в-одному технології для вирішення завдань, які кардинально відрізняються один від одного. Зрозуміти пропозицію — зовсім не те саме, що розпізнати об'єкт. Але люди намагаються в обох випадках використати глибоке навчання. З когнітивної точки зору це якісно різні завдання. Я просто вражений тим, як мало у співтоваристві фахівців із глибокого навчання цінують класичний ІІ. Навіщо чекати на появу срібної кулі? Вона недосяжна, і безплідні пошуки не дозволяють збагнути всю складність завдання створення ІІ.

Також ви згадуєте, що ІІ-системи необхідні розуміння причинно-наслідкових зв'язків. Ви вважаєте, що в цьому нам допоможе глибоке навчання, класичний ІІ або щось зовсім нове?

Це ще одна сфера, для якої глибоке навчання не надто підходить. Воно не пояснює причини якихось подій, а обчислює можливість події в заданих умовах.

Про що ми говоримо? Ви дивитесь деякі сценарії, і ви розумієте, чому це відбувається і що може статися, якщо якісь обставини зміняться. Я можу подивитися на підставку, на якій стоїть телевізор, і уявити, що якщо я відріжу їй одну ногу, то підставка перевернеться і телевізор впаде. Це причинно-наслідковий зв'язок.

Класичний ІІ дає нам при цьому деякі інструменти. Він може уявити, наприклад, що таке підтримка і таке падіння. Але не перехвалюватиму. Проблема в тому, що класичний ІІ здебільшого залежить від повноти інформації про те, що відбувається, а я зробив висновок, лише подивившись на підставку. Я якимось чином можу узагальнювати, представляти частини підставки, які мені не видно. У нас поки що немає інструментів для реалізації цієї властивості.

Ще ви говорите про те, що люди мають вроджене знання. Як це можна реалізувати в ІІ?

У момент народження наш мозок вже є дуже ретельно продуманою системою. Вона не фіксована, природа створила першу, грубу чернетку. А потім навчання допомагає нам переглядати цю чернетку протягом усього нашого життя.

Груба чернетка мозку вже має певні можливості. Новонароджений гірський козел вже за кілька годин здатний безпомилково спускатися схилом гори. Очевидно, що він уже має розуміння тривимірного простору, свого тіла і взаємозв'язку між ними. Дуже складна система.

Тому я вважаю, що нам потрібні гібриди. Важко уявити, як можна створити робота, який добре функціонує у світі без аналогічних знань, з чого йому починати, замість того, щоб починати з чистого аркуша і вчитися на тривалому, величезному досвіді.

Щодо людей, то наше вроджене знання походить з нашого геному, який еволюціонував довгий час. А з ІІ-системами нам доведеться піти іншим шляхом. Частково це можуть бути правила побудови наших алгоритмів. Частково це може бути правила створення структур даних, якими маніпулюють ці алгоритми. І частково це можуть бути знання, які ми безпосередньо вкладатимемо в машини.

Цікаво, що у книзі ви підводите до ідеї довіри та створення довірчих систем. Чому ви обрали саме цей критерій?

Я вважаю, що сьогодні все це є грою гри в м'яч. Мені здається, ми проживаємо дивний момент історії, багато в чому довіряючи ПЗ, яке не заслуговує на довіру. Думаю, властиві нам сьогодні занепокоєння не будуть вічними. Через сто років ІІ виправдає нашу довіру, а може бути й раніше.

Але сьогодні ІІ небезпечний. Не в тому сенсі, як побоюється Ілон Маск, а в тому, що системи співбесіди при прийомі на роботу дискримінують жінок, причому незалежно від того, що роблять програмісти, тому що їх інструменти дуже прості.

Я хотів би, щоб у нас був якісніший ШІ. Не хочу, щоб почалася «зима штучного інтелекту», коли люди усвідомлюють, що ІІ не працює і просто небезпечний, і не захочуть це виправляти.

У певному сенсі ваша книга справді здається дуже оптимістичною. Ви припускаєте, що можна побудувати заслуговує на довіру ІІ. Просто нам потрібно подивитись в іншому напрямку.

Певно, книга дуже песимістична у короткостроковій перспективі та дуже оптимістична у довгостроковій. Ми вважаємо, що всі описані нами проблеми можуть бути вирішені, якщо ширше подивитися на те, якими мають бути правильні відповіді. І ми думаємо, що якщо це станеться, світ стане кращим.

Джерело: habr.com

Ми не можемо довіряти ІІ-системам, побудованим на одному лише глибокому навчанні

Додати коментар або відгук Скасувати відповідь