🥇Чи можна запрограмувати довільність?

У чому відмінність людини та програми

Нейронні мережі, які й становлять зараз практично всю область штучного інтелекту, можуть враховувати у прийнятті рішення набагато більше факторів, ніж людина, робити це швидше і здебільшого точніше. Але програми діють лише тому, що їх запрограмували або навчили. Вони можуть бути дуже складними, враховувати багато факторів та діяти дуже варіативно. Але все одно не можуть замінити людину у прийнятті рішень. Чим відрізняється від такої програми людина? Тут треба відзначити 3 ключові відмінності, з яких випливають усі інші:

Людина має картину світу, яка дозволяє їй щодо інформації доповнювати картину такими даними, які не прописані в програмі. Крім того, картина світу структурно влаштована так, що дозволяє нам мати хоч якесь уявлення про все. Навіть якщо це щось кругле і світиться у небі (НЛО). Зазвичай для цього будують онтології, але онтології не мають такої повноти, погано враховують багатозначність понять, їх взаємний вплив і поки що застосовні лише у суворо обмежених темах.
Людина має логіку, яка враховує цю картину світу, що нами називається здоровим глуздом або common sense. Будь-яке твердження має сенс, і враховує приховані недекларовані знання. Незважаючи на те, що законам логіки багато сотень років, ніхто досі не знає, як функціонує звичайна, не математична, логіка міркувань. Ми по суті не знаємо, як запрограмувати навіть звичайні силогізми.
Довільність. Програми не мають довільності. Це, мабуть, найскладніше з усіх трьох відмінностей. Що ми називаємо довільністю? Можливість побудувати нову поведінку, відмінне від того, що ми виконували при тих же обставинах раніше, або побудувати поведінку в нових обставинах, що не зустрічалися. Тобто, по суті, це створення на ходу нової програми поведінки без спроб і помилок з урахуванням нових, у тому числі внутрішніх, обставин.

Довільністю поки що є незвіданим полем для дослідників. Генетичні алгоритми, здатні породити нову програму поведінки інтелектуальних агентів, є виходом, оскільки вони породжують рішення не логічно, а шляхом «мутацій» і рішення «випадково» під час відбору цих мутацій, тобто шляхом спроб і помилок. Людина знаходить рішення одразу, вибудовуючи його логічно. Людина може навіть пояснити, чому обрано таке рішення. Генетичний алгоритм не має аргументів.

Відомо, що, чим вище тварина на еволюційних сходах, тим більш довільною може бути її поведінка. І найбільшу довільність виявляє саме в людини, оскільки людина має здатність брати до уваги не лише зовнішні обставини та свої вивчені навички, а й приховані обставини – особисті мотиви, повідомлені раніше відомості, підсумки дії у подібних обставинах. Це сильно збільшує варіативність поведінки людини, і, на мою думку, до цього причетна саме свідомість. Але про це трохи згодом.

Свідомість та довільність

До чого тут свідомість? У психології поведінки відомо, що звичні дії ми здійснюємо автоматично, машинально, тобто, без участі свідомості. Це примітний факт, що означає, що свідомість причетна до створення нової поведінки, пов'язана з орієнтовною поведінкою. Це також означає, що свідомість підключається саме тоді, коли треба змінити звичний патерн поведінки, наприклад, відреагувати нові запити з урахуванням нових можливостей. Також деякі вчені, наприклад, Докінз чи Метцингер, вказували, що свідомість якось пов'язані з наявністю в людей образу себе, що модель світу включає і модель самого суб'єкта. Як тоді повинна виглядати сама система, яка мала б таку довільність? Яка структура матиме, щоб вона могла побудувати нову поведінку для вирішення завдання відповідно до нових обставин.

Для цього нам треба спочатку згадати та уточнити деякі відомі факти. Всі тварини, які мають нервову систему, так чи інакше містять у ній модель середовища, інтегрованого з арсеналом своїх можливих дій у ній. Тобто це не тільки модель середовища, як пишуть деякі вчені, а модель можливої поведінки в тій чи іншій ситуації. І одночасно це модель передбачення змін у середовищі у відповідь на будь-які дії тварини. Це не завжди враховують когнітивні вчені, хоча на це прямо вказують відкриті дзеркальних нейронів премоторної кори, а також дослідження активації нейронів макак, у відповідь на сприйняття банана у яких активується не лише області банана в зоровій та скроневій корі, а й руки в соматосенсорній, тому що модель банана безпосередньо пов'язана з рукою, тому що мавпі цікавий тільки той фрукт, що вона може взяти його і з'їсти. Ми просто забуваємо, що нервова система виникла не для відображення світу тваринами. Вони не софісти, вони просто хочуть їсти, тому їхня модель – це переважно модель поведінки, а не відображення середовища.

Така модель вже має певну міру довільності, яка виявляється у варіативності поведінки у подібних обставин. Тобто тварини мають певний арсенал можливих дій, які вони можуть здійснити залежно від ситуації. Це можуть бути складніші тимчасові патерни (умовно-рефлекторні), ніж безпосередня реакція на події. Але все одно це не повністю довільна поведінка, що дозволяє нам дресирувати тварин, але не людину.

І тут є важлива обставина, яку нам треба врахувати – чим більш відомі обставини зустрілися, тим менш варіативна поведінка, оскільки мозок має рішення. І навпаки, що обставини новіші, то більше вписувалося варіантів можливого поведінки. І все питання у їхньому відборі та комбінації. Тварини це роблять, просто виявляючи весь арсенал своїх можливих дій, як показав у своїх експериментах ще Скінер.

Не можна сказати, що довільна поведінка є цілком новою, вона складається з раніше вивчених патернів поведінки. Це їхня перекомбінація, ініційована новими обставинами, що не повністю збігаються з тими обставинами, на які вже є готовий патерн. І в цьому якраз є точка поділу довільної та машинальної поведінки.

Моделювання довільності

Створення програми довільної поведінки, що вміє враховувати нові обставини, дозволило б зробити універсальну «програми всього» (за аналогією з «теорією всього») хоча б для певного домену завдань.

Щоб могла зробити їхню поведінку більш довільною, вільною? Проведені мною експерименти показали, що єдиним виходом є наявність другої моделі, яка моделює першу і може її змінювати, тобто діяти не з середовищем як перша, а з першою моделлю, щоб змінювати її.

Перша модель реагує обставини середовища. І якщо активований нею патерн виявився новим, викликається друга модель, яка навчена шукати рішення у першій моделі, розпізнаючи усі можливі варіанти поведінки у новій обстановці. Нагадаю, що у новій обстановці варіантів поведінки активується більше, тому питання саме у їхньому відборі чи комбінації. Це тому, що на відміну від знайомої обстановки, у відповідь нові обставини активується не один патерн поведінки, а відразу кілька.

Щоразу, коли мозок зустрічається з чимось новим, він здійснює не один, а два акти – розпізнавання ситуації у першій моделі та розпізнавання вже здійснених чи можливих дій другою моделлю. І ось у цій структурі проявляється багато можливостей, схожих на свідомість.

Ця двоактна структура дозволяє враховувати як зовнішні, а й внутрішні чинники – у другій моделі можуть запам'ятовуватися і розпізнавати підсумки попередньої дії, віддалені мотиви суб'єкта тощо.
Така система може будувати нову поведінку відразу, без довгого навчання, що ініціюється середовищем відповідно до еволюційної теорії. Наприклад, друга модель має можливість трансферу рішень з одних підмоделей першої моделі на інші її частини та багато інших можливостей метамоделі.
Відмінною властивістю свідомості є наявність знання про свою дію або автобіографічної пам'яті, як показано в статті (1). Запропонована двоактна структура має таку здатність – друга модель може зберігати дані про дії першої (жоден модель не може зберігати дані про власні дії, тому що для цього вона повинна містити несуперечливі моделі своїх дій, а не реакцій середовища).

Але як саме відбувається побудова нової поведінки у двоактній структурі свідомості? У нас у розпорядженні немає мозку та навіть його правдоподібної моделі. Ми стали експериментувати з дієслівними кадрами як прототипами моделей, які містяться у нашому мозку. Фрейм представляє собою набір варіантів актантів дієслова для опису ситуації, а комбінація фреймів може бути описи складного поведінки. Фрейми опису ситуацій – це кадри першої моделі, кадр опису своїх дій у ній – це кадр другої моделі з дієсловами особистих дій. У нас часто вони змішані, тому що навіть одна пропозиція – це суміш кількох актів розпізнавання та дії (мовного акту). А сама побудова довгих мовних виразів – найкращий приклад довільної поведінки.

Коли перша модель системи розпізнає новий патерн, який у неї відсутня запрограмована відповідь, вона викликає другу модель. Друга модель збирає активовані кадри першою і шукає більш короткий шлях у графі зв'язкових кадрів, який найкращим способом як би замкне патерни нової ситуації комбінацією кадрів. Це досить складна операція і ми ще не досягли цього результату, що претендує на звання «програми всього», але перші успіхи обнадіюють.

Експериментальні дослідження свідомості шляхом моделювання та порівняння програмних рішень з даними психології дає цікавий матеріал для подальших досліджень і дозволяє перевірити деякі гіпотези, що погано перевіряються в експериментах над людьми. Це можна назвати моделюючими експериментами. І це лише перший результат у цьому напрямі дослідження.

Бібліографія

1. Двохактна структура рефлексивної свідомості, А. Хом'яков, Academia.edu, 2019.

Джерело: habr.com

Чи можна запрограмувати довільність?

У чому відмінність людини та програми

Свідомість та довільність

Моделювання довільності

Додати коментар або відгук Скасувати відповідь