Кніга (быцця?). Разважанні аб прыродзе розуму. частка II

Кніга (быцця?). Разважанні аб прыродзе розуму. частка II

Слова аб працэсах, ці ўсе мы крыху кантраматы.

Працягі разважанняў на тэму розуму як натуральнага, так і штучнага (ІІ), Першая частка тут


Пытанне на засыпанне: ці жыве чалавек у зараз? Не, калі мы ідзем па вуліцы і непасрэдна сузіраем навакольны свет мы дзейнічаем больш ці менш цяперашні час… Хоць насамрэч – пакуль тое, што мы бачым, пройдзе звычайныя механізмы распазнання/класіфікацыі – усё гэта будзе нядаўнім, але ўсё ж мінулым. Г.зн. чалавек жыве ў мінулым?

На прыкладзе: вы ідзяце па вуліцы, бачыце сабаку. Або машыну. У любым выпадку, калі мы гаворым пра момант — гэтая інфармацыя ўжо састарэлая. Калі мы будзем апераваць дадзенымі, якія прайшлі ўсе нашы кагнітыўныя механізмы (а мозг – далёка не самы хуткадзейны вылічальнік!) мы проста не будзем паспяваць за мірам! Сабака нападзе ці наадварот - уцячэ, і ваша жаданне пакалашмаціць яе за вухам застанецца нерэалізаваным, а машына саб'е вас, ці праедзе міма, хоць менавіта гэтую машыну вы і жадалі злавіць .

Але так дзякуй богу не адбываецца, і вось чаму: мозг працуе інакш. Адзінкай успрымання з'яўляецца не аб'ект, і нават не сукупнасць аб'ектаў, а працэсы. Сабака бяжыць. Да вас ці ад вас. Ці не бяжыць, а ляжыць, напрыклад. Машына гэтак жа нерухомая (на паркоўцы), ці рухаецца ў вызначаным кірунку. Ва ўсіх выпадках вы ўспрымаеце працэс, які мае працягласць у часе і, адпаведна, вызначанае развіццё ў будучыні. Калі я кажу, што мы ўспрымаем падзеі разгорнутымі ў часе – гэта не фігура гаворкі. Правядзіце эксперымент - вазьміце дзясятак фатаграфій (г.зн. маментальных злепкаў рэальнасці) і апішыце, што бачыце. Вось некалькі людзей у пакоі, яны сварацца, ці вось чалавек ідзе па вуліцы, ці вось сядзіць - глядзіць тэлевізар, а той - чытае кнігу. Гэта ўсё працяглыя ў часе працэсы! Вы ўспрымаеце маментальны злепак, як нешта мелае працягласць. Вы не ўмееце па-іншаму, таму, што мозг так і працуе: ён натрэніраваны апазнаваць працэсы, а не разрозненыя аб'екты на сцэне. Гэтак жа, як не вочы-нос-рот, а твар у комплексе (прывітанне, згортачныя нейронавыя сеткі).

Свет складаецца з працэсаў, а не з аб'ектаў. Калі спытаць у вас, што такое яблык, то дарослыя людзі ў большасці скажуць, што гэта плён/фрукт, а дзеці - што гэта ежа. Але і тое, і другое - працэснае апісанне, таму, што першае азначае, што той яблык расце на дрэве, і служыць дрэву для размнажэння, а другое - што яно ядома. Ні тое, ні іншае не звязана з непасрэднымі прыкметамі яблыка - формай, колерам, памерам ... Таму, што прыкметы дазваляюць ідэнтыфікаваць, але не дазваляюць выкарыстоўваць, або зразумець дзе яно выкарыстоўваецца ў навакольным свеце, г.зн. вызначыць менавіта працэсы.

Калі ўзяць тыповы дыспут аб прыродзе часу, то класічнымі будуць пастулаты аб нязменнасці мінулага (па-за кантэкстам падарожжаў у часе), важнасці сучаснасці (ёсць толькі імгненне… ), і будучыні, якое пакуль не існуе, а значыць яго можна змяніць. Калі мы гаворым пра аб'ектыўную рэальнасць — вельмі нават можа быць, што так яно і ёсць. Аднак чалавек жыве ў сваёй, суб'ектыўнай мадэлі свету, а там усё амаль наадварот!

Мінулае далёка не так нязменнае, як хацелася б. Пастаянна атрымліваючы новую інфармацыю, чалавек перабудоўвае мінулае, каб выключыць супярэчнасці (вы думалі Пётр Сцяпанавіч на сімпозіуме, а ён прэч са стрып-клуба выходзіць… Гэта значыць нікуды, ён, забаўнік, не ездзіў і наогул… ). У той жа час ваша суб'ектыўнае будучыню ў многіх аспектах з'яўляецца канстантай (што б там ні было, а ў пятніцу ў мяне піва і футбол!). Мала таго - маючы пэўную мэту ў будучыні, вы не толькі выбудоўваеце ланцужок працэсаў у зваротным парадку.Каб стаць дырэктарам буйной кампаніі, трэба скончыць прэстыжную ВНУ з дыпломам, для гэтага ў яе трэба спачатку паступіць, для гэтага трэба добра здаць АДЭ, марш вучыць урокі!), але і цалкам верагодна - сыходзьце ў гэтым працэсе ў мінулае (ці не было ў нас сяброў/знаёмых, якія зараз падняліся і абраслі сувязямі і маглі б дапамагчы дзіцяці з ВНУ) - чым не кантрамоцыя? 😉

Зрэшты, я крыху адцягнуўся. Усё ж галоўнае, на чым я хацеў засяродзіць увагу - гэта працэсы. Я глыбока перакананы, што патэнцыйны ІІ трэба навучаць не на фота і нават не на відэа. Згортачная сетка мае два ўзроўня (мінімум) – і ў сутнасці гэта дзве розныя сеткі: адна навучаная знаходзіць у волкім малюнку нейкія графічныя патэрны, другая мае справу – з вынахадам першай – г.зн. з ужо апрацаванай і падрыхтаванай інфармацыяй. Для таго, каб паспяхова ўзаемадзейнічаць са светам ІІ трэба таксама самае: на нейкім (далёка не першым) узроўні павінна прысутнічаць сетка, якая атрымлівае на ўваход разгорнутую ў часе карту працэсаў. Канцэпцыі "пачатку" і "канца", "руху", "трансфармацыі", "зліцця" і "падзелу" - гэта тое, з чым павінна навучыцца працаваць сетка.

Я амаль упэўнены, што тыя, хто займаюцца ІІ гульняў, накшталт Альфа Го, гэта так ці інакш разумеюць. Магчыма падыходы там некалькі іншыя, але сутнасць тая ж: бягучая сітуацыя на дошцы (прычым у разгортцы на некалькі апошніх хадоў) - аналізуецца на прадмет таго "што наогул адбываецца". І ў залежнасці ад таго, наколькі тое, што адбываецца, адпавядае таму, што павінна адбывацца – падбіраюцца ўласныя хады.

Вельмі складана казаць аб стратэгіі / паводзінах, калі на ўваходзе карцінка з сэнсараў. І наадварот - падрыхтаваны вектар, які змяшчае поўны расклад па бягучым стане поля ў гульнях з поўнай інфармацыяй (лічы поўная карціна свету) - цалкам пасільная задача, як паказвае практыка. Аднак, калі згортачная сетка першых узроўняў ідэнтыфікавала аб'екты, а наступныя ўзроўні аналізуюць гэтыя аб'екты ў дынаміцы, ідэнтыфікуючы працэсы (знаёмыя па навучанні, напрыклад) дапаўняе дадзеныя, атрыманыя раней, то з гэтым ужо здаецца можна працаваць…

Пытанні знаўцам:

Наколькі рэальна, улічваючы бягучыя напрацоўкі па нейронавых сетках зрабіць прыкладна наступнае:

На ўваходзе, дапусцім, бесперапынны відэасігнал, магчыма стэрэа. Як варыянт: з некалькімі ступенямі свабоды (магчымасць паварочваць камеру - адвольна, ці па схеме). Зрэшты, пры неабходнасці відэасігнал можа быць дапоўнены/заменены любымі іншымі спосабамі прасторавага ўспрымання - ад сонара да лідара.

Строга кажучы…на ўваходзе можа быць любы цяперашні час паток - хоць гаворка / тэкст, хоць каціроўкі валют, але ... У разгляданым працэсе мне прасцей абапірацца на адзіны даступны мне для непасрэднага вывучэння ўзор розуму - мой уласны! ) А ў гэтым «ўзоры» сэнсарны канал - па-за канкурэнцыяй!
На выхадзе:

  1. Карта глыбінь (калі камера статычная) або карта ДКР. прасторы (дынамічная камера/лідар, etc.);

    Для чагоНеабходна, калі мы жадаем мець рэальнае прасторавае размяшчэнне аб'ектаў для адзнакі іх узаемадзеяння. У такім разе малюнак з камеры ёсць толькі двухмерная праекцыя прасторы большай памернасці, і патрэбныя дадатковыя пераўтварэнні.

  2. Вылучэнне асобных аб'ектаў (з улікам карты глыбінь/прасторы, а не толькі/не столькі бачных контураў);
  3. Вылучэнне аб'ектаў, якія рухаюцца (хуткасць/паскарэнне, пабудова/прадказанне траекторыі(?));
  4. Іерархічная класіфікацыя аб'ектаў па любых вымаемых прыкметах (формы/габарытаў/колеру/нюансаў руху/Складовых частак(?)). Г.зн. па сутнасці вымання метрык для Гілбертава прасторы.

    пра іерахіюмагчыма слова "Іерархічная" не зусім дарэчы ў дадзеным выпадку. Я хацеў падкрэсліць, магчымасць у любы момант падабраць метрыкі так, што б Адлегласць Хэмінга паміж імі дазволіла лічыць два розных набору метрык сутнасць адным паняццем. Як "чырвоная машына" і "Сіні аўтобус" павінны быць абагульнены ў паняцце "транспартны сродак", напрыклад.

Важна: па магчымасці сістэма не прадугледжаная. Г.зн. нейкія базавыя рэчы могуць быць закладзены (напрыклад - згортачная сетка першага пласта, для вылучэння контураў/геаметрыі), але вылучаць аб'екты і пазней распазнаваць іх павінна навучыцца сама.

  • Ну і, нарэшце, пабудова разгорткі (на аснове пп 1,4, г.зн. прасторавай карты з улікам метрык) у часе (пакуль, на гэтым этапе мабыць непасрэдна назіранага перыяду), з мэтай правесці аналіз па пунктах 2-4, з каб выявіць: працэсы/падзеі (якія з'яўляюцца па сутнасці сваёй зменамі у часе п.3) і іх кластарнай класіфікацыі (п.4).

Яшчэ раз: з карцінкі з сэнсараў мы спачатку здабываем апісанне свету ў больш падрыхтаваным выглядзе, размечаным па вымаемым прыкметах і падзеленым не на пікселі, а на аб'екты. Затым разгортваем свет, які складаецца з аб'ектаў у часе і атрыманую «карціну свету» падаем на ўваход наступнай сеткі, якая працуе з ёй так, як працавалі папярэднія пласты з сэнсарным малюначкам. Там, дзе вылучаліся контуры аб'ектаў, зараз будуць вылучацца «контуры» працэсаў, якія адбываюцца. Узаемаразмяшчэнне аб'ектаў у прасторы падобна прычынна следчай сувязі працэсаў у часе ... Неяк так.

Меркавана пасля гэтага сістэма павінна быць здольная апазнаваць працэсы па іх частцы (як здольная апазнаваць выявы, маючы толькі іх фрагмент, ці як напісанне працягу тэксту па ўзоры), і як следства - прадказваць тыя, як наперад, так і назад у часе, пашыраючы мадэль п.5 неабмежавана ў абодва бакі. Гэтак жа, як мяркуецца, маючы ўяўленне пра складовыя працэсы, сістэма можа выяўляць па некалькіх звязаных лакальных працэсах больш маштабныя, глабальныя і як следства - няяўныя, схаваныя працэсы, якія з'яўляюцца складовай часткай выяўленых глабальных, але не ўспрымаюцца непасрэдна.

Ну і апошняе: маючы ў будучыні фіксаваны стан сістэмы (дзе зафіксаваны толькі значныя элементы гілбертавых метрык, пры свабоднай трактоўцы астатніх, не істотных значэнняў) – ці здольная сетка "дадумаць" астатняе?

Ну г.зн. калі б гэта была выява, у якой зададзены толькі два нязвязаных фрагмента — ці можа сетка, навучаная на нейкай выбарцы дабудаваць «несупярэчлівую» поўную выяву? Выбарка ў дадзеным выпадку - аналагічныя часовыя інтэрвалы з вопыту, фрагменты - бягучы і зададзены стан. Вынік: несупярэчлівая «гісторыя», якая злучае адно і другое…

Мне здаецца, гэта ўжо будзе суцэль істотная база для наступных эксперыментаў:

  • уключэнне ў «гісторыю» ўласных дзеянняў, калі магчыма/неабходна
  • прыярытэт «заканамерных» прычынна-следчых патэрнаў над некантралюемымі стахастычным выкідамі (праблема рулеткі)
  • нейкі варыянт цікаўнасці, г.зн. актыўнае пазнанне заканамернасцей праз дзеянне… etc

PS Цалкам дапушчаю, што я толькі што вынайшаў ровар, і дасведчаныя людзі даўно ўжо ўжываюць гэтыя прынцыпы на практыку. 😉 У такім выпадку прашу мяне "ткнуць носам" у адпаведныя распрацоўкі. І ўжо зусім будзе выдатна, калі ёсць падрабязнае апісанне фундаментальных праблем такога падыходу ці абгрунтаванне, чаму ён у прынцыпе не працуе.

PPS Я разумею, што тэкст волкі, і думка пераскоквае з аднаго на іншае, але я вельмі жадаў задаць пары чалавек гэтыя пытанні (частка «пытанне знаўцам»), а гэта цяжка зрабіць без хоць нейкага выкладу. Мінулы тэкст (а я яго зараз перачытваў, і зразумеў што ён вельмі складаны для ўспрымання) сваю задачу выканаў: я атрымаў некалькі каштоўных для мяне дыскусій… Спадзяюся і ў гэты раз пракоціць! 😉

Крыніца: habr.com

Дадаць каментар