🥇Kniha (Genesis?). Úvahy o podstate rozumu. Časť II

Slovo o procesoch, alebo všetci sme tak trochu protivinutia.

Pokračujúce úvahy na tému inteligencie, prirodzenej aj umelej (AI), prvá časť tu

Záludná otázkaŽije človek v prítomnom okamihu? Nie, keď kráčame po ulici a priamo kontemplujeme svet okolo nás, konáme viac-menej v reálnom čase...Hoci v skutočnosti – kým to, čo vidíme, neprejde bežnými mechanizmami rozpoznávania/klasifikácie – toto všetko bude nedávne, ale stále minulosť. Takže, žije človek v minulosti?

Napríklad: idete po ulici a vidíte psa. Alebo auto. V každom prípade, ak hovoríme o danom okamihu, táto informácia je už zastaraná. Ak operujeme s údajmi, ktoré už boli spracované všetkými našimi kognitívnymi mechanizmami (a mozog nie je najrýchlejší počítač!), jednoducho nebudeme držať krok so svetom! Pes zaútočí alebo naopak utečie a vaša túžba potľapkať ho po uchu zostane nenaplnená a auto vás zrazí alebo predbehne, aj keď je to práve to auto, ktoré ste sa snažili „chytiť“.

Ale našťastie sa to nedeje a tu je dôvod: mozog funguje inak. Jednotkou vnímania nie je objekt, ani súbor objektov, ale procesy. Pes beží. K vám alebo od vás. Alebo nebeží, ale leží napríklad. Auto je to isté – stojí (na parkovisku) alebo sa pohybuje určitým smerom. Vo všetkých prípadoch vnímate proces, ktorý sa tiahne v čase a podľa toho má určitý vývoj v budúcnosti. Keď hovorím, že vnímame udalosti ako odvíjajúce sa v čase, nehovorím len tak. Urobte experiment – urobte tucet fotografií (t. j. momentiek reality) a opíšte, čo vidíte. Tu je niekoľko ľudí v miestnosti, ktorí sa hádajú, alebo tu je človek, ktorý kráča po ulici, alebo tu je niekto, kto sedí a pozerá televíziu, a ďalší číta knihu. To všetko sú procesy, ktoré sa tiahnu v čase! Momentku vnímate ako niečo s kontinuitou. Nemôžete inak, pretože tak funguje mozog: je vycvičený na rozpoznávanie procesov, nie izolovaných objektov na javisku. Rovnako ako nie oči-nos-ústa, ale tvár ako celok (ahoj, konvolučné neurónové siete).

Svet sa skladá z procesov, nie z objektov. Ak sa vás opýtam, čo je jablko, potom väčšina dospelých povie, že je to tak ovocie, a deti - čo je toto? jedloAle oba sú opisy procesov, pretože prvý znamená, že toto jablko rastie na stromea slúži stromu na rozmnožovanie a druhým je, že jedléAni jedno nesúvisí s bezprostrednými charakteristikami jablka – tvarom, farbou, veľkosťou... Pretože charakteristiky umožňujú identifikáciu, ale neumožňujú použitie alebo pochopenie jeho použitia v okolitom svete, t. j. určenie procesov, ktoré sú s tým spojené.

Ak si vezmeme typickú debatu o podstate času, klasickými postulátmi sú nemennosť minulosti (mimo kontextu cestovania v čase), dôležitosť prítomnosti (existuje len okamih... 😉 ) a budúcnosť, ktorá ešte neexistuje, a preto sa dá zmeniť. Keď hovoríme o objektívnej realite, môže to byť pravda. Ľudia však žijú vo svojom vlastnom, subjektívnom modeli sveta a tam je všetko takmer naopak!

Minulosť zďaleka nie je taká nemenná, ako by sme si priali. Ľudia neustále dostávajú nové informácie a prestavujú minulosť, aby odstránili rozpory.Mysleli ste si, že Piotr Stepanych je na sympóziu, ale tam je, odchádza zo striptízového klubu... To znamená, že nikam nejde, ten vtipkár, nikam nešiel a aj tak... ). Zároveň je vaša subjektívna budúcnosť v mnohých ohľadoch konštantná (Nech je to ako chce, v piatok si dám pivo a futbal!). Navyše, s konkrétnym cieľom v budúcnosti nielenže budujete reťazec procesov v opačnom poradí (Ak sa chcete stať riaditeľom veľkej spoločnosti, musíte absolvovať prestížnu univerzitu s diplomom. Najprv sa na ňu musíte zapísať a na to musíte dobre zložiť Jednotnú štátnu skúšku. Choďte si naštudovať domáce úlohy!), ale je tiež celkom možné, že sa týmto procesom vraciate do minulosti (Mali sme nejakých priateľov/známych, ktorí sú teraz povýšení, majú dobré kontakty a mohli by pomôcť nášmu dieťaťu so štúdiom na univerzite?) — ako by to nemohlo byť protinávrhom? 😉

Trochu som však odbočil. Hlavná vec, na ktorú som sa chcel zamerať, bola táto. procesySom hlboko presvedčený, že potenciálna umelá inteligencia by sa nemala trénovať pomocou fotografií alebo dokonca videí. Konvolučná sieť má najmenej dve vrstvy – v podstate dve rôzne siete: jedna je trénovaná na detekciu určitých grafických vzorov v surovom obraze, zatiaľ čo druhá sa zaoberá výstupom prvej – t. j. s už spracovanými a pripravenými informáciami. Pre úspešnú interakciu so svetom umelej inteligencie je potrebné to isté: na nejakej úrovni (ďaleko od prvej) musí existovať sieť, ktorá ako vstup prijíma časovo rozmiestnenú mapu procesov. Pojmy „začiatok“ a „koniec“, „pohyb“, „transformácia“, „zlúčenie“ a „oddelenie“ – to sú pojmy, s ktorými sa sieť musí naučiť pracovať.

Som si takmer istý, že tí, ktorí pracujú na umelej inteligencii pre hry ako Alpha Go, to tak či onak chápu. Ich prístupy sa môžu mierne líšiť, ale podstata je rovnaká: aktuálna situácia na hracej doske (konkrétne posledných pár ťahov) sa analyzuje, aby sa určilo, „čo sa vlastne deje“. A v závislosti od toho, ako blízko sa to, čo sa deje, zhoduje s tým, čo by sa malo stať, si hráč vyberá vlastné ťahy.

Je veľmi ťažké hovoriť o stratégii/správaní, keď je vstupom obraz zo senzora. Naopak, pripravený vektor obsahujúci kompletné rozloženie aktuálneho stavu hracej plochy v hrách s kompletnými informáciami (t. j. kompletným obrazom sveta) je, ako ukazuje prax, úplne uskutočniteľná úloha. Ak však konvolučná sieť prvých vrstiev identifikovala objekty a nasledujúce vrstvy tieto objekty dynamicky analyzujú, identifikujú procesy (napríklad známe z tréningu) a dopĺňajú predtým získané údaje, potom sa zdá byť uskutočniteľné s týmto pracovať...

Otázky pre expertov:

Aké realistické je vzhľadom na súčasný vývoj v neurónových sieťach urobiť niečo ako nasledovné:

Pri vchodePovedzme, že ide o nepretržitý video signál, možno stereo. Prípadne by mohol mať viacero stupňov voľnosti (schopnosť otáčať kameru ľubovoľne alebo podľa vzoru). V prípade potreby však možno video signál doplniť alebo nahradiť akýmikoľvek inými metódami priestorového vnímania, od sonaru po lidar.

Prísne vzaté…pri vchode môže byť čokoľvek v reálnom čase tok - či už je to reč/text alebo kurzy mien, ale... V uvažovanom procese je pre mňa jednoduchšie spoľahnúť sa na jedinú vzorku mysle, ktorú mám k dispozícii na priame štúdium - svoju vlastnú! ) A v tejto „vzorke“ je zmyslový kanál bezkonkurenčný!
Na východe:

Mapa hĺbky (ak je kamera statická) alebo mapa okolitého priestoru (dynamická kamera/lidar atď.);
Za čoToto je nevyhnutné, ak chceme mať realistické priestorové usporiadanie objektov na posúdenie ich interakcií. V tomto prípade je obraz z kamery iba dvojrozmernou projekciou viacrozmerného priestoru, čo si vyžaduje ďalšie transformácie.
Výber jednotlivých objektov (s prihliadnutím na mapu hĺbky/priestoru a nielen/nie až tak viditeľné kontúry);
Výber pohybujúcich sa objektov (rýchlosť/zrýchlenie, konštrukcia/predikcia trajektórie(?));
Hierarchická klasifikácia objektov podľa akýchkoľvek extrahovateľných znakov (tvar/rozmery/farba/nuansy/zložky pohybu(?)). To je v podstate extrakcia metrík pre Hilbertove priestory.
o hierarchiiMožno slovo „hierarchický“ v tomto prípade nie je úplne vhodné. Chcel som zdôrazniť možnosť kedykoľvek vybrať metriky, aby Hemingova vzdialenosť Rozdiel medzi nimi umožnil považovať dva rôzne súbory metrík v podstate za jeden koncept. Rovnako ako by sa napríklad „červené auto“ a „modrý autobus“ mali zovšeobecniť do konceptu „vozidlo“.

Dôležité: Ak je to možné, systém by nemal byť predtrénovaný. To znamená, že niektoré základné funkcie môžu byť zabudované (napríklad konvolučná sieť prvej vrstvy na extrakciu kontúr/geometrie), ale mal by sa naučiť extrahovať objekty a následne ich sám rozpoznávať.

No a nakoniec, zostavenie skenovania (na základe odsekov 1,4, t. j. priestorovej mapy zohľadňujúcej metriky) v čase (zatiaľ, v tejto fáze, zrejme priamo pozorovaného obdobia), aby sa vykonala analýza podľa bodov 2-4, aby sa identifikovali: procesy/udalosti (ktoré sú v podstate zmeny v čase (s. 3) a ich klasifikácia klastrov (s. 4).

Ešte raz: zo snímok zo senzorov najprv extrahujeme precíznejší popis sveta, označený podľa extrahovaných znakov a rozdelený na objekty, a nie na pixely. Potom rozvinieme svet pozostávajúci z týchto objektov. v čase a dostal „obraz sveta“ Privádzame ho na vstup ďalšej siete, ktorá ho spracováva rovnakým spôsobom, ako predchádzajúce vrstvy spracovávali zmyslový obraz. Tam, kde boli predtým identifikované kontúry objektov, budú teraz identifikované „kontúry“ prebiehajúcich procesov. Relatívne polohy objektov v priestore sú podobné vzťahu príčiny a následku procesov v čase... Niečo také.

Pravdepodobne by potom mal byť systém schopný rozpoznávať procesy podľa ich časti (tak ako dokáže rozpoznávať obrázky, ktoré majú iba ich fragment, alebo ako napísanie pokračovania textu podľa vzoru) a v dôsledku toho ich predpovedať dopredu aj dozadu v čase, čím sa model bodu 5 neobmedzene rozširuje v oboch smeroch. Tiež sa predpokladá, že vďaka pochopeniu zložených procesov dokáže systém identifikovať rozsiahlejšie globálne procesy na základe niekoľkých súvisiacich lokálnych procesov a v dôsledku toho aj implicitné, skryté procesy, ktoré sú neoddeliteľnou súčasťou identifikovaných globálnych procesov, ale nie sú priamo vnímané.

A nakoniec: pri danom fixnom stave systému v budúcnosti (kde sú fixné iba významné prvky Hilbertových metrík a zvyšok irelevantných hodnôt sa voľne interpretuje), je sieť schopná „prísť na to“ so zvyškom?

Takže, ak by išlo o obrázok s iba dvoma nesúvisiacimi fragmentmi, mohla by sieť trénovaná na vzorke vytvoriť „konzistentný“ kompletný obraz? Vzorka by v tomto prípade pozostávala z podobných časových intervalov z experimentu a fragmenty by predstavovali aktuálny a cieľový stav. Výsledok: konzistentná „história“ spájajúca tieto dva...

Zdá sa mi, že toto už bude veľmi významný základ pre ďalšie experimenty:

zahrnutie vlastných činov do „histórie“, ak je to možné/nevyhnutné
priorita „pravidelných“ vzorcov príčin a následkov pred nekontrolovanými stochastickými odľahlými hodnotami (problém rulety)
nejaký druh zvedavosti, t. j. aktívne poznávanie vzorcov prostredníctvom konania... atď.

P.S. Som celkom ochotný priznať, že som len znovu vynašiel koleso a že znalí ľudia tieto princípy už dlho používajú v praxi. 😉 V tom prípade ma prosím nasmerujte správnym smerom. A bolo by ešte úžasnejšie, keby ste mohli poskytnúť podrobný popis základných problémov tohto prístupu alebo zdôvodnenie, prečo to v prvom rade nefunguje.

PPS Uvedomujem si, že text je hrubý a myšlienky skáču z jednej veci na druhú, ale naozaj som chcel položiť tieto otázky niekoľkým ľuďom (sekcia „otázky pre odborníkov“) a to je ťažké urobiť bez aspoň nejakej prezentácie. Predchádzajúci text (Práve som si to znova prečítala a uvedomila som si, že je to veľmi ťažké pochopiť) Splnilo to svoj účel: Dostala som niekoľko cenných diskusií pre mňa... Dúfam, že to tentoraz tiež funguje! 😉

Zdroj: hab.com

Genesis?). Úvahy o povahe mysle. Časť II