Genesis?). Úvahy o povaze mysli. Část II

Genesis?). Úvahy o povaze mysli. Část II

Pár slov o procesech nebo trochu o nás všech protivětry.

Pokračování úvah na téma inteligence, přirozené i umělé (AI), část první zde


Otázka o zasypávání: Bydlí ta osoba nyní? Ne, když jdeme po ulici a přímo kontemplujeme svět kolem nás, jednáme víceméně v reálném čase... I když ve skutečnosti - pokud to, co vidíme, projde obvyklými mechanismy rozpoznávání / klasifikace - to vše bude nedávné, ale stále minulost. Tito. žije člověk v minulosti?

Například: jdete po ulici a vidíte psa. Nebo auto. V každém případě, pokud mluvíme o okamžiku, tyto informace jsou již zastaralé. Pokud budeme operovat s daty, která prošla všemi našimi kognitivními mechanismy (a mozek zdaleka není nejrychlejší kalkulačka!), prostě neudržíme krok se světem! Pes zaútočí nebo naopak uteče a vaše touha poplácat ho za uchem zůstane nenaplněna a auto vás srazí nebo projede, ačkoli jste to chtěli „chytit“.

Ale díky bohu se to tak neděje a tady je důvod: mozek funguje jinak. Jednotkou vnímání není objekt, nebo dokonce soubor objektů, ale procesy. Pes běží. Tobě nebo od tebe. Nebo neběží, ale například leží. Auto také stojí (na parkovišti) nebo se pohybuje určitým směrem. Ve všech případech vnímáte proces, který se prodlužuje v čase a podle toho má určitý vývoj do budoucna. Když říkám, že události vnímáme jako odvíjející se v čase, není to řečnická figura. Proveďte experiment – ​​pořiďte tucet fotografií (tj. momentek reality) a popište, co vidíte. Tady je několik lidí v místnosti, hádají se, nebo tady jde člověk po ulici, nebo tady sedí a dívá se na televizi a tady další člověk čte knihu. To vše jsou procesy prodloužené v čase! Snímek vnímáte jako něco, co má příponu. Nevíte, jak to udělat jinak, protože tak funguje mozek: je trénovaný, aby rozpoznával procesy, a ne izolované objekty na jevišti. Stejně jako ne oči-nos-ústa, ale obličej jako celek (ahoj, konvoluční neuronové sítě).

Svět se skládá z procesů, ne z objektů. Když se tě zeptám, co to je jablko, pak většina dospělých řekne, že tohle je ovoce, a děti - co to je? jídlo. Ale oba jsou popisy procesů, protože první znamená, že toto jablko roste na stromě, a slouží stromu k rozmnožování, a druhá je, že to jedlý. Ani jedno, ani druhé není spojeno s přímou charakteristikou jablka - tvar, barva, velikost... Protože vlastnosti umožňují identifikaci, ale neumožňují použití, ani pochopení, kde se ve vnějším světě používá, tzn. definovat procesy.

Vezmeme-li typickou debatu o povaze času, pak klasické postuláty budou o neměnnosti minulosti (mimo kontext cestování časem), důležitosti přítomnosti (existuje jen okamžik... 😉), a budoucnost, která ještě neexistuje, což znamená, že ji lze změnit. Když mluvíme o objektivní realitě, může se docela dobře stát, že tomu tak je. Člověk však žije ve svém, subjektivním modelu světa a tam je vše skoro naopak!

Minulost není zdaleka tak neměnná, jak bychom si přáli. Člověk neustále přijímá nové informace a přestavuje minulost, aby odstranil rozpory (Mysleli jste si, že Pyotr Stepanych byl na sympoziu a vyšel ze striptýzového klubu... To znamená nikam, on, bavič, nechodil a vůbec... ). Vaše subjektivní budoucnost je zároveň v mnoha ohledech konstantní (ať je to jak chce, v pátek mám pivo a fotbal!). Navíc, když máte v budoucnu konkrétní cíl, nejen že vytvoříte řetězec procesů v opačném pořadí (Chcete-li se stát ředitelem velké společnosti, musíte vystudovat prestižní univerzitu s diplomem, k tomu se musíte nejprve zapsat, k tomu musíte dobře složit jednotnou státní zkoušku a nastudovat si domácí úkoly!), ale je také docela pravděpodobné, že v tomto procesu půjdete do minulosti (Neměli jsme přátele/známé, kteří nyní vstali a získali spojení a mohli by pomoci dítěti s univerzitou?) - proč ne proti-emoce? 😉

To jsem však trochu odbočil. Přesto je hlavní věc, na kterou jsem se chtěl zaměřit procesy. Jsem hluboce přesvědčen, že potenciální AI by se neměla trénovat na fotkách nebo dokonce videích. Konvoluční síť má dvě úrovně (minimum) - a ve skutečnosti se jedná o dvě různé sítě: jedna je trénovaná k nalezení určitých grafických vzorů v surovém obrázku, druhá se zabývá výstupem té první - tzn. s již zpracovanými a připravenými informacemi. Pro úspěšnou interakci se světem umělé inteligence je zapotřebí totéž: na nějaké (v žádném případě ne první) úrovni musí existovat síť, která jako vstup přijímá mapu procesů rozvíjených v průběhu času. Pojmy „začátek“ a „konec“, „pohyb“, „transformace“, „sloučení“ a „rozdělení“ jsou tím, s čím se musí síť naučit pracovat.

Jsem si docela jistý, že ti, kteří pracují na herní umělé inteligenci, jako je Alpha Go, tomu tak či onak rozumí. Možná jsou přístupy poněkud odlišné, ale podstata je stejná: současná situace na šachovnici (a ve vývoji posledních několika tahů) je analyzována z hlediska „co se obecně děje“. A podle toho, do jaké míry to, co se děje, odpovídá tomu, co by se mělo stát, vybíráme vlastní pohyby.

Je velmi obtížné mluvit o strategii/chování, když je vstupem obrázek ze senzorů. A naopak - připravený vektor obsahující kompletní rozpis aktuálního stavu hřiště ve hrách s kompletními informacemi (uvažovat úplný obraz světa) je zcela proveditelný úkol, jak ukazuje praxe. Pokud však konvoluční síť prvních úrovní identifikovala objekty a další úrovně tyto objekty dynamicky analyzují a identifikují procesy (známé například z tréninku), které doplňují dříve získaná data, pak se s tím zdá možné pracovat. ..

Otázky pro odborníky:

Jak reálné je vzhledem k současnému vývoji neuronových sítí udělat přibližně toto:

U vchodu, řekněme nepřetržitý video signál, případně stereo. Volitelně: s několika stupni volnosti (možnost otáčet kamerou - libovolně nebo podle vzoru). V případě potřeby však lze videosignál doplnit/nahradit jakýmikoli jinými metodami prostorového vnímání – od sonaru po lidar.

Přesně řečeno…vstup může být jakýkoli v reálném čase tok - dokonce i řeč/text, dokonce i kotace měn, ale... V uvažovaném procesu je pro mě snazší spolehnout se na jediný vzorek mysli, který mám k dispozici pro přímé studium – svou vlastní! ) A v tomto „vzorku“ je smyslový kanál mimo konkurenci!
Na výstupu:

  1. Mapa hloubky (pokud je kamera statická) nebo mapa prostředí. prostor (dynamická kamera/lidar atd.);

    Za coPro posouzení jejich vzájemného působení je nutné, pokud chceme mít reálné prostorové uspořádání objektů. V tomto případě je obraz z kamery pouze dvourozměrnou projekcí vícerozměrného prostoru a jsou potřeba další transformace.

  2. Izolace jednotlivých objektů (s přihlédnutím k mapě hloubky/prostoru a nejen/ne tolik viditelných vrstevnic);
  3. Identifikace pohybujících se objektů (rychlost/zrychlení, konstrukce/předpověď trajektorie(?));
  4. Hierarchická klasifikace objektů podle jakýchkoli extrahovaných charakteristik (tvar/rozměry/barva/nuance pohybu/díly součástí(?)). Tito. v podstatě extrahování metrik pro Hilbertovy prostory.

    o hierarchiiMožná, že slovo „hierarchický“ není v tomto případě zcela vhodné. Chtěl jsem zdůraznit možnost kdykoli vybrat metriky Hemingova vzdálenost mezi nimi nám umožnilo zvážit dvě různé sady metrik jako jeden koncept. Jak by se například „červené auto“ a „modrý autobus“ měly zobecnit do pojmu „vozidlo“.

Je důležité, aby se: Pokud je to možné, systém není předtrénován. Tito. některé základní věci lze položit (například konvoluční síť první vrstvy, pro zvýraznění kontur/geometrie), ale musí se naučit vybírat objekty a později je rozpoznávat samo.

  • A nakonec sestavení rozmítání (na základě bodů 1,4, tedy prostorové mapy zohledňující metriky) v čase (prozatím v této fázi zdánlivě přímo sledovaného období), za účelem provedení analýzy podle bodů 2. -4, s za účelem identifikace: procesů/událostí (které jsou v podstatě Změny v časovém kroku 3) a jejich klasifikaci shluků (krok 4).

Ještě jednou: z obrazu ze senzorů nejprve vytáhneme popis světa v připravenější podobě, označený podle extrahovaných znaků a rozdělený nikoli na pixely, ale na objekty. Pak rozšiřujeme svět skládající se z objektů včas a obdrželi "obraz světa" přivedeme ho na vstup další sítě, která s ním pracuje stejně, jako předchozí vrstvy pracovaly se smyslovým obrazem. Tam, kde byly zvýrazněny obrysy objektů, budou nyní zvýrazněny „kontury“ probíhajících procesů. Relativní poloha objektů v prostoru je podobná vztahu příčiny a následku procesů v čase... Něco takového.

Pravděpodobně by poté měl být systém schopen rozpoznat procesy podle jejich částí (jako je schopen rozpoznat obrazy, které mají pouze jejich fragment, resp. psaní pokračování textu podle předlohy), a v důsledku toho je předvídat dopředu i dozadu v čase, čímž se model kroku 5 neomezeně rozšiřuje v obou směrech. Také pravděpodobně, s představou o procesech, z nichž se skládá, může systém identifikovat z několika souvisejících lokálních procesů větší, globální procesy a v důsledku toho implicitní, skryté procesy, které jsou nedílnou součástí identifikovaných globálních. ale nejsou přímo vnímány.

A poslední věc: mít pevný stav systému v budoucnu (kde jsou pevné pouze významné prvky Hilbertových metrik s volnou interpretací zbývajících, nepodstatných hodnot) - je síť schopna „vymyslet“ odpočinek?

No, to je. pokud by to byl obrázek, ve kterém byly uvedeny pouze dva nesouvisející fragmenty, mohla by síť natrénovaná na nějakém vzorku vytvořit „konzistentní“ úplný obrázek? Vzorkem jsou v tomto případě podobné časové intervaly ze zkušenosti, fragmenty jsou aktuální a specifikované stavy. Výsledek: konzistentní „příběh“ spojující jedno a druhé...

Zdá se mi, že to již bude docela významný základ pro další experimenty:

  • zařazení vlastního jednání do „historie“, pokud je to možné/nutné
  • priorita „přirozených“ vzorců příčin a následků před nekontrolovanými stochastickými emisemi (problém s ruletou)
  • nějaká verze kuriozity, tzn. aktivní poznávání vzorů prostřednictvím jednání...atd

PS Plně přiznávám, že jsem právě vynalezl kolo a znalí lidé tyto principy aplikují v praxi již dlouhou dobu. 😉 V tomto případě vás žádám, abyste „strčili nos“ do příslušného vývoje. A bylo by naprosto úžasné, kdyby existoval podrobný popis zásadních problémů tohoto přístupu nebo zdůvodnění, proč v principu nefunguje.

PPS Jsem si vědom toho, že text je hrubý a myšlenka přeskakuje z jednoho na druhý, ale opravdu jsem chtěl položit tyto otázky několika lidem (sekce „otázka pro odborníky“), bez toho je těžké se obejít alespoň nějaká prezentace. Minulý text (a teď jsem si to znovu četl a uvědomil jsem si, že je to velmi obtížné pochopit) splnilo to svůj účel: dostalo se mi několika diskuzí, které pro mě byly cenné... Doufám, že to bude fungovat i tentokrát! 😉

Zdroj: www.habr.com

Přidat komentář