Zanafilla?). Reflektime mbi natyrën e mendjes. Pjesa II

Zanafilla?). Reflektime mbi natyrën e mendjes. Pjesa II

Një fjalë për proceset, ose të gjithë ne pak kundër erërave.

Vazhdimi i mendimeve mbi temën e inteligjencës, natyrore dhe artificiale (AI), Pjesa e Parë këtu


Pyetje e ndërlikuar: A jeton personi tani? Jo, kur ecim në rrugë dhe soditim drejtpërdrejt botën përreth nesh, ne veprojmë pak a shumë realtime... Edhe pse në fakt - përderisa ajo që shohim kalon përmes mekanizmave të zakonshëm të njohjes / klasifikimit - e gjithë kjo do të jetë e fundit, por gjithsesi e kaluara. Ato. a jeton një person në të kaluarën?

Për shembull: po ecni në rrugë dhe shihni një qen. Ose një makinë. Në çdo rast, nëse po flasim për momentin, ky informacion është tashmë i vjetëruar. Nëse operojmë me të dhëna që kanë kaluar nëpër të gjithë mekanizmat tanë njohës (dhe truri është larg nga llogaritësi më i shpejtë!) ne thjesht nuk do të mbajmë hapin me botën! Qeni do të sulmojë ose, përkundrazi, do të ikë, dhe dëshira juaj për ta përkëdhelur pas veshit do të mbetet e paplotësuar, dhe makina do t'ju godasë ose do të kalojë pranë, megjithëse ishte kjo makinë që dëshironit të "kapje".

Por falë Zotit nuk ndodh kështu, dhe ja pse: truri funksionon ndryshe. Njësia e perceptimit nuk është një objekt, apo edhe një grup objektesh, por procese. Qeni po vrapon. Për ju ose nga ju. Ose ai nuk vrapon, por shtrihet, për shembull. Makina është gjithashtu e palëvizshme (në një parking), ose lëviz në një drejtim të caktuar. Në të gjitha rastet, ju perceptoni një proces që shtrihet me kalimin e kohës dhe, në përputhje me rrethanat, ka një zhvillim të caktuar në të ardhmen. Kur them se ne i perceptojmë ngjarjet si të shpalosura në kohë, kjo nuk është një figurë fjalësh. Kryeni një eksperiment - bëni një duzinë fotografish (d.m.th., fotografi të realitetit) dhe përshkruani atë që shihni. Këtu janë disa njerëz në një dhomë, ata po grinden, ose këtu është një person që ecën në rrugë, ose këtu është ulur duke parë TV, dhe këtu është një person tjetër duke lexuar një libër. Të gjitha këto janë procese të zgjatura në kohë! Ju e perceptoni fotografinë si diçka që ka një shtrirje. Ju nuk dini si ta bëni atë ndryshe, sepse kështu funksionon truri: ai është i trajnuar të njohë proceset dhe jo objektet e izoluara në skenë. Ashtu si jo sy-hundë-gojë, por fytyra në tërësi (përshëndetje, rrjete nervore konvolucionale).

Bota përbëhet nga procese, jo objekte. Nëse ju pyes se çfarë është pemë mollë, atëherë shumica e të rriturve do të thonë se kjo është fruta, dhe fëmijët - çfarë është ajo? ushqim. Por të dyja janë përshkrime të procesit, sepse e para do të thotë se kjo mollë rritet në një pemë, dhe i shërben pemës për riprodhim, dhe e dyta është se ajo i ngrënshëm. As njëra dhe as tjetra nuk lidhet me karakteristikat e drejtpërdrejta të një molle - forma, ngjyra, madhësia... Sepse karakteristikat lejojnë identifikimin, por nuk lejojnë përdorimin, apo kuptimin se ku përdoret në botën e jashtme, d.m.th. përcaktojnë proceset.

Nëse marrim një debat tipik për natyrën e kohës, atëherë postulatet klasike do të jenë për pandryshueshmërinë e së shkuarës (jashtë kontekstit të udhëtimit në kohë), rëndësinë e së tashmes (ka vetëm një moment... 😉), dhe e ardhmja, e cila ende nuk ekziston, që do të thotë se mund të ndryshohet. Kur flasim për realitetin objektiv, fare mirë mund të jetë se është kështu. Sidoqoftë, një person jeton në modelin e tij, subjektiv të botës, dhe atje gjithçka është pothuajse e kundërta!

E kaluara nuk është aq e pandryshueshme sa do të donim. Duke marrë vazhdimisht informacione të reja, një person rindërton të kaluarën në mënyrë që të eliminojë kontradiktat (menduat se Pyotr Stepanych ishte në simpozium, dhe ai po del nga një klub striptizi... Kjo do të thotë askund, ai, argëtuesi, nuk shkoi dhe fare... ). Në të njëjtën kohë, e ardhmja juaj subjektive është konstante në shumë aspekte (sido që të jetë, të premten pi birrë dhe futboll!). Për më tepër, duke pasur një qëllim specifik në të ardhmen, ju jo vetëm që ndërtoni një zinxhir procesesh në rend të kundërt (Për t'u bërë drejtor i një kompanie të madhe, duhet të diplomoheni në një universitet prestigjioz me një diplomë, për këtë duhet së pari të regjistroheni në të, për këtë ju duhet të kaloni mirë Provimin e Unifikuar të Shtetit dhe të studioni detyrat e shtëpisë tuaj!), por ka gjithashtu shumë të ngjarë që në këtë proces të shkoni në të kaluarën (A nuk kishim miq/të njohur që tani janë ngritur dhe kanë fituar lidhje dhe mund të ndihmonin një fëmijë me universitetin?) - pse jo kundër emocioneve? 😉

Megjithatë, unë largohem pak. Megjithatë, gjëja kryesore në të cilën doja të përqendrohesha është proceset. Jam thellësisht i bindur se AI potencial nuk duhet të trajnohet për foto apo edhe video. Një rrjet konvolucional ka dy nivele (minimumi) - dhe në fakt këto janë dy rrjete të ndryshme: njëri është i trajnuar për të gjetur modele të caktuara grafike në një imazh të papërpunuar, i dyti merret me daljen e të parit - d.m.th. me informacione të përpunuara dhe të përgatitura tashmë. Për të ndërvepruar me sukses me botën e AI, nevojitet e njëjta gjë: në një nivel (në asnjë mënyrë të parë) duhet të ketë një rrjet që merr si hyrje një hartë të proceseve të shpalosura me kalimin e kohës. Konceptet e "fillimit" dhe "fundit", "lëvizjes", "transformimit", "bashkimit" dhe "ndarjes" janë ato me të cilat rrjeti duhet të mësojë të punojë.

Jam shumë i sigurt se ata që punojnë në lojën AI, si Alpha Go, e kuptojnë këtë në një mënyrë ose në një tjetër. Ndoshta qasjet atje janë disi të ndryshme, por thelbi është i njëjtë: situata aktuale në tabelë (dhe në zhvillimin e lëvizjeve të fundit) analizohet për "çfarë po ndodh në përgjithësi". Dhe në varësi të asaj se sa korrespondon ajo që ndodh me atë që duhet të ndodhë, ne zgjedhim lëvizjet tona.

Është shumë e vështirë të flasësh për strategji/sjellje kur hyrja është një foto nga sensorët. Dhe anasjelltas - një vektor i përgatitur që përmban një ndarje të plotë të gjendjes aktuale të fushës në lojëra me informacion të plotë (konsideroni një pamje të plotë të botës) është një detyrë plotësisht e realizueshme, siç tregon praktika. Sidoqoftë, nëse rrjeti konvolucional i niveleve të para ka identifikuar objekte, dhe nivelet e ardhshme i analizojnë këto objekte në dinamikë, duke identifikuar procese (të njohura nga trajnimi, për shembull) që plotësojnë të dhënat e marra më herët, atëherë duket e mundur të punohet me këtë. ..

Pyetje për ekspertët:

Sa realiste është, duke pasur parasysh zhvillimet aktuale në rrjetet nervore, të bëjmë afërsisht sa vijon:

Në hyrje, le të themi një sinjal video të vazhdueshme, ndoshta stereo. Si opsion: me disa shkallë lirie (aftësia për të rrotulluar kamerën - në mënyrë arbitrare, ose sipas një modeli). Sidoqoftë, nëse është e nevojshme, sinjali video mund të plotësohet/zëvendësohet me çdo metodë tjetër të perceptimit hapësinor - nga sonar në lidar.

Me thënë të drejtën…hyrja mund të jetë çdo gjë realtime rrjedhë - edhe fjalim/tekst, edhe kuotat e monedhës, por... Në procesin në shqyrtim, e kam më të lehtë të mbështetem në të vetmen mostër të mendjes që kam në dispozicion për studim të drejtpërdrejtë - timin! ) Dhe në këtë "kampion" kanali ndijor është përtej konkurrencës!
Në dalje:

  1. Harta e thellësisë (nëse kamera është statike) ose harta e mjedisit. hapësirë ​​(kamerë dinamike/lidar, etj.);

    Per cfareËshtë e nevojshme nëse duam të kemi një rregullim real hapësinor të objekteve për të vlerësuar ndërveprimin e tyre. Në këtë rast, imazhi nga kamera është vetëm një projeksion dy-dimensional i një hapësire me dimensione më të larta dhe nevojiten transformime shtesë.

  2. Izolimi i objekteve individuale (duke marrë parasysh hartën e thellësisë/hapësirës, ​​dhe jo vetëm/jo aq shumë konturet e dukshme);
  3. Identifikimi i objekteve në lëvizje (shpejtësia/nxitimi, ndërtimi/parashikimi i trajektores(?));
  4. Klasifikimi hierarkik i objekteve sipas çdo karakteristike të nxjerrë (forma/dimensionet/ngjyra/nuancat e lëvizjes/Pjesët përbërëse(?)). ato. në thelb nxjerrjen e metrikës për hapësirat e Hilbertit.

    në lidhje me hierarkinëNdoshta fjala "hierarkike" nuk është plotësisht e përshtatshme në këtë rast. Doja të theksoja aftësinë për të zgjedhur metrikë në çdo kohë në mënyrë që Distanca e Hemingës mes tyre na lejoi të konsideronim dy grupe të ndryshme metrike si një koncept. Si duhet të përgjithësohen "makina e kuqe" dhe "autobusi blu" në konceptin "automjet", për shembull.

Rëndësishme: Nëse është e mundur, sistemi nuk është i trajnuar paraprakisht. Ato. mund të vendosen disa gjëra themelore (për shembull, një rrjet konvolucional i shtresës së parë, për të theksuar konturet/gjeometrinë), por ai duhet të mësojë të zgjedhë objektet dhe më vonë t'i njohë ato vetë.

  • Dhe, së fundi, ndërtimi i një spastrimi (bazuar në pikat 1,4, d.m.th. një hartë hapësinore duke marrë parasysh metrikat) në kohë (për momentin, në këtë fazë të periudhës në dukje të vëzhguar drejtpërdrejt), për të kryer një analizë sipas pikave 2. -4, me për të identifikuar: procese/ngjarje (të cilat janë në thelb ndryshimet në hapin kohor 3) dhe klasifikimin e tyre në grup (hapi 4).

Edhe një herë: nga imazhi nga sensorët, së pari nxjerrim një përshkrim të botës në një formë më të përgatitur, të shënuar sipas veçorive të nxjerra dhe të ndarë jo në piksel, por në objekte. Pastaj ne zgjerojmë botën e përbërë nga objekte në kohë dhe mori "foto e botës" ne e ushqejmë atë në hyrjen e rrjetit të ardhshëm, i cili punon me të në të njëjtën mënyrë që shtresat e mëparshme kanë punuar me imazhin ndijor. Aty ku u theksuan konturet e objekteve, tani do të theksohen "konturet" e proceseve në vazhdim. Pozicioni relativ i objekteve në hapësirë ​​është i ngjashëm me raportin shkak-pasojë të proceseve në kohë... Diçka e tillë.

Me sa duket, pas kësaj, sistemi duhet të jetë në gjendje të njohë proceset nga pjesët e tyre (siç është në gjendje të njohë imazhet, duke pasur vetëm fragmentin e tyre, ose si shkrimi i një vazhdimësie të tekstit sipas modelit), dhe si pasojë, parashikoni ato si përpara ashtu edhe prapa në kohë, duke e zgjeruar modelin e hapit 5 në mënyrë të pakufizuar në të dy drejtimet. Gjithashtu, me sa duket, duke pasur një ide mbi proceset përbërëse, sistemi mund të identifikojë, nga disa procese lokale të lidhura, procese më të mëdha, globale dhe, si pasojë, procese të fshehta, të fshehta, që janë pjesë përbërëse e atyre globale të identifikuara, por nuk perceptohen drejtpërdrejt.

Dhe gjëja e fundit: të kesh një gjendje fikse të sistemit në të ardhmen (ku fiksohen vetëm elementë të rëndësishëm të metrikës Hilbert, me një interpretim të lirë të vlerave të mbetura, jo thelbësore) - është rrjeti i aftë të "mendojë" pushoni?

Epo, kjo është. nëse do të ishte një imazh në të cilin jepeshin vetëm dy fragmente të palidhura, a mundet një rrjet i trajnuar në një mostër të plotësojë një imazh të plotë "të qëndrueshëm"? Mostra në këtë rast është intervale kohore të ngjashme nga përvoja, fragmentet janë gjendjet aktuale dhe të specifikuara. Rezultati: një "histori" e qëndrueshme që lidh njërën dhe tjetrën...

Më duket se kjo tashmë do të jetë një bazë mjaft e rëndësishme për eksperimente të mëtejshme:

  • përfshirja e veprimeve të veta në "histori", nëse është e mundur/e nevojshme
  • përparësia e modeleve "natyrore" shkak-pasojë mbi emetimet e pakontrolluara stokastike (problemi i ruletës)
  • ndonjë version i kuriozitetit, d.m.th. njohja aktive e modeleve nëpërmjet veprimit... etj

PS E pranoj plotësisht që sapo kam shpikur timonin dhe njerëzit e ditur i kanë zbatuar këto parime në praktikë për një kohë të gjatë. 😉 Në këtë rast, ju kërkoj të “fusni hundën” në zhvillimet përkatëse. Dhe do të ishte absolutisht e mrekullueshme nëse do të kishte një përshkrim të hollësishëm të problemeve themelore të kësaj qasjeje ose një justifikim se pse ajo nuk funksionon në parim.

PPS Jam i vetëdijshëm që teksti është i papërpunuar dhe ideja kalon nga njëri në tjetrin, por me të vërtetë doja t'u bëja disa njerëzve këto pyetje (seksioni "pyetja për ekspertët"), dhe kjo është e vështirë të bëhet pa në të paktën një prezantim. Teksti i kaluar (dhe po e rilexova tani, dhe kuptova se ishte shumë e vështirë për t'u kuptuar) i shërbeu qëllimit të saj: mora disa diskutime që ishin të vlefshme për mua... Shpresoj të funksionojë edhe këtë herë! 😉

Burimi: www.habr.com

Shto një koment