Genesis?). Apmąstymai apie proto prigimtį. II dalis

Genesis?). Apmąstymai apie proto prigimtį. II dalis

Žodis apie procesus arba apie mus visus priešpriešiniai vėjai.

Minčių natūralaus ir dirbtinio intelekto (AI) tema, pirma dalis, tęsinys čia


Klausimas užpildyti: Ar žmogus dabar gyvena? Ne, kai einame gatve ir tiesiogiai mąstome apie mus supantį pasaulį, daugiau ar mažiau veikiame Realtime... Nors iš tikrųjų – kol tai, ką matome, praeis per įprastus atpažinimo/klasifikavimo mechanizmus – visa tai bus neseniai, bet vis tiek praeitis. Tie. ar žmogus gyvena praeitimi?

Pavyzdžiui: eini gatve ir pamatai šunį. Arba mašina. Bet kokiu atveju, jei kalbame apie momentą, ši informacija jau yra pasenusi. Jei dirbsime su duomenimis, kurie praėjo visus mūsų pažinimo mechanizmus (o smegenys toli gražu nėra greičiausias skaičiuotuvas!), mes tiesiog neatsiliksime nuo pasaulio! Šuo užpuls arba, priešingai, pabėgs, o tavo noras paglostyti už ausies liks neišsipildęs, o mašina tave partrenks arba pravažiuos, nors būtent šią mašiną norėjai „pagauti“.

Bet ačiū Dievui, kad taip nenutinka, ir štai kodėl: smegenys veikia kitaip. Suvokimo vienetas yra ne objektas ar net daiktų rinkinys, o procesai. Šuo bėga. Jums arba iš jūsų. Arba jis nebėga, o guli, pavyzdžiui. Automobilis taip pat stovi (parkavimo aikštelėje), arba juda tam tikra kryptimi. Visais atvejais jūs suvokiate procesą, kuris tęsiasi laikui bėgant ir atitinkamai vystosi ateityje. Kai sakau, kad įvykius suvokiame kaip laike besiskleidžiančius, tai nėra kalbos figūra. Atlikite eksperimentą – nufotografuokite keliolika nuotraukų (t. y. realybės momentinių nuotraukų) ir aprašykite tai, ką matote. Čia yra keli žmonės kambaryje, jie ginčijasi, arba čia žmogus eina gatve, arba čia sėdi ir žiūri televizorių, o štai kitas žmogus skaito knygą. Tai visi procesai, pratęsti laiku! Jūs suvokiate momentinę nuotrauką kaip kažką, kas turi plėtinį. Nežinai, kaip tai padaryti kitaip, nes taip veikia smegenys: jos išmokytos atpažinti procesus, o ne pavienius objektus scenoje. Kaip ir ne akys-nosis-burna, o visas veidas (labas, konvoliuciniai neuroniniai tinklai).

Pasaulis susideda iš procesų, o ne iš objektų. Jei paklausiu, kas tai yra яблоко, tada dauguma suaugusiųjų pasakys, kad taip yra vaisių, o vaikai – kas tai? maistas. Bet abu yra proceso aprašymai, nes pirmasis reiškia, kad šis obuolys auga ant medžio, ir tarnauja medžiui reprodukcijai, o antrasis – tai valgomas. Nei viena, nei kita nesiejama su tiesioginėmis obuolio savybėmis – forma, spalva, dydžiu... Nes charakteristikos leidžia identifikuoti, bet neleidžia naudoti, ar suprasti, kur jis naudojamas išoriniame pasaulyje, t.y. apibrėžti procesus.

Jei imsime tipišką diskusiją apie laiko prigimtį, tai klasikiniai postulatai bus apie praeities nekintamumą (už kelionių laiku konteksto), dabarties svarbą (yra tik akimirka... 😉), ir ateitis, kurios dar nėra, vadinasi, ją galima pakeisti. Kai kalbame apie objektyvią tikrovę, gali būti, kad taip yra. Tačiau žmogus gyvena savo, subjektyviame pasaulio modelyje, o ten viskas beveik priešingai!

Praeitis nėra tokia nekintanti, kaip norėtume. Nuolat gaudamas naujos informacijos, žmogus atkuria praeitį, kad pašalintų prieštaravimus (jūs manėte, kad Piotras Stepanychas buvo simpoziume, o jis išeina iš striptizo klubo... Tai reiškia, kad niekur, jis, pramogautojas, nėjo ir išvis... ). Tuo pačiu metu jūsų subjektyvi ateitis daugeliu aspektų yra pastovi (kad ir kaip būtų, penktadienį aš geriu alų ir futbolą!). Be to, turėdami konkretų tikslą ateityje, jūs ne tik kuriate procesų grandinę atvirkštine tvarka (Norėdami tapti didelės įmonės direktoriumi, turite baigti prestižinį universitetą su diplomu, tam pirmiausia turite įstoti į jį, tam turite gerai išlaikyti vieningą valstybinį egzaminą ir išstudijuoti namų darbus!), bet taip pat gana tikėtina, kad šiame procese nueisi į praeitį (Ar mes neturėjome draugų/pažįstamų, kurie dabar pakilo ir užmezgė ryšius ir galėtų padėti vaikui mokytis universitete?) – kodėl gi ne kontremocija? 😉

Tačiau aš šiek tiek nukrypstu. Vis dėlto pagrindinis dalykas, į kurį norėjau sutelkti dėmesį, yra procesus. Esu giliai įsitikinęs, kad potencialus AI neturėtų būti mokomas nuotraukomis ar net vaizdo įrašais. Konvoliucinis tinklas turi du lygius (minimalus) – ir iš tikrųjų tai yra du skirtingi tinklai: vienas yra išmokytas rasti tam tikrus grafinius raštus neapdorotame vaizde, antrasis susijęs su pirmojo išvestimi – t.y. su jau apdorota ir paruošta informacija. Norint sėkmingai bendrauti su AI pasauliu, reikia to paties: tam tikrame (jokiu būdu ne pirmame) lygyje turi būti tinklas, kuris kaip įvestį gauna laikui bėgant išsiskleidusių procesų žemėlapį. Tinklas turi išmokti dirbti su sąvokomis „pradžia“ ir „pabaiga“, „judėjimas“, „transformacija“, „susijungimas“ ir „skilimas“.

Esu tikras, kad tie, kurie dirba su žaidimų AI, pavyzdžiui, Alpha Go, vienaip ar kitaip tai supranta. Galbūt požiūriai ten kiek skiriasi, bet esmė ta pati: esama padėtis lentoje (ir kelių paskutinių judesių raidoje) analizuojama, „kas vyksta apskritai“. Ir priklausomai nuo to, kiek tai, kas vyksta, atitinka tai, kas turėtų įvykti, pasirenkame savo judesius.

Labai sunku kalbėti apie strategiją/elgesį, kai įvestis yra vaizdas iš jutiklių. Ir atvirkščiai - paruoštas vektorius, kuriame yra pilnas dabartinės lauko būklės suskirstymas žaidimuose su visa informacija (apsvarstykite išsamų pasaulio vaizdą), kaip rodo praktika, yra visiškai įmanoma užduotis. Tačiau jei pirmųjų lygių konvoliucinis tinklas identifikavo objektus, o kiti lygiai analizuoja šiuos objektus dinamikoje, identifikuodami procesus (pavyzdžiui, pažįstamus iš mokymo), kurie papildo anksčiau gautus duomenis, tada atrodo, kad su tuo dirbti įmanoma. ..

Klausimai ekspertams:

Kiek realu, atsižvelgiant į dabartinius neuroninių tinklų pokyčius, atlikti apytiksliai šiuos veiksmus:

Prie įėjimo, tarkime, nuolatinis vaizdo signalas, galbūt stereofoninis. Kaip pasirinktis: su keliais laisvės laipsniais (galimybė pasukti fotoaparatą - savavališkai arba pagal modelį). Tačiau prireikus vaizdo signalą galima papildyti/pakeisti bet kokiais kitais erdvinio suvokimo būdais – nuo ​​sonaro iki lidaro.

Griežtai kalbant…įvestis gali būti bet kokia Realtime srautas - net kalba/tekstas, net valiutų kabutės, bet... Nagrinėjamame procese man lengviau pasikliauti vieninteliu tiesioginiam tyrimui prieinamu proto pavyzdžiu - savo! ) Ir šiame „pavyzdyje“ jutimo kanalas nekonkuruoja!
Prie išėjimo:

  1. Gylio žemėlapis (jei fotoaparatas yra statinis) arba aplinkos žemėlapis. erdvė (dinaminė kamera/lidaras ir kt.);

    Kodėl?Jei norime turėti realų erdvinį objektų išdėstymą, būtina įvertinti jų sąveiką. Šiuo atveju vaizdas iš fotoaparato yra tik dvimatė aukštesnės erdvės projekcija, todėl reikia papildomų transformacijų.

  2. Atskirų objektų izoliavimas (atsižvelgiant į gylio/erdvės žemėlapį, o ne tik/ne tiek matomus kontūrus);
  3. Judančių objektų identifikavimas (greitis/įsibėgėjimas, konstrukcija/trajektorijos numatymas(?));
  4. Hierarchinė objektų klasifikacija pagal bet kokias išgaunamas charakteristikas (forma/matmenys/spalva/judesio niuansai/Komponentinės dalys(?)). Tie. iš esmės išgaunant metriką Hilberto erdvės.

    apie hierarchijąGalbūt žodis „hierarchinis“ šiuo atveju nėra visiškai tinkamas. Norėjau pabrėžti galimybę bet kada pasirinkti metrikas, kad Hemingos atstumas tarp jų du skirtingus metrikų rinkinius galėjome laikyti viena sąvoka. Kaip, pavyzdžiui, „raudonas automobilis“ ir „mėlynas autobusas“ turėtų būti apibendrinti į „transporto priemonės“ sąvoką.

Svarbu: Jei įmanoma, sistema nėra iš anksto apmokyta. Tie. kai kurie pagrindiniai dalykai gali būti išdėstyti (pavyzdžiui, pirmojo sluoksnio konvoliucinis tinklas, skirtas kontūrams/geometrijai išryškinti), bet jis turi išmokti atsirinkti objektus ir vėliau juos atpažinti pats.

  • Ir, galiausiai, laike (šiuo metu, šiuo akivaizdžiai tiesiogiai stebimo laikotarpio etapu) sudaryti nuskaitymą (pagal 1,4 punktus, t. y. erdvinį žemėlapį, atsižvelgiant į metriką), kad būtų galima atlikti analizę pagal 2 punktus. -4, siekiant nustatyti: procesus / įvykius (kurie iš esmės yra pakeitimus 3 laiko žingsnyje) ir jų klasterių klasifikaciją (4 veiksmas).

Dar kartą: iš vaizdo iš jutiklių pirmiausia išgauname pasaulio aprašymą labiau paruošta forma, sužymėtą pagal išgautus požymius ir suskirstytą ne į pikselius, o į objektus. Tada plečiame pasaulį, susidedantį iš objektų laiku ir gavo "pasaulio paveikslas" mes tiekiame jį į kito tinklo įvestį, kuris veikia su juo taip pat, kaip ankstesni sluoksniai dirbo su jutiminiu vaizdu. Ten, kur buvo išryškinti objektų kontūrai, dabar bus išryškinti vykstančių procesų „kontūrai“. Santykinė objektų padėtis erdvėje panaši į procesų priežasties-pasekmės ryšį laike... Kažkas panašaus.

Tikėtina, kad po to sistema turėtų atpažinti procesus pagal jų dalis (kaip gali atpažinti vaizdus, ​​turėdama tik jų fragmentą arba kaip teksto tęsinio rašymas pagal modelį), ir dėl to numatyti juos tiek pirmyn, tiek atgal, neribotai išplėsdami 5 žingsnio modelį į abi puses. Taip pat, ko gero, turėdama idėją apie sudedamuosius procesus, sistema iš kelių susijusių lokalinių procesų gali atpažinti didesnius, globalius procesus ir dėl to numanomus, paslėptus procesus, kurie yra neatsiejama identifikuotų globalių procesų dalis, bet nėra tiesiogiai suvokiami.

Ir paskutinis dalykas: turintis fiksuotą sistemos būseną ateityje (kur fiksuoti tik reikšmingi Hilberto metrikos elementai, laisvai interpretuojant likusias, neesmines reikšmes) – ar tinklas gali „apgalvoti“ poilsis?

Na, tai yra. Jei tai būtų vaizdas, kuriame pateikti tik du nesusiję fragmentai, ar tinklas, parengtas pagal tam tikrą pavyzdį, galėtų sudaryti „nuoseklų“ pilną vaizdą? Pavyzdys šiuo atveju yra panašūs laiko intervalai iš patirties, fragmentai yra dabartinė ir nurodytos būsenos. Rezultatas: nuosekli „istorija“, jungianti vieną ir kitą...

Man atrodo, kad tai jau bus gana reikšmingas pagrindas tolesniems eksperimentams:

  • savo veiksmų įtraukimas į „istoriją“, jei įmanoma/reikia
  • „natūralių“ priežasties ir pasekmės modelių prioritetas prieš nekontroliuojamą stochastinę emisiją (ruletės problema)
  • kažkokia smalsumo versija, t.y. aktyvus modelių pažinimas per veiksmą... ir t.t

PS Pilnai prisipažįstu, kad aš ką tik išradau ratą, o išmanantys žmonės jau seniai taiko šiuos principus praktikoje. 😉 Tokiu atveju prašau „kišti nosį“ į atitinkamus pokyčius. Ir būtų tikrai nuostabu, jei būtų detaliai aprašytos pagrindinės šio požiūrio problemos arba būtų pagrįsti, kodėl jis iš esmės neveikia.

PPS Žinau, kad tekstas yra grubus, o mintys šokinėja nuo vienos prie kitos, bet labai norėjau užduoti keletą žmonių šiuos klausimus (skiltis „Klausimas ekspertams“), ir be to sunku apsieiti bent jau koks nors pristatymas. Buvęs tekstas (o aš dabar perskaičiau, ir supratau, kad labai sunku suprasti) jis atliko savo tikslą: sulaukiau kelių man vertingų diskusijų... Tikiuosi, kad ir šį kartą pavyks! 😉

Šaltinis: www.habr.com

Добавить комментарий