
Nekoliko riječi o procesima, ili o svima nama po malo .
Nastavak razmišljanja na temu inteligencije, prirodne i umjetne (AI), prvi dio
Backfill question: Da li osoba sada živi? Ne, kada hodamo ulicom i direktno kontempliramo svijet oko sebe, manje-više djelujemo u stvarnom vremenu... Iako će u stvari – sve dok ono što vidimo prolazi kroz uobičajene mehanizme prepoznavanja/klasifikacije – sve ovo biti nedavno, ali ipak prošlost. One. da li osoba živi u prošlosti?
Na primjer: hodate ulicom i vidite psa. Ili auto. U svakom slučaju, ako govorimo o trenutku, ova informacija je već zastarjela. Ako operišemo podacima koji su prošli kroz sve naše kognitivne mehanizme (a mozak je daleko od najbržeg kalkulatora!) jednostavno nećemo pratiti svijet! Pas će napasti ili, naprotiv, pobjeći, a vaša želja da ga potapšate iza uha ostat će neispunjena, a auto će vas udariti ili proći, iako ste upravo taj automobil htjeli "uhvatiti".
Ali, hvala Bogu, to se ne dešava tako, a evo zašto: mozak radi drugačije. Jedinica percepcije nije predmet, pa čak ni skup objekata, već procesi. Pas trči. Za vas ili od vas. Ili ne trči, već leži, na primjer. Automobil također miruje (na parkingu), ili se kreće u određenom smjeru. U svim slučajevima uočavate proces koji se proteže tokom vremena i, shodno tome, ima određeni razvoj u budućnosti. Kada kažem da događaje doživljavamo kao da se odvijaju u vremenu, to nije figura govora. Provedite eksperiment - napravite desetak fotografija (tj. snimaka stvarnosti) i opišite šta vidite. Evo nekoliko ljudi u prostoriji, svađaju se, ili neko ide ulicom, ili evo sjedi i gleda TV, a evo još jedne osobe koja čita knjigu. Sve su to procesi produženi u vremenu! Snimak doživljavate kao nešto što ima ekstenziju. Ne znate kako drugačije, jer mozak tako funkcionira: on je obučen da prepoznaje procese, a ne izolovane objekte na sceni. Baš kao ne oči-nos-usta, već lice u cjelini (zdravo, konvolucione neuronske mreže).
Svijet se sastoji od procesa, a ne od objekata. Ako te pitam šta je to jabuka, onda će većina odraslih reći da je to voće, i djeca - šta je to? hrana. Ali oba su opisi procesa, jer prvi znači da je ova jabuka raste na drvetu, i služi drvetu za reprodukciju, a drugo je da ono jestivo. Ni jedno ni drugo se ne vezuje za direktne karakteristike jabuke - oblik, boja, veličina... Jer karakteristike dozvoljavaju identifikaciju, ali ne dozvoljavaju upotrebu, odnosno razumevanje gde se koristi u spoljnom svetu, tj. definirati procese.
Ako uzmemo tipičnu raspravu o prirodi vremena, onda će klasični postulati biti o nepromjenjivosti prošlosti (izvan konteksta putovanja kroz vrijeme), važnosti sadašnjosti (postoji samo trenutak... 😉), i budućnost, koja još ne postoji, što znači da se može promeniti. Kada govorimo o objektivnoj stvarnosti, vrlo je moguće da je to tako. Međutim, čovjek živi u svom, subjektivnom modelu svijeta, a tamo je sve gotovo suprotno!
Prošlost nije ni približno nepromjenjiva koliko bismo željeli. Neprestano primajući nove informacije, osoba obnavlja prošlost kako bi eliminisala kontradikcije (mislili ste da je Pjotr Stepanych na simpozijumu, a izlazi iz striptiz kluba... To znači nigde, on, zabavljač, nije otišao i uopšte... ). U isto vrijeme, vaša subjektivna budućnost je konstanta u mnogim aspektima (šta god da je, u petak imam pivo i fudbal!). Štaviše, imajući određeni cilj u budućnosti, ne samo da gradite lanac procesa obrnutim redoslijedom (Da biste postali direktor velike kompanije, morate diplomirati na prestižnom univerzitetu, za to se prvo morate upisati, za to morate dobro položiti Jedinstveni državni ispit i proučiti svoj domaći!), ali je također vrlo vjerovatno da ćete u ovom procesu otići u prošlost (Zar nismo imali prijatelje/poznanike koji su se sada uzdigli i stekli veze i mogli bi pomoći djetetu sa fakultetom?) - zašto ne kontraemocija? 😉
Međutim, malo sam skrenuo pažnju. Ipak, glavna stvar na koju sam želio da se fokusiram je procesi. Duboko sam uvjeren da potencijalnu umjetnu inteligenciju ne treba trenirati na fotografijama ili čak video zapisima. Konvoluciona mreža ima dva nivoa (minimalno) – a zapravo su to dve različite mreže: jedna je obučena da pronađe određene grafičke obrasce u sirovoj slici, druga se bavi izlazom prve – tj. sa već obrađenim i pripremljenim informacijama. Za uspješnu interakciju sa svijetom AI potrebna je ista stvar: na nekom (nikako prvom) nivou mora postojati mreža koja kao ulaz prima mapu procesa koji se odvijaju tokom vremena. Koncepti “početka” i “kraja”, “kretanja”, “transformacije”, “spajanja” i “podjele” su ono s čime mreža mora naučiti raditi.
Prilično sam siguran da oni koji rade na igricama AI, kao što je Alpha Go, razumiju ovo na ovaj ili onaj način. Možda su pristupi tamo nešto drugačiji, ali suština je ista: trenutno se stanje na tabli (i u razvoju posljednjih nekoliko poteza) analizira za „ono što se događa općenito“. I u zavisnosti od toga koliko ono što se dešava odgovara onome što bi trebalo da se desi, mi biramo sopstvene poteze.
Vrlo je teško govoriti o strategiji/ponašanju kada je ulaz slika sa senzora. I obrnuto - pripremljeni vektor koji sadrži potpunu analizu trenutnog stanja terena u igricama s potpunim informacijama (razmotrite kompletnu sliku svijeta) je potpuno izvediv zadatak, kao što praksa pokazuje. Međutim, ako konvoluciona mreža prvih nivoa ima identifikovane objekte, a sledeći nivoi analiziraju ove objekte u dinamici, identifikujući procese (poznate iz obuke, na primer) dopunjuju podatke dobijene ranije, onda se čini da je moguće raditi s ovim. .
Pitanja za stručnjake:
Koliko je realno, uzimajući u obzir trenutna dešavanja u neuronskim mrežama, uraditi otprilike sljedeće:
Na ulazu, recimo kontinuirani video signal, eventualno stereo. Kao opcija: sa nekoliko stupnjeva slobode (mogućnost rotiranja kamere - proizvoljno ili prema obrascu). Međutim, ako je potrebno, video signal se može dopuniti/zamijeniti bilo kojim drugim metodama prostorne percepcije - od sonara do lidara.
Strogo govoreći…ulaz može biti bilo ko u stvarnom vremenu tok - čak i govor/tekst, čak i valutni citati, ali... U procesu koji se razmatra, lakše mi je da se oslonim na jedini uzorak uma koji mi je dostupan za direktno proučavanje - svoj! ) I u ovom "uzorku" senzorni kanal je van konkurencije!
na izlazu:
- Mapa dubine (ako je kamera statična) ili mapa okruženja. prostor (dinamička kamera/lidar, itd.);
Za štaNeophodno je ukoliko želimo da imamo pravi prostorni raspored objekata da procenimo njihovu interakciju. U ovom slučaju, slika sa kamere je samo dvodimenzionalna projekcija višedimenzionalnog prostora i potrebne su dodatne transformacije.
- Izolacija pojedinačnih objekata (uzimajući u obzir dubinu/prostornu kartu, a ne samo/ne toliko vidljive konture);
- Identifikacija pokretnih objekata (brzina/ubrzanje, konstrukcija/predviđanje putanje(?));
- Hijerarhijska klasifikacija objekata prema bilo kojim izdvojenim karakteristikama (oblik/dimenzije/boja/nijanse kretanja/komponentni dijelovi(?)). One. u suštini izdvajanje metrike za .
o hijerarhijiMožda riječ “hijerarhijski” nije sasvim prikladna u ovom slučaju. Želio sam naglasiti mogućnost odabira metrike u bilo kojem trenutku, tako da između njih omogućilo nam je da dva različita skupa metrika razmotrimo kao jedan koncept. Kako "crveni auto" i "plavi autobus" treba generalizirati u koncept "vozila", na primjer.
Važno je da se: Ako je moguće, sistem nije prethodno obučen. One. neke osnovne stvari se mogu postaviti (na primjer, konvoluciona mreža prvog sloja, za isticanje kontura/geometrije), ali mora naučiti da bira objekte i kasnije ih sam prepozna.
- I, konačno, konstruisanje skeniranja (na osnovu tačaka 1,4, odnosno prostorne karte koja uzima u obzir metriku) u vremenu (za sada, u ovoj fazi očigledno direktno posmatranog perioda), kako bi se izvršila analiza prema tačkama 2. -4, sa da bi se identifikovali: procesi/događaji (koji su u suštini promjene u vremenskom koraku 3) i njihovu klasifikaciju klastera (korak 4).
Još jednom: iz slike sa senzora prvo izdvajamo opis svijeta u pripremljenijem obliku, označen prema izdvojenim karakteristikama i podijeljen ne na piksele, već na objekte. Zatim širimo svijet koji se sastoji od objekata na vrijeme i primljeno "slika svijeta" unosimo ga na ulaz sljedeće mreže, koja radi s njim na isti način na koji su prethodni slojevi radili sa senzornom slikom. Tamo gdje su bile istaknute konture objekata, sada će biti istaknute „konture“ tekućih procesa. Relativni položaj objekata u prostoru sličan je uzročno-posledičnoj vezi procesa u vremenu... Tako nešto.
Pretpostavlja se da bi sistem nakon toga trebao biti u stanju da prepozna procese po njihovim dijelovima (kao što je u stanju da prepozna slike koje imaju samo njihov fragment, ili kao ), i kao posljedicu, predviđa ih i naprijed i nazad u vremenu, proširujući model koraka 5 neograničeno u oba smjera. Takođe, pretpostavlja se, imajući ideju o konstitutivnim procesima, sistem može da identifikuje, iz više povezanih lokalnih procesa, veće, globalne procese i, kao posledicu, implicitne, skrivene procese koji su sastavni deo identifikovanih globalnih, ali se ne percipiraju direktno.
I posljednja stvar: imati fiksno stanje sistema u budućnosti (gdje su fiksni samo značajni elementi Hilbertove metrike, uz slobodnu interpretaciju preostalih, nebitnih vrijednosti) - je li mreža sposobna da "promišlja" odmoriti se?
Pa, to je. ako bi to bila slika u kojoj su data samo dva nepovezana fragmenta, da li bi mreža obučena na nekom uzorku mogla dovršiti "dosljednu" kompletnu sliku? Uzorak u ovom slučaju su slični vremenski intervali iz iskustva, fragmenti su trenutna i navedena stanja. Rezultat: konzistentna "priča" koja povezuje jedno i drugo...
Čini mi se da će to već biti prilično značajna osnova za dalje eksperimente:
- uključivanje vlastitih radnji u „istoriju“, ako je moguće/potrebno
- prioritet “prirodnih” uzročno-posljedičnih obrazaca nad nekontroliranim stohastičkim emisijama (problem ruleta)
- neka verzija radoznalosti, tj. aktivno spoznavanje obrazaca kroz akciju... itd
PS U potpunosti priznajem da sam upravo izmislio točak, a upućeni ljudi već duže vrijeme primjenjuju ove principe u praksi. 😉 U ovom slučaju, molim vas da “zabodete nos” u relevantna dešavanja. I bilo bi apsolutno divno ako postoji detaljan opis fundamentalnih problema ovog pristupa ili opravdanje zašto on u principu ne funkcioniše.
PPS Svjestan sam da je tekst surov i da ideja skače s jedne na drugu, ali sam zaista želio postaviti par ljudi ova pitanja (odjeljak „pitanje stručnjacima“), a ovo je teško bez na barem neka prezentacija. (i sad sam ga ponovo čitao i shvatio da je veoma teško razumjeti) poslužio je svojoj svrsi: primio sam nekoliko diskusija koje su mi bile vrijedne... Nadam se da će uspjeti i ovaj put! 😉
izvor: www.habr.com
