Genesi?). Riflessioni sulla natura della mente. Seconda parte

Genesi?). Riflessioni sulla natura della mente. Seconda parte

Una parola sui processi, o un po’ su tutti noi controventi.

Continuazione delle riflessioni sul tema dell'intelligenza, sia naturale che artificiale (AI), prima parte qui


Domanda sul rinterro: La persona vive adesso? No, quando camminiamo per strada e contempliamo direttamente il mondo che ci circonda, agiamo più o meno in tempo reale... Anche se in effetti – purché ciò che vediamo passa attraverso i consueti meccanismi di riconoscimento/classificazione – tutto questo sarà recente, ma pur sempre passato. Quelli. una persona vive nel passato?

Ad esempio: stai camminando per strada e vedi un cane. O un'auto. In ogni caso, se parliamo del momento, queste informazioni sono già obsolete. Se operiamo con dati che hanno attraversato tutti i nostri meccanismi cognitivi (e il cervello è ben lungi dall’essere il calcolatore più veloce!) semplicemente non staremo al passo con il mondo! Il cane attaccherà o, al contrario, scapperà, e il tuo desiderio di dargli una pacca dietro l'orecchio rimarrà insoddisfatto, e l'auto ti colpirà o passerà, anche se era proprio questa macchina che volevi "catturare".

Ma grazie a Dio non succede così, ed ecco perché: il cervello funziona diversamente. L'unità di percezione non è un oggetto, e nemmeno un insieme di oggetti, ma i processi. Il cane sta correndo. A te o da te. Oppure non corre, ma si sdraia, per esempio. L'auto è anche ferma (in un parcheggio) o si muove in una determinata direzione. In tutti i casi si percepisce un processo che si prolunga nel tempo e, di conseguenza, ha un certo sviluppo nel futuro. Quando dico che percepiamo gli eventi come se si svolgessero nel tempo, non è un modo di dire. Conduci un esperimento: scatta una dozzina di fotografie (cioè istantanee della realtà) e descrivi ciò che vedi. Qui ci sono diverse persone in una stanza, che stanno litigando, oppure ecco una persona che cammina per strada, oppure qui è seduta a guardare la TV, ed ecco un'altra persona che legge un libro. Questi sono tutti processi prolungati nel tempo! Percepisci l'istantanea come qualcosa che ha un'estensione. Non sai fare altrimenti, perché è così che funziona il cervello: è addestrato a riconoscere i processi, e non gli oggetti isolati sulla scena. Proprio come non gli occhi-naso-bocca, ma il viso nel suo insieme (ciao, reti neurali convoluzionali).

Il mondo è costituito da processi, non da oggetti. Se ti chiedo di cosa si tratta mela, allora la maggior parte degli adulti dirà che lo è fruttae bambini: che cos'è? cibo. Ma entrambe sono descrizioni di processi, perché la prima significa che questa mela cresce su un albero, e serve all'albero per la riproduzione, e il secondo è quello commestibile. Né l'uno né l'altro sono associati alle caratteristiche dirette di una mela: forma, colore, dimensione... Perché le caratteristiche consentono l'identificazione, ma non consentono l'uso, né la comprensione di dove viene utilizzata nel mondo esterno, cioè definire i processi.

Se prendiamo un tipico dibattito sulla natura del tempo, i postulati classici riguarderanno l'immutabilità del passato (al di fuori del contesto del viaggio nel tempo), l'importanza del presente (esiste solo un momento... 😉), e il futuro, che ancora non esiste, il che significa che può essere cambiato. Quando parliamo di realtà oggettiva, può benissimo essere che sia così. Tuttavia, una persona vive nel suo modello soggettivo del mondo, e lì tutto è quasi il contrario!

Il passato non è così immutabile come vorremmo. Ricevendo costantemente nuove informazioni, una persona ricostruisce il passato per eliminare le contraddizioni (pensavi che Pyotr Stepanych fosse al simposio e uscisse da uno strip club... Ciò significa da nessuna parte, lui, l'intrattenitore, non è andato e per niente... ). Allo stesso tempo, il tuo futuro soggettivo è una costante sotto molti aspetti (qualunque cosa sia, venerdì ho birra e calcio!). Inoltre, avendo un obiettivo specifico in futuro, non solo costruisci una catena di processi in ordine inverso (Per diventare amministratore di una grande azienda bisogna diplomarsi in una prestigiosa università con un diploma, per questo devi prima iscriverti, per questo devi superare bene l'Esame di Stato Unificato e studiare i compiti!), ma è anche molto probabile che in questo processo andrai nel passato (Non avevamo amici/conoscenti che ora sono cresciuti e hanno acquisito conoscenze e potrebbero aiutare un bambino con l’università?) - perché non la contro-emozione? 😉

Tuttavia, sto divagando un po'. Tuttavia, la cosa principale su cui volevo concentrarmi è processi. Sono profondamente convinto che la potenziale intelligenza artificiale non dovrebbe essere addestrata su foto e nemmeno su video. Una rete convoluzionale ha due livelli (minimo) - e in effetti si tratta di due reti diverse: una è addestrata a trovare determinati schemi grafici in un'immagine grezza, la seconda si occupa dell'output della prima - cioè con informazioni già elaborate e preparate. Per interagire con successo con il mondo dell’AI occorre la stessa cosa: ad un certo livello (non certo al primo) deve esserci una rete che riceva in input una mappa di processi dispiegati nel tempo. I concetti di “inizio” e “fine”, “movimento”, “trasformazione”, “fusione” e “divisione” sono ciò con cui la rete deve imparare a lavorare.

Sono abbastanza sicuro che coloro che lavorano sull'intelligenza artificiale dei giochi, come Alpha Go, lo capiscano in un modo o nell'altro. Forse gli approcci sono un po’ diversi, ma l’essenza è la stessa: la situazione attuale sulla scacchiera (e nello sviluppo delle ultime mosse) viene analizzata per “ciò che sta accadendo in generale”. E a seconda di quanto ciò che accade corrisponde a ciò che dovrebbe accadere, selezioniamo le nostre mosse.

È molto difficile parlare di strategia/comportamento quando l’input è un’immagine proveniente dai sensori. E viceversa: un vettore preparato contenente una ripartizione completa dello stato attuale del campo nei giochi con informazioni complete (considera un quadro completo del mondo) è un compito completamente fattibile, come dimostra la pratica. Tuttavia, se la rete convoluzionale dei primi livelli ha identificato oggetti, e i livelli successivi analizzano questi oggetti in dinamica, identificando processi (familiari dall'addestramento, ad esempio) che completano i dati ottenuti in precedenza, allora sembra possibile lavorare con questo. ..

Domande per gli esperti:

Quanto è realistico, dati gli attuali sviluppi nelle reti neurali, fare approssimativamente quanto segue:

All'entrata, diciamo un segnale video continuo, possibilmente stereo. Come opzione: con diversi gradi di libertà (la possibilità di ruotare la telecamera - arbitrariamente o secondo uno schema). Tuttavia, se necessario, il segnale video può essere integrato/sostituito con qualsiasi altro metodo di percezione spaziale, dal sonar al lidar.

In senso stretto…l'input può essere qualsiasi cosa in tempo reale flusso - anche parlato/testo, anche citazioni di valuta, ma... Nel processo in esame, è più facile per me fare affidamento sull'unico campione della mente a mia disposizione per lo studio diretto: il mio! ) E in questo “campione” il canale sensoriale è fuori concorrenza!
All'uscita:

  1. Mappa di profondità (se la fotocamera è statica) o mappa ambientale. spazio (telecamera dinamica/lidar, ecc.);

    Per cosaÈ necessario, se vogliamo avere una reale disposizione spaziale degli oggetti, valutare la loro interazione. In questo caso, l'immagine della telecamera è solo una proiezione bidimensionale di uno spazio dimensionale superiore e sono necessarie ulteriori trasformazioni.

  2. Isolamento dei singoli oggetti (tenendo conto della mappa di profondità/spazio e non solo/non tanto dei contorni visibili);
  3. Identificazione di oggetti in movimento (velocità/accelerazione, costruzione/previsione della traiettoria(?));
  4. Classificazione gerarchica degli oggetti in base alle caratteristiche estratte (forma/dimensioni/colore/sfumature di movimento/Parti componenti(?)). Quelli. essenzialmente estraendo metriche per Spazi di Hilbert.

    riguardo alla gerarchiaForse la parola “gerarchico” non è del tutto appropriata in questo caso. Volevo sottolineare la possibilità di selezionare le metriche in qualsiasi momento in questo modo Distanza Heminga tra di loro ci ha permesso di considerare due diversi insiemi di parametri come un unico concetto. Come, ad esempio, "macchina rossa" e "autobus blu" dovrebbero essere generalizzati nel concetto di "veicolo".

Importante: Se possibile, il sistema non è pre-addestrato. Quelli. si possono stabilire alcune cose fondamentali (ad esempio una rete convoluzionale del primo strato, per evidenziare contorni/geometrie), ma deve imparare a selezionare gli oggetti e poi a riconoscerli da solo.

  • E, infine, costruire una scansione (basata sui punti 1,4, cioè una mappa spaziale che tenga conto delle metriche) nel tempo (per ora, in questa fase del periodo apparentemente direttamente osservato), al fine di effettuare un'analisi secondo i punti 2 -4, con al fine di identificare: processi/eventi (che sono essenzialmente i cambiamenti temporale fase 3) e la loro classificazione in cluster (fase 4).

Ancora una volta: dall'immagine proveniente dai sensori, estraiamo prima una descrizione del mondo in una forma più preparata, contrassegnata in base alle caratteristiche estratte e divisa non in pixel, ma in oggetti. Quindi espandiamo il mondo costituito da oggetti in tempo e ricevuto "immagine del mondo" lo alimentiamo all'input della rete successiva, che funziona con esso nello stesso modo in cui gli strati precedenti hanno lavorato con l'immagine sensoriale. Laddove prima erano evidenziati i contorni degli oggetti, ora verranno evidenziati i “contorni” dei processi in corso. La posizione relativa degli oggetti nello spazio è simile alla relazione di causa-effetto dei processi nel tempo... Qualcosa del genere.

Presumibilmente, dopo questo, il sistema dovrebbe essere in grado di riconoscere i processi dalle loro parti (così come è in grado di riconoscere le immagini, avendone solo il frammento, o come scrivere una continuazione del testo secondo il modello), e di conseguenza, prevederli sia in avanti che all'indietro nel tempo, espandendo il modello del passo 5 illimitatamente in entrambe le direzioni. Inoltre, presumibilmente, avendo un'idea dei processi costituenti, il sistema può identificare, da diversi processi locali correlati, processi globali più ampi e, di conseguenza, processi impliciti e nascosti che sono parte integrante di quelli globali identificati, ma non vengono percepiti direttamente.

E l’ultima cosa: avere uno stato fisso del sistema nel futuro (dove solo gli elementi significativi della metrica di Hilbert sono fissi, con una libera interpretazione dei restanti valori non essenziali) – la rete è in grado di “pensare” al riposo?

Bene, questo è. se si trattasse di un'immagine in cui fossero forniti solo due frammenti non correlati, una rete addestrata su un campione potrebbe completare un'immagine completa “coerente”? Il campione in questo caso è costituito da intervalli di tempo simili tratti dall'esperienza, i frammenti sono gli stati attuali e specificati. Il risultato: una “storia” coerente che collega l’uno e l’altro...

Mi sembra che questa sarà già una base abbastanza significativa per ulteriori esperimenti:

  • inclusione delle proprie azioni nella “storia”, se possibile/necessario
  • priorità dei modelli di causa-effetto “naturali” rispetto alle emissioni stocastiche incontrollate (problema della roulette)
  • qualche versione di curiosità, ad es. cognizione attiva di schemi attraverso l'azione... ecc

PS Ammetto pienamente che ho appena inventato la ruota e che persone esperte applicano questi principi nella pratica da molto tempo. 😉 In questo caso vi chiedo di “mettere il naso” negli sviluppi rilevanti. E sarebbe assolutamente meraviglioso se ci fosse una descrizione dettagliata dei problemi fondamentali di questo approccio o una giustificazione del motivo per cui in linea di principio non funziona.

PPS Mi rendo conto che il testo è rozzo e l'idea salta da una all'altra, ma volevo fare queste domande a un paio di persone (la sezione “domande agli esperti”), e di questa è difficile fare a meno almeno qualche presentazione. Testo passato (e lo stavo rileggendo adesso, e mi sono reso conto che era molto difficile da capire) è servito al suo scopo: ho ricevuto diverse discussioni che sono state preziose per me... spero che funzioni anche questa volta! 😉

Fonte: habr.com

Aggiungi un commento