Genesis?). Reflecties over de aard van de geest. Deel II

Genesis?). Reflecties over de aard van de geest. Deel II

Een woord over processen, of wij allemaal een beetje tegenwind.

Vervolg van gedachten over het onderwerp intelligentie, zowel natuurlijke als kunstmatige (AI), deel één hier


Vraag over opvullen: Woont de persoon nu? Nee, als we over straat lopen en direct naar de wereld om ons heen kijken, handelen we min of meer realtime... Hoewel in feite - zolang wat we zien de gebruikelijke mechanismen van herkenning / classificatie volgt - dit allemaal recent zal zijn, maar nog steeds tot het verleden. Die. Leeft een mens in het verleden?

Bijvoorbeeld: je loopt over straat en ziet een hond. Of een auto. Hoe dan ook, als we het over het moment hebben, is deze informatie al verouderd. Als we werken met data die al onze cognitieve mechanismen hebben doorlopen (en de hersenen zijn verre van de snelste rekenmachine!) zullen we de wereld simpelweg niet bijhouden! De hond zal aanvallen of, integendeel, wegrennen, en je verlangen om hem achter het oor te aaien zal onvervuld blijven, en de auto zal je raken of voorbijgaan, ook al was het deze auto die je wilde 'vangen'.

Maar godzijdank gebeurt het niet op die manier, en dit is de reden: de hersenen werken anders. De eenheid van perceptie is geen object, of zelfs een reeks objecten, maar processen. De hond rent. Van jou of van jou. Of hij rent niet, maar gaat bijvoorbeeld liggen. De auto staat ook stil (op een parkeerplaats) of beweegt in een bepaalde richting. In alle gevallen neem je een proces waar dat zich in de tijd uitstrekt en dus een bepaalde ontwikkeling in de toekomst kent. Als ik zeg dat we gebeurtenissen waarnemen alsof ze zich in de tijd ontvouwen, is dat geen stijlfiguur. Voer een experiment uit: maak een tiental foto's (d.w.z. momentopnamen van de werkelijkheid) en beschrijf wat je ziet. Hier zijn verschillende mensen in een kamer, ze maken ruzie, of hier loopt een persoon over straat, of hier zit tv te kijken, en hier is een andere persoon die een boek leest. Dit zijn allemaal processen die in de tijd zijn uitgebreid! Je neemt de momentopname waar als iets dat een extensie heeft. Je weet niet hoe je het anders moet doen, want zo werken de hersenen: ze zijn getraind om processen te herkennen, en niet om geïsoleerde objecten op het podium. Net zoals niet ogen-neus-mond, maar het gezicht als geheel (hallo, convolutionele neurale netwerken).

De wereld bestaat uit processen, niet uit objecten. Als ik je vraag wat het is appel, dan zullen de meeste volwassenen zeggen dat dit zo is fruit, en kinderen - wat is het? eten. Maar beide zijn procesbeschrijvingen, want de eerste betekent dat deze appel groeit aan een boom, en dient de boom voor reproductie, en de tweede is dat hij eetbaar. Noch het een, noch het ander wordt geassocieerd met de directe kenmerken van een appel - vorm, kleur, grootte... Omdat de kenmerken identificatie mogelijk maken, maar geen gebruik of begrip mogelijk maken waar het in de buitenwereld wordt gebruikt, d.w.z. de processen definiëren.

Als we een typisch debat nemen over de aard van de tijd, dan zullen de klassieke postulaten gaan over de onveranderlijkheid van het verleden (buiten de context van tijdreizen), het belang van het heden (er is maar een moment... 😉), en de toekomst, die nog niet bestaat, wat betekent dat deze kan worden veranderd. Als we het over de objectieve werkelijkheid hebben, kan het heel goed zo zijn dat dit zo is. Een persoon leeft echter in zijn eigen, subjectieve wereldmodel, en daar is alles bijna het tegenovergestelde!

Het verleden is lang niet zo onveranderlijk als we zouden willen. Door voortdurend nieuwe informatie te ontvangen, herbouwt een persoon het verleden om tegenstrijdigheden te elimineren (je dacht dat Pyotr Stepanych op het symposium was, en hij komt uit een stripclub... Dit betekent nergens, hij, de entertainer, is niet gegaan en helemaal niet... ). Tegelijkertijd is je subjectieve toekomst in veel opzichten een constante (wat het ook is, op vrijdag heb ik bier en voetbal!). Bovendien bouw je, met een specifiek doel in de toekomst, niet alleen een keten van processen in omgekeerde volgorde op (Om directeur van een groot bedrijf te worden, moet je met een diploma afstuderen aan een prestigieuze universiteit, hiervoor moet je je eerst inschrijven, hiervoor moet je het Unified State Exam goed behalen en je huiswerk bestuderen!), maar het is ook zeer waarschijnlijk dat je in dit proces naar het verleden gaat (Hadden we geen vrienden/kennissen die nu zijn opgestaan ​​en connecties hebben verworven en een kind konden helpen met studeren?) - waarom geen tegenemotie? 😉

Ik dwaal echter een beetje af. Toch is het belangrijkste waar ik me op wilde concentreren processen. Ik ben er diep van overtuigd dat potentiële AI niet getraind mag worden op foto’s of zelfs video’s. Een convolutioneel netwerk heeft (minimaal) twee niveaus - en in feite zijn dit twee verschillende netwerken: het ene is getraind om bepaalde grafische patronen in een onbewerkt beeld te vinden, het tweede houdt zich bezig met de uitvoer van het eerste - d.w.z. met reeds verwerkte en voorbereide informatie. Om succesvol te kunnen communiceren met de wereld van AI is hetzelfde nodig: op een bepaald (zeker niet het eerste) niveau moet er een netwerk zijn dat als input een kaart van processen ontvangt die zich in de loop van de tijd hebben ontwikkeld. De begrippen ‘begin’ en ‘einde’, ‘beweging’, ‘transformatie’, ‘samensmelten’ en ‘verdelen’ zijn waar het netwerk mee moet leren werken.

Ik ben er vrij zeker van dat degenen die aan game-AI werken, zoals Alpha Go, dit op de een of andere manier begrijpen. Misschien zijn de benaderingen daar enigszins anders, maar de essentie is hetzelfde: de huidige situatie op het bord (en in de ontwikkeling van de laatste paar zetten) wordt geanalyseerd op ‘wat er in het algemeen gebeurt’. En afhankelijk van hoeveel wat er gebeurt overeenkomt met wat er zou moeten gebeuren, selecteren we onze eigen zetten.

Het is heel moeilijk om over strategie/gedrag te praten als de input een beeld van sensoren is. En omgekeerd - een voorbereide vector met een volledige analyse van de huidige stand van het veld in games met volledige informatie (beschouw een compleet beeld van de wereld) is een volledig haalbare taak, zoals de praktijk laat zien. Als het convolutionele netwerk van de eerste niveaus echter objecten heeft geïdentificeerd, en de volgende niveaus deze objecten dynamisch analyseren, waarbij processen worden geïdentificeerd (bijvoorbeeld bekend uit training) die de eerder verkregen gegevens aanvullen, dan lijkt het mogelijk om hiermee te werken. ..

Vragen voor deskundigen:

Hoe realistisch is het, gegeven de huidige ontwikkelingen op het gebied van neurale netwerken, om ongeveer het volgende te doen:

Bij de ingang, laten we zeggen een continu videosignaal, mogelijk stereo. Als optie: met meerdere vrijheidsgraden (de mogelijkheid om de camera te draaien - willekeurig of volgens een patroon). Indien nodig kan het videosignaal echter worden aangevuld/vervangen door andere methoden voor ruimtelijke waarneming - van sonar tot lidar.

Strikt gesproken…de invoer kan iedereen zijn realtime stroom - zelfs spraak/tekst, zelfs valutakoersen, maar... In het proces dat ik beschouw, is het gemakkelijker voor mij om te vertrouwen op het enige voorbeeld van de geest dat voor directe studie voor mij beschikbaar is: het mijne! ) En in dit “voorbeeld” staat het sensorische kanaal buiten concurrentie!
Bij de uitgang:

  1. Dieptekaart (als de camera statisch is) of omgevingskaart. ruimte (dynamische camera/lidar, etc.);

    WaarvoorAls we een echte ruimtelijke ordening van objecten willen hebben, is het noodzakelijk om hun interactie te beoordelen. In dit geval is het beeld van de camera slechts een tweedimensionale projectie van een hoger-dimensionale ruimte en zijn aanvullende transformaties nodig.

  2. Isolatie van individuele objecten (rekening houdend met de diepte/ruimtekaart, en niet alleen/niet zozeer zichtbare contouren);
  3. Identificatie van bewegende objecten (snelheid/versnelling, constructie/voorspelling van traject(?));
  4. Hiërarchische classificatie van objecten volgens eventueel geëxtraheerde kenmerken (vorm/afmetingen/kleur/nuances van beweging/componentonderdelen(?)). Die. in wezen het extraheren van statistieken voor Hilbertruimten.

    over de hiërarchieMisschien is het woord ‘hiërarchisch’ in dit geval niet helemaal op zijn plaats. Ik wilde de mogelijkheid benadrukken om op elk gewenst moment statistieken te selecteren Heminga-afstand tussen hen lieten ons toe om twee verschillende sets metrieken als één concept te beschouwen. Hoe bijvoorbeeld ‘rode auto’ en ‘blauwe bus’ moeten worden gegeneraliseerd naar het concept ‘voertuig’.

Belangrijk: Indien mogelijk is het systeem niet voorgetraind. Die. Er kunnen enkele basiszaken worden vastgelegd (bijvoorbeeld een convolutioneel netwerk van de eerste laag, voor het benadrukken van contouren/geometrie), maar het moet leren objecten te selecteren en ze later zelfstandig te herkennen.

  • En ten slotte, het construeren van een scan (gebaseerd op punten 1,4, d.w.z. een ruimtelijke kaart die rekening houdt met metrieken) in de tijd (voor nu, in dit stadium van de ogenschijnlijk direct waargenomen periode), om een ​​analyse uit te voeren volgens punten 2 -4, met om te identificeren: processen/gebeurtenissen (die in wezen veranderingen in de tijd stap 3) en hun clusterclassificatie (stap 4).

Nogmaals: uit het beeld van de sensoren extraheren we eerst een beschrijving van de wereld in een meer voorbereide vorm, gemarkeerd volgens de geëxtraheerde kenmerken en niet verdeeld in pixels, maar in objecten. Vervolgens breiden we de wereld uit die uit objecten bestaat op tijd en ontvangen "beeld van de wereld" we voeren het door naar de ingang van het volgende netwerk, dat er op dezelfde manier mee werkt als de vorige lagen met het sensorische beeld werkten. Waar de contouren van objecten werden benadrukt, worden nu de ‘contouren’ van lopende processen benadrukt. De relatieve positie van objecten in de ruimte is vergelijkbaar met de oorzaak-gevolgrelatie van processen in de tijd... Zoiets.

Vermoedelijk zou het systeem hierna in staat moeten zijn processen te herkennen aan hun onderdelen (zoals het afbeeldingen kan herkennen die alleen hun fragment hebben, of zoals het schrijven van een vervolg op de tekst volgens het model), en als gevolg daarvan zowel voorwaarts als achterwaarts in de tijd voorspellen, waarbij het model van stap 5 onbeperkt in beide richtingen wordt uitgebreid. Vermoedelijk kan het systeem, omdat het een idee heeft van de samenstellende processen, uit verschillende gerelateerde lokale processen grotere, mondiale processen identificeren en, als gevolg daarvan, impliciete, verborgen processen die een integraal onderdeel vormen van de geïdentificeerde mondiale processen. maar worden niet direct waargenomen.

En het laatste: het hebben van een vaste toestand van het systeem in de toekomst (waar alleen significante elementen van de Hilbert-metrieken vastliggen, met een vrije interpretatie van de resterende, niet-essentiële waarden) – is het netwerk in staat om de rest?

Nou ja, dat is het. als het een afbeelding zou zijn waarin slechts twee niet-gerelateerde fragmenten werden weergegeven, zou een netwerk dat op een bepaald monster is getraind een “consistent” volledig beeld kunnen voltooien? Het voorbeeld bestaat in dit geval uit vergelijkbare tijdsintervallen uit ervaring, de fragmenten zijn de huidige en gespecificeerde toestanden. Het resultaat: een consistent ‘verhaal’ dat het één en het ander verbindt...

Het lijkt mij dat dit al een vrij belangrijke basis zal zijn voor verdere experimenten:

  • het opnemen van het eigen handelen in de ‘geschiedenis’, indien mogelijk/nodig
  • prioriteit van “natuurlijke” oorzaak-en-gevolgpatronen boven ongecontroleerde stochastische emissies (rouletteprobleem)
  • een of andere versie van nieuwsgierigheid, d.w.z. actieve kennis van patronen door actie... enz

PS Ik geef volledig toe dat ik zojuist het wiel heb uitgevonden, en dat deskundige mensen deze principes al heel lang in de praktijk toepassen. 😉 In dit geval vraag ik je “je neus te steken” in de relevante ontwikkelingen. En het zou absoluut geweldig zijn als er een gedetailleerde beschrijving komt van de fundamentele problemen van deze aanpak of een rechtvaardiging waarom deze in principe niet werkt.

PPS Ik ben me ervan bewust dat de tekst grof is en dat het idee van het een naar het ander springt, maar ik wilde deze vragen heel graag aan een paar mensen stellen (de sectie 'Vraag aan de experts'), en dit is moeilijk om zonder te doen. tenminste wat presentatie. Tekst uit het verleden (en ik was het nu opnieuw aan het lezen, en besefte dat het heel moeilijk te begrijpen was) het diende zijn doel: ik kreeg verschillende discussies die voor mij waardevol waren... Ik hoop dat het deze keer ook werkt! 😉

Bron: www.habr.com

Voeg een reactie