Genesis?). Reflexiounen iwwer d'Natur vum Geescht. Deel II

Genesis?). Reflexiounen iwwer d'Natur vum Geescht. Deel II

E Wuert iwwer Prozesser, oder eis all e bëssen Géigewier.

Fortsetzung vu Gedanken zum Thema Intelligenz, souwuel natierlech a kënschtlech (AI), Deel XNUMX hei


Froen op Réckfëllung: Liewen déi Persoun elo an? Neen, wa mir duerch d'Strooss goen an direkt d'Welt ronderëm eis iwwerdenken, handele mir méi oder manner Echtzäit... Och wann tatsächlech - soulaang wat mir gesinn duerch déi üblech Mechanismen vun der Unerkennung / Klassifikatioun geet - all dat wäert rezent sinn, awer nach ëmmer d'Vergaangenheet. Déi. lieft eng Persoun an der Vergaangenheet?

Zum Beispill: Dir gitt op d'Strooss a kuckt en Hond. Oder en Auto. Op jidde Fall, wa mir iwwer de Moment schwätzen, ass dës Informatioun scho veroudert. Wa mir mat Daten operéieren, déi all eis kognitiv Mechanismen duerchgaang sinn (an d'Gehir ass wäit vum schnellsten Rechner!) Mir halen einfach net mat der Welt mat! Den Hond attackéiert oder, am Géigendeel, fortlafen, an Äre Wonsch hannert d'Ouer ze klappen bleift net erfëllt, an den Auto schloen Iech oder passéiert laanscht, obwuel et dësen Auto war deen Dir wollt "fangen".

Mee Gott sei Dank geschitt et net esou, an dofir: d'Gehir funktionnéiert anescht. D'Eenheet vun der Perceptioun ass keen Objet, oder souguer eng Rei vun Objeten, mee Prozesser. Den Hond leeft. Fir Iech oder vun Iech. Oder hie leeft net, mä läit zum Beispill. Den Auto ass och stationär (op enger Parkplaz), oder beweegt sech an eng bestëmmte Richtung. An alle Fäll erkennt Dir e Prozess, dee sech iwwer Zäit verlängert an deementspriechend eng gewëssen Entwécklung an Zukunft huet. Wann ech soen datt mir d'Evenementer als entfalen an der Zäit gesinn, ass dëst keng Ried. Maacht en Experiment - maacht eng Dose Fotoen (dh Snapshots vun der Realitéit) a beschreiwt wat Dir gesitt. Hei sinn e puer Leit an engem Zëmmer, si streiden, oder hei geet eng Persoun op der Strooss, oder hei sëtzt Fernseh kucken, an hei ass eng aner Persoun, déi e Buch liest. Dëst sinn all Prozesser an der Zäit verlängert! Dir erkennt de Snapshot als eppes wat eng Extensioun huet. Dir wësst net wéi Dir et anescht maache kënnt, well dat ass wéi d'Gehir funktionnéiert: et gëtt trainéiert fir Prozesser ze erkennen, an net isoléiert Objeten op der Bühn. Just wéi net Aen-Nues-Mond, mee d'Gesiicht als Ganzt (Moien, konvolutional neural Netzwierker).

D'Welt besteet aus Prozesser, net Objeten. Wann ech Iech froen wat et ass Äppel, da soen déi meescht Erwuessen datt dëst ass Uebst, a Kanner - wat ass et? Liewensmëttel. Awer béid sinn Prozessbeschreiwungen, well déi éischt bedeit datt dësen Apel wiisst op engem Bam, an déngt de Bam fir Reproduktioun, an déi zweet ass, datt et iessbar. Weder dat eent nach dat anert ass mat den direkten Charakteristiken vun engem Apel verbonnen - Form, Faarf, Gréisst ... Well d'Charakteristiken erlaben Identifikatioun, awer erlaben net Gebrauch, oder Versteesdemech wou et an der Äussewelt benotzt gëtt, d.h. d'Prozesser definéieren.

Wa mir eng typesch Debatt iwwer d'Natur vun der Zäit huelen, da wäerten déi klassesch Postulate iwwer d'Immutabilitéit vun der Vergaangenheet (ausserhalb vum Kontext vun der Zäitrees), d'Wichtegkeet vum heitegen (et gëtt nëmmen e Moment ... 😉), an d'Zukunft, déi et nach net gëtt, dat heescht datt se geännert ka ginn. Wa mir iwwer objektiv Realitéit schwätzen, kann et ganz gutt sinn, datt dat esou ass. Allerdéngs lieft eng Persoun a sengem eegenen, subjektiven Modell vun der Welt, an do ass alles bal de Géigendeel!

D'Vergaangenheet ass net bal sou onverännerbar wéi mir wëllen. Konstant nei Informatioun ze kréien, baut eng Persoun d'Vergaangenheet op fir Widdersproch ze eliminéieren (Dir hutt geduecht datt de Pyotr Stepanych um Symposium war, an hien kënnt aus engem Stripclub ... Dat heescht néierens, hien, den Entertainer, ass net gaang a guer net ... ). Zur selwechter Zäit ass Är subjektiv Zukunft a ville Aspekter konstant (wat et och ass, Freides hunn ech Béier a Fussball!). Ausserdeem, e spezifescht Zil an der Zukunft ze hunn, baut Dir net nëmmen eng Kette vu Prozesser an ëmgedréint Uerdnung (Fir den Direkter vun enger grousser Firma ze ginn, musst Dir vun enger prestigiéiser Uni mat engem Diplom ofzeschléissen, dofir musst Dir Iech fir d'éischt anzeschreiwen, dofir musst Dir den Unified State Exam gutt passéieren an Är Hausaufgaben studéieren!), awer et ass och zimlech wahrscheinlech datt Dir an dësem Prozess an d'Vergaangenheet gitt (Hu mir keng Frënn/Bekannten, déi elo opgestan sinn a Verbindungen erfaasst hunn an engem Kand mat der Uni hëllefe kéinten?) - firwat net Géigemotioun? 😉

Ech degress awer e bëssen. Trotzdem, den Haapt Saach op ech wollt konzentréieren ass Prozesser. Ech sinn zudéifst iwwerzeegt datt potenziell AI net op Fotoen oder souguer Videoen trainéiert soll ginn. E convolutional Netzwierk huet zwee Niveauen (Minimum) - an tatsächlech sinn dat zwee verschidde Netzwierker: een ass trainéiert fir bestëmmte grafesch Musteren an engem roude Bild ze fannen, dat zweet beschäftegt sech mam Output vum éischten - d.h. mat scho veraarbechten a preparéierten Informatioun. Fir erfollegräich mat der Welt vun AI ze interagéieren, ass datselwecht gebraucht: op e puer (nach net um éischte) Niveau muss et e Netzwierk sinn, deen als Input eng Kaart vu Prozesser kritt, déi mat der Zäit entfalten ass. D'Konzepter vun "Ufank" an "Enn", "Bewegung", "Transformatioun", "Fusioun" an "Dividing" sinn wat d'Netz muss léieren mat ze schaffen.

Ech si ganz sécher datt déi, déi um Spill AI schaffen, wéi Alpha Go, dat eng oder aner Manéier verstinn. Vläicht sinn d'Approche do e bëssen anescht, awer d'Essenz ass déiselwecht: déi aktuell Situatioun um Bord (an an der Entwécklung vun de leschte Beweegunge) gëtt analyséiert fir "wat am Allgemengen geschitt." An jee no wéi vill wat geschitt entsprécht wat soll geschéien, wielt mir eis eege Beweegungen.

Et ass ganz schwéier iwwer Strategie / Verhalen ze schwätzen wann den Input e Bild vu Sensoren ass. A vice versa - e preparéierten Vektor deen e kompletten Decompte vum aktuellen Zoustand vum Terrain a Spiller mat kompletter Informatioun enthält (betruecht e komplett Bild vun der Welt) ass eng komplett machbar Aufgab, wéi d'Praxis weist. Wéi och ëmmer, wann de convolutional Reseau vun den éischten Niveauen Objete identifizéiert huet, an déi nächst Niveauen analyséieren dës Objeten an der Dynamik, Identifikatioun Prozesser (bekannt aus Training, zum Beispill), datt d'Daten ergänzen virdrun kritt, da schéngt et méiglech mat dëser ze schaffen. ..

Froen fir Experten:

Wéi realistesch ass et, no aktuellen Entwécklungen an neurale Netzwierker, ongeféier déi folgend ze maachen:

An der Entrée, Loosst d'soen eng kontinuéierlech Video Signal, eventuell Stereo. Als Optioun: mat e puer Fräiheetsgraden (d'Fäegkeet fir d'Kamera ze rotéieren - arbiträr oder no engem Muster). Wéi och ëmmer, wann néideg, kann de Videosignal ergänzt / ersat ginn duerch all aner Methode vun der raimlecher Perceptioun - vu Sonar bis Lidar.

Streng geschwat…den Input kann alles sinn Echtzäit Flux - souguer Ried/Text, souguer Währungsquoten, awer ... Am Prozess, dee betruecht gëtt, ass et méi einfach fir mech op déi eenzeg Probe vum Geescht ze vertrauen, déi mir fir direkt Studie verfügbar hunn - meng eegen! ) An an dësem "Probe" ass de sensoresche Kanal iwwer d'Konkurrenz!
An der Sortie:

  1. Déift Kaart (wann d'Kamera statesch ass) oder Ëmfeld Kaart. Raum (dynamesch Kamera / Lidar, etc.);

    Fir watEt ass noutwendeg wa mir eng real raimlech Arrangement vun Objete wëllen hunn fir hir Interaktioun ze bewäerten. An dësem Fall ass d'Bild vun der Kamera nëmmen eng zweedimensional Projektioun vun engem méi héije Dimensiounsraum, an zousätzlech Transformatiounen sinn néideg.

  2. Isolatioun vun eenzelne Objeten (d'Déift / Raum Kaart berücksichtegt, an net nëmmen / net esou vill siichtbar Konturen);
  3. Identifikatioun vun bewegt Objeten (Vitesse / Beschleunegung, Konstruktioun / Viraussetzung vun der Streck (?));
  4. Hierarchesch Klassifikatioun vun Objeten no all extrahéiert Charakteristiken (Form / Dimensiounen / Faarf / Nuancen vun Bewegung / Komponente Deeler (?)). Déi. wesentlech Metriken extrahéieren fir Hilbert Plazen.

    iwwer d'HierarchieVläicht ass d'Wuert "Hierarchesch" an dësem Fall net ganz ubruecht. Ech wollt d'Fäegkeet ënnersträichen, Metriken zu all Moment ze wielen, sou datt Heminga Distanz tëscht hinnen erlaabt eis zwee verschidde Sätz vu Metriken als ee Konzept ze betruechten. Wéi zum Beispill "rout Auto" a "bloe Bus" an d'Konzept vun "Gefier" generaliséiert ginn.

Et ass wichteg fir: Wa méiglech, ass de System net viraus trainéiert. Déi. e puer grondleeënd Saache kënne festgeluecht ginn (zum Beispill e convolutional Netzwierk vun der éischter Layer, fir d'Konturen/Geometrie ze markéieren), awer et muss léieren Objeten ze wielen a spéider eleng ze erkennen.

  • A schliisslech e Sweep konstruéieren (baséiert op Punkten 1,4, also eng raimlech Kaart, déi Metriken berücksichtegt) an der Zäit (fir elo, an dëser Phase vun der anscheinend direkt observéierter Period), fir eng Analyse no Punkten 2 auszeféieren. -4, mat fir z'identifizéieren: Prozesser / Eventer (déi am Wesentlechen Ännerungen an Zäit Schrëtt 3) an hir Cluster Klassifikatioun (Schrëtt 4).

Nach eng Kéier: aus dem Bild vun de Sensoren extrahéiere mir als éischt eng Beschreiwung vun der Welt an enger méi preparéierter Form, markéiert no den extrahéierten Features an net a Pixelen opgedeelt, mee an Objeten. Da erweidere mir d'Welt aus Objeten an der Zäit a krut "Bild vun der Welt" mir fidderen et un den Input vum nächste Netz, dee mat deem funktionnéiert wéi déi fréier Schichten mam sensoresche Bild geschafft hunn. Wou d'Konturen vun Objeten markéiert goufen, ginn d'"Konturen" vun de lafende Prozesser elo beliicht. D'relativ Positioun vun Objeten am Raum ass ähnlech wéi d'Ursaach-an-Effekt Relatioun vu Prozesser an der Zäit ... Eppes wéi dat.

Wahrscheinlech, duerno soll de System fäeg sinn Prozesser no hiren Deeler z'erkennen (wéi et fäeg ass Biller ze erkennen, nëmmen hir Fragmenter ze hunn oder als schreiwen eng Fortsetzung vum Text no Modell), an als Konsequenz, viraussoen se souwuel no vir an zréck an der Zäit, de Modell vum Schrëtt 5 onlimitéiert a béid Richtungen ausbauen. Och, viraussiichtlech, eng Iddi vun de konstituerende Prozesser ze hunn, kann de System, aus verschiddene verbonne lokalen Prozesser, méi grouss, global Prozesser identifizéieren an, als Konsequenz, implizit, verstoppte Prozesser, déi en integralen Deel vun den identifizéierten globalen sinn, awer net direkt ugesi ginn.

An déi lescht Saach: e fixen Zoustand vum System an der Zukunft ze hunn (wou nëmme bedeitend Elementer vun Hilbert Metriken fixéiert sinn, mat enger fräier Interpretatioun vun de verbleiwen, net wesentleche Wäerter) - ass d'Netz fäeg fir "auszedenken" Rescht?

Gutt, dat ass. wann et e Bild wier an deem nëmmen zwee net verbonne Fragmenter ginn, kéint e Reseau trainéiert op e puer Echantillon engem "konsequent" komplett Bild komplett? D'Probe an dësem Fall ass ähnlech Zäitintervalle vun der Erfahrung, d'Fragmenter sinn déi aktuell a spezifizéiert Staaten. D'Resultat: eng konsequent "Geschicht" déi een an déi aner verbënnt ...

Et schéngt mir datt dëst schonn eng zimlech bedeitend Basis fir weider Experimenter wäert sinn:

  • Inclusioun vun eegenen Handlungen an der "Geschicht", wa méiglech / noutwenneg
  • Prioritéit vun "natierlechen" Ursaach-an-Effekt Muster iwwer onkontrolléiert stochastic Emissiounen (Roulette Problem)
  • puer Versioun vun Virwëtz, i.e. aktiv Erkennung vu Mustere duerch Handlung ... etc

PS Ech ginn ganz zou datt ech just d'Rad erfonnt hunn, an erfannen Leit hunn dës Prinzipien an der Praxis fir eng laang Zäit applizéiert. 😉 An dësem Fall froen ech Iech, "d'Nues" an déi relevant Entwécklungen ze stéieren. An et wier absolut wonnerbar, wann et eng detailléiert Beschreiwung vun de fundamentale Problemer vun dëser Approche gëtt oder eng Begrënnung firwat et am Prinzip net funktionnéiert.

PPS Ech sinn bewosst datt den Text grujeleg ass, an d'Iddi spréngt vun engem op dat anert, awer ech wollt wierklech e puer Leit dës Froen stellen (d'Sektioun "Fro un d'Experten"), an dëst ass schwéier ouni ze maachen mannst e puer Presentatioun. Vergaangenheet Text (an ech hunn et elo nach eng Kéier gelies, a gemierkt datt et ganz schwéier ze verstoen ass) et huet säin Zweck gedéngt: Ech krut e puer Diskussiounen, déi fir mech wäertvoll waren... Ech hoffen et funktionnéiert och dës Kéier! 😉

Source: will.com

Setzt e Commentaire