Genesis?). Mga pagpamalandong sa kinaiyahan sa hunahuna. Bahin II

Genesis?). Mga pagpamalandong sa kinaiyahan sa hunahuna. Bahin II

Usa ka pulong mahitungod sa mga proseso, o kitang tanan gamay kontra hangin.

Pagpadayon sa mga hunahuna sa hilisgutan sa paniktik, natural ug artipisyal (AI), Unang Bahin dinhi


Lisud nga pangutana: Nagpuyo ba ang tawo karon? Dili, kung maglakaw kita sa dalan ug direkta nga mamalandong sa kalibutan sa atong palibot, molihok kita labi pa o dili kaayo tinuod nga panahon... Bisan tuod sa pagkatinuod - basta ang atong makita moagi sa naandan nga mga mekanismo sa pag-ila / klasipikasyon - kining tanan bag-o pa, apan sa nangagi. Mga. nabuhi ba ang usa ka tawo sa nangagi?

Pananglitan: naglakaw ka sa dalan ug nakakita ug iro. O usa ka sakyanan. Sa bisan unsang kaso, kung naghisgot kami bahin sa higayon, kini nga kasayuran wala na sa panahon. Kung naglihok kita gamit ang datos nga nakaagi sa tanan namong mga mekanismo sa panghunahuna (ug ang utok layo sa labing paspas nga calculator!) Dili gyud kami makasunod sa kalibutan! Ang iro moatake o, sa kasukwahi, molayas, ug ang imong tinguha sa pagpikpik niini sa luyo sa dalunggan magpabilin nga dili matuman, ug ang sakyanan mohapak kanimo o molabay, bisan tuod kini nga sakyanan nga gusto nimo "dakpon."

Apan salamat sa Dios wala kini mahitabo sa ingon, ug ania ang hinungdan: lahi ang paglihok sa utok. Ang yunit sa panglantaw dili usa ka butang, o bisan usa ka hugpong sa mga butang, apan mga proseso. Nagdagan ang iro. Sa imo o gikan kanimo. O dili siya modagan, apan mohigda, pananglitan. Ang salakyanan usab naghunong (sa usa ka parkinganan), o naglihok sa usa ka piho nga direksyon. Sa tanan nga mga kaso, imong makita ang usa ka proseso nga molugway sa paglabay sa panahon ug, sumala niana, adunay usa ka piho nga pag-uswag sa umaabot. Sa diha nga ako moingon nga atong gitan-aw ang mga panghitabo ingon nga nagpadayag sa panahon, kini dili usa ka hulagway sa pagsulti. Paghimo og eksperimento - pagkuha og usa ka dosena nga mga litrato (ie, mga snapshot sa kamatuoran) ug ihulagway kung unsa ang imong nakita. Ania ang pipila ka mga tawo sa usa ka lawak, sila nag-away, o ania ang usa ka tawo nga naglakaw sa dalan, o ania ang naglingkod nga nagtan-aw sa TV, ug ania ang laing tawo nga nagbasa og libro. Kini ang tanan nga mga proseso nga gipalugway sa oras! Imong gitan-aw ang snapshot isip usa ka butang nga adunay extension. Wala ka mahibal-an kung unsaon pagbuhat niini sa bisan unsang laing paagi, tungod kay mao kana kung giunsa ang paglihok sa utok: gibansay kini sa pag-ila sa mga proseso, ug dili sa nahilit nga mga butang sa entablado. Sama sa dili mata-ilong-baba, apan ang nawong sa kinatibuk-an (hello, convolutional neural networks).

Ang kalibutan naglangkob sa mga proseso, dili mga butang. Kung mangutana ko kung unsa ni mansanas, unya ang kadaghanan sa mga hamtong moingon nga kini mao prutas, ug mga bata - unsa man kini? pagkaon. Apan ang duha mao ang proseso nga mga paghulagway, tungod kay ang una nagpasabot nga kini nga mansanas mitubo sa usa ka kahoy, ug nag-alagad sa kahoy alang sa pagsanay, ug ang ikaduha mao nga kini makaon. Wala'y usa o ang lain nga nalangkit sa direkta nga mga kinaiya sa usa ka mansanas - porma, kolor, gidak-on ... Tungod kay ang mga kinaiya nagtugot sa pag-ila, apan dili motugot sa paggamit, o pagsabut diin kini gigamit sa gawas nga kalibutan, i.e. ipasabut ang mga proseso.

Kung magkuha kita og usa ka tipikal nga debate bahin sa kinaiyahan sa panahon, nan ang mga klasiko nga postulate mao ang bahin sa pagkadili mabag-o sa nangagi (sa gawas sa konteksto sa pagbiyahe sa oras), ang kamahinungdanon sa karon (adunay usa ka gutlo ... πŸ˜‰), ug ang umaabot, nga wala pa, nga nagpasabot nga kini mahimong mausab. Kung maghisgot kita bahin sa obhetibo nga reyalidad, mahimo nga ingon niini. Bisan pa, ang usa ka tawo nagpuyo sa iyang kaugalingon, suhetibo nga modelo sa kalibutan, ug didto ang tanan halos sukwahi!

Ang nangagi dili halos dili mausab sama sa atong gusto. Kanunay nga nakadawat og bag-ong impormasyon, ang usa ka tawo nagtukod pag-usab sa nangagi aron sa pagwagtang sa mga kontradiksyon (naghunahuna ka nga si Pyotr Stepanych naa sa symposium, ug gikan siya sa usa ka strip club ... Kini nagpasabot nga wala'y bisan asa, siya, ang entertainer, wala moadto ug sa tanan ... ). Sa samang higayon, ang imong suhetibong kaugmaon kay kanunay sa daghang aspeto (bisan unsa pa, sa Biyernes naa koy beer ug football!). Dugang pa, nga adunay usa ka piho nga katuyoan sa umaabot, dili ka lamang magtukod usa ka kadena sa mga proseso sa reverse order (Aron mahimong direktor sa usa ka dako nga kompanya, kinahanglan nimo nga mograduwar sa usa ka prestihiyosong unibersidad nga adunay diploma, alang niini kinahanglan ka una nga magpalista niini, tungod niini kinahanglan nimo nga maipasa ang Unified State Exam nga maayo, ug tun-an ang imong homwork!), apan lagmit usab nga sa niini nga proseso moadto ka sa nangagi (Wala ba kitay mga higala/kaila nga karon nabanhaw ug nakabaton og mga koneksyon ug makatabang sa usa ka bata sa unibersidad?) - nganong dili kontra-emosyon? πŸ˜‰

Bisan pa, nagpalayo ako gamay. Bisan pa, ang panguna nga butang nga gusto nako ipunting mao mga proseso. Kumbinsido kaayo ko nga ang potensyal nga AI kinahanglan dili mabansay sa mga litrato o bisan mga video. Ang usa ka convolutional network adunay duha ka lebel (minimum) - ug sa pagkatinuod kini mao ang duha ka lain-laing mga network: ang usa gibansay sa pagpangita sa pipila ka mga graphic patterns sa usa ka hilaw nga larawan, ang ikaduha naghisgot sa output sa una - i.e. uban sa naproseso na ug giandam nga impormasyon. Aron malampuson nga makig-uban sa kalibutan sa AI, parehas nga butang ang gikinahanglan: sa pipila (dili ang una) nga lebel kinahanglan adunay usa ka network nga makadawat ingon input usa ka mapa sa mga proseso nga gibuklad sa paglabay sa panahon. Ang mga konsepto sa "pagsugod" ug "katapusan", "paglihok", "pagbag-o", "paghiusa" ug "pagbahin" mao ang kinahanglan nga makat-unan sa network sa pagtrabaho.

Sigurado ako nga kadtong nagtrabaho sa dula AI, sama sa Alpha Go, nakasabut niini sa usa ka paagi o sa lain. Tingali ang mga pamaagi didto medyo lahi, apan ang esensya parehas: ang karon nga kahimtang sa pisara (ug sa pag-uswag sa katapusan nga pipila nga mga paglihok) gisusi alang sa "kung unsa ang nahitabo sa kinatibuk-an." Ug depende kung unsa ang mahitabo katumbas sa kung unsa ang kinahanglan mahitabo, gipili namon ang among kaugalingon nga mga lihok.

Lisud kaayo ang paghisgot bahin sa estratehiya / pamatasan kung ang input usa ka litrato gikan sa mga sensor. Ug vice versa - usa ka andam nga vector nga adunay usa ka kompleto nga pagkahugno sa karon nga kahimtang sa uma sa mga dula nga adunay kompleto nga kasayuran (hunahunaa ang usa ka kompleto nga litrato sa kalibutan) usa ka hingpit nga mahimo nga buluhaton, ingon nga gipakita sa praktis. Bisan pa, kung ang convolutional network sa unang mga lebel nakaila sa mga butang, ug ang sunod nga lebel mag-analisar niini nga mga butang sa dinamika, pag-ila sa mga proseso (pamilyar sa pagbansay, pananglitan) nga makadugang sa datos nga nakuha sa sayo pa, nan kini daw posible nga magtrabaho niini. ..

Mga pangutana alang sa mga eksperto:

Unsa ka realistiko kini, nga gihatag karon nga mga pag-uswag sa mga neural network, nga buhaton ang gibana-bana nga mga musunud:

Sa entrada, ingnon ta nga padayon nga signal sa video, lagmit stereo. Ingon usa ka kapilian: nga adunay daghang mga ang-ang sa kagawasan (ang abilidad sa pag-rotate sa camera - arbitraryo, o sumala sa usa ka sumbanan). Bisan pa, kung gikinahanglan, ang signal sa video mahimong madugangan / pulihan sa bisan unsang ubang mga pamaagi sa spatial nga panan-aw - gikan sa sonar hangtod sa lidar.

Estrikto nga pagsulti…ang input mahimong bisan unsa tinuod nga panahon dagan - bisan ang sinultihan/teksto, bisan ang mga kinutlo sa kuwarta, apan... Sa proseso nga gikonsiderar, mas sayon ​​alang kanako ang pagsalig sa bugtong sample sa hunahuna nga anaa kanako alang sa direktang pagtuon - ang akong kaugalingon! ) Ug sa niini nga "sample" ang sensory channel dili sa kompetisyon!
Sa exit:

  1. Mapa sa giladmon (kon static ang camera) o mapa sa palibot. luna (dinamikong camera/lidar, ug uban pa);

    Alang sa unsaGikinahanglan kini kung gusto nato nga adunay tinuod nga spatial nga kahikayan sa mga butang aron masusi ang ilang interaksyon. Sa kini nga kaso, ang imahe gikan sa camera usa lamang ka two-dimensional nga projection sa usa ka mas taas nga dimensiyon nga wanang, ug kinahanglan ang dugang nga mga pagbag-o.

  2. Pag-inusara sa tagsa-tagsa nga mga butang (sa pagkonsiderar sa giladmon/space map, ug dili lamang/dili kaayo makita nga mga contour);
  3. Pag-ila sa naglihok nga mga butang (katulin / pagpatulin, pagtukod / panagna sa trajectory(?));
  4. Hierarchical nga klasipikasyon sa mga butang sumala sa bisan unsa nga gikuha nga mga kinaiya (porma / dimensyon / kolor / nuances sa paglihok / Component parts(?)). Mga. esensya nga pagkuha metrics para sa Hilbert luna.

    mahitungod sa hierarchyTingali ang pulong nga "Hierarchical" dili hingpit nga angay niini nga kaso. Gusto nako nga hatagan og gibug-aton ang abilidad sa pagpili sa mga sukatan bisan unsang orasa aron kana Heminga nga distansya tali kanila nagtugot kanamo sa pagkonsiderar sa duha ka lain-laing mga set sa metrics isip usa ka konsepto. Sa unsang paagi ang "pula nga awto" ug "asul nga bus" kinahanglan nga i-generalize sa konsepto sa "sakyanan", pananglitan.

Kini mao ang importante sa: Kung mahimo, ang sistema wala gibansay. Mga. pipila ka mga batakang butang mahimong ibutang (pananglitan, usa ka convolutional network sa unang layer, alang sa pag-highlight sa mga contour/geometry), apan kini kinahanglan nga makakat-on sa pagpili sa mga butang ug sa ulahi makaila niini sa iyang kaugalingon.

  • Ug, sa katapusan, ang pagtukod sa usa ka sweep (base sa mga punto 1,4, i.e. usa ka spatial nga mapa nga gikonsiderar ang mga sukatan) sa oras (sa karon, sa kini nga yugto sa dayag nga direkta nga naobserbahan nga panahon), aron mahimo ang usa ka pagtuki sumala sa mga puntos 2 -4, uban sa aron sa pag-ila: mga proseso/mga panghitabo (nga mao ang esensya mga pagbag-o sa oras nga lakang 3) ug ang ilang cluster classification (lakang 4).

Sa makausa pa: gikan sa imahe gikan sa mga sensor, una namon nga gikuha ang usa ka paghulagway sa kalibutan sa usa ka labi ka andam nga porma, gimarkahan sumala sa nakuha nga mga bahin ug gibahin dili sa mga pixel, apan sa mga butang. Dayon atong gipalapad ang kalibutan nga naglangkob sa mga butang sa panahon ug nakadawat "larawan sa kalibutan" gipakaon namo kini sa input sa sunod nga network, nga nagtrabaho uban niini sa samang paagi nga ang nangaging mga lut-od nagtrabaho uban sa sensory nga hulagway. Kung diin ang mga contour sa mga butang gipasiugda, ang "mga contour" sa nagpadayon nga mga proseso ipasiugda karon. Ang relatibong posisyon sa mga butang sa kawanangan susama sa hinungdan-ug-epekto nga relasyon sa mga proseso sa panahon... Usa ka butang nga sama niana.

Tingali, pagkahuman niini, ang sistema kinahanglan nga makaila sa mga proseso pinaagi sa ilang mga bahin (tungod kay kini makahimo sa pag-ila sa mga imahe, nga adunay tipik lamang niini, o ingon pagsulat sa pagpadayon sa teksto sumala sa modelo), ug isip resulta, matagna sila sa unahan ug paatras sa panahon, pagpalapad sa modelo sa lakang 5 nga walay kinutuban sa duha ka direksyon. Usab, lagmit, nga adunay usa ka ideya sa mga proseso sa constituent, ang sistema makaila, gikan sa ubay-ubay nga may kalabutan nga lokal nga mga proseso, mas dako, global nga mga proseso ug, isip usa ka sangputanan, implicit, tinago nga mga proseso nga usa ka integral nga bahin sa giila nga mga global, apan dili direkta nga masabtan.

Ug ang katapusan nga butang: adunay usa ka piho nga kahimtang sa sistema sa umaabot (diin ang hinungdanon nga mga elemento sa mga sukatan sa Hilbert ang gitakda, nga adunay libre nga paghubad sa nahabilin, dili kinahanglanon nga mga kantidad) - mao ang network nga makahimo sa "paghunahuna" sa pahulay?

Aw, mao kana. kung kini usa ka imahen diin duha ra nga wala’y kalabutan nga mga tipik ang gihatag, mahimo ba nga ang usa ka network nga gibansay sa pipila nga sample makakompleto sa usa ka "makanunayon" nga kompleto nga imahe? Ang sample sa kini nga kaso parehas nga mga agwat sa oras gikan sa kasinatian, ang mga tipik mao ang karon ug gipiho nga mga estado. Ang resulta: usa ka makanunayon nga "istorya" nga nagkonektar sa usa ug sa lain...

Para nako kini usa na ka hinungdanon nga sukaranan alang sa dugang nga mga eksperimento:

  • paglakip sa kaugalingon nga mga aksyon sa "kasaysayan", kung mahimo / kinahanglan
  • prayoridad sa "natural" nga hinungdan-ug-epekto nga mga sumbanan kay sa dili makontrol nga stochastic emissions (problema sa roulette)
  • pipila ka bersyon sa pagkamausisaon, i.e. aktibo nga pag-ila sa mga sumbanan pinaagi sa aksyon... etc

PS Ako hingpit nga giangkon nga ako bag-o lang nag-imbento sa ligid, ug ang mga tawo nga may kahibalo nag-apply niini nga mga prinsipyo sa praktis sa dugay nga panahon. πŸ˜‰ Sa kini nga kaso, gihangyo ko ikaw nga "idunggo ang imong ilong" sa mga may kalabotan nga kalamboan. Ug kini mahimong hingpit nga kahibulongan kung adunay usa ka detalyado nga paghulagway sa mga sukaranan nga mga problema sa kini nga pamaagi o usa ka katarungan kung ngano nga wala kini molihok sa prinsipyo.

PPS Ako nahibalo nga ang teksto mao ang krudo, ug ang ideya milukso gikan sa usa ngadto sa usa, apan ako gusto gayud nga mangutana sa usa ka magtiayon nga sa mga tawo niini nga mga pangutana (ang "pangutana ngadto sa mga eksperto" seksyon), ug kini mao ang lisud nga sa pagbuhat sa walay sa labing menos pipila ka presentasyon. Kaagi nga text (ug gibasa nako kini pag-usab karon, ug nakaamgo nga lisod kaayo sabton) kini nagsilbi sa iyang katuyoan: Nakadawat kog daghang mga panaghisgot nga bililhon alang kanako... Nanghinaut ko nga kini molihok usab niining panahona! πŸ˜‰

Source: www.habr.com

Idugang sa usa ka comment