Genesis?). Nêrînên li ser xwezaya hiş. Beş II

Genesis?). Nêrînên li ser xwezaya hiş. Beş II

Gotinek li ser pêvajoyan, an jî em hemî piçekî li dijî bayê.

Berdewamiya ramanên li ser mijara îstîxbaratê, hem xwezayî û hem jî çêkirî (AI), Beş Yek vir


Pirsa dijwar: Ma mirov niha tê de dijî? Na, dema ku em li kolanê dimeşin û rasterast li cîhana li dora xwe dihizirin, em kêm-zêde tevdigerin realtime... Her çend di rastiyê de - heya ku tiştê ku em dibînin di mekanîzmayên adetî yên naskirinê / dabeşkirinê re derbas dibe - ev hemî dê nû be, lê dîsa jî paşerojê ye. Ewan. mirov di dema borî de dijî?

Mînak: hûn li kolanê dimeşin û kûçikek dibînin. An jî otomobîlek. Di her rewşê de, heke em li ser vê gavê dipeyivin, ev agahdarî jixwe kevn e. Ger em bi daneyên ku di nav hemî mekanîzmayên me yên cognitive de derbas bûne bixebitin (û mêjî ji hesabkarê herî bilez dûr e!) em ê bi tenê xwe bi cîhanê re negirin! Kûçik dê êrîş bike an, berevajî, bireve, û xwesteka we ya ku hûn li pişt guhê wî bixin dê pêk neyê, û otomobîl dê li we biqelişe an jî derbas bibe, her çend ev otomobîla ku we dixwest hûn "bigirin" bû.

Lê şikir ji Xwedê re ew bi vî rengî nabe, û li vir çima: mêjî bi rengek cûda dixebite. Yekeya têgihiştinê ne objeyek, an jî komek nesneyan e, lê pêvajo ye. Kûçik direve. Ji we re an ji we re. An jî ew nareve, lê radizê, wek nimûne. Otomobîl jî rawestayî ye (li parkkirinê), an jî di rêyek diyar de dimeşe. Di hemî rewşan de, hûn pêvajoyek ku bi demê re dirêj dibe û, li gorî vê yekê, di pêşerojê de pêşkeftinek diyar dike, fêm dikin. Dema ku ez dibêjim ku em bûyeran di dema xwe de diqewimin dibînin, ev ne jimareyek axaftinê ye. Ezmûnek pêk bînin - bi dehan wêneyan bigirin (ango, dîmenên rastiyê) û tiştê ku hûn dibînin diyar bikin. Li vir çend kes di odeyekê de ne, ew bi hev re dikevin hev, an li vir kesek li kolanê dimeşe, an li vir rûniştiye li televîzyonê temaşe dike, û li vir kesek din pirtûkek dixwîne. Vana hemî pêvajoyên di demê de dirêjkirî ne! Hûn wêneya wêneyê wekî tiştek ku xwedan dirêjbûnek heye dihesibînin. Hûn nizanin meriv wê çawa bi rengek din bike, ji ber ku mêjî bi vî rengî dixebite: ew tê perwerde kirin ku pêvajoyan nas bike, û ne tiştên veqetandî yên li ser qonaxê. Mîna ne çav-poz-dev, lê rû bi tevahî (silav, torgilokên neuralî yên hevgirtî).

Dinya ji pêvajoyan pêk tê, ne ji tiştan. Ger ez ji we bipirsim ew çi ye apple, hingê piraniya mezinan dê bêjin ku ev e mêwe, û zarok - ew çi ye? xwarin. Lê her du jî danasînên pêvajoyê ne, ji ber ku ya yekem tê vê wateyê ku ev sêv e li ser darê mezin dibe, û ji darê re xizmetê dike ji bo nûvekirinê, û ya duyemîn jî ew e xwarinê. Ne yek û ne jî ya din bi taybetiyên rasterast ên sêvekê ve girêdayî ne - şekl, reng, mezinahî... Ji ber ku taybetmendî rê dide naskirinê, lê rê nade ku were bikar anîn, an jî têgihîştina ku li cîhana derve tê bikaranîn, yanî. pêvajoyan diyar bike.

Ger em nîqaşek tîpîk di derbarê xwezaya demê de bikin, wê hingê postulatên klasîk dê li ser neguhezbariya rabirdûyê (li derveyî çarçoweya rêwîtiya demê), girîngiya niha (tenê kêliyek heye... 😉), û paşerojê, ku hîn tune ye, ku tê wateya ku ew dikare were guhertin. Dema ku em behsa rastiya objektîf dikin, dibe ku ev yek wusa be. Lêbelê, mirovek di modela xwe, subjektîf a cîhanê de dijî, û li wir her tişt hema hema berevajî ye!

Rabirdû bi qasî ku em dixwazin neguherbar e. Bi domdarî agahdariya nû werdigire, mirov ji nû ve paşerojê ava dike da ku nakokiyan ji holê rake (te digot qey Pyotr Stepanych li sempozyûmê ye, û ew ji klûbek strip tê... Ev tê wê wateyê ku li tu derê, ew, şanoger, neçû û qet ... ). Di heman demê de, paşeroja we ya subjektîf di gelek aliyan de domdar e (çi dibe bila bibe, roja înê min bîr û futbol heye!). Digel vê yekê, di pêşerojê de xwedî armancek taybetî, hûn ne tenê zincîreyek pêvajoyên di rêza berevajî de ava dikin (Ji bo ku hûn bibin rêvebirê pargîdaniyek mezin, hûn hewce ne ku ji zanîngehek bi prestîj bi diplomek mezûn bibin, ji bo vê yekê divê hûn pêşî tê de tomar bikin, ji bo vê yekê hûn hewce ne ku Ezmûna Dewleta Yekgirtî baş derbas bikin, û dersên xwe bixwînin!), lê di heman demê de pir gengaz e ku di vê pêvajoyê de hûn biçin paşerojê (Ma hevalên me/hevalên me tunebûn ku niha rabûne û pêwendiya xwe bi dest xistine û dikarin di zanîngehê de alîkariya zarokekî bikin?) - çima ne li dijî hestan? 😉

Lêbelê, ez piçek dûr dibim. Dîsa jî, ya sereke ku min dixwest ez li ser bisekinim ev e pêvajoyên. Ez bi kûr bawer im ku AI-ya potansiyel divê li ser wêneyan an jî vîdyoyan neyê perwerde kirin. Tora konvolutional du astan heye (kêmtirîn) - û bi rastî ev du torên cihêreng in: yek tê perwerde kirin ku di wêneyek xav de hin qalibên grafîkî bibîne, ya duyemîn bi derketina ya yekem re têkildar e - ango. bi agahiyên ku ji berê ve hatine çêkirin û amade kirin. Ji bo ku meriv bi cîhana AI-ê re bi serfirazî têkîlî bike, heman tişt hewce ye: di asta (bi tu awayî yekem) de pêdivî ye ku torgilokek hebe ku nexşeyek pêvajoyên ku bi demê re vedibe wekî têketinê werdigire. Têgînên "destpêk" û "dawî", "tevger", "veguhertin", "hevkirin" û "parçekirin" ew in ku divê torê fêrî xebatê bike.

Ez pir pê bawer im ku yên ku li ser lîstika AI-ê dixebitin, mîna Alpha Go, vê yekê bi rengekî din fam dikin. Dibe ku nêzîkatiyên li wir hinekî cûda bin, lê cewher yek e: rewşa heyî ya li ser panelê (û di pêşkeftina çend tevgerên paşîn de) ji bo "tiştê ku bi gelemperî diqewime" tê analîz kirin. Û li gorî ka çi diqewime bi tiştê ku divê biqewime re têkildar e, em tevgerên xwe hilbijêrin.

Pir dijwar e ku meriv li ser stratejiyê / tevgerê biaxive dema ku têketin wêneyek ji sensoran be. Berevajî vê yekê - vektorek amadekirî ku di lîstikên bi agahdariya bêkêmasî de têkçûnek bêkêmasî ya rewşa heyî ya zeviyê vedihewîne (wêneyek bêkêmasî ya cîhanê bihesibîne) wekî ku pratîk destnîşan dike, karek bi tevahî pêkan e. Lêbelê, heke şebekeya konvokî ya astên yekem tiştan nas kiribe, û astên din van tiştan di dînamîkê de analîz bikin, pêvajoyên (mînak ji perwerdehiyê nas) ku daneyên berê hatine bidestxistin temam dikin, wê hingê gengaz e ku meriv bi vê re bixebite. ..

Pirs ji bo pisporan:

Çiqas realîst e, ji ber pêşkeftinên heyî yên di torên neuralî de, bi qasî jêrîn bikin:

Li dergehê, em bêjin sînyalek vîdyoyek domdar, dibe ku stereo be. Wekî vebijark: bi çend dereceyên azadiyê (kapasîteya zivirîna kamerayê - bi kêfî, an li gorî nimûneyek). Lêbelê, heke hewce be, sînyala vîdyoyê dikare bi her awayên din ên têgihîştina cîhê - ji sonar heya lidar were zêdekirin / guheztin.

Bi eşkereyî…input dikare her kes be realtime herikîn - tewra axaftin/nivis, tewra biwêjên diravî jî, lê... Di pêvajoya ku li ber çavan tê girtin de, ji min re hêsantir e ku xwe bispêrim nimûneya tenê ya hişê ku ji bo lêkolîna rasterast li ber destê min heye - ya xwe! ) Û di vê "nimûneyê" de kanala hestî li derveyî pêşbaziyê ye!
Di derketinê de:

  1. Nexşeya kûrahî (heke kamera statîk be) an nexşeya jîngehê. cîh (kamera dînamîkî / lidar, hwd.);

    Ji bo çiPêdivî ye ku ger em bixwazin ku lihevhatinek cîhê rastîn a tiştan hebe ku têkiliya wan binirxînin. Di vê rewşê de, wêneyê ji kamerayê tenê projeyek du-alî ya cîhek-dimensîyonek bilindtir e, û veguherînên din hewce ne.

  2. Veqetandina hêmanên kesane (li ber çavê nexşeya kûrahî / cîhê, û ne tenê / ne ew qas xêzên xuyayî);
  3. Naskirina tiştên ku diherikin (lez / lezbûn, avakirin / pêşbîniya trajektorê(?));
  4. Tesnîfkirina hîyerarşîk a tiştan li gorî her taybetmendiyek jêderkirî (şekl / mezinahî / reng / nuwazeyên tevgerê / Parçeyên pêkhatî(?)). Ewan. bi bingehîn derxistina metrîkan ji bo Cihên Hilbert.

    li ser hiyerarşiyêDibe ku peyva "Hiyerarşîk" di vê rewşê de bi tevahî ne guncaw be. Min xwest ez balê bikişînim ser kapasîteya hilbijartina metrîkan di her kêliyê de ji ber vê yekê Heminga dûr di navbera wan de hişt ku em du komên cûda yên metrîkan wekî yek têgehekê bihesibînin. Mînakî, "otomobêla sor" û "otobusa şîn" çawa divê di têgîna "wesayîtê" de were gelemperî kirin.

Ev ji bo me girîng e: Ger gengaz be, pergal ne pêşdibistanê ye. Ewan. hin tiştên bingehîn dikarin bêne danîn (mînak, torgilokek konvolutional ya qata yekem, ji bo ronîkirina konturan/geometrî), lê divê ew fêrî hilbijartina tiştan bibe û dûv re wan bi serê xwe nas bike.

  • Û, di dawiyê de, avakirina şûştinek (li ser bingeha xalên 1,4, ango nexşeyek cîhê ku metrîkan digire ber çavan) di wextê de (ji bo niha, di vê qonaxê de ji heyama ku bi eşkere rasterast tê şopandin), da ku analîzek li gorî xalên 2 pêk bîne. -4, ji bo naskirina: pêvajo/bûyeran (ku di bingeh de ne guhertin di dema gavê 3 de) û dabeşkirina komê ya wan (gav 4).

Carek din: ji wêneya ji senzoran, em pêşî danasîna cîhanê bi rengek amadetir derdixin, ku li gorî taybetmendiyên derxistinê têne nîşankirin û ne li pixelan, lê li tiştan têne dabeş kirin. Paşê em cîhana ku ji nesneyan pêk tê berfireh dikin li dema xwe û wergirtin "wêneya cîhanê" em wê têxin têketina tora din, ya ku bi wê re dixebite bi heman awayê ku qatên berê bi wêneya hestî re dixebitîn. Li cihê ku konturên nesneyan hatin ronîkirin, êdî wê "kontur"ên pêvajoyên ku didomin werin kifşkirin. Helwesta nisbî ya nesneyan di fezayê de dişibe têkiliya sedem-encamê ya pêvajoyên di demê de... Tiştekî wisa.

Tê texmînkirin, piştî vê yekê, divê pergal bikaribe pêvajoyan bi parçeyên wan nas bike (wek ku ew dikare wêneyan nas bike, tenê perçeyek wan hebe, an wekî nivîsandina berdewamiya metnê li gorî modelê), û di encamê de, wan di demê de hem pêş û hem jî paşde pêşbînî bikin, modela gava 5-ê bêsînor di her du alîyan de berfireh bikin. Di heman demê de, tê texmîn kirin ku bi ramanek pêvajoyên pêkhatî re, pergal dikare ji gelek pêvajoyên herêmî yên têkildar, pêvajoyên mezin, gerdûnî û di encamê de pêvajoyên nepenî, veşartî yên ku beşek yekgirtî ya gerdûnî ya naskirî ne nas bike. lê rasterast nayên dîtin.

Û ya dawîn: di pêşerojê de hebûna rewşek sabît a pergalê (ku tenê hêmanên girîng ên metrîkên Hilbert têne sererast kirin, bi şîroveyek belaş a nirxên mayî, ne-bingehîn) - ev tor e ku bikaribe "bifikire" rehetî?

Belê, ew e. heke ew wêneyek bûya ku tê de tenê du perçeyên negirêdayî hatin dayîn, gelo toreyek ku li ser hin nimûneyan hatî perwerde kirin dikare wêneyek bêkêmasî ya "hevgirtî" temam bike? Nimûne di vê rewşê de navberên demkî yên ji ezmûnê wekhev in, perçe dewletên heyî û diyarkirî ne. Encam: "çîrokek" domdar ku yek û ya din girêdide ...

Ji min re xuya dike ku ev ê jixwe bingehek pir girîng be ji bo ceribandinên din:

  • tevlêkirina kirinên xwe di "dîrokê" de, heke gengaz be/pêdivî be
  • pêşîniya qalibên sedem-encama "xwezayî" li ser emelên stokastîk ên nekontrolkirî (pirsgirêka rûletê)
  • hin guhertoyên meraqê, yanî. naskirina aktîf a qalibên bi tevgerê... hwd

PS Ez bi tevahî qebûl dikim ku min tenê çerx îcad kiriye, û mirovên zana ji demek dirêj ve van prensîban di pratîkê de bicîh dikin. 😉 Di vê rewşê de, ez ji we dipirsim ku hûn "pozê xwe bixin" nav geşedanên têkildar. Û ew ê bêkêmasî ecêb be heke bi hûrgulî pirsgirêkên bingehîn ên vê nêzîkatiyê ravekirinek hebe an jî rastdariyek hebe ku çima ew di prensîbê de naxebite.

PPS Ez haydar im ku nivîs xav e, û raman ji yekî ber bi yekî din ve diçe, lê min bi rastî dixwest ku van pirsan ji çend kesan bipirsim (beşa "pirsa ji pisporan re"), û ev yek dijwar e bêyî bi kêmanî hin pêşkêşî. Nivîsa berê (û min aniha ji nû ve dixwend, û min fêm kir ku têgihîştina wê pir dijwar e) ew gihîşt armanca xwe: Min çend nîqaşên ku ji bo min bi qîmet bûn wergirtin... Ez hêvî dikim ku vê carê jî kar bike! 😉

Source: www.habr.com

Add a comment