Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Ang mga teknolohiya ug modelo para sa atong umaabot nga computer vision system gimugna ug hinayhinay nga gipauswag ug sa lain-laing mga proyekto sa atong kompanya - sa Mail, Cloud, Search. Nahingkod sila sama sa maayong keso o cognac. Usa ka adlaw nakaamgo kami nga ang among mga neural network nagpakita ug maayo kaayo nga mga resulta sa pag-ila, ug kami nakahukom sa paghiusa kanila sa usa ka produkto nga b2b - Panan-awon - nga among gigamit karon sa among kaugalingon ug gitanyag kanimo nga gamiton.

Karon, ang teknolohiya sa among computer vision sa Mail.Ru Cloud Solutions nga plataporma malampuson nga nagtrabaho ug nagsulbad sa labi ka komplikado nga praktikal nga mga problema. Gibase kini sa daghang mga neural network nga gibansay sa among mga set sa datos ug espesyalista sa pagsulbad sa mga problema nga gigamit. Ang tanan nga mga serbisyo nagdagan sa among mga pasilidad sa server. Mahimo nimong i-integrate ang publiko nga Vision API sa imong mga aplikasyon, diin ang tanan nga mga kapabilidad sa serbisyo magamit. Ang API paspas - salamat sa mga server GPU, ang kasagaran nga oras sa pagtubag sulod sa among network mao ang 100 ms.

Lakaw ngadto sa iring, adunay usa ka detalyado nga istorya ug daghang mga pananglitan sa buhat sa Panan-awon.

Usa ka pananglitan sa usa ka serbisyo diin kami mismo naggamit sa gihisgutan nga mga teknolohiya sa pag-ila sa nawong mao ang Events. Usa sa mga sangkap niini mao ang Vision photo stand, nga among gi-install sa lainlaing mga komperensya. Kung moduol ka sa ingon nga baroganan sa litrato, pagkuha og litrato gamit ang built-in nga camera ug isulod ang imong email, makit-an dayon sa sistema taliwala sa daghang mga litrato nga nakuhaan ka sa mga photographer sa kawani sa komperensya, ug, kung gusto, ipadala kanimo ang nakit-an nga mga litrato pinaagi sa email. Ug wala kami maghisgot bahin sa mga gipasundayag nga mga litrato sa litrato-Ang Panan-awon nakaila kanimo bisan sa background sa daghang mga bisita. Siyempre, dili ang litrato nagbarug sa ilang mga kaugalingon nga giila, kini mga papan lamang sa matahum nga mga baroganan nga yano nga nagkuha og mga litrato sa mga bisita gamit ang ilang mga built-in nga camera ug nagpadala sa kasayuran sa mga server, diin ang tanan nga salamangka sa pag-ila mahitabo. Ug nakita namon labaw pa sa kausa kung unsa ka katingad-an ang pagkaepektibo sa teknolohiya bisan sa mga espesyalista sa pag-ila sa imahe. Sa ubos maghisgot kita bahin sa pipila ka mga pananglitan.

1. Ang among modelo sa Pag-ila sa Nawong

1.1. Neural network ug katulin sa pagproseso

Alang sa pag-ila, gigamit namon ang usa ka pagbag-o sa modelo sa neural network sa ResNet 101. Average nga Pooling sa katapusan gipulihan sa usa ka hingpit nga konektado nga layer, susama sa kung giunsa kini gihimo sa ArcFace. Bisan pa, ang gidak-on sa mga representasyon sa vector kay 128, dili 512. Ang among set sa pagbansay adunay mga 10 milyon nga litrato sa 273 ka tawo.

Ang modelo dali nga nagdagan salamat sa usa ka maampingon nga gipili nga arkitektura sa configuration sa server ug GPU computing. Nagkinahanglan kini gikan sa 100 ms aron makadawat usa ka tubag gikan sa API sa among mga internal nga network - kini naglakip sa pag-ila sa nawong (pag-ila sa nawong sa usa ka litrato), pag-ila ug pagbalik sa PersonID sa tubag sa API. Uban sa daghang mga volume sa umaabot nga data - mga litrato ug mga video - magkinahanglan kini og daghang oras aron mabalhin ang datos sa serbisyo ug makadawat usa ka tubag.

1.2. Pagtimbang-timbang sa pagka-epektibo sa modelo

Apan ang pagtino sa kaepektibo sa mga neural network usa ka dili klaro nga buluhaton. Ang kalidad sa ilang trabaho nagdepende sa kung unsang mga datos ang nagtakda sa mga modelo nga gibansay ug kung kini na-optimize alang sa pagtrabaho sa piho nga datos.

Nagsugod kami sa pagtimbang-timbang sa katukma sa among modelo sa popular nga LFW verification test, apan kini gamay ra ug yano. Human maabot ang 99,8% nga katukma, dili na kini magamit. Adunay usa ka maayo nga kompetisyon alang sa pag-evaluate sa mga modelo sa pag-ila - Megaface, diin anam-anam namong nakaabot sa 82% nga ranggo 1. Ang Megaface test naglangkob sa usa ka milyon nga mga litrato - mga distractor - ug ang modelo kinahanglan nga makahimo sa pag-ila pag-ayo sa pipila ka libo nga mga litrato sa mga celebrity gikan sa Facescrub dataset gikan sa mga distractor. Bisan pa, pagkahuman natangtang ang mga sayup sa pagsulay sa Megaface, nahibal-an namon nga sa na-clear nga bersyon nakab-ot namon ang katukma sa 98% nga ranggo 1 (ang mga litrato sa mga sikat sa kasagaran medyo piho). Busa, naghimo sila og bulag nga pagsulay sa pag-ila, susama sa Megaface, apan adunay mga litrato sa "ordinaryo" nga mga tawo. Dayon among gipauswag ang pagkatukma sa pag-ila sa among mga dataset ug mipadayon sa unahan. Dugang pa, naggamit kami usa ka pagsulay sa kalidad sa clustering nga naglangkob sa pipila ka libo nga mga litrato; gisundog niini ang pag-tag sa nawong sa panganod sa user. Sa kini nga kaso, ang mga pungpong mga grupo sa parehas nga mga indibidwal, usa ka grupo alang sa matag mailhan nga tawo. Among gisusi ang kalidad sa trabaho sa tinuod nga mga grupo (tinuod).

Siyempre, ang mga sayup sa pag-ila mahitabo sa bisan unsang modelo. Apan ang ingon nga mga sitwasyon kanunay nga masulbad pinaagi sa pag-ayo sa mga threshold alang sa piho nga mga kondisyon (alang sa tanan nga mga komperensya gigamit namon ang parehas nga mga sukaranan, apan, pananglitan, alang sa mga sistema sa pagkontrol sa pag-access kinahanglan namon nga dugangan pag-ayo ang mga sukaranan aron adunay gamay nga sayup nga mga positibo). Ang kadaghanan sa mga bisita sa komperensya giila sa husto sa among mga photo booth sa Panan-awon. Usahay adunay motan-aw sa giputol nga preview ug moingon, "Nasayop ang imong sistema, dili ako." Unya gi-open namo ang litrato sa kinatibuk-an, ug naa gyud ning bisita sa litrato, wala lang namo siya gikuhaan, apan usa ka tawo, ang tawo naa ra sa background sa blur zone. Dugang pa, ang neural network kanunay nga husto nga nakaila bisan kung ang bahin sa nawong dili makita, o ang tawo nagbarug sa profile, o bisan ang tunga nga pagliko. Ang sistema makaila sa usa ka tawo bisan kung ang nawong naa sa lugar sa optical distortion, ingnon ta, kung mag-shoot gamit ang usa ka lapad nga anggulo nga lente.

1.3. Mga pananglitan sa pagsulay sa lisud nga mga sitwasyon

Sa ubos mao ang mga pananglitan kung giunsa ang among neural network molihok. Ang mga litrato gisumite sa input, nga kinahanglan niyang label gamit ang PersonID - usa ka talagsaon nga identifier sa usa ka tawo. Kung ang duha o daghan pa nga mga imahe adunay parehas nga ID, nan, sumala sa mga modelo, kini nga mga litrato naghulagway sa parehas nga tawo.

Atong timan-an dayon nga sa pagsulay, kita adunay access sa lain-laing mga parameter ug modelo thresholds nga atong ma-configure aron makab-ot ang usa ka partikular nga resulta. Ang publiko nga API gi-optimize alang sa labing katumpakan sa kasagaran nga mga kaso.

Magsugod kita sa pinakasimple nga butang, nga adunay pag-ila sa nawong sa atubangan.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Aw, sayon ​​ra kaayo kadto. Himoon nato nga komplikado ang buluhaton, dugangan ang usa ka bungot ug pipila ka tuig.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Ang uban moingon nga kini dili usab lisud, tungod kay sa duha ka mga kaso ang tibuok nawong makita, ug daghang impormasyon mahitungod sa nawong anaa sa algorithm. Okay, atong himoon nga profile si Tom Hardy. Kini nga problema labi ka labi ka komplikado, ug kami naggugol og daghang paningkamot aron malampuson nga masulbad kini samtang nagpadayon ang usa ka gamay nga rate sa sayup: gipili namon ang usa ka set sa pagbansay, gihunahuna pinaagi sa arkitektura sa neural network, gipauswag ang mga function sa pagkawala ug gipauswag ang pre-processing. sa mga litrato.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Atong butangan siya ug purong:

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Pinaagi sa dalan, kini usa ka pananglitan sa usa ka labi ka lisud nga kahimtang, tungod kay ang nawong gitagoan pag-ayo, ug sa ubos nga litrato adunay usa usab ka lawom nga anino nga nagtago sa mga mata. Sa tinuud nga kinabuhi, ang mga tawo kanunay nga nagbag-o sa ilang hitsura sa tabang sa itom nga baso. Buhaton nato ang sama ni Tom.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Okay, atong sulayan ang paglabay sa mga litrato gikan sa lain-laing mga edad, ug niining higayona mag-eksperimento kita sa laing aktor. Atong kuhaon ang usa ka labi ka komplikado nga pananglitan, diin ang mga pagbag-o nga may kalabutan sa edad labi nga gipahayag. Dili layo ang kahimtang; kini mahitabo kanunay kung kinahanglan nimo itandi ang litrato sa pasaporte sa nawong sa nagdala. Pagkahuman, ang una nga litrato idugang sa usa ka pasaporte kung ang tag-iya 20 ka tuig ang edad, ug sa edad nga 45 ang usa ka tawo mahimo’g mabag-o pag-ayo:

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Sa imong hunahuna nga ang panguna nga espesyalista sa imposible nga mga misyon wala kaayo nagbag-o sa edad? Sa akong hunahuna nga bisan ang pipila ka mga tawo maghiusa sa ibabaw ug sa ubos nga mga litrato, ang batang lalaki nausab kaayo sa daghang mga tuig.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Ang mga neural network makasugat og mga kausaban sa panagway nga mas kanunay. Pananglitan, usahay ang mga babaye makahimo pag-ayo sa ilang imahe sa tabang sa mga kosmetiko:

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Karon atong pakomplikado ang buluhaton: ingnon ta ang lainlaing bahin sa nawong gitabonan sa lainlaing mga litrato. Sa maong mga kaso, ang algorithm dili makakomparar sa tibuok nga mga sample. Bisan pa, ang Panan-awon nagdumala sa mga sitwasyon nga sama niini nga maayo.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Pinaagi sa dalan, mahimong adunay daghang mga nawong sa usa ka litrato; pananglitan, labaw sa 100 ka mga tawo ang mahimong mohaum sa usa ka kinatibuk-ang litrato sa usa ka hall. Kini usa ka lisud nga kahimtang alang sa mga neural network, tungod kay daghang mga nawong ang mahimong lainlain ang suga, ang uban wala sa pokus. Bisan pa, kung ang litrato gikuha nga adunay igo nga resolusyon ug kalidad (labing menos 75 ka mga pixel kada kwadrado nga nagtabon sa nawong), ang Panan-awon makahimo sa pag-ila ug pag-ila niini.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Ang pagkatalagsaon sa mga litrato sa pagreport ug mga imahe gikan sa mga surveillance camera mao nga ang mga tawo kanunay nga hanap tungod kay sila wala sa focus o naglihok nianang higayuna:

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Dugang pa, ang intensity sa suga mahimong magkalainlain gikan sa usa ka imahe hangtod sa usa ka imahe. Kini, usab, kanunay nga mahimong usa ka babag; daghang mga algorithm adunay daghang kalisud sa husto nga pagproseso sa mga imahe nga labi ka ngitngit ug labi ka kahayag, wala pay labot ang tukma nga pagpares niini. Pahinumdoman ko ikaw nga aron makab-ot kini nga resulta kinahanglan nimo nga i-configure ang mga threshold sa usa ka piho nga paagi; kini nga bahin dili pa magamit sa publiko. Gigamit namon ang parehas nga neural network alang sa tanan nga mga kliyente; kini adunay mga sukaranan nga angay alang sa kadaghanan nga praktikal nga mga buluhaton.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Bag-ohay lang mi nagpagawas ug bag-ong bersyon sa modelo nga nag-ila sa mga nawong sa Asya nga adunay taas nga katukma. Kini usa ka dako nga problema kaniadto, nga gitawag pa gani nga "pagkat-on sa makina" (o "neural network") nga rasismo. Ang European ug American neural network nakaila sa mga Caucasian nga mga nawong nga maayo, apan sa mga Mongoloid ug Negroid nga nag-atubang ang sitwasyon mas grabe pa. Lagmit, sa China sukwahi gayod ang kahimtang. Mahitungod kini sa mga set sa datos sa pagbansay nga nagpakita sa mga dominanteng tipo sa mga tawo sa usa ka partikular nga nasud. Bisan pa, ang kahimtang nagbag-o; karon kini nga problema dili kaayo grabe. Ang panan-awon walay problema sa mga tawo nga lainlaig rasa.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Ang pag-ila sa nawong usa lang sa daghang aplikasyon sa atong teknolohiya; Ang panan-awon mahimong mabansay sa pag-ila sa bisan unsa. Pananglitan, ang mga plaka sa lisensya, lakip ang mga kondisyon nga lisud alang sa mga algorithm: sa hait nga mga anggulo, hugaw ug lisud nga basahon ang mga plaka sa lisensya.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

2. Praktikal nga mga kaso sa paggamit

2.1. Pisikal nga kontrol sa pag-access: kung ang duha ka tawo mogamit sa parehas nga pass

Sa tabang sa Panan-awon, mahimo nimong ipatuman ang mga sistema alang sa pagrekord sa pag-abot ug pagbiya sa mga empleyado. Ang tradisyonal nga sistema nga gibase sa mga electronic pass adunay klaro nga mga disbentaha, pananglitan, mahimo nimong ipasa ang duha ka tawo gamit ang usa ka badge. Kung ang access control system (ACS) gidugangan sa Panan-awon, kini matinud-anon nga magrekord kung kinsa ang mianhi/mibiya ug kanus-a.

2.2. Pagsubay sa oras

Kini nga kaso sa paggamit sa Panan-awon suod nga nalangkit sa nauna. Kung imong dugangan ang sistema sa pag-access sa among serbisyo sa pag-ila sa nawong, dili lamang kini makit-an ang mga paglapas sa pagkontrol sa pag-access, apan aron marehistro usab ang aktwal nga presensya sa mga empleyado sa bilding o pasilidad. Sa laing pagkasulti, ang Panan-awon makatabang kanimo nga matinud-anon nga maghunahuna kung kinsa ang miadto sa trabaho ug mibiya sa unsang orasa, ug kinsa ang hingpit nga nilaktaw sa trabaho, bisan kung ang iyang mga kauban nagtabon alang kaniya atubangan sa iyang mga labaw.

2.3. Video Analytics: Pagsubay ug Seguridad sa mga Tawo

Pinaagi sa pagsubay sa mga tawo gamit ang Panan-awon, tukma nimong masusi ang tinuod nga trapiko sa mga shopping area, estasyon sa tren, mga agianan, kadalanan ug daghan pang publikong lugar. Ang among pagsubay mahimo usab nga dako nga tabang sa pagkontrol sa pag-access, pananglitan, sa usa ka bodega o uban pang hinungdanon nga lugar sa opisina. Ug siyempre, ang pagsubay sa mga tawo ug mga nawong makatabang sa pagsulbad sa mga problema sa seguridad. Nasakpan ang usa nga nangawat sa imong tindahan? Idugang ang iyang PersonID, nga gibalik sa Panan-awon, sa blacklist sa imong video analytics software, ug sa sunod higayon nga ang sistema mopahibalo dayon sa seguridad kon kini nga matang makita pag-usab.

2.4. Sa pamatigayon

Ang retail ug lain-laing mga negosyo sa serbisyo interesado sa pag-ila sa pila. Sa tabang sa Panan-awon, mahimo nimong mailhan nga dili kini usa ka random nga panon sa mga tawo, apan usa ka pila, ug mahibal-an ang gitas-on niini. Ug dayon gipahibalo sa sistema ang mga nagdumala bahin sa usa ka pila aron mahibal-an nila ang kahimtang: kung adunay pagdagsa sa mga bisita ug kinahanglan nga tawagan ang dugang nga mga trabahante, o adunay usa nga naghinayhinay sa ilang mga katungdanan sa trabaho.

Ang laing makapaikag nga buluhaton mao ang pagbulag sa mga empleyado sa kompanya sa hawanan gikan sa mga bisita. Kasagaran, ang sistema gibansay sa pagbulag sa mga butang nga nagsul-ob sa piho nga mga sinina (dress code) o adunay lahi nga bahin (branded scarf, badge sa dughan, ug uban pa). Makatabang kini sa mas tukma nga pagtimbang-timbang sa pagtambong (aron ang mga empleyado dili "magpataas" sa estadistika sa mga tawo sa hawanan pinaagi sa ilang presensya lamang).

Gamit ang pag-ila sa nawong, mahimo usab nimo nga susihon ang imong mamiminaw: kung unsa ang pagkamaunongon sa mga bisita, nga mao, pila ka mga tawo ang mibalik sa imong establisemento ug kung unsang kadaghanon. Kalkulahin kung pila ka talagsaon nga mga bisita ang moabut kanimo matag bulan. Aron ma-optimize ang mga gasto sa atraksyon ug pagpadayon, mahimo usab nimo mahibal-an ang pagbag-o sa trapiko depende sa adlaw sa semana ug bisan sa oras sa adlaw.

Ang mga franchisor ug mga kompanya sa kadena mahimong mag-order sa usa ka pagsusi base sa mga litrato sa kalidad sa pagmarka sa lainlaing mga outlet sa tingi: ang presensya sa mga logo, karatula, poster, banner, ug uban pa.

2.5. Pinaagi sa transportasyon

Ang laing pananglitan sa pagsiguro sa seguridad gamit ang video analytics mao ang pag-ila sa mga butang nga gibiyaan sa mga hawanan sa mga tugpahanan o mga estasyon sa tren. Ang panan-awon mahimong mabansay sa pag-ila sa mga butang sa gatusan ka mga klase: mga piraso sa muwebles, bag, maleta, payong, lain-laing matang sa sinina, botelya, ug uban pa. Kung ang imong sistema sa pag-analisa sa video nakamatikod sa usa ka butang nga wala’y tag-iya ug nahibal-an kini gamit ang Panan-awon, nagpadala kini usa ka signal sa serbisyo sa seguridad. Ang usa ka susama nga buluhaton nalangkit sa awtomatik nga pag-ila sa dili kasagaran nga mga sitwasyon sa publikong mga dapit: adunay mibati nga masakiton, o adunay nanigarilyo sa sayop nga dapit, o ang usa ka tawo nahulog sa riles, ug uban pa - kining tanan nga mga sumbanan mahimong mailhan sa mga sistema sa video analytics pinaagi sa Vision API.

2.6. Pag-agos sa dokumento

Ang laing makapaikag nga umaabot nga aplikasyon sa Panan-awon nga atong gipalambo karon mao ang pag-ila sa dokumento ug ang ilang awtomatik nga pag-parse sa mga database. Imbis nga mano-mano ang pagsulod (o mas grabe pa, pagsulod) sa walay katapusan nga mga serye, mga numero, mga petsa sa isyu, mga numero sa account, mga detalye sa bangko, mga petsa ug mga lugar nga natawhan ug uban pang mga pormal nga datos, mahimo nimong i-scan ang mga dokumento ug awtomatiko nga ipadala kini sa usa ka luwas nga channel pinaagi sa API ngadto sa panganod, diin ang sistema makaila niini nga mga dokumento sa langaw, mag-parse kanila ug ibalik ang tubag uban ang datos sa gikinahanglang format para sa awtomatik nga pagsulod sa database. Karon ang Panan-awon nahibal-an na kung unsaon pagklasipikar ang mga dokumento (lakip ang PDF) - nagpalahi sa mga pasaporte, SNILS, TIN, birth certificate, sertipiko sa kaminyoon ug uban pa.

Siyempre, ang neural network dili makahimo sa pagdumala sa tanan niini nga mga sitwasyon sa gawas sa kahon. Sa matag kaso, usa ka bag-ong modelo ang gitukod alang sa usa ka piho nga kostumer, daghang mga hinungdan, mga nuances ug mga kinahanglanon ang gikonsiderar, gipili ang mga set sa datos, ug gihimo ang mga pag-uli sa pagbansay, pagsulay, ug pag-configure.

3. Skema sa operasyon sa API

Ang "entrance gate" sa Panan-awon para sa mga tiggamit mao ang REST API. Makadawat kini og mga litrato, mga video file ug mga sibya gikan sa mga network camera (RTSP streams) isip input.

Aron magamit ang Panan-awon, kinahanglan nimo sa sa serbisyo sa Mail.ru Cloud Solutions ug makadawat mga token sa pag-access (client_id + client_secret). Ang pag-authenticate sa user gihimo gamit ang OAuth protocol. Ang gigikanan nga datos sa mga lawas sa mga hangyo sa POST gipadala sa API. Ug agig tubag, ang kliyente nakadawat gikan sa API usa ka resulta sa pag-ila sa JSON nga format, ug ang tubag nahan-ay: kini adunay kasayuran bahin sa nakit-an nga mga butang ug ang ilang mga koordinasyon.

Uban sa usa ka bungot, itom nga baso ug sa profile: lisud nga mga sitwasyon alang sa computer vision

Sampol nga tubag

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

Ang tubag adunay usa ka makapaikag nga parameter nga katingad-an - kini ang kondisyon nga "kabugnaw" sa usa ka nawong sa usa ka litrato, uban ang tabang niini gipili namon ang labing kaayo nga shot sa usa ka nawong gikan sa pagkasunod-sunod. Gibansay namo ang usa ka neural network aron matagna ang posibilidad nga ang usa ka litrato magustuhan sa mga social network. Kon mas maayo ang kalidad sa litrato ug mas mapahiyumon ang nawong, mas dako ang katahom.

Ang API Vision naggamit og konsepto nga gitawag og space. Kini usa ka himan alang sa paghimo sa lainlaing mga hugpong sa mga nawong. Ang mga pananglitan sa mga luna mao ang itom ug puti nga mga lista, mga lista sa mga bisita, empleyado, kliyente, ug uban pa. Alang sa matag timaan sa Panan-awon, makahimo ka og hangtod sa 10 ka mga luna, ang matag luna mahimong adunay hangtod sa 50 ka libo ka PersonID, nga mao, hangtod sa 500 ka libo. kada token. Dugang pa, ang gidaghanon sa mga token matag account dili limitado.

Karon ang API nagsuporta sa mosunod nga mga pamaagi sa pag-ila ug pag-ila:

  • Pag-ila / Itakda - pag-ila ug pag-ila sa mga nawong. Awtomatikong naghatag ug PersonID sa matag talagsaon nga tawo, ibalik ang PersonID ug mga koordinasyon sa nakit-an nga mga tawo.
  • Pagtangtang - pagtangtang sa usa ka piho nga PersonID gikan sa database sa tawo.
  • Truncate - gitangtang ang tibuuk nga wanang gikan sa PersonID, mapuslanon kung gigamit kini ingon usa ka wanang sa pagsulay ug kinahanglan nimo nga i-reset ang database alang sa produksiyon.
  • Detect - pagkakita sa mga butang, talan-awon, plaka sa lisensya, landmark, pila, ug uban pa. Gibalik ang klase sa nakit-an nga mga butang ug ang ilang mga koordinasyon
  • Detect alang sa mga dokumento - nakamatikod sa piho nga mga matang sa mga dokumento sa Russian Federation (nag-ila sa pasaporte, SNILS, numero sa pag-ila sa buhis, ug uban pa).

Sa dili madugay mahuman na usab namo ang pagtrabaho sa mga pamaagi alang sa OCR, pagtino sa gender, edad ug emosyon, ingon man pagsulbad sa mga problema sa pagpamaligya, nga mao, alang sa awtomatik nga pagkontrol sa pagpakita sa mga butang sa mga tindahan. Makita nimo ang kompleto nga dokumentasyon sa API dinhi: https://mcs.mail.ru/help/vision-api

4. Panapos

Karon, pinaagi sa publiko nga API, mahimo nimong ma-access ang pag-ila sa nawong sa mga litrato ug video; ang pag-ila sa lainlaing mga butang, mga plaka sa lisensya, mga landmark, mga dokumento ug tibuuk nga mga eksena gisuportahan. Mga sitwasyon sa aplikasyon - ang dagat. Dali, sulayi ang among serbisyo, itakda kini nga labing lisud nga mga buluhaton. Ang una nga 5000 nga mga transaksyon libre. Tingali kini ang "nawala nga sangkap" alang sa imong mga proyekto.

Mahimo nimong ma-access dayon ang API sa pagrehistro ug koneksyon. Panan-awon. Ang tanan nga mga tiggamit sa Habra nakadawat usa ka code nga pang-promosyon alang sa dugang nga mga transaksyon. Palihug isulat kanako ang email address nga imong gigamit sa pagparehistro sa imong account!

Source: www.habr.com

Idugang sa usa ka comment