Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Chaidh teicneòlasan agus modalan airson ar siostam lèirsinn coimpiutair san àm ri teachd a chruthachadh agus a leasachadh mean air mhean agus ann am pròiseactan eadar-dhealaichte den chompanaidh againn - ann am Mail, Cloud, Search. Dh’ fhàs iad mar chàise math no cognac. Aon latha thuig sinn gu bheil na lìonraidhean neural againn a’ nochdadh deagh thoraidhean ann an aithne, agus chuir sinn romhainn an cur còmhla ann an aon toradh b2b - Vision - a bhios sinn a-nis gar cleachdadh fhèin agus a’ tabhann dhut a chleachdadh.

An-diugh, tha an teicneòlas lèirsinn coimpiutair againn air àrd-ùrlar Mail.Ru Cloud Solutions ag obair gu soirbheachail agus a’ fuasgladh dhuilgheadasan practaigeach fìor iom-fhillte. Tha e stèidhichte air grunn lìonraidhean neural a tha air an trèanadh air na seataichean dàta againn agus a tha gu sònraichte a’ fuasgladh dhuilgheadasan gnìomhaichte. Bidh na seirbheisean uile a’ ruith air na goireasan frithealaiche againn. Faodaidh tu an API Vision poblach fhilleadh a-steach do na tagraidhean agad, tro bheil comasan na seirbheis rim faighinn. Tha an API luath - le taing dha GPUs an fhrithealaiche, is e an ùine freagairt cuibheasach taobh a-staigh ar lìonra 100 ms.

Rach don chat, tha sgeulachd mhionaideach ann agus mòran eisimpleirean de dh’ obair Vision.

Is e eisimpleir de sheirbheis anns a bheil sinn fhìn a’ cleachdadh nan teicneòlasan aithneachaidh aghaidh a chaidh ainmeachadh tachartasan. Is e aon de na pàirtean aige ionadan dhealbhan Vision, a bhios sinn a’ stàladh aig diofar cho-labhairtean. Ma thig thu faisg air a leithid de sheasamh dhealbhan, gabh dealbh leis a’ chamara togte agus cuir a-steach am post-d agad, lorgaidh an siostam sa bhad am measg an t-sreath de dhealbhan an fheadhainn anns an deach do ghlacadh le luchd-togail dhealbhan na co-labhairt, agus, ma thogras tu, cuiridh e na dealbhan a chaidh a lorg thugad air post-d. Agus chan eil sinn a 'bruidhinn mu dheidhinn seallaidhean dhealbhan àrd-ùrlair - tha Vision gad aithneachadh eadhon air a' chùl ann an sluagh de luchd-tadhail. Gu dearbh, chan e na standan dhealbhan fhèin a tha aithnichte, is e dìreach clàran ann an ionadan brèagha a tha dìreach a ’togail dhealbhan de aoighean leis na camarathan togte aca agus a’ sgaoileadh fiosrachadh gu na frithealaichean, far a bheil an draoidheachd aithneachaidh gu lèir a ’tachairt. Agus tha sinn air barrachd air aon uair fhaicinn cho iongantach sa tha èifeachdas an teicneòlais eadhon am measg eòlaichean aithne ìomhaigh. Gu h-ìosal bruidhnidh sinn mu chuid de na h-eisimpleirean.

1. Ar Modail Aithneachaidh Aghaidh

1.1. Lìonra neural agus astar giollachd

Airson aithneachadh, bidh sinn a’ cleachdadh mion-atharrachadh air modal lìonra neural ResNet 101. Tha còmhdach cuibheasach ceangailte aig an deireadh air a chuir an àite còmhdach làn-cheangailte, coltach ri mar a thèid a dhèanamh ann an ArcFace. Ach, is e meud nan riochdachaidhean vectar 128, chan e 512. Anns an t-seata trèanaidh againn tha timcheall air 10 millean dealbh de 273 neach.

Bidh am modail a’ ruith gu math luath le taing do ailtireachd rèiteachaidh frithealaiche a chaidh a thaghadh gu faiceallach agus coimpiutaireachd GPU. Bheir e bho 100 ms airson freagairt fhaighinn bhon API air na lìonraidhean a-staigh againn - tha seo a’ toirt a-steach lorg aghaidh (lorg aghaidh ann an dealbh), ag aithneachadh agus a’ tilleadh PersonID ann am freagairt API. Le meud mòr de dhàta a’ tighinn a-steach - dealbhan agus bhideothan - bheir e tòrr a bharrachd ùine airson an dàta a ghluasad chun t-seirbheis agus gus freagairt fhaighinn.

1.2. A 'measadh èifeachdas a' mhodail

Ach is e obair gu math teagmhach a th’ ann a bhith a’ dearbhadh èifeachdas lìonraidhean neural. Tha càileachd an cuid obrach an urra ri dè na seataichean dàta air an deach na modailean a thrèanadh agus an deach an leasachadh as fheàrr airson obrachadh le dàta sònraichte.

Thòisich sinn a’ measadh cruinneas ar modail leis an deuchainn dearbhaidh LFW mòr-chòrdte, ach tha e ro bheag agus sìmplidh. Às deidh dha cruinneas 99,8% a ruighinn, chan eil e feumail tuilleadh. Tha farpais math ann airson modalan aithneachaidh a mheasadh - Megaface, air an do ràinig sinn mean air mhean 82% ìre 1. Tha an deuchainn Megaface air a dhèanamh suas de mhillean dealbh - luchd-tarraing - agus bu chòir gum biodh am modail comasach air eadar-dhealachadh math a dhèanamh air grunn mhìltean de dhealbhan de dhaoine ainmeil bhon Facescrub dàta bho luchd-tarraing aire. Ach, às deidh dhuinn deuchainn mhearachdan Megaface a ghlanadh, lorg sinn leis an dreach a chaidh fhuadach gu bheil sinn a’ faighinn cruinneas de 98% aig ìre 1 (tha dealbhan de dhaoine ainmeil gu math sònraichte sa chumantas). Mar sin, chruthaich iad deuchainn aithneachaidh air leth, coltach ri Megaface, ach le dealbhan de dhaoine “àbhaisteach”. An uairsin leasaich sinn cruinneas aithneachaidh air na stòran-dàta againn agus chaidh sinn fada air adhart. A bharrachd air an sin, bidh sinn a’ cleachdadh deuchainn càileachd cruinneachadh anns a bheil grunn mhìltean de dhealbhan; bidh e coltach ri tagadh aghaidh ann an sgòth an neach-cleachdaidh. Anns a 'chùis seo, tha cruinneachaidhean nan buidhnean de dhaoine fa leth, aon bhuidheann airson gach neach aithnichte. Rinn sinn sgrùdadh air càileachd na h-obrach air buidhnean fìor (fìor).

Gu dearbh, bidh mearachdan aithneachaidh a’ tachairt le modail sam bith. Ach bidh suidheachaidhean mar seo gu tric air am fuasgladh le bhith a’ gleusadh na stairsnich airson suidheachaidhean sònraichte (airson a h-uile co-labhairt bidh sinn a’ cleachdadh na h-aon stairsnich, ach, mar eisimpleir, airson siostaman smachd ruigsinneachd feumaidh sinn na stairsnich àrdachadh gu mòr gus am bi nas lugha de rudan meallta ann). Bha a’ mhòr-chuid de luchd-tadhail co-labhairt air an aithneachadh gu ceart leis na bothain dhealbhan Vision againn. Aig amannan bhiodh cuideigin a’ coimhead air an ro-shealladh bàrr agus ag ràdh, “Rinn an siostam agad mearachd, cha b’ e mise a bh ’ann.” An uairsin dh'fhosgail sinn an dealbh gu h-iomlan, agus thionndaidh e a-mach gu robh an neach-tadhail seo san dealbh, a-mhàin nach robh sinn a 'togail dhealbhan dheth, ach cuideigin eile, bha an duine dìreach a' tachairt air a 'chùl anns an raon blur. A bharrachd air an sin, bidh an lìonra neural gu tric ag aithneachadh gu ceart eadhon nuair nach eil pàirt den aghaidh ri fhaicinn, no gu bheil an neach na sheasamh ann am pròifil, no eadhon leth-thionndadh. Faodaidh an siostam aithneachadh neach eadhon ged a tha an aghaidh anns an raon de shaobhadh optigeach, can, nuair a bhios tu a ’losgadh le lionsa ceàrn farsaing.

1.3. Eisimpleirean de dheuchainnean ann an suidheachaidhean duilich

Gu h-ìosal tha eisimpleirean de mar a tha an lìonra neural againn ag obair. Tha dealbhan air an cur a-steach don chuir a-steach, a dh’ fheumas i leubail a ’cleachdadh PersonID - aithnichear sònraichte neach. Ma tha an aon ID aig dà ìomhaigh no barrachd, an uairsin, a rèir nam modalan, tha na dealbhan sin a’ sealltainn an aon neach.

Bheir sinn fa-near sa bhad, nuair a bhios sinn a’ dèanamh deuchainn, gu bheil cothrom againn air diofar pharaimearan agus stairsnich mhodail as urrainn dhuinn a rèiteachadh gus toradh sònraichte a choileanadh. Tha an API poblach air a mheudachadh airson an cruinneas as àirde ann an cùisean cumanta.

Feuch an tòisich sinn leis an rud as sìmplidh, le aithne aghaidh aghaidh.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Uill, bha sin ro fhurasta. Dèanamaid an obair iom-fhillte, cuir feusag agus dòrlach de bhliadhnaichean.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Bidh cuid ag ràdh nach robh seo cuideachd ro dhoirbh, oir anns gach cùis tha an aghaidh gu lèir ri fhaicinn, agus tha tòrr fiosrachaidh mun aghaidh ri fhaighinn don algairim. Ceart gu leòr, tionndaidhidh sinn Tom Hardy gu ìomhaigh. Tha an duilgheadas seo tòrr nas iom-fhillte, agus chuir sinn seachad tòrr oidhirp gus a fhuasgladh gu soirbheachail fhad ‘s a bha sinn a’ cumail ìre mearachd ìosal: thagh sinn seata trèanaidh, a ’smaoineachadh tro ailtireachd an lìonra neural, thug sinn urram do na gnìomhan call agus leasaich sinn an ro-ghiollachd. de dhealbhan.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Cuiridh sinn ceann-aodach air:

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Air an t-slighe, tha seo na eisimpleir de shuidheachadh gu math duilich, leis gu bheil an aghaidh gu math falaichte, agus anns an dealbh gu h-ìosal tha sgàil dhomhainn cuideachd a ’falach nan sùilean. Ann am fìor bheatha, bidh daoine gu tric ag atharrachadh an coltas le cuideachadh bho speuclairean dorcha. Dèanamaid an aon rud ri Tom.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Ceart gu leòr, feuchaidh sinn ri dealbhan de dhiofar aoisean a thilgeil a-steach, agus an turas seo feuchaidh sinn ri cleasaiche eile. Gabhamaid eisimpleir tòrr nas iom-fhillte, far a bheil atharrachaidhean co-cheangailte ri aois gu sònraichte follaiseach. Chan eil an suidheachadh fada; bidh e a ’tachairt gu math tric nuair a dh’ fheumas tu coimeas a dhèanamh eadar an dealbh sa chead-siubhail agus aghaidh an neach-giùlain. Às deidh na h-uile, thèid a 'chiad dealbh a chur ri cead-siubhail nuair a tha an sealbhadair 20 bliadhna a dh'aois, agus le aois 45 faodaidh neach atharrachadh gu mòr:

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

A bheil thu a 'smaoineachadh nach eil am prìomh eòlaiche air miseanan do-dhèanta air atharrachadh mòran le aois? Tha mi a’ smaoineachadh gun cuireadh eadhon beagan dhaoine na dealbhan gu h-àrd is gu h-ìosal còmhla, tha am balach air atharrachadh cho mòr thar nam bliadhnaichean.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Bidh lìonraidhean neural a’ tighinn tarsainn air atharrachaidhean ann an coltas mòran nas trice. Mar eisimpleir, uaireannan faodaidh boireannaich an ìomhaigh aca atharrachadh gu mòr le cuideachadh bho stuthan maise:

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

A-nis dèanamaid an obair nas iom-fhillte: is dòcha gu bheil diofar phàirtean den aghaidh còmhdaichte ann an diofar dhealbhan. Ann an leithid de chùisean, chan urrainn don algairim coimeas a dhèanamh eadar sampallan slàn. Ach, bidh Vision a’ làimhseachadh shuidheachaidhean mar seo gu math.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Air an t-slighe, faodaidh tòrr aghaidhean a bhith ann an dealbh; mar eisimpleir, faodaidh còrr is 100 neach a bhith a 'freagairt ann an dealbh coitcheann de thalla. Is e suidheachadh duilich a tha seo airson lìonraidhean neural, leis gum faod mòran aghaidhean a bhith air an lasadh ann an dòigh eadar-dhealaichte, cuid a-mach à fòcas. Ach, ma thèid an dealbh a thogail le rùn agus càileachd gu leòr (co-dhiù 75 piogsail gach ceàrnag a’ còmhdach an aghaidh), bidh e comasach dha Vision a lorg agus aithneachadh.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Is e cho sònraichte ‘s a tha dealbhan aithris agus ìomhaighean bho chamarathan sgrùdaidh gu bheil daoine gu tric doilleir leis gu robh iad a-mach à fòcas no gu robh iad a’ gluasad aig an àm sin:

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Cuideachd, faodaidh an dian solais atharrachadh gu mòr bho ìomhaigh gu ìomhaigh. Bidh seo, cuideachd, gu tric na chnap-starra; tha duilgheadas mòr aig mòran algorithms a bhith a’ làimhseachadh ìomhaighean a tha ro dhorcha agus ro aotrom, gun luaidh air a bhith gan maidseadh gu ceart. Leig leam do chuimhneachadh gum feum thu na stairsnich a rèiteachadh ann an dòigh shònraichte gus an toradh seo a choileanadh; chan eil am feart seo ri fhaighinn gu poblach fhathast. Bidh sinn a’ cleachdadh an aon lìonra neural airson a h-uile neach-dèiligidh; tha stairsnich aige a tha iomchaidh airson a’ mhòr-chuid de ghnìomhan practaigeach.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

O chionn ghoirid chuir sinn a-mach dreach ùr den mhodail a tha ag aithneachadh aghaidhean Àisianach le fìor chruinneas. B’ àbhaist dha seo a bhith na dhuilgheadas mòr, ris an canar eadhon gràin-cinnidh “ionnsachadh inneal” (no “lìonra neural”). Dh’ aithnich lìonraidhean neural Eòrpach is Ameireagaidh gu math aghaidhean Caucasian, ach le aghaidhean Mongoloid agus Negroid bha an suidheachadh tòrr na bu mhiosa. Is dòcha, ann an Sìona bha an suidheachadh dìreach a chaochladh. Tha e mu dheidhinn seataichean dàta trèanaidh a tha a’ nochdadh na prìomh sheòrsan dhaoine ann an dùthaich shònraichte. Ach, tha an suidheachadh ag atharrachadh; an-diugh chan eil an duilgheadas seo cho gann. Chan eil duilgheadas sam bith aig lèirsinn le daoine de dhiofar chinnidhean.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Is e aithne aghaidh dìreach aon den iomadh cleachdadh a th’ aig ar teicneòlas; Faodar lèirsinn a thrèanadh gus rud sam bith aithneachadh. Mar eisimpleir, lannan ceadachd, a’ gabhail a-steach suidheachaidhean duilich airson algoirmean: aig ceàrnan biorach, lannan cead salach agus duilich a leughadh.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

2. Cùisean cleachdaidh practaigeach

2.1. Smachd ruigsinneachd corporra: nuair a bhios dithis a’ cleachdadh an aon bhealaich

Le cuideachadh bho Vision, faodaidh tu siostaman a chuir an gnìomh airson a bhith a’ clàradh teachd agus falbh luchd-obrach. Tha eas-bhuannachdan follaiseach aig an t-siostam traidiseanta stèidhichte air pasan dealanach, mar eisimpleir, faodaidh tu a dhol seachad air dithis a’ cleachdadh aon bhràiste. Ma tha Vision a’ cur ris an t-siostam smachd ruigsinneachd (ACS), bidh e gu h-onarach a’ clàradh cò a thàinig/a dh’fhalbh agus cuin.

2.2. A 'cumail sùil air ùine

Tha dlùth cheangal aig a’ chùis cleachdaidh Vision seo ris an fhear roimhe. Ma chuireas tu ris an t-siostam ruigsinneachd leis an t-seirbheis aithne aghaidh againn, bidh e comasach chan e a-mhàin briseadh smachd ruigsinneachd a lorg, ach cuideachd fìor làthaireachd luchd-obrach san togalach no san goireas a chlàradh. Ann am faclan eile, cuidichidh Vision thu gu h-onarach le bhith a’ toirt aire do cò a thàinig a dh’ obair agus a dh’fhalbh aig an àm, agus cò a leum gu obair gu tur, eadhon ged a bhiodh a cho-obraichean a’ còmhdach air a shon air beulaibh an àrd-oifigearan aige.

2.3. Mion-sgrùdadh Bhidio: Lorg Daoine agus Tèarainteachd

Le bhith a’ cumail sùil air daoine a’ cleachdadh Vision, faodaidh tu measadh ceart a dhèanamh air fìor thrafaig raointean bhùthan, stèiseanan rèile, trannsaichean, sràidean agus mòran àiteachan poblach eile. Faodaidh ar tracadh cuideachd a bhith na chuideachadh mòr ann a bhith a’ cumail smachd air ruigsinneachd, mar eisimpleir, gu taigh-bathair no togalaichean oifis cudromach eile. Agus gu dearbh, bidh cumail sùil air daoine agus aghaidhean a’ cuideachadh le fuasgladh fhaighinn air duilgheadasan tèarainteachd. An do ghlac thu cuideigin a ghoid bhon bhùth agad? Cuir a PersonID, a chaidh a thilleadh le Vision, ri liosta dhubh a’ bhathar-bog anailis bhidio agad, agus an ath thuras bheir an siostam fios sa bhad don tèarainteachd ma nochdas an seòrsa seo a-rithist.

2.4. Ann am malairt

Tha ùidh aig gnìomhachasan reic agus diofar sheirbheisean ann an aithneachadh ciudha. Le cuideachadh bho Vision, faodaidh tu aithneachadh nach e sluagh air thuaiream a tha seo, ach ciudha, agus co-dhùin a fhad. Agus an uairsin bidh an siostam ag innse don fheadhainn a tha os cionn ciudha gus an urrainn dhaibh an suidheachadh obrachadh a-mach: an dàrna cuid tha luchd-tadhail a’ tighinn a-steach agus feumar luchd-obrach a bharrachd a ghairm, no tha cuideigin a’ slaodadh nan dleastanasan obrach aca.

Is e obair inntinneach eile luchd-obrach companaidh san talla a sgaradh bho luchd-tadhail. Mar as trice, bidh an siostam air a thrèanadh gus rudan a sgaradh le aodach sònraichte (còd èideadh) no le feart sònraichte (sgarfa le suaicheantas, bràiste air a’ bhroilleach, agus mar sin air adhart). Bidh seo a’ cuideachadh le bhith a’ measadh làthaireachd nas mionaidiche (gus nach bi luchd-obrach “ag àrdachadh” staitistig dhaoine san talla leis an làthaireachd a-mhàin).

A’ cleachdadh aithne aghaidh, faodaidh tu cuideachd do luchd-èisteachd a mheasadh: dè an dìlseachd a th’ aig luchd-tadhail, is e sin, cia mheud duine a thilleas chun ionad agad agus dè cho tric. Obraich a-mach cia mheud neach-tadhail gun samhail a thig thugad gach mìos. Gus cosgaisean tarraing is gleidhidh a mheudachadh, faodaidh tu cuideachd faighinn a-mach an atharrachadh ann an trafaic a rèir latha na seachdain agus eadhon àm an latha.

Faodaidh franchisors agus companaidhean slabhraidh measadh òrdachadh stèidhichte air dealbhan de chàileachd branndadh diofar ionadan reic: làthaireachd suaicheantasan, soidhnichean, postairean, brataichean is mar sin air adhart.

2.5. Le còmhdhail

Is e eisimpleir eile de bhith a’ dèanamh cinnteach à tèarainteachd le bhith a’ cleachdadh anailisean bhidio a bhith a’ comharrachadh nithean air an trèigsinn ann an tallaichean puirt-adhair no stèiseanan rèile. Faodar lèirsinn a thrèanadh gus nithean de cheudan de chlasaichean aithneachadh: pìosan àirneis, pocannan, màileidean, sgàileanan, diofar sheòrsaichean aodaich, botail, agus mar sin air adhart. Ma lorgas an siostam anailis bhidio agad rud gun shealbhadair agus ma dh’ aithnicheas e e le bhith a’ cleachdadh Vision, cuiridh e comharra chun t-seirbheis tèarainteachd. Tha gnìomh coltach ris co-cheangailte ri lorg fèin-ghluasadach air suidheachaidhean neo-àbhaisteach ann an àiteachan poblach: cuideigin a’ faireachdainn tinn, no cuideigin a’ smocadh san àite cheàrr, no neach a’ tuiteam air na rèilichean, agus mar sin air adhart - faodar na pàtranan sin uile aithneachadh le siostaman anailis bhidio. tro Vision API.

2.6. Sruth sgrìobhainnean

Is e cleachdadh inntinneach eile de Vision san àm ri teachd a tha sinn a’ leasachadh an-dràsta aithneachadh sgrìobhainnean agus am parsadh fèin-ghluasadach gu stòran-dàta. An àite a bhith a’ dol a-steach le làimh (no nas miosa, a’ dol a-steach) sreath gun chrìoch, àireamhan, cinn-latha cur a-mach, àireamhan cunntais, mion-fhiosrachadh banca, cinn-latha agus àiteachan breith agus mòran dàta foirmeil eile, faodaidh tu sgrìobhainnean a sganadh agus an cur gu fèin-ghluasadach thairis air seanal tèarainte tron API chun sgòth, far an aithnich an siostam na sgrìobhainnean sin air an itealan, gan parsadh agus a ’tilleadh freagairt le dàta anns a’ chruth a tha a dhìth airson a dhol a-steach don stòr-dàta gu fèin-ghluasadach. An-diugh tha fios aig Vision mu thràth mar a nì thu seòrsachadh de sgrìobhainnean (a ’toirt a-steach PDF) - bidh e a’ dèanamh eadar-dhealachadh eadar ceadan-siubhail, SNILS, TIN, teisteanasan breith, teisteanasan pòsaidh agus feadhainn eile.

Gu dearbh, chan urrainn don lìonra neural na suidheachaidhean sin uile a làimhseachadh a-mach às a ’bhogsa. Anns gach cùis, tha modail ùr air a thogail airson neach-ceannach sònraichte, thathas a ’toirt aire do ghrunn fhactaran, nuances agus riatanasan, tha seataichean dàta air an taghadh, agus thathas a’ dèanamh ath-aithris air trèanadh, deuchainn agus rèiteachadh.

3. Sgeama obrachaidh API

Is e an “geata inntrigidh” aig Vision airson luchd-cleachdaidh an REST API. Gheibh e dealbhan, faidhlichean bhidio agus craolaidhean bho chamarathan lìonra (sruthan RTSP) mar chur-a-steach.

Gus Vision a chleachdadh, feumaidh tu clàradh ann an seirbheis Mail.ru Cloud Solutions agus faigh comharran ruigsinneachd (client_id + client_secret). Bithear a’ dearbhadh luchd-cleachdaidh a’ cleachdadh protocol OAuth. Thèid an dàta tùsail ann am buidhnean iarrtasan POST a chuir chun API. Agus mar fhreagairt, gheibh an neach-dèiligidh bhon API toradh aithneachaidh ann an cruth JSON, agus tha am freagairt structaraichte: tha fiosrachadh ann mu na stuthan a chaidh a lorg agus na co-chomharran aca.

Le feusag, glainneachan dorcha agus ann am pròifil: suidheachaidhean duilich airson lèirsinn coimpiutair

Freagairt shampall

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

Anns an fhreagairt tha paramadair inntinneach iongantach - is e seo “fionnarachd” aodann ann an dealbh, le a chuideachadh bidh sinn a ’taghadh an sealladh as fheàrr de dh’ aodann bhon t-sreath. Rinn sinn trèanadh air lìonra neural gus ro-innse a dhèanamh air an coltas gum bi dealbh air a mheas air lìonraidhean sòisealta. Mar as fheàrr càileachd an dealbh agus mar as motha a bhios an aghaidh a’ gàire, is ann as motha a bhios e.

Bidh API Vision a’ cleachdadh bun-bheachd ris an canar space. Is e inneal a tha seo airson diofar sheataichean aghaidh a chruthachadh. Is e eisimpleirean de àiteachan liostaichean dubh is geal, liostaichean de luchd-tadhail, luchd-obrach, teachdaichean, msaa. Airson gach comharra ann an Vision, faodaidh tu suas ri 10 àiteachan a chruthachadh, faodaidh suas ri 50 mìle PersonID a bhith aig gach àite, is e sin, suas ri 500 mìle gach tòcan. A bharrachd air an sin, chan eil an àireamh de chomharran airson gach cunntas cuingealaichte.

An-diugh tha an API a’ toirt taic do na dòighean lorgaidh is aithneachaidh a leanas:

  • Aithnich/Suidhich - lorg agus aithneachadh aghaidhean. Sònrachadh PersonID gu fèin-ghluasadach do gach neach sònraichte, a’ tilleadh an PersonID agus co-chomharran nan daoine a chaidh a lorg.
  • Sguab às - cuir às do PersonID sònraichte bhon stòr-dàta neach.
  • Truncate - a ’glanadh an àite gu lèir bho PersonID, feumail ma chaidh a chleachdadh mar àite deuchainn agus feumaidh tu an stòr-dàta ath-shuidheachadh airson cinneasachadh.
  • Lorg - lorg nithean, seallaidhean, truinnsearan cead, comharran-tìre, ciudhaichean, msaa. A’ tilleadh an clas de nithean a chaidh a lorg agus na co-chomharran aca
  • Lorg airson sgrìobhainnean - lorgar seòrsaichean sònraichte de sgrìobhainnean de Chaidreachas na Ruis (a ’dèanamh eadar-dhealachadh air cead-siubhail, SNILS, àireamh aithneachaidh chìsean, msaa).

Bidh sinn cuideachd a’ crìochnachadh obair a dh’ aithghearr air dòighean airson OCR, a’ dearbhadh gnè, aois agus faireachdainnean, a bharrachd air a bhith a’ fuasgladh dhuilgheadasan marsantachd, is e sin, airson smachd fèin-ghluasadach a chumail air taisbeanadh bathair ann an stòran. Gheibh thu na sgrìobhainnean API iomlan an seo: https://mcs.mail.ru/help/vision-api

4. Co-dhùnadh

A-nis, tron ​​​​API poblach, gheibh thu cothrom air aithne aghaidh ann an dealbhan agus bhideothan; thathas a’ toirt taic do chomharrachadh diofar stuthan, pleitean cead, comharran-tìre, sgrìobhainnean agus seallaidhean slàn. Sgeama tagraidh - a 'mhuir. Thig, dèan deuchainn air an t-seirbheis againn, suidhich na gnìomhan as duilghe. Tha a’ chiad 5000 malairt an-asgaidh. Is dòcha gur e seo an “tàthchuid a tha a dhìth” airson do phròiseactan.

Faodaidh tu faighinn chun API sa bhad nuair a chlàraicheas tu agus nuair a nì thu ceangal. lèirsinn. Gheibh a h-uile neach-cleachdaidh Habra còd adhartachaidh airson gnothaichean a bharrachd. Feuch an sgrìobh thu thugam an seòladh puist-d a chleachd thu airson do chunntas a chlàradh!

Source: www.habr.com

Cuir beachd ann