Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Технологияҳо ва моделҳои системаи биниши компютерии ояндаи мо тадриҷан ва дар лоиҳаҳои гуногуни ширкати мо - дар Почта, Абр, Ҷустуҷӯ офарида ва такмил дода шуданд. Онҳо мисли панир ё коняки хуб пухта шуданд. Рӯзе мо фаҳмидем, ки шабакаҳои нейронии мо дар шинохти худ натиҷаҳои аъло нишон медиҳанд ва мо тасмим гирифтем, ки онҳоро дар як маҳсулоти b2b - Vision муттаҳид кунем, ки ҳоло мо худамон истифода мебарем ва ба шумо барои истифода пешниҳод мекунем.

Имрӯз, технологияи биниши компютерии мо дар платформаи Mail.Ru Cloud Solutions бомуваффақият кор мекунад ва масъалаҳои хеле мураккаби амалиро ҳал мекунад. Он ба як қатор шабакаҳои нейронӣ асос ёфтааст, ки дар маҷмӯи додаҳои мо таълим дода шудаанд ва дар ҳалли масъалаҳои амалӣ тахассус доранд. Ҳама хидматҳо дар иншооти сервери мо кор мекунанд. Шумо метавонед API-и ҷамъиятии Vision-ро ба замимаҳои худ ворид кунед, ки тавассути он тамоми қобилиятҳои хидмат дастрасанд. API зуд аст - ба шарофати GPU-ҳои сервер, вақти миёнаи вокуниш дар шабакаи мо 100 мс аст.

Ба назди гурба равед, як ҳикояи муфассал ва мисолҳои зиёди кори Vision мавҷуд аст.

Ҳамчун намунаи хидмате, ки дар он мо худамон технологияҳои шинохти чеҳраи зикршударо истифода мебарем, мо метавонем мисол орем Достони. Яке аз ҷузъҳои он стендҳои аксбардории Vision мебошад, ки мо дар конфронсҳои гуногун насб мекунем. Агар шумо ба чунин стенди аксбардорӣ наздик шавед, бо камераи дарунсохт акс гиред ва почтаи электронии худро ворид кунед, система фавран дар байни массиви аксҳое пайдо мекунад, ки шумо дар он суратгирони кормандони конфронс акс гирифтаед ва агар хоҳед, аксҳои ёфтшударо тавассути почтаи электронӣ ба шумо мефиристад. Ва мо дар бораи аксҳои саҳнавии портретӣ ҳарф намезанем - Vision шуморо ҳатто дар паси анбӯҳи меҳмонон эътироф мекунад. Албатта, на худи стендҳои аксбардорӣ эътироф мешаванд, инҳо танҳо планшетҳо дар стендҳои зебо ҳастанд, ки танҳо бо камераҳои дарунсохтаи худ аксҳои меҳмононро мегиранд ва маълумотро ба серверҳо интиқол медиҳанд, ки дар он ҷо тамоми ҷодугарии шинохтан рух медиҳад. Ва мо на як бор дидаем, ки то чӣ андоза самаранокии технология ҳатто дар байни мутахассисони шинохти тасвир ҳайратовар аст. Дар зер мо дар бораи баъзе мисолхо сухан меронем.

1. Модели шинохти чеҳраи мо

1.1. Шабакаи нейрон ва суръати коркард

Барои шинохти мо, мо дигаргунии модели шабакаи нейронии ResNet 101-ро истифода мебарем.Ҳавзи миёна дар охир бо қабати комилан пайваст иваз карда мешавад, ба монанди он, ки он дар ArcFace иҷро мешавад. Бо вуҷуди ин, андозаи намоишҳои векторӣ 128 аст, на 512. Маҷмӯи омӯзишии мо тақрибан 10 миллион акси 273 нафарро дар бар мегирад.

Модел ба шарофати меъмории конфигуратсияи бодиққат интихобшудаи сервер ва ҳисобкунии GPU хеле зуд кор мекунад. Барои гирифтани посух аз API дар шабакаҳои дохилии мо аз 100 мс вақт лозим аст - ба ин муайянкунии чеҳра (муайян кардани чеҳра дар акс), шинохтан ва баргардонидани PersonID дар посухи API дохил мешавад. Бо миқдори зиёди маълумоти воридотӣ - аксҳо ва видеоҳо - интиқоли маълумот ба хидмат ва гирифтани посух вақти бештарро талаб мекунад.

1.2. Арзёбии самаранокии модел

Аммо муайян кардани самаранокии шабакаҳои нейронӣ як вазифаи хеле номуайян аст. Сифати кори онҳо аз он вобаста аст, ки моделҳо дар кадом маҷмӯаҳои маълумот омӯхта шудаанд ва оё онҳо барои кор бо маълумоти мушаххас оптимизатсия карда шудаанд.

Мо ба арзёбии дақиқии модели худ бо санҷиши маъмули тасдиқи LFW шурӯъ кардем, аммо он хеле хурд ва оддӣ аст. Пас аз расидан ба 99,8% дақиқ, он дигар фоиданок нест. Барои баҳодиҳии моделҳои шинохтан озмуни хубе вуҷуд дорад - Megaface, ки мо тадриҷан ба 82% дараҷаи 1 расидем. Санҷиши Megaface аз як миллион акс - парешонҳо иборат аст ва модел бояд чанд ҳазор акси одамони машҳурро аз Facescrub хуб фарқ кунад. маҷмӯаи маълумот аз парокандакунандаҳо. Аммо, пас аз тоза кардани санҷиши Megaface хатогиҳо, мо фаҳмидем, ки бо версияи тозашуда мо дақиқии 98% дараҷаи 1-ро ба даст меорем (аксҳои одамони машхур умуман хеле мушаххасанд). Аз ин рӯ, онҳо як санҷиши мушаххаси алоҳидаеро, ки ба Megaface монанд аст, сохтанд, аммо бо аксҳои одамони "оддӣ". Сипас, мо дақиқии шинохти маҷмӯи додаҳои худро такмил додем ва хеле пеш рафтем. Илова бар ин, мо санҷиши сифати кластерро истифода мебарем, ки аз якчанд ҳазор акс иборат аст; он аломатгузории чеҳраро дар абри корбар тақлид мекунад. Дар ин ҳолат, кластерҳо гурӯҳҳои шахсони якхела мебошанд, як гурӯҳ барои ҳар як шахси шинохташуда. Сифати корро дар гуруххои реалй тафтиш кардем (дуруст).

Албатта, хатогиҳои шинохтан дар ҳама гуна моделҳо рух медиҳанд. Аммо ин гуна вазъиятҳо аксар вақт тавассути танзими дақиқи ҳадди аққал барои шароитҳои мушаххас ҳал карда мешаванд (барои ҳама конфронсҳо мо ҳадди якхеларо истифода мебарем, аммо, масалан, барои системаҳои назорати дастрасӣ мо бояд ҳаддиҳоро хеле зиёд кунем, то мусбатҳои бардурӯғ камтар бошанд). Аксарияти мутлақи меҳмонони конфронс аз ҷониби стендҳои аксҳои Vision мо дуруст эътироф карда шуданд. Баъзан касе ба пешнамоиши буридашуда нигоҳ карда, мегӯяд: "Системаи шумо хато кард, ин ман набудам." Баъдан мо аксро пурра кушодем ва маълум шуд, ки воқеан дар ин акс ин меҳмон ҳаст, танҳо мо ӯро не, балки каси дигарро аксбардорӣ мекардем, шахс танҳо дар замина дар минтақаи камранг қарор гирифтааст. Гузашта аз ин, шабакаи нейрон аксар вақт дуруст эътироф мекунад, ҳатто вақте ки як қисми чеҳра намоён нест, ё шахс дар профил истода бошад ё ҳатто нимгардонида бошад. Система метавонад шахсро эътироф кунад, ҳатто агар чеҳра дар минтақаи таҳрифи оптикӣ бошад, масалан, ҳангоми тирандозӣ бо линзаи васеъ кунҷ.

1.3. Намунаҳои санҷиш дар ҳолатҳои душвор

Дар зер намунаҳое ҳастанд, ки чӣ тавр шабакаи нейронии мо кор мекунад. Аксҳо ба вуруд пешниҳод карда мешаванд, ки вай бояд онҳоро бо истифода аз PersonID - идентификатори беназири шахс нишон диҳад. Агар ду ё зиёда тасвирҳо як ID дошта бошанд, пас тибқи моделҳо, ин аксҳо ҳамон як шахсро тасвир мекунанд.

Биёед фавран қайд кунем, ки ҳангоми санҷиш, мо ба параметрҳо ва ҳадди моделҳои гуногун дастрасӣ дорем, ки мо метавонем барои ба даст овардани натиҷаи мушаххас танзим кунем. API-и ҷамъиятӣ барои дақиқии ҳадди аксар дар ҳолатҳои умумӣ оптимизатсия карда шудааст.

Биёед бо соддатарин чиз, бо шинохти чеҳраи пешина оғоз кунем.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Бале, ин хеле осон буд. Биёед, вазифаро мураккаб кунем, ришу чанд сол зам кунем.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Баъзеҳо мегӯянд, ки ин ҳам чандон душвор набуд, зеро дар ҳарду ҳолат тамоми чеҳра намоён аст ва дар алгоритм маълумоти зиёде дар бораи чеҳра мавҷуд аст. Хуб, биёед Том Хардиро ба профил табдил диҳем. Ин масъала хеле мураккабтар аст ва мо барои бомуваффақият ҳалли он бо нигоҳ доштани сатҳи пасти хатогӣ кӯшиши зиёд сарф кардем: мо маҷмӯи омӯзишро интихоб кардем, тавассути меъмории шабакаи нейронӣ фикр кардем, функсияҳои талафотро такмил додем ва коркарди пешакиро такмил додем. аз суратхо.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Биёед ба ӯ сарпӯше пӯшем:

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Дар омади гап, ин як мисоли вазъияти махсусан душвор аст, зеро чеҳра хеле тира шудааст ва дар акси поён низ сояи амиқе мавҷуд аст, ки чашмҳоро пинҳон мекунад. Дар ҳаёти воқеӣ, одамон аксар вақт намуди зоҳирии худро бо ёрии айнаки торик иваз мекунанд. Биёед бо Том низ ҳамин тавр кунем.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Хуб, биёед кӯшиш кунем, ки аксҳои синну соли гуногунро гузорем ва ин дафъа мо бо як актёри дигар озмоиш хоҳем кард. Мисоли хеле мураккабро гирем, ки дар он тағйироти вобаста ба синну сол махсусан зоҳир мешавад. Вазъият чандон дур нест, он аксар вақт рух медиҳад, вақте ки шумо бояд аксро дар шиноснома бо чеҳраи баранда муқоиса кунед. Дар ниҳоят, акси аввалин ба шиноснома вақте илова карда мешавад, ки соҳиби 20-сола бошад ва дар синни 45-солагӣ шахс метавонад хеле тағир ёбад:

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Оё шумо фикр мекунед, ки мутахассиси асосӣ оид ба миссияҳои ғайриимкон бо синну сол чандон тағир наёфтааст? Ман фикр мекунам, ки ҳатто чанд нафар аксҳои боло ва поёнро якҷоя мекунанд, писар дар тӯли солҳо хеле тағир ёфтааст.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Шабакаҳои нейронӣ дар намуди зоҳирӣ бештар дучор меоянд. Масалан, баъзан занон метавонанд бо ёрии косметика симои худро хеле тағйир диҳанд:

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Акнун биёед вазифаро боз ҳам мушкилтар кунем: фарз кунем, ки қисмҳои гуногуни рӯй дар аксҳои гуногун фаро гирифта шудаанд. Дар чунин ҳолатҳо, алгоритм наметавонад тамоми намунаҳоро муқоиса кунад. Бо вуҷуди ин, Vision чунин вазъиятҳоро хуб ҳал мекунад.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Дар омади гап, дар акс чеҳраҳои зиёд буда метавонанд, масалан, дар як акси умумии толор зиёда аз 100 нафар ҷой гирифта метавонанд. Ин вазъияти душвор барои шабакаҳои нейрон аст, зеро бисёр чеҳраҳо метавонанд ба таври гуногун равшан шаванд, баъзеҳо аз фокус берунанд. Аммо, агар акс бо қарори кофӣ ва сифати кофӣ гирифта шавад (ҳадди ақал 75 пиксел дар як мураббаъ, ки рӯйро фаро мегирад), Vision метавонад онро ошкор ва шинохт.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Хусусияти аксҳои репортажӣ ва тасвирҳо аз камераҳои назоратӣ дар он аст, ки одамон аксар вақт норавшан мешаванд, зеро онҳо аз фокус берун буданд ё дар он лаҳза ҳаракат мекарданд:

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Инчунин, шиддатнокии равшанӣ метавонад аз тасвир ба тасвир хеле фарқ кунад. Ин ҳам аксар вақт як монеаи монеа мешавад; бисёр алгоритмҳо дар коркарди дурусти тасвирҳои аз ҳад торик ва хеле сабук душвориҳои зиёд доранд, на аз он ҷумла мувофиқати дақиқи онҳо. Хотиррасон мекунам, ки барои ба даст овардани ин натиҷа шумо бояд ҳаддиҳоро ба таври муайян танзим кунед; ин хусусият ҳанӯз дастрас нест. Мо як шабакаи нейронро барои ҳама муштариён истифода мебарем; он дорои остонаҳое мебошад, ки барои аксари вазифаҳои амалӣ мувофиқанд.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Мо ба наздикӣ як версияи нави моделро нашр кардем, ки чеҳраҳои осиёиро бо дақиқии баланд эътироф мекунад. Ин як мушкили бузурге буд, ки ҳатто нажодпарастӣ "омӯзиши мошинсозӣ" (ё "шабакаи нейрон") номида мешуд. Шабакаҳои нейронии аврупоӣ ва амрикоӣ чеҳраҳои қафқозро хуб шинохтанд, аммо бо чеҳраҳои муғулоид ва негроид вазъ хеле бадтар буд. Эҳтимол, дар Чин вазъият комилан баръакс буд. Ин ҳама дар бораи маҷмӯи маълумотест, ки намудҳои бартаридоштаи одамонро дар як кишвари мушаххас инъикос мекунанд. Аммо вазъият тагьир меёбад, имруз ин проблема чандон тезу тунд нест. Биниш бо одамони нажодҳои гуногун мушкилот надорад.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Шинохти чеҳра танҳо яке аз барномаҳои зиёди технологияи мост; Бинишро барои шинохтани ҳама чиз омӯзонидан мумкин аст. Масалан, рақамҳои рақамӣ, аз ҷумла дар шароите, ки барои алгоритмҳо душвор аст: дар кунҷҳои тез, ифлос ва хондан душвор.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

2. Ҳолатҳои истифодаи амалӣ

2.1. Назорати дастрасии ҷисмонӣ: вақте ки ду нафар як гузаргоҳро истифода мебаранд

Бо ёрии Vision, шумо метавонед системаҳои сабти омадан ва рафтани кормандонро татбиқ кунед. Системаи анъанавӣ, ки ба гузарномаҳои электронӣ асос ёфтааст, камбудиҳои ошкоро дорад, масалан, шумо метавонед бо истифода аз як нишона ду нафарро гузаред. Агар системаи назорати дастрасӣ (ACS) бо Vision мукаммал карда шавад, он ростқавлона сабт мекунад, ки кӣ омада/чакидааст ва кай.

2.2. Пайгирии вақт

Ин парвандаи истифодаи Vision бо парвандаи қаблӣ зич алоқаманд аст. Агар шумо системаи дастрасиро бо хидмати шинохти чеҳраи мо пурра кунед, он метавонад на танҳо вайронкунии назорати дастрасиро ошкор кунад, балки ҳузури воқеии кормандонро дар бино ё иншоот ба қайд гирад. Ба ибораи дигар, Vision ба шумо кӯмак мекунад, ки ростқавлона ба назар гиред, ки кӣ ба кор омаду дар кадом вақт рафт ва кӣ корро тамоман напартофт, ҳатто агар ҳамкасбонаш ӯро дар назди роҳбарон фаро гирифта бошанд.

2.3. Таҳлили видео: пайгирии одамон ва амният

Бо пайгирии одамон бо истифода аз Vision, шумо метавонед ҳаракати воқеии минтақаҳои савдо, вокзалҳо, гузаргоҳҳо, кӯчаҳо ва бисёр ҷойҳои дигари ҷамъиятиро дақиқ арзёбӣ кунед. Мониторинги мо инчунин метавонад дар назорати дастрасӣ, масалан, ба анбор ё дигар биноҳои муҳими офисӣ кӯмаки калон расонад. Ва албатта, пайгирии одамон ва чеҳраҳо ба ҳалли мушкилоти амниятӣ мусоидат мекунад. Оё касеро аз мағозаи шумо дуздидаед? PersonID-и ӯро, ки аз ҷониби Vision баргардонида шудааст, ба рӯйхати сиёҳи нармафзори таҳлили видеоии худ илова кунед ва дафъаи оянда система дар сурати аз нав пайдо шудани ин намуд фавран амниятро огоҳ мекунад.

2.4. Дар савдо

Савдо ва ширкатҳои гуногуни хидматрасонӣ ба шинохти навбат таваҷҷӯҳ доранд. Бо ёрии Vision, шумо метавонед эътироф кунед, ки ин издиҳоми тасодуфии одамон нест, балки навбат аст ва дарозии онро муайян кунед. Ва он гоҳ система ба масъулон дар бораи навбат хабар медиҳад, то онҳо вазъиятро фаҳманд: ё омадани меҳмонон вуҷуд дорад ва коргарони иловагиро даъват кардан лозим аст ё касе вазифаи худро суст мекунад.

Дигар вазифаи ҷолиб ин аст, ки кормандони ширкат дар толор аз меҳмонон ҷудо карда шаванд. Одатан, система барои ҷудо кардани ашёҳо бо либосҳои муайян (кодҳои либос) ё бо ягон хусусияти фарқкунанда (рӯймоли брендӣ, нишони сари сина ва ғайра) таълим дода мешавад. Ин барои дурусттар баҳодиҳии ҳузури ҳозирон кӯмак мекунад (то ки кормандон омори одамонро дар толор бо ҳузури худ "пур накунанд").

Бо истифода аз шинохти чеҳра, шумо инчунин метавонед аудиторияи худро арзёбӣ кунед: садоқати меҳмонон чӣ гуна аст, яъне чӣ қадар одамон ба муассисаи шумо бармегарданд ва бо кадом зудӣ. Ҳисоб кунед, ки чӣ қадар меҳмонони беназир дар як моҳ ба шумо меоянд. Барои оптимизатсия кардани хароҷоти ҷалб ва нигоҳдорӣ, шумо инчунин метавонед тағирёбии трафикро вобаста ба рӯзи ҳафта ва ҳатто вақти рӯз пайдо кунед.

Франчайзорҳо ва ширкатҳои занҷир метавонанд дар асоси аксҳои сифати брендинги нуқтаҳои савдои гуногун арзёбиро фармоиш диҳанд: мавҷудияти логотипҳо, нишонаҳо, плакатҳо, баннерҳо ва ғайра.

2.5. Бо нақлиёт

Мисоли дигари таъмини амният бо истифода аз видео-таҳлил ин муайян кардани ашёи партофташуда дар толорҳои фурудгоҳҳо ё истгоҳҳои роҳи оҳан мебошад. Бинишро барои шинохти ашёи садҳо синфҳо омӯзондан мумкин аст: порчаҳои мебел, сумкаҳо, ҷомадонҳо, чатрҳо, намудҳои гуногуни либос, шишаҳо ва ғайра. Агар системаи таҳлили видеоии шумо объекти бесоҳибро ошкор кунад ва онро бо истифода аз Vision эътироф кунад, он ба хадамоти амният сигнал мефиристад. Вазифаи шабеҳ бо муайян кардани автоматии ҳолатҳои ғайриоддӣ дар ҷойҳои ҷамъиятӣ алоқаманд аст: касе худро бемор ҳис мекунад, ё касе дар ҷои нодуруст сигор мекашад, ё шахс ба рельс меафтад ва ғайра - ҳамаи ин намунаҳоро системаҳои таҳлилии видеоӣ эътироф мекунанд. тавассути API Vision.

2.6. Ҷараёни ҳуҷҷат

Дигар барномаи ҷолиби ояндаи Vision, ки мо ҳоло таҳия карда истодаем, шинохти ҳуҷҷатҳо ва таҳлили автоматии онҳо дар пойгоҳи додаҳо мебошад. Ба ҷои он ки дастӣ ворид кунед (ё бадтараш, ворид кунед) серияҳои беохир, рақамҳо, санаҳои додашуда, рақамҳои суратҳисоб, реквизитҳои бонкӣ, сана ва ҷои таваллуд ва бисёр дигар маълумоти расмӣ, шумо метавонед ҳуҷҷатҳоро скан кунед ва ба таври худкор тавассути канали бехатар фиристед. API ба абр, ки дар он система ин ҳуҷҷатҳоро дар парвоз эътироф мекунад, онҳоро таҳлил мекунад ва посухро бо маълумот дар формати зарурӣ барои ворид шудан ба пойгоҳи додаҳо бармегардонад. Имрӯз Vision аллакай медонад, ки чӣ гуна тасниф кардани ҳуҷҷатҳо (аз ҷумла PDF) - байни шиносномаҳо, SNILS, ТИН, шаҳодатномаҳои таваллуд, шаҳодатномаи ақди никоҳ ва ғайра фарқ мекунад.

Албатта, шабакаи нейрон қодир нест, ки ҳамаи ин ҳолатҳоро берун аз қуттӣ ҳал кунад. Дар ҳар як ҳолат, модели нав барои муштарии мушаххас сохта мешавад, бисёр омилҳо, нозукиҳо ва талаботҳо ба назар гирифта мешаванд, маҷмӯи маълумот интихоб карда мешаванд ва такрори омӯзиш, озмоиш ва конфигуратсия гузаронида мешаванд.

3. Схемаи амалиёти API

"Дарвозаи даромадгоҳ"-и Vision барои корбарон REST API мебошад. Он метавонад аксҳо, файлҳои видеоӣ ва пахшҳоро аз камераҳои шабакавӣ (ҷараёни RTSP) ҳамчун вуруд қабул кунад.

Барои истифодаи Vision, ба шумо лозим аст имзо то дар хидмати Mail.ru Cloud Solutions ва гирифтани аломатҳои дастрасӣ (client_id + client_secret). Аутентификатсияи корбар бо истифода аз протоколи OAuth анҷом дода мешавад. Маълумоти манбаъ дар мақомоти дархостҳои POST ба API фиристода мешавад. Ва дар посух, муштарӣ аз API натиҷаи шинохтанро дар формати JSON мегирад ва посух сохторбандӣ шудааст: он дорои маълумот дар бораи объектҳои ёфтшуда ва координатаҳои онҳо мебошад.

Бо риш, айнаки торик ва дар профил: ҳолатҳои душвор барои биниши компютер

Намунаи ҷавоб

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

Ҷавоб як параметри ҷолибро дар бар мегирад - ин "хунукии" шартии чеҳра дар акс аст, ки бо ёрии он мо беҳтарин кадри чеҳраро аз пайдарпай интихоб мекунем. Мо як шабакаи нейронро таълим додем, то эҳтимолияти писанд омадани акс дар шабакаҳои иҷтимоӣ пешгӯӣ шавад. Чӣ қадаре ки сифати акс беҳтар бошад ва чеҳраи хандон бештар бошад, олиҷаноб бештар мешавад.

API Vision мафҳуми фазоро истифода мебарад. Ин асбобест барои эҷоди маҷмӯи гуногуни чеҳраҳо. Намунаҳои ҷойҳо рӯйхати сиёҳ ва сафед, рӯйхати меҳмонон, кормандон, мизоҷон ва ғайра мебошанд. Барои ҳар як токен дар Vision, шумо метавонед то 10 фосила эҷод кунед, ҳар як фосила метавонад то 50 ҳазор PersonID дошта бошад, яъне то 500 ҳазор. барои як нишона. Ғайр аз он, шумораи нишонаҳо барои як ҳисоб маҳдуд нест.

Имрӯз API усулҳои муайян ва шинохти зеринро дастгирӣ мекунад:

  • Шинохтан/Танзим кардан - ошкор ва шинохти чеҳраҳо. Ба таври худкор шахсияти шахсро ба ҳар як шахси беназир таъин мекунад, ID шахс ва координатаҳои шахсони ёфтшударо бармегардонад.
  • Нест кардан - нест кардани шахсияти мушаххас аз пойгоҳи додаҳои шахс.
  • Буридан - тамоми фазоро аз PersonID тоза мекунад, агар он ҳамчун фазои санҷишӣ истифода шуда бошад ва ба шумо лозим аст, ки пойгоҳи додаҳоро барои истеҳсол дубора барқарор кунед.
  • Муайян кардан - ошкор кардани объектҳо, саҳнаҳо, рақамҳои давлатӣ, аломатҳо, навбатҳо ва ғайра. Синфи объектҳои ёфтшуда ва координатаҳои онҳоро бармегардонад
  • Муайян кардани ҳуҷҷатҳо - намудҳои мушаххаси ҳуҷҷатҳои Федератсияи Русияро муайян мекунад (паспорт, SNILS, рақами мушаххаси андоз ва ғ. фарқ мекунад).

Мо инчунин ба зудӣ корҳоро оид ба усулҳои OCR, муайян кардани ҷинс, синну сол ва эҳсосот, инчунин ҳалли мушкилоти фурӯш, яъне барои ба таври худкор назорат кардани намоиши молҳо дар мағозаҳо ба итмом мерасонем. Шумо метавонед ҳуҷҷатҳои пурраи API-ро дар ин ҷо пайдо кунед: https://mcs.mail.ru/help/vision-api

4. Хулоса

Акнун, тавассути API-и оммавӣ, шумо метавонед ба шинохти чеҳра дар аксҳо ва видеоҳо дастрасӣ пайдо кунед; муайян кардани ашёҳои гуногун, рақамҳои рақамӣ, нишонаҳо, ҳуҷҷатҳо ва тамоми саҳнаҳо дастгирӣ карда мешавад. Сенарияҳои татбиқ - баҳр. Биёед, хидмати моро санҷед ва ба он вазифаҳои душвортаринро гузоред. 5000 амалиёти аввал ройгон аст. Шояд он "компоненти гумшуда" барои лоиҳаҳои шумо бошад.

Ҳангоми бақайдгирӣ ва пайвастшавӣ шумо метавонед фавран ба API дастрасӣ пайдо кунед. Нигоҳи. Ҳама корбарони Habra барои транзаксияҳои иловагӣ рамзи таблиғот мегиранд. Лутфан ба ман суроғаи почтаи электроние, ки барои сабти номи худ истифода бурдед, нависед!

Манбаъ: will.com

Илова Эзоҳ