د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

زموږ د راتلونکي کمپیوټر لید سیسټم لپاره ټیکنالوژي او ماډلونه په تدریجي ډول رامینځته شوي او ښه شوي او زموږ د شرکت په بیلابیلو پروژو کې - په میل ، کلاوډ ، لټون کې. دوی د ښه پنیر یا کونګاک په څیر پاخه شوي. یوه ورځ موږ پوهیږو چې زموږ عصبي شبکې په پیژندلو کې عالي پایلې ښیې ، او موږ پریکړه وکړه چې دوی په یو واحد B2b محصول - ویژن - کې سره یوځای کړو چې اوس موږ پخپله کاروو او تاسو ته یې د کارولو وړاندیز کوو.

نن ورځ، د Mail.Ru Cloud Solutions پلیټ فارم کې زموږ د کمپیوټر لید ټیکنالوژي په بریالیتوب سره کار کوي او خورا پیچلې عملي ستونزې حل کوي. دا د یو شمیر عصبي شبکو پراساس دی چې زموږ د ډیټا سیټونو کې روزل شوي او د پلي شوي ستونزو حل کولو کې تخصص لري. ټول خدمتونه زموږ د سرور تاسیساتو کې پرمخ ځي. تاسو کولی شئ عامه ویژن API په خپلو غوښتنلیکونو کې مدغم کړئ ، د کوم له لارې چې د خدماتو ټولې وړتیاوې شتون لري. API ګړندی دی - د سرور GPUs څخه مننه ، زموږ په شبکه کې د اوسط غبرګون وخت 100 ms دی.

پیشو ته لاړشئ ، دلته یوه مفصله کیسه او د ویژن د کار ډیری مثالونه شتون لري.

د خدمت یوه بیلګه په کوم کې چې موږ پخپله د مخ پیژندنې ټیکنالوژۍ کاروو پیښی. د هغې یوه برخه د ویژن عکس سټینډونه دي ، کوم چې موږ په مختلف کنفرانسونو کې نصب کوو. که تاسو داسې عکس سټینډ ته ورشئ ، د جوړ شوي کیمرې سره عکس واخلئ او خپل بریښنالیک دننه کړئ ، سیسټم به سمدلاسه د عکسونو په مینځ کې هغه څه ومومي چې تاسو پکې د کنفرانس کارمندانو عکس اخیستونکو لخوا نیول شوي ، او که وغواړئ ، موندل شوي عکسونه به تاسو ته د بریښنالیک له لارې واستوي. او موږ د سټیج شوي پورټریټ شاټونو په اړه خبرې نه کوو — ویژن تاسو حتی د لیدونکو په ډیری شالید کې پیژني. البته، دا هغه عکسونه ندي چې پخپله پیژندل شوي وي، دا یوازې په ښکلي سټینډونو کې ټابلیټونه دي چې په ساده ډول د میلمنو عکسونه د دوی جوړ شوي کیمرې سره اخلي او سرورونو ته معلومات لیږدوي، چیرې چې د پیژندنې ټول جادو پیښیږي. او موږ له یو ځل څخه ډیر لیدلي چې د ټیکنالوژۍ اغیزمنتیا حتی د عکس پیژندنې متخصصینو ترمنځ څومره حیرانتیا ده. لاندې به موږ د ځینو مثالونو په اړه خبرې وکړو.

1. زموږ د مخ پیژندنې ماډل

۱.۱. عصبي شبکه او د پروسس سرعت

د پیژندنې لپاره، موږ د ResNet 101 عصبي شبکې ماډل ترمیم کاروو. په پای کې اوسط پولینګ په بشپړ ډول وصل شوي پرت سره ځای په ځای کیږي ، ورته ورته چې دا په ArcFace کې ترسره کیږي. په هرصورت، د ویکتور نمایشونو اندازه 128 ده، نه 512. زموږ د روزنې سیټ د 10 خلکو شاوخوا 273 ملیون عکسونه لري.

ماډل خورا ګړندی پرمخ ځي د احتیاط غوره شوي سرور ترتیب کولو جوړښت او GPU کمپیوټري څخه مننه. زموږ په داخلي شبکو کې د API څخه ځواب ترلاسه کولو لپاره له 100 ms څخه وخت نیسي - پدې کې د مخ کشف (په عکس کې د مخ موندل) ، د API ځواب کې د شخص ID پیژندل او بیرته راستنول شامل دي. د راتلونکو ډیټا لوی مقدار سره - عکسونه او ویډیوګانې - دا به خدمت ته د ډیټا لیږدولو او ځواب ترلاسه کولو لپاره ډیر وخت ونیسي.

1.2. د ماډل اغیزمنتوب ارزونه

مګر د عصبي شبکو د موثریت ټاکل خورا مبهم کار دی. د دوی د کار کیفیت پدې پورې اړه لري چې کوم ډیټا سیټونه موډلونه روزل شوي او ایا دوی د ځانګړي ډیټا سره کار کولو لپاره غوره شوي.

موږ د مشهور LFW تایید ازموینې سره زموږ د ماډل دقت ارزونه پیل کړه ، مګر دا خورا کوچنی او ساده دی. د 99,8٪ دقت ته رسیدو وروسته، دا نور ګټور نه دی. د پیژندنې ماډلونو ارزولو لپاره ښه سیالي شتون لري - میګافیس ، په کوم کې چې موږ په تدریجي ډول 82٪ درجه 1 ته ورسیدو. د میګافیس ازموینه د یو ملیون عکسونو څخه جوړه شوې - ګډوډي - او ماډل باید وکولی شي د Facescrub څخه د مشهورو شخصیتونو څو زره عکسونه په ښه توګه توپیر کړي. د ګډوډونکو څخه ډیټا سیټ. په هرصورت، د میګافیس ازموینې د غلطیتونو پاکولو سره، موږ وموندله چې د پاک شوي نسخې سره موږ د 98٪ درجه درجه 1 دقت ترلاسه کوو (د مشهورو شخصیتونو عکسونه عموما خورا مشخص دي). له همدې امله، دوی د پیژندنې جلا ازموینه جوړه کړه، د میګافیس په څیر، مګر د "عادي" خلکو عکسونو سره. بیا موږ په خپلو ډیټاسیټونو کې د پیژندنې دقت ښه کړ او ډیر مخکې لاړ شو. برسېره پردې، موږ د کلستر کولو کیفیت ازموینه کاروو چې د څو زرو عکسونو څخه جوړه وي؛ دا د کارونکي کلاوډ کې د مخ ټاګ کولو سمولیټ کوي. په دې حالت کې، کلسترونه د ورته اشخاصو ګروپونه دي، د هر پیژندل شوي کس لپاره یوه ډله. موږ په ریښتیني ګروپونو کې د کار کیفیت چیک کړ (ریښتیا).

البته، د پیژندنې تېروتنې د هر ماډل سره واقع کیږي. مګر دا ډول شرایط اکثرا د ځانګړو شرایطو لپاره د حدونو په ښه کولو سره حل کیږي (د ټولو کنفرانسونو لپاره موږ ورته حدونه کاروو ، مګر د مثال په توګه ، د لاسرسي کنټرول سیسټمونو لپاره موږ باید حدونه خورا ډیر کړو ترڅو لږ غلط مثبت شتون ولري). د کنفرانس ډیری لیدونکي زموږ د لید عکس بوټو لخوا په سمه توګه پیژندل شوي. ځینې ​​​​وختونه یو څوک به کرل شوي مخکتنې ته وګوري او ووایی ، "ستاسو سیسټم غلطي کړې ، دا زه نه وم." بیا موږ عکس په بشپړ ډول خلاص کړ ، او معلومه شوه چې واقعیا په عکس کې دا لیدونکی و ، یوازې موږ د هغه عکس نه و اخیستی ، مګر بل څوک ، هغه سړی یوازې د بلور زون په شالید کې و. برسېره پردې، عصبي شبکه اکثرا په سمه توګه پیژني حتی کله چې د مخ یوه برخه نه لیدل کیږي، یا شخص په پروفایل کې ولاړ وي، یا حتی نیم بدل شوی وي. سیسټم کولی شي یو شخص وپیژني حتی که مخ د نظری تحریف په ساحه کې وي ، ووایه ، کله چې د پراخه زاویې لینز سره ډزې کیږي.

1.3. په سختو شرایطو کې د ازموینې بیلګې

لاندې مثالونه دي چې زموږ عصبي شبکه څنګه کار کوي. عکسونه داخل ته سپارل کیږي، کوم چې هغه باید د PersonID په کارولو سره لیبل کړي - د یو شخص ځانګړی پیژندونکی. که دوه یا ډیر عکسونه ورته ID ولري، نو د ماډلونو له مخې، دا عکسونه ورته شخص انځوروي.

راځئ چې سمدلاسه یادونه وکړو چې د ازموینې پرمهال ، موږ مختلف پیرامیټرو او ماډل حدونو ته لاسرسی لرو چې موږ کولی شو د یوې ځانګړې پایلې ترلاسه کولو لپاره تنظیم کړو. عامه API په عامو قضیو کې د اعظمي دقت لپاره مطلوب دی.

راځئ چې د ساده شی سره پیل وکړو، د مخ مخ پیژندنې سره.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

ښه، دا خورا اسانه وه. راځئ چې کار پیچلی کړو، ږیره او یو لاس کلونه اضافه کړو.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

ځینو به ویل چې دا هم ډېره ستونزمنه نه وه، ځکه چې په دواړو حالتونو کې ټول مخ ښکاره کېږي او د مخ په اړه ډېر معلومات الګوریتم ته رسېدلي دي. ښه، راځئ چې ټام هارډي پروفایل ته واړوو. دا ستونزه ډیره پیچلې ده، او موږ ډیرې هڅې مصرف کړې چې په بریالیتوب سره یې حل کړي پداسې حال کې چې د ټیټې غلطۍ کچه ساتل کیږي: موږ د روزنې سیټ غوره کړ، د عصبي شبکې د جوړښت له لارې فکر وکړ، د ضایع کولو فعالیتونه یې ښه کړل او د پروسس کولو دمخه یې ښه کړه. د عکسونو

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

راځه چې ورته سرپوښ وکړو:

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

په هرصورت، دا د یو ځانګړي ستونزمن حالت یوه بیلګه ده، ځکه چې مخ په پراخه کچه پټ شوی، او په لاندې عکس کې یو ژور سیوري هم شتون لري چې سترګې پټوي. په ریښتیني ژوند کې، خلک ډیری وختونه د تیاره شیشو په مرسته خپل بڼه بدلوي. راځئ چې د ټام سره هم همداسې وکړو.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

ښه، راځئ هڅه وکړو چې د مختلف عمرونو عکسونه وغورځوو، او دا ځل به موږ د یو بل لوبغاړي سره تجربه وکړو. راځئ چې یو ډیر پیچلي مثال واخلو، چیرې چې د عمر پورې اړوند بدلونونه په ځانګړې توګه څرګند شوي. وضعیت ډیر لرې نه دی؛ دا ډیری وختونه پیښیږي کله چې تاسو اړتیا لرئ په پاسپورټ کې عکس د اخیستونکي مخ سره پرتله کړئ. په هرصورت، لومړی عکس په پاسپورټ کې اضافه کیږي کله چې مالک 20 کلن وي، او د 45 کلنۍ په عمر کې یو سړی کولی شي ډیر بدلون ومومي:

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

ایا تاسو فکر کوئ چې د ناممکن ماموریت اصلي متخصص د عمر سره ډیر بدلون نه دی راغلی؟ زه فکر کوم چې حتی یو څو خلک به د پورتنۍ او ښکته عکسونو سره یوځای کړي، هلک د کلونو په اوږدو کې ډیر بدل شوی.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

عصبي شبکې ډیر ځله په ظاهري بدلونونو سره مخ کیږي. د مثال په توګه، ځینې وختونه ښځې کولی شي د کاسمیټکس په مرسته خپل عکس خورا بدل کړي:

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

اوس راځئ چې دنده نوره هم پیچلې کړو: فرض کړئ چې د مخ مختلفې برخې په مختلف عکسونو پوښل شوي. په داسې حالتونو کې، الګوریتم نشي کولی ټول نمونې پرتله کړي. په هرصورت، ویژن د دې په څیر وضعیت ښه اداره کوي.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

په هرصورت، په عکس کې ډیری مخونه کیدی شي؛ د بیلګې په توګه، د 100 څخه ډیر خلک د تالار په عمومي عکس کې ځای کیدی شي. دا د عصبي شبکو لپاره یو ستونزمن حالت دی، ځکه چې ډیری مخونه په مختلف ډول روښانه کیدی شي، ځینې د تمرکز څخه بهر. که څه هم، که عکس د کافي ریزولوشن او کیفیت سره اخیستل شوی وي (لږترلږه په هر مربع کې 75 پکسلز د مخ پوښښ)، لید به د دې وړتیا ولري چې کشف او وپیژني.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

د څارنې کیمرې څخه د راپور ورکولو عکسونو او عکسونو ځانګړتیا دا ده چې خلک ډیری وختونه تیاره کیږي ځکه چې دوی د تمرکز څخه بهر وو یا په دې شیبه کې حرکت کوي:

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

همچنان ، د روښنايي شدت له عکس څخه عکس ته خورا توپیر کولی شي. دا هم ډیری وختونه د خنډ لامل کیږي؛ ډیری الګوریتمونه په سمه توګه د عکسونو پروسس کولو کې لوی مشکل لري کوم چې ډیر تیاره او ډیر سپک دي ، د دې لپاره چې په سمه توګه د دوی سره سمون ونه کړي. اجازه راکړئ تاسو ته یادونه وکړم چې د دې پایلې ترلاسه کولو لپاره تاسو اړتیا لرئ چې حدونه په یو مشخص ډول تنظیم کړئ؛ دا خصوصیت لاهم په عامه توګه شتون نلري. موږ د ټولو پیرودونکو لپاره ورته عصبي شبکه کاروو؛ دا حدونه لري چې د ډیری عملي کارونو لپاره مناسب دي.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

موږ پدې وروستیو کې د ماډل یوه نوې نسخه وړاندې کړه چې آسیایی مخونه د لوړ دقت سره پیژني. دا یوه لویه ستونزه وه، کوم چې حتی د "ماشین زده کړې" (یا "عصبي شبکه") توکمپالنه بلل کیده. اروپایی او امریکایی عصبی شبکو د قفقاز مخونه په ښه توګه پیژنی، مګر د منګولیډ او نیګرویډ مخونو سره وضعیت خورا خراب و. شاید، په چین کې وضعیت بالکل برعکس و. دا ټول د روزنې ډیټا سیټونو په اړه دي چې په یو ځانګړي هیواد کې د خلکو غالب ډولونه منعکس کوي. په هرصورت، وضعیت د بدلون په حال کې دی؛ نن ورځ دا ستونزه دومره جدي نه ده. لید د مختلفو نسلونو خلکو سره کومه ستونزه نلري.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

د مخ پیژندنه زموږ د ټیکنالوژۍ ډیری غوښتنلیکونو څخه یوازې یو دی؛ لید د هر څه پیژندلو لپاره روزل کیدی شي. د مثال په توګه، د جواز پلیټونه، په شمول د الګوریتمونو لپاره ستونزمن شرایط: په تیز زاویو کې، خندا او د جواز پلیټونو لوستل ستونزمن دي.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

2. د عملي کارونې قضیې

2.1. د فزیکي لاسرسي کنټرول: کله چې دوه کسان ورته پاس کاروي

د ویژن په مرسته تاسو کولی شئ د کارمندانو د راتګ او وتلو ثبتولو لپاره سیسټمونه پلي کړئ. د بریښنایی پاسونو پراساس دودیز سیسټم څرګند زیانونه لري ، د مثال په توګه ، تاسو کولی شئ د یو بیج په کارولو سره دوه کسان تیر کړئ. که چیرې د لاسرسي کنټرول سیسټم (ACS) د ویژن سره ضمیمه شي ، نو دا به په صادقانه توګه ثبت کړي چې څوک راغلی / چپه شوی او کله.

2.2. د وخت تعقیب

دا د ویژن کارولو قضیه د تیر سره نږدې تړاو لري. که تاسو زموږ د مخ پیژندنې خدمت سره د لاسرسي سیسټم ضمیمه کړئ ، نو دا به نه یوازې د دې وړتیا ولري چې د لاسرسي کنټرول سرغړونې کشف کړي ، بلکه په ودانۍ یا تاسیساتو کې د کارمندانو ریښتیني شتون هم ثبت کړي. په بل عبارت، ویژن به تاسو سره په صادقانه توګه په دې حساب کې مرسته وکړي چې څوک کار ته راغلی او په کوم وخت کې پریښودل شوی، او چا په بشپړ ډول کار پریښود، حتی که د هغه همکارانو د هغه د لوړ پوړو چارواکو په وړاندې د هغه لپاره پوښښ کړی وي.

2.3. د ویډیو تحلیل: د خلکو تعقیب او امنیت

د ویژن په کارولو سره د خلکو تعقیب کولو سره ، تاسو کولی شئ د پیرودلو ساحو ، ریل سټیشنونو ، تیریدو ، سړکونو او ډیری نورو عامه ځایونو ریښتیني ترافیک په سمه توګه ارزونه وکړئ. زموږ تعقیب کولی شي د لاسرسي په کنټرول کې هم خورا مرسته وکړي، د بیلګې په توګه، ګودام یا نورو مهمو دفترونو ته. او البته، د خلکو او مخونو تعقیب د امنیتي ستونزو په حل کې مرسته کوي. ستاسو له پلورنځي څخه څوک غلا کوي؟ د هغه شخص ID اضافه کړئ ، کوم چې د ویژن لخوا بیرته راستون شوی ، ستاسو د ویډیو تحلیلي سافټویر تور لیست کې ، او بل ځل سیسټم به سمدلاسه امنیت ته خبرداری ورکړي که چیرې دا ډول بیا څرګند شي.

2.4. په تجارت کې

پرچون او مختلف خدماتي سوداګرۍ د قطار پیژندلو سره علاقه لري. د ویژن په مرسته، تاسو کولی شئ وپیژندئ چې دا د خلکو تصادفي ډله نه ده، مګر یو قطار دی، او د هغې اوږدوالی وټاکئ. او بیا سیسټم مسؤلینو ته د کتار په اړه خبر ورکوي ترڅو دوی وضعیت وپیژني: یا دلته د لیدونکو راتګ شتون لري او اضافي کارګران باید وغوښتل شي، یا یو څوک د دوی د دندو په دندو کې سستي کوي.

بل په زړه پورې دنده دا ده چې په تالار کې د شرکت کارمندان له لیدونکو څخه جلا کړئ. په عموم ډول، سیسټم روزل کیږي چې هغه شیان جلا کړي چې ځانګړي جامې اغوندي (د جامو کوډ) یا د ځینې ځانګړي ځانګړتیاو سره (د نښه شوي سکارف، په سینه کې بیج، او داسې نور). دا مرسته کوي د حاضري په دقیقه ارزونه کې (تر څو کارمندان په تالار کې د خلکو احصایې د دوی یوازې شتون سره "تعرف" نه کړي).

د مخ پیژندنې په کارولو سره ، تاسو کولی شئ خپل لیدونکي هم ارزونه وکړئ: د لیدونکو وفاداري څه ده ، دا دی چې څومره خلک ستاسو تاسیس ته راستنیږي او په کوم تعدد سره. محاسبه کړئ چې په میاشت کې څومره ځانګړي لیدونکي تاسو ته راځي. د جذابیت او ساتلو لګښتونو اصلاح کولو لپاره ، تاسو کولی شئ د اونۍ په ورځ او حتی د ورځې وخت پورې اړوند ترافیک کې بدلون هم ومومئ.

فرنچائزر او چینایي شرکتونه کولی شي د مختلف پرچون پلورنځیو د برانډینګ کیفیت عکسونو پراساس د ارزونې امر وکړي: د لوګو شتون، نښې، پوسټرونه، بینرونه او داسې نور.

2.5. د ترانسپورت په واسطه

د ویډیو تحلیلونو په کارولو سره د امنیت تضمین کولو بله بیلګه د هوایی ډګرونو یا ریل سټیشنونو په تالار کې د پریښودو توکو پیژندل دي. لید د سلګونو ټولګیو شیانو پیژندلو لپاره روزل کیدی شي: د فرنیچر ټوټې، کڅوړې، سوټ کیسونه، چترۍ، مختلف ډوله جامې، بوتلونه او داسې نور. که ستاسو د ویډیو تحلیل سیسټم یو بې مالکه څیز کشف کړي او د ویژن په کارولو سره یې پیژني، دا امنیتي خدمت ته سیګنال لیږي. ورته دنده په عامه ځایونو کې د غیر معمولي حالتونو اتوماتیک کشف سره تړاو لري: یو څوک ناروغ احساس کوي، یا څوک په غلط ځای کې سګرټ څکوي، یا یو څوک په ریلونو کې راښکته کیږي، او داسې نور - دا ټول نمونې د ویډیو تحلیل سیسټمونو لخوا پیژندل کیدی شي. د ویژن API له لارې.

2.6. د اسنادو جریان

د ویژن بل په زړه پوري راتلونکي غوښتنلیک چې موږ یې اوس مهال رامینځته کوو د اسنادو پیژندنه او ډیټابیسونو کې د دوی اتوماتیک تجزیه کول دي. د دې پرځای چې په لاسي ډول نه ختمیدونکي لړۍ ، شمیرې ، د مسلې نیټه ، د حساب شمیرې ، د بانک توضیحات ، د زیږون نیټه او د زیږون ځایونه او ډیری نور رسمي معلومات په لاسي ډول داخل کړئ (یا بدتر داخل کړئ) ، تاسو کولی شئ اسناد سکین کړئ او په اتوماتيک ډول یې د خوندي چینل له لارې واستوئ. کلاوډ ته API، چیرې چې سیسټم به دا اسناد په الوتنه کې وپیژني، دوی یې تجزیه کړي او ډیټابیس ته د اتوماتیک ننوتلو لپاره په اړین شکل کې د معلوماتو سره ځواب بیرته راولي. نن ورځ ویژن دمخه پوهیږي چې څنګه اسناد طبقه بندي کړي (د پی ډی ایف په شمول) - د پاسپورټونو ، SNILS ، TIN ، زیږون سندونو ، د واده سندونو او نورو ترمینځ توپیر کوي.

البته، عصبي شبکه د دې توان نلري چې دا ټول حالتونه د بکس څخه بهر اداره کړي. په هر حالت کې، یو نوی ماډل د یو ځانګړي پیرودونکي لپاره جوړ شوی، ډیری فاکتورونه، لنډیزونه او اړتیاوې په پام کې نیول شوي، د معلوماتو سیټونه غوره شوي، او د روزنې، ازموینې او ترتیب تکرارونه ترسره کیږي.

3. د API عملیات سکیم

د کاروونکو لپاره د ویژن "د ننوتلو دروازه" د REST API دی. دا کولی شي عکسونه، ویډیو فایلونه او خپرونې د شبکې کیمرې (RTSP جریان) څخه د ان پټ په توګه ترلاسه کړي.

د ویژن کارولو لپاره، تاسو اړتیا لرئ پورته د Mail.ru کلاوډ حلونو خدمت کې او د لاسرسي نښه ترلاسه کړئ (client_id + client_secret). د کارونکي تصدیق د OAuth پروتوکول په کارولو سره ترسره کیږي. د POST غوښتنو په بدن کې د سرچینې ډاټا API ته لیږل کیږي. او په ځواب کې، پیرودونکی د API څخه د JSON بڼه کې د پیژندنې پایله ترلاسه کوي، او ځواب یې جوړ شوی دی: دا د موندل شویو شیانو او د دوی همغږۍ په اړه معلومات لري.

د ږیرې سره، تیاره شیشې او په پروفایل کې: د کمپیوټر لید لپاره ستونزمن حالتونه

د نمونې ځواب

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

ځواب په زړه پورې پیرامیټر حیرانتیا لري - دا په عکس کې د مخ مشروط "یختیا" ده ، د دې په مرسته موږ د ترتیب څخه د مخ غوره شاټ غوره کوو. موږ یو عصبي شبکه روزلې ترڅو د دې احتمال وړاندوینه وکړو چې عکس به په ټولنیزو شبکو کې خوښ شي. هرڅومره چې د عکس کیفیت ښه وي او څومره چې د مخ موسکا وي ، هومره په زړه پوری وي.

API ویژن د ځای په نوم مفهوم کاروي. دا د مخونو مختلف سیټونو جوړولو لپاره وسیله ده. د ځایونو مثالونه تور او سپین لیستونه دي، د لیدونکو لیست، کارمندان، مراجعین، او نور. په ویژن کې د هر نښه لپاره، تاسو کولی شئ تر 10 پورې ځایونه جوړ کړئ، هر ځای کولی شي تر 50 زرو پورې PersonIDs ولري، دا تر 500 زرو پورې په نښه . سربیره پردې، په هر حساب کې د ټوکن شمیر محدود ندی.

نن API د لاندې کشف او پیژندنې میتودونو ملاتړ کوي:

  • پیژندل / ترتیب کول - د مخونو کشف او پیژندنه. په اوتومات ډول هر ځانګړي کس ته د شخص ID ګماري، د شخص ID بیرته راګرځوي او د موندل شوي کسانو همغږي کوي.
  • حذف کول - د شخص ډیټابیس څخه د ځانګړي شخص ID حذف کول.
  • Truncate - د PersonID څخه ټول ځای پاکوي، ګټور که دا د ازموینې ځای په توګه کارول شوی وي او تاسو اړتیا لرئ د تولید لپاره ډیټابیس بیا تنظیم کړئ.
  • کشف - د شیانو کشف کول، صحنې، د جواز تختې، نښه، کتارونه، او داسې نور.
  • د اسنادو کشف کول - د روسیې فدراسیون د اسنادو ځانګړي ډولونه کشف کوي (پاسپورټ، SNILS، د مالیې پیژندنې شمیره، او نور توپیر کوي).

موږ به ژر تر ژره د OCR لپاره میتودونو باندې کار پای ته ورسوو، د جنسیت، عمر او احساساتو ټاکل، او همدارنګه د سوداګریزو ستونزو حل کول، دا په اتوماتيک ډول په پلورنځیو کې د توکو د ښودلو کنټرول لپاره. تاسو کولی شئ دلته بشپړ API اسناد ومومئ: https://mcs.mail.ru/help/vision-api

4. پایله

اوس ، د عامه API له لارې ، تاسو کولی شئ په عکسونو او ویډیوګانو کې د مخ پیژندنې ته لاسرسی ومومئ؛ د مختلف شیانو پیژندنه ، د جواز پلیټونو ، د نښه کولو نښه ، سندونه او ټولې صحنې ملاتړ کیږي. د غوښتنلیک سناریو - سمندر. راشئ، زموږ خدمت و ازموئ، دا خورا ستونزمن کارونه تنظیم کړئ. لومړنۍ 5000 لیږدونه وړیا دي. شاید دا به ستاسو د پروژو لپاره "د ورک شوي اجزا" وي.

تاسو کولی شئ سمدلاسه د راجسټریشن او پیوستون وروسته API ته لاسرسی ومومئ. لرلید. د هابرا ټول کاروونکي د اضافي معاملو لپاره پروموشنل کوډ ترلاسه کوي. مهرباني وکړئ ما ته هغه بریښنالیک ولیکئ چې تاسو د خپل حساب راجستر کولو لپاره کارولی و!

سرچینه: www.habr.com

Add a comment