தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

எங்கள் எதிர்கால கணினி பார்வை அமைப்புக்கான தொழில்நுட்பங்கள் மற்றும் மாதிரிகள் எங்கள் நிறுவனத்தின் பல்வேறு திட்டங்களில் - அஞ்சல், கிளவுட், தேடலில் உருவாக்கப்பட்டு படிப்படியாக மேம்படுத்தப்பட்டன. அவர்கள் நல்ல சீஸ் அல்லது காக்னாக் போன்ற முதிர்ச்சியடைந்தனர். ஒரு நாள், எங்கள் நரம்பியல் நெட்வொர்க்குகள் அங்கீகாரத்தில் சிறந்த முடிவுகளைக் காட்டுகின்றன என்பதை நாங்கள் உணர்ந்தோம், மேலும் அவற்றை ஒரு ஒற்றை b2b தயாரிப்பாக இணைக்க முடிவு செய்தோம் - விஷன் - அதை நாங்கள் இப்போது பயன்படுத்துகிறோம்.

இன்று, Mail.Ru Cloud Solutions தளத்தில் எங்கள் கணினி பார்வை தொழில்நுட்பம் வெற்றிகரமாக செயல்பட்டு மிகவும் சிக்கலான நடைமுறை சிக்கல்களை தீர்க்கிறது. இது பல நரம்பியல் நெட்வொர்க்குகளை அடிப்படையாகக் கொண்டது, அவை எங்கள் தரவுத் தொகுப்புகளில் பயிற்சி பெற்றவை மற்றும் பயன்பாட்டு சிக்கல்களைத் தீர்ப்பதில் நிபுணத்துவம் பெற்றவை. அனைத்து சேவைகளும் எங்கள் சர்வர் வசதிகளில் இயங்குகின்றன. உங்கள் பயன்பாடுகளில் பொது பார்வை API ஐ ஒருங்கிணைக்கலாம், இதன் மூலம் சேவையின் அனைத்து திறன்களும் கிடைக்கும். API வேகமாக உள்ளது - சர்வர் GPU களுக்கு நன்றி, எங்கள் நெட்வொர்க்கில் சராசரியாக 100 ms ஆகும்.

பூனைக்குச் செல்லுங்கள், ஒரு விரிவான கதை மற்றும் விஷனின் வேலைக்கான பல எடுத்துக்காட்டுகள் உள்ளன.

குறிப்பிடப்பட்ட முக அங்கீகார தொழில்நுட்பங்களை நாமே பயன்படுத்தும் சேவையின் எடுத்துக்காட்டு நிகழ்வுகள். அதன் கூறுகளில் ஒன்று விஷன் ஃபோட்டோ ஸ்டாண்டுகள், நாங்கள் பல்வேறு மாநாடுகளில் நிறுவுகிறோம். அத்தகைய புகைப்பட நிலைப்பாட்டை நீங்கள் அணுகினால், உள்ளமைக்கப்பட்ட கேமரா மூலம் புகைப்படம் எடுத்து உங்கள் மின்னஞ்சலை உள்ளிடவும், மாநாட்டின் பணியாளர் புகைப்படக் கலைஞர்களால் நீங்கள் கைப்பற்றப்பட்ட புகைப்படங்களின் வரிசையில் கணினி உடனடியாகக் கண்டுபிடிக்கும், மேலும் விரும்பினால், கிடைத்த புகைப்படங்களை மின்னஞ்சல் மூலம் உங்களுக்கு அனுப்பும். நாங்கள் அரங்கேற்றப்பட்ட போர்ட்ரெய்ட் காட்சிகளைப் பற்றி பேசவில்லை - பார்வையாளர்கள் கூட்டத்தின் பின்னணியில் கூட விஷன் உங்களை அடையாளம் கண்டுகொள்கிறது. நிச்சயமாக, அங்கீகரிக்கப்பட்ட புகைப்பட ஸ்டாண்டுகள் அல்ல, இவை அழகான ஸ்டாண்டுகளில் உள்ள டேப்லெட்டுகள், அவை விருந்தினர்களின் உள்ளமைக்கப்பட்ட கேமராக்கள் மூலம் புகைப்படங்களை எடுத்து சேவையகங்களுக்கு தகவல்களை அனுப்பும், அங்கு அனைத்து அங்கீகார மந்திரங்களும் நடக்கும். இமேஜ் அறிகனிசேஷன் நிபுணர்களிடையே கூட தொழில்நுட்பத்தின் செயல்திறன் எவ்வளவு ஆச்சரியமாக இருக்கிறது என்பதை நாங்கள் ஒன்றுக்கு மேற்பட்ட முறை பார்த்திருக்கிறோம். கீழே நாம் சில உதாரணங்களைப் பற்றி பேசுவோம்.

1. எங்கள் முகத்தை அடையாளம் காணும் மாதிரி

1.1 நரம்பியல் நெட்வொர்க் மற்றும் செயலாக்க வேகம்

அங்கீகாரத்திற்காக, ரெஸ்நெட் 101 நியூரல் நெட்வொர்க் மாடலின் மாற்றத்தைப் பயன்படுத்துகிறோம். ஆர்க்ஃபேஸில் எவ்வாறு செய்யப்படுகிறது என்பதைப் போலவே, முடிவில் சராசரி பூலிங் முழுமையாக இணைக்கப்பட்ட லேயரால் மாற்றப்படுகிறது. இருப்பினும், திசையன் பிரதிநிதித்துவங்களின் அளவு 128, 512 அல்ல. எங்கள் பயிற்சித் தொகுப்பில் 10 நபர்களின் சுமார் 273 மில்லியன் புகைப்படங்கள் உள்ளன.

கவனமாக தேர்ந்தெடுக்கப்பட்ட சர்வர் உள்ளமைவு கட்டமைப்பு மற்றும் GPU கம்ப்யூட்டிங்கின் காரணமாக இந்த மாதிரி மிக விரைவாக இயங்குகிறது. எங்கள் உள் நெட்வொர்க்குகளில் API இலிருந்து பதிலைப் பெற 100 ms ஆகும் - இதில் முகம் கண்டறிதல் (புகைப்படத்தில் முகத்தைக் கண்டறிதல்), API பதிலில் PersonID ஐ அடையாளம் கண்டு திரும்பப் பெறுதல் ஆகியவை அடங்கும். பெரிய அளவிலான உள்வரும் தரவுகளுடன் - புகைப்படங்கள் மற்றும் வீடியோக்கள் - தரவை சேவைக்கு மாற்றுவதற்கும் பதிலைப் பெறுவதற்கும் அதிக நேரம் எடுக்கும்.

1.2 மாதிரியின் செயல்திறனை மதிப்பீடு செய்தல்

ஆனால் நரம்பியல் நெட்வொர்க்குகளின் செயல்திறனைத் தீர்மானிப்பது மிகவும் தெளிவற்ற பணியாகும். அவர்களின் பணியின் தரமானது, மாதிரிகள் பயிற்சியளிக்கப்பட்ட தரவு மற்றும் குறிப்பிட்ட தரவுகளுடன் வேலை செய்வதற்கு அவை உகந்ததாக்கப்பட்டுள்ளதா என்பதைப் பொறுத்தது.

பிரபலமான LFW சரிபார்ப்பு சோதனை மூலம் எங்கள் மாதிரியின் துல்லியத்தை மதிப்பீடு செய்யத் தொடங்கினோம், ஆனால் இது மிகவும் சிறியது மற்றும் எளிமையானது. 99,8% துல்லியத்தை அடைந்த பிறகு, அது பயனற்றது. அங்கீகார மாதிரிகளை மதிப்பிடுவதில் ஒரு நல்ல போட்டி உள்ளது - மெகாஃபேஸ், அதில் நாங்கள் படிப்படியாக 82% ரேங்க் 1 ஐ எட்டினோம். மெகாஃபேஸ் சோதனையானது ஒரு மில்லியன் புகைப்படங்களைக் கொண்டுள்ளது - திசைதிருப்புபவர்கள் - மேலும் இந்த மாதிரியானது ஃபேஸ்ஸ்க்ரப்பில் இருந்து பல ஆயிரம் பிரபலங்களின் புகைப்படங்களை நன்கு வேறுபடுத்தி அறிய முடியும். திசைதிருப்புபவர்களிடமிருந்து தரவுத்தொகுப்பு. இருப்பினும், பிழைகளின் Megaface சோதனையை அழித்த பிறகு, அழிக்கப்பட்ட பதிப்பின் மூலம் 98% ரேங்க் 1 என்ற துல்லியத்தை அடைவதைக் கண்டறிந்தோம் (பிரபலங்களின் புகைப்படங்கள் பொதுவாக மிகவும் குறிப்பிட்டவை). எனவே, அவர்கள் மெகாஃபேஸைப் போலவே ஒரு தனி அடையாள சோதனையை உருவாக்கினர், ஆனால் "சாதாரண" நபர்களின் புகைப்படங்களுடன். பின்னர் எங்கள் தரவுத்தொகுப்புகளில் அங்கீகாரத் துல்லியத்தை மேம்படுத்தி, வெகுதூரம் முன்னேறினோம். கூடுதலாக, நாங்கள் பல ஆயிரம் புகைப்படங்களைக் கொண்ட கிளஸ்டரிங் தர சோதனையைப் பயன்படுத்துகிறோம்; இது பயனரின் மேகக்கணியில் முகம் குறியிடுவதை உருவகப்படுத்துகிறது. இந்த வழக்கில், கொத்துகள் என்பது ஒரே மாதிரியான நபர்களின் குழுக்கள், அடையாளம் காணக்கூடிய ஒவ்வொரு நபருக்கும் ஒரு குழு. உண்மையான குழுக்களின் பணியின் தரத்தை நாங்கள் சரிபார்த்தோம் (உண்மை).

நிச்சயமாக, எந்த மாதிரியிலும் அங்கீகார பிழைகள் ஏற்படுகின்றன. ஆனால் இத்தகைய சூழ்நிலைகள் பெரும்பாலும் குறிப்பிட்ட நிபந்தனைகளுக்கான நுழைவாயில்களை நன்றாகச் சரிசெய்வதன் மூலம் தீர்க்கப்படுகின்றன (அனைத்து மாநாடுகளுக்கும் நாங்கள் ஒரே வரம்புகளைப் பயன்படுத்துகிறோம், ஆனால், எடுத்துக்காட்டாக, அணுகல் கட்டுப்பாட்டு அமைப்புகளுக்கு, குறைவான தவறான நேர்மறைகள் இருக்கும் வகையில் வரம்புகளை பெரிதும் அதிகரிக்க வேண்டும்). பெரும்பாலான மாநாட்டு பார்வையாளர்கள் எங்கள் விஷன் புகைப்படச் சாவடிகளால் சரியாக அங்கீகரிக்கப்பட்டனர். சில நேரங்களில் யாராவது செதுக்கப்பட்ட முன்னோட்டத்தைப் பார்த்து, “உங்கள் சிஸ்டம் தவறு செய்து விட்டது, அது நான் அல்ல” என்று கூறுவார்கள். பின்னர் நாங்கள் புகைப்படத்தை முழுவதுமாகத் திறந்தோம், புகைப்படத்தில் உண்மையில் இந்த பார்வையாளர் இருந்தார், நாங்கள் அவரை மட்டுமே புகைப்படம் எடுக்கவில்லை, ஆனால் வேறு யாரோ, அந்த நபர் மங்கலான மண்டலத்தில் பின்னணியில் இருந்தார். மேலும், முகத்தின் ஒரு பகுதி தெரியவில்லை, அல்லது நபர் சுயவிவரத்தில் நிற்கும் போது அல்லது பாதி திரும்பியிருந்தாலும் கூட நரம்பியல் நெட்வொர்க் பெரும்பாலும் சரியாக அடையாளம் காணும். வைட் ஆங்கிள் லென்ஸ் மூலம் படம்பிடிக்கும்போது, ​​ஆப்டிகல் சிதைவு பகுதியில் முகம் இருந்தாலும், சிஸ்டம் ஒருவரை அடையாளம் காண முடியும்.

1.3 கடினமான சூழ்நிலைகளில் சோதனைக்கான எடுத்துக்காட்டுகள்

எங்கள் நரம்பியல் நெட்வொர்க் எவ்வாறு செயல்படுகிறது என்பதற்கான எடுத்துக்காட்டுகள் கீழே உள்ளன. ஒரு நபரின் தனிப்பட்ட அடையாளங்காட்டியான PersonID ஐப் பயன்படுத்தி அவர் லேபிளிட வேண்டிய புகைப்படங்கள் உள்ளீட்டில் சமர்ப்பிக்கப்படுகின்றன. இரண்டு அல்லது அதற்கு மேற்பட்ட படங்களுக்கு ஒரே ஐடி இருந்தால், மாடல்களின் படி, இந்த புகைப்படங்கள் ஒரே நபரை சித்தரிக்கின்றன.

சோதனை செய்யும் போது, ​​​​ஒரு குறிப்பிட்ட முடிவை அடைய நாம் கட்டமைக்கக்கூடிய பல்வேறு அளவுருக்கள் மற்றும் மாதிரி வரம்புகளுக்கான அணுகல் எங்களிடம் உள்ளது என்பதை உடனடியாக கவனிக்க வேண்டும். பொது API ஆனது பொதுவான நிகழ்வுகளில் அதிகபட்ச துல்லியத்திற்காக உகந்ததாக உள்ளது.

முன் எதிர்கொள்ளும் முகத்தை அடையாளம் கண்டுகொள்வதன் மூலம் எளிமையான விஷயத்துடன் ஆரம்பிக்கலாம்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

சரி, அது மிகவும் எளிதாக இருந்தது. பணியை சிக்கலாக்குவோம், ஒரு தாடி மற்றும் சில வருடங்கள் சேர்க்கலாம்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

இதுவும் மிகவும் கடினமாக இல்லை என்று சிலர் கூறுவார்கள், ஏனென்றால் இரண்டு சந்தர்ப்பங்களிலும் முழு முகமும் தெரியும், மேலும் முகத்தைப் பற்றிய நிறைய தகவல்கள் அல்காரிதத்திற்கு கிடைக்கின்றன. சரி, டாம் ஹார்டியை சுயவிவரமாக மாற்றுவோம். இந்த சிக்கல் மிகவும் சிக்கலானது, மேலும் குறைந்த பிழை விகிதத்தை பராமரிக்கும் போது அதை வெற்றிகரமாக தீர்க்க நாங்கள் நிறைய முயற்சி செய்தோம்: நாங்கள் ஒரு பயிற்சித் தொகுப்பைத் தேர்ந்தெடுத்தோம், நரம்பியல் நெட்வொர்க்கின் கட்டமைப்பைப் பற்றி சிந்தித்து, இழப்பு செயல்பாடுகளை மேம்படுத்தி, முன் செயலாக்கத்தை மேம்படுத்தினோம். புகைப்படங்கள்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

அவருக்கு ஒரு தலைக்கவசம் போடுவோம்:

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

மூலம், இது குறிப்பாக கடினமான சூழ்நிலைக்கு ஒரு எடுத்துக்காட்டு, ஏனெனில் முகம் பெரிதும் மறைக்கப்பட்டுள்ளது, மேலும் கீழே உள்ள புகைப்படத்தில் கண்களை மறைக்கும் ஆழமான நிழலும் உள்ளது. நிஜ வாழ்க்கையில், மக்கள் பெரும்பாலும் இருண்ட கண்ணாடிகளின் உதவியுடன் தங்கள் தோற்றத்தை மாற்றுகிறார்கள். டாமிலும் அதையே செய்வோம்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

சரி, வெவ்வேறு வயதினரின் புகைப்படங்களை எடுக்க முயற்சிப்போம், இந்த முறை வேறு நடிகருடன் பரிசோதனை செய்வோம். மிகவும் சிக்கலான உதாரணத்தை எடுத்துக்கொள்வோம், அங்கு வயது தொடர்பான மாற்றங்கள் குறிப்பாக உச்சரிக்கப்படுகின்றன. நிலைமை வெகு தொலைவில் இல்லை; பாஸ்போர்ட்டில் உள்ள புகைப்படத்தை தாங்குபவரின் முகத்துடன் ஒப்பிட வேண்டியிருக்கும் போது இது அடிக்கடி நிகழ்கிறது. எல்லாவற்றிற்கும் மேலாக, உரிமையாளருக்கு 20 வயதாக இருக்கும்போது முதல் புகைப்படம் பாஸ்போர்ட்டில் சேர்க்கப்படும், மேலும் 45 வயதிற்குள் ஒரு நபர் பெரிதும் மாறலாம்:

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

சாத்தியமற்ற பணிகளின் முக்கிய நிபுணர் வயதுக்கு ஏற்ப மாறவில்லை என்று நினைக்கிறீர்களா? ஒரு சிலர் கூட மேல் மற்றும் கீழ் புகைப்படங்களை இணைப்பார்கள் என்று நினைக்கிறேன், பையன் பல ஆண்டுகளாக மிகவும் மாறிவிட்டான்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

நரம்பியல் நெட்வொர்க்குகள் தோற்றத்தில் மாற்றங்களை அடிக்கடி சந்திக்கின்றன. உதாரணமாக, சில நேரங்களில் பெண்கள் அழகுசாதனப் பொருட்களின் உதவியுடன் தங்கள் படத்தை பெரிதும் மாற்றலாம்:

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

இப்போது பணியை இன்னும் சிக்கலாக்குவோம்: முகத்தின் வெவ்வேறு பகுதிகள் வெவ்வேறு புகைப்படங்களில் மூடப்பட்டிருக்கும் என்று வைத்துக்கொள்வோம். இதுபோன்ற சந்தர்ப்பங்களில், அல்காரிதம் முழு மாதிரிகளையும் ஒப்பிட முடியாது. இருப்பினும், விஷன் இது போன்ற சூழ்நிலைகளை நன்கு கையாளுகிறது.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

மூலம், ஒரு புகைப்படத்தில் நிறைய முகங்கள் இருக்கலாம்; உதாரணமாக, ஒரு மண்டபத்தின் பொதுவான புகைப்படத்தில் 100 க்கும் மேற்பட்டவர்கள் பொருத்த முடியும். நரம்பியல் நெட்வொர்க்குகளுக்கு இது ஒரு கடினமான சூழ்நிலை, ஏனெனில் பல முகங்கள் வித்தியாசமாக ஒளிரும், சில கவனம் செலுத்தவில்லை. இருப்பினும், புகைப்படம் போதுமான தெளிவுத்திறன் மற்றும் தரத்துடன் எடுக்கப்பட்டால் (ஒரு சதுரத்திற்கு குறைந்தது 75 பிக்சல்கள் முகத்தை மறைக்கும்), விஷன் அதைக் கண்டறிந்து அடையாளம் காண முடியும்.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

கண்காணிப்பு கேமராக்களில் இருந்து அறிக்கையிடும் புகைப்படங்கள் மற்றும் படங்களின் தனித்தன்மை என்னவென்றால், மக்கள் பெரும்பாலும் மங்கலாக்கப்படுகிறார்கள், ஏனெனில் அவர்கள் கவனம் செலுத்தவில்லை அல்லது அந்த நேரத்தில் நகர்கிறார்கள்:

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

மேலும், ஒளியின் தீவிரம் படத்திலிருந்து படத்திற்கு பெரிதும் மாறுபடும். இதுவும் அடிக்கடி முட்டுக்கட்டையாக மாறும்; பல வழிமுறைகள் மிகவும் இருட்டாகவும், ஒளியாகவும் இருக்கும் படங்களைச் சரியாகச் செயலாக்குவதில் பெரும் சிரமத்தை எதிர்கொள்கின்றன. இந்த முடிவை அடைய, நீங்கள் ஒரு குறிப்பிட்ட வழியில் வரம்புகளை உள்ளமைக்க வேண்டும் என்பதை உங்களுக்கு நினைவூட்டுகிறேன்; இந்த அம்சம் இன்னும் பொதுவில் கிடைக்கவில்லை. அனைத்து வாடிக்கையாளர்களுக்கும் ஒரே நரம்பியல் வலையமைப்பைப் பயன்படுத்துகிறோம்; இது பெரும்பாலான நடைமுறைப் பணிகளுக்கு ஏற்ற வாசல்களைக் கொண்டுள்ளது.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

ஆசிய முகங்களை அதிக துல்லியத்துடன் அங்கீகரிக்கும் மாடலின் புதிய பதிப்பை நாங்கள் சமீபத்தில் வெளியிட்டோம். இது ஒரு பெரிய பிரச்சனையாக இருந்தது, இது "இயந்திர கற்றல்" (அல்லது "நரம்பியல் நெட்வொர்க்") இனவெறி என்றும் அழைக்கப்படுகிறது. ஐரோப்பிய மற்றும் அமெரிக்க நரம்பியல் நெட்வொர்க்குகள் காகசியன் முகங்களை நன்கு அங்கீகரித்தன, ஆனால் மங்கோலாய்டு மற்றும் நெக்ராய்டு முகங்களுடன் நிலைமை மிகவும் மோசமாக இருந்தது. அநேகமாக, சீனாவில் நிலைமை நேர்மாறாக இருந்தது. இது ஒரு குறிப்பிட்ட நாட்டில் ஆதிக்கம் செலுத்தும் நபர்களை பிரதிபலிக்கும் பயிற்சி தரவுத் தொகுப்புகளைப் பற்றியது. இருப்பினும், நிலைமை மாறுகிறது; இன்று இந்த பிரச்சனை அவ்வளவு தீவிரமாக இல்லை. வெவ்வேறு இன மக்களுடன் பார்வைக்கு எந்த பிரச்சனையும் இல்லை.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

முக அங்கீகாரம் என்பது நமது தொழில்நுட்பத்தின் பல பயன்பாடுகளில் ஒன்றாகும்; எதையும் அடையாளம் காண பார்வைக்கு பயிற்சி அளிக்கப்படும். எடுத்துக்காட்டாக, உரிமத் தகடுகள், அல்காரிதங்களுக்கு கடினமான சூழ்நிலைகள் உட்பட: கூர்மையான கோணங்களில், அழுக்கு மற்றும் உரிமத் தகடுகளைப் படிக்க கடினமாக உள்ளது.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

2. நடைமுறை பயன்பாட்டு வழக்குகள்

2.1 உடல் அணுகல் கட்டுப்பாடு: இரண்டு பேர் ஒரே பாஸைப் பயன்படுத்தும் போது

பார்வையின் உதவியுடன், பணியாளர்களின் வருகை மற்றும் புறப்பாடு பதிவு செய்வதற்கான அமைப்புகளை நீங்கள் செயல்படுத்தலாம். மின்னணு பாஸ்களை அடிப்படையாகக் கொண்ட பாரம்பரிய அமைப்பு வெளிப்படையான குறைபாடுகளைக் கொண்டுள்ளது, எடுத்துக்காட்டாக, ஒரு பேட்ஜைப் பயன்படுத்தி நீங்கள் இரண்டு நபர்களை அனுப்பலாம். அணுகல் கட்டுப்பாட்டு அமைப்பு (ACS) பார்வையுடன் கூடுதலாக இருந்தால், அது யார் வந்தது/இடந்தது, எப்போது வந்தது என்பதை நேர்மையாக பதிவு செய்யும்.

2.2 நேர கண்காணிப்பு

இந்த பார்வை பயன்பாட்டு வழக்கு முந்தையவற்றுடன் நெருக்கமாக தொடர்புடையது. எங்கள் முக அங்கீகார சேவையுடன் அணுகல் அமைப்பை நீங்கள் கூடுதலாகச் செய்தால், அணுகல் கட்டுப்பாட்டு மீறல்களைக் கண்டறிவது மட்டுமல்லாமல், கட்டிடம் அல்லது வசதியில் பணியாளர்களின் உண்மையான இருப்பைப் பதிவுசெய்யவும் முடியும். வேறு வார்த்தைகளில் கூறுவதானால், பணிக்கு வந்தவர்கள் மற்றும் எந்த நேரத்தில் வெளியேறினார்கள், யார் வேலையை முழுவதுமாக புறக்கணித்தார்கள் என்பதை நேர்மையாக கணக்கில் எடுத்துக்கொள்வதற்கு விஷன் உதவும்.

2.3 வீடியோ பகுப்பாய்வு: மக்கள் கண்காணிப்பு மற்றும் பாதுகாப்பு

விஷனைப் பயன்படுத்தி மக்களைக் கண்காணிப்பதன் மூலம், ஷாப்பிங் பகுதிகள், ரயில் நிலையங்கள், பாதைகள், தெருக்கள் மற்றும் பல பொது இடங்களின் உண்மையான போக்குவரத்தை நீங்கள் துல்லியமாக மதிப்பிடலாம். எங்கள் கண்காணிப்பு அணுகலைக் கட்டுப்படுத்துவதில் பெரும் உதவியாக இருக்கும், எடுத்துக்காட்டாக, ஒரு கிடங்கு அல்லது பிற முக்கியமான அலுவலக வளாகங்களுக்கு. நிச்சயமாக, நபர்களையும் முகங்களையும் கண்காணிப்பது பாதுகாப்புச் சிக்கல்களைத் தீர்க்க உதவுகிறது. உங்கள் கடையில் யாராவது திருடுவது பிடிபட்டதா? உங்கள் வீடியோ பகுப்பாய்வு மென்பொருளின் தடுப்புப்பட்டியலில் விஷன் மூலம் திருப்பியளிக்கப்பட்ட அவரது PersonID ஐச் சேர்க்கவும், அடுத்த முறை இந்த வகை மீண்டும் தோன்றினால் கணினி உடனடியாக பாதுகாப்பை எச்சரிக்கும்.

2.4 வர்த்தகத்தில்

சில்லறை மற்றும் பல்வேறு சேவை வணிகங்கள் வரிசை அங்கீகாரத்தில் ஆர்வமாக உள்ளன. பார்வையின் உதவியுடன், இது ஒரு சீரற்ற மக்கள் கூட்டம் அல்ல, ஆனால் ஒரு வரிசை என்பதை நீங்கள் அடையாளம் கண்டு, அதன் நீளத்தை தீர்மானிக்க முடியும். பின்னர் கணினி பொறுப்பாளர்களுக்கு ஒரு வரிசையைப் பற்றி தெரிவிக்கிறது, இதனால் அவர்கள் நிலைமையைக் கண்டுபிடிக்க முடியும்: ஒன்று பார்வையாளர்களின் வருகை மற்றும் கூடுதல் பணியாளர்களை அழைக்க வேண்டும், அல்லது யாரோ ஒருவர் தங்கள் வேலை கடமைகளில் தாமதம் செய்கிறார்.

மற்றொரு சுவாரஸ்யமான பணி, மண்டபத்தில் உள்ள நிறுவன ஊழியர்களை பார்வையாளர்களிடமிருந்து பிரிப்பது. பொதுவாக, குறிப்பிட்ட ஆடைகள் (ஆடைக் குறியீடு) அல்லது சில தனித்துவமான அம்சங்களுடன் (பிராண்டட் ஸ்கார்ஃப், மார்பில் பேட்ஜ் மற்றும் பல) அணிந்திருக்கும் பொருட்களைப் பிரிக்க கணினி பயிற்சியளிக்கப்படுகிறது. இது வருகையை மிகவும் துல்லியமாக மதிப்பிட உதவுகிறது (இதனால் பணியாளர்கள் மண்டபத்தில் உள்ளவர்களின் புள்ளிவிபரங்களை அவர்களின் இருப்பின் மூலம் "உயர்த்த" மாட்டார்கள்).

முக அங்கீகாரத்தைப் பயன்படுத்தி, உங்கள் பார்வையாளர்களை நீங்கள் மதிப்பீடு செய்யலாம்: பார்வையாளர்களின் விசுவாசம் என்ன, அதாவது, எத்தனை பேர் உங்கள் நிறுவனத்திற்குத் திரும்புகிறார்கள், எந்த அதிர்வெண்ணுடன் வருகிறார்கள். ஒரு மாதத்திற்கு எத்தனை தனிப்பட்ட பார்வையாளர்கள் உங்களிடம் வருகிறார்கள் என்பதைக் கணக்கிடுங்கள். ஈர்ப்பு மற்றும் தக்கவைப்புக்கான செலவுகளை மேம்படுத்த, வாரத்தின் நாள் மற்றும் நாளின் நேரத்தைப் பொறுத்து போக்குவரத்தில் ஏற்படும் மாற்றத்தையும் நீங்கள் கண்டறியலாம்.

பல்வேறு சில்லறை விற்பனை நிலையங்களின் பிராண்டிங்கின் தரத்தின் புகைப்படங்களின் அடிப்படையில் உரிமையாளர்கள் மற்றும் சங்கிலி நிறுவனங்கள் மதிப்பீட்டை ஆர்டர் செய்யலாம்: லோகோக்கள், அடையாளங்கள், சுவரொட்டிகள், பதாகைகள் மற்றும் பல.

2.5 போக்குவரத்து மூலம்

வீடியோ பகுப்பாய்வுகளைப் பயன்படுத்தி பாதுகாப்பை உறுதி செய்வதற்கான மற்றொரு எடுத்துக்காட்டு, விமான நிலையங்கள் அல்லது ரயில் நிலையங்களின் அரங்குகளில் கைவிடப்பட்ட பொருட்களை அடையாளம் காண்பது. நூற்றுக்கணக்கான வகுப்புகளின் பொருட்களை அடையாளம் காண பார்வைக்கு பயிற்சி அளிக்கப்படலாம்: தளபாடங்கள், பைகள், சூட்கேஸ்கள், குடைகள், பல்வேறு வகையான ஆடைகள், பாட்டில்கள் மற்றும் பல. உங்கள் வீடியோ பகுப்பாய்வு அமைப்பு உரிமையற்ற பொருளைக் கண்டறிந்து, விஷனைப் பயன்படுத்தி அதை அடையாளம் கண்டால், அது பாதுகாப்புச் சேவைக்கு ஒரு சமிக்ஞையை அனுப்புகிறது. இதேபோன்ற பணி பொது இடங்களில் அசாதாரண சூழ்நிலைகளை தானாக கண்டறிவதோடு தொடர்புடையது: யாரோ ஒருவர் உடல்நிலை சரியில்லாமல் இருக்கிறார், அல்லது யாரோ தவறான இடத்தில் புகைபிடிக்கிறார்கள், அல்லது ஒரு நபர் தண்டவாளத்தில் விழுகிறார், மற்றும் பல - இந்த வடிவங்கள் அனைத்தையும் வீடியோ பகுப்பாய்வு அமைப்புகளால் அங்கீகரிக்க முடியும். விஷன் ஏபிஐ மூலம்.

2.6 ஆவண ஓட்டம்

நாம் தற்போது உருவாக்கி வரும் விஷனின் மற்றொரு சுவாரஸ்யமான எதிர்கால பயன்பாடு ஆவண அங்கீகாரம் மற்றும் தரவுத்தளங்களில் தானாக பாகுபடுத்துதல் ஆகும். முடிவில்லா தொடர்கள், எண்கள், வெளியீட்டுத் தேதிகள், கணக்கு எண்கள், வங்கி விவரங்கள், தேதிகள் மற்றும் பிறந்த இடங்கள் மற்றும் பல முறைப்படுத்தப்பட்ட தரவுகளை கைமுறையாக உள்ளிடுவதற்குப் பதிலாக (அல்லது மோசமாக உள்ளிடுவது) மேகக்கணிக்கு API, அங்கு கணினி இந்த ஆவணங்களை பறக்கும் போது அடையாளம் கண்டு, அவற்றை அலசி, தரவுத்தளத்தில் தானாக நுழைவதற்கு தேவையான வடிவத்தில் தரவுடன் பதிலை வழங்கும். பாஸ்போர்ட், SNILS, TIN, பிறப்புச் சான்றிதழ்கள், திருமணச் சான்றிதழ்கள் மற்றும் பிறவற்றை வேறுபடுத்தி - இன்று விஷன் ஆவணங்களை (PDF உட்பட) எவ்வாறு வகைப்படுத்துவது என்பதை ஏற்கனவே அறிந்திருக்கிறது.

நிச்சயமாக, நரம்பியல் நெட்வொர்க் இந்த எல்லா சூழ்நிலைகளையும் பெட்டிக்கு வெளியே கையாள முடியாது. ஒவ்வொரு சந்தர்ப்பத்திலும், ஒரு குறிப்பிட்ட வாடிக்கையாளருக்காக ஒரு புதிய மாதிரி கட்டப்பட்டுள்ளது, பல காரணிகள், நுணுக்கங்கள் மற்றும் தேவைகள் கணக்கில் எடுத்துக்கொள்ளப்படுகின்றன, தரவுத் தொகுப்புகள் தேர்ந்தெடுக்கப்படுகின்றன, மேலும் பயிற்சி, சோதனை மற்றும் கட்டமைப்பு ஆகியவற்றின் மறு செய்கைகள் மேற்கொள்ளப்படுகின்றன.

3. API செயல்பாட்டுத் திட்டம்

பயனர்களுக்கான விஷனின் "நுழைவு வாயில்" REST API ஆகும். இது புகைப்படங்கள், வீடியோ கோப்புகள் மற்றும் நெட்வொர்க் கேமராக்களிலிருந்து (RTSP ஸ்ட்ரீம்கள்) உள்ளீடாக ஒளிபரப்புகளைப் பெறலாம்.

பார்வையைப் பயன்படுத்த, உங்களுக்குத் தேவை பதிவு Mail.ru Cloud Solutions சேவையில் அணுகல் டோக்கன்களைப் பெறவும் (client_id + client_secret). OAuth நெறிமுறையைப் பயன்படுத்தி பயனர் அங்கீகாரம் செய்யப்படுகிறது. POST கோரிக்கைகளின் உடல்களில் உள்ள மூலத் தரவு API க்கு அனுப்பப்படும். இதற்கு பதிலளிக்கும் விதமாக, கிளையன்ட் API இலிருந்து JSON வடிவத்தில் ஒரு அங்கீகார முடிவைப் பெறுகிறார், மேலும் பதில் கட்டமைக்கப்பட்டுள்ளது: இது கண்டுபிடிக்கப்பட்ட பொருள்கள் மற்றும் அவற்றின் ஒருங்கிணைப்புகள் பற்றிய தகவல்களைக் கொண்டுள்ளது.

தாடி, இருண்ட கண்ணாடி மற்றும் சுயவிவரத்தில்: கணினி பார்வைக்கு கடினமான சூழ்நிலைகள்

மாதிரி பதில்

{
   "status":200,
   "body":{
      "objects":[
         {
            "status":0,
            "name":"file_0"
         },
         {
            "status":0,
            "name":"file_2",
            "persons":[
               {
                  "tag":"person9"
                  "coord":[149,60,234,181],
                  "confidence":0.9999,
                  "awesomeness":0.45
               },
               {
                  "tag":"person10"
                  "coord":[159,70,224,171],
                  "confidence":0.9998,
                  "awesomeness":0.32
               }
            ]
         }

         {
            "status":0,
            "name":"file_3",
            "persons":[
               {
               "tag":"person11",
               "coord":[157,60,232,111],
               "aliases":["person12", "person13"]
               "confidence":0.9998,
               "awesomeness":0.32
               }
            ]
         },
         {
            "status":0,
            "name":"file_4",
            "persons":[
               {
               "tag":"undefined"
               "coord":[147,50,222,121],
               "confidence":0.9997,
               "awesomeness":0.26
               }
            ]
         }
      ],
      "aliases_changed":false
   },
   "htmlencoded":false,
   "last_modified":0
}

பதிலில் ஒரு சுவாரஸ்யமான அளவுரு அற்புதம் உள்ளது - இது ஒரு புகைப்படத்தில் ஒரு முகத்தின் நிபந்தனை "குளிர்ச்சி" ஆகும், அதன் உதவியுடன் வரிசையிலிருந்து ஒரு முகத்தின் சிறந்த காட்சியைத் தேர்ந்தெடுக்கிறோம். சமூக வலைப்பின்னல்களில் ஒரு புகைப்படம் விரும்பப்படுவதற்கான சாத்தியக்கூறுகளைக் கணிக்க ஒரு நரம்பியல் நெட்வொர்க்கைப் பயிற்றுவித்தோம். புகைப்படத்தின் தரம் சிறப்பாகவும், சிரிக்கும் முகமாகவும் இருந்தால், அற்புதம் அதிகமாகும்.

ஏபிஐ விஷன் ஸ்பேஸ் என்ற கருத்தைப் பயன்படுத்துகிறது. இது வெவ்வேறு முகங்களை உருவாக்குவதற்கான ஒரு கருவியாகும். இடங்களின் எடுத்துக்காட்டுகள் கருப்பு மற்றும் வெள்ளை பட்டியல்கள், பார்வையாளர்கள், பணியாளர்கள், வாடிக்கையாளர்களின் பட்டியல்கள் போன்றவை. விஷனில் உள்ள ஒவ்வொரு டோக்கனுக்கும் 10 இடைவெளிகளை உருவாக்கலாம், ஒவ்வொரு இடத்திலும் 50 ஆயிரம் பேர் ஐடிகள் இருக்கலாம், அதாவது 500 ஆயிரம் வரை இருக்கலாம். டோக்கனுக்கு. மேலும், ஒரு கணக்கிற்கு டோக்கன்களின் எண்ணிக்கை வரையறுக்கப்படவில்லை.

இன்று API பின்வரும் கண்டறிதல் மற்றும் அங்கீகார முறைகளை ஆதரிக்கிறது:

  • அடையாளம்/அமைத்தல் - முகங்களைக் கண்டறிதல் மற்றும் அறிதல். ஒவ்வொரு தனிப்பட்ட நபருக்கும் தானாகவே ஒரு PersonID ஐ ஒதுக்குகிறது, PersonID மற்றும் கண்டுபிடிக்கப்பட்ட நபர்களின் ஒருங்கிணைப்புகளை வழங்குகிறது.
  • நீக்கு - நபர் தரவுத்தளத்திலிருந்து ஒரு குறிப்பிட்ட நபர் ஐடியை நீக்குதல்.
  • துண்டிக்கவும் - PersonID இலிருந்து முழு இடத்தையும் அழிக்கிறது, இது சோதனை இடமாகப் பயன்படுத்தப்பட்டால் பயனுள்ளதாக இருக்கும், மேலும் நீங்கள் உற்பத்திக்காக தரவுத்தளத்தை மீட்டமைக்க வேண்டும்.
  • கண்டறிதல் - பொருள்கள், காட்சிகள், உரிமத் தகடுகள், அடையாளங்கள், வரிசைகள் போன்றவற்றைக் கண்டறிதல்
  • ஆவணங்களைக் கண்டறிதல் - ரஷ்ய கூட்டமைப்பின் குறிப்பிட்ட வகை ஆவணங்களைக் கண்டறிகிறது (பாஸ்போர்ட், SNILS, வரி அடையாள எண், முதலியவற்றை வேறுபடுத்துகிறது).

OCR க்கான முறைகள், பாலினம், வயது மற்றும் உணர்ச்சிகளைத் தீர்மானித்தல், அத்துடன் வணிகச் சிக்கல்களைத் தீர்ப்பது, அதாவது கடைகளில் பொருட்களைக் காட்சிப்படுத்துவதைத் தானாகக் கட்டுப்படுத்துவது போன்றவற்றை விரைவில் முடிப்போம். முழுமையான API ஆவணங்களை இங்கே காணலாம்: https://mcs.mail.ru/help/vision-api

4. முடிவுக்கு

இப்போது, ​​பொது API மூலம், நீங்கள் புகைப்படங்கள் மற்றும் வீடியோக்களில் முக அங்கீகாரத்தை அணுகலாம்; பல்வேறு பொருள்கள், உரிமத் தகடுகள், அடையாளங்கள், ஆவணங்கள் மற்றும் முழு காட்சிகளின் அடையாளம் ஆதரிக்கப்படுகிறது. பயன்பாட்டு காட்சிகள் - கடல். வாருங்கள், எங்கள் சேவையை சோதிக்கவும், மிகவும் தந்திரமான பணிகளை அமைக்கவும். முதல் 5000 பரிவர்த்தனைகள் இலவசம். ஒருவேளை அது உங்கள் திட்டங்களுக்கு "காணாமல் போன மூலப்பொருளாக" இருக்கலாம்.

பதிவு மற்றும் இணைப்பில் நீங்கள் உடனடியாக API ஐ அணுகலாம். நோக்கம் . அனைத்து ஹப்ரா பயனர்களும் கூடுதல் பரிவர்த்தனைகளுக்கான விளம்பரக் குறியீட்டைப் பெறுகிறார்கள். உங்கள் கணக்கை பதிவு செய்ய நீங்கள் பயன்படுத்திய மின்னஞ்சல் முகவரியை எனக்கு எழுதுங்கள்!

ஆதாரம்: www.habr.com

கருத்தைச் சேர்