கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

சில மாதங்களுக்கு முன்பு, Google இலிருந்து எங்கள் சக ஊழியர்கள் செலவழித்தது on Kaggle பரபரப்பான படங்களுக்கு ஒரு வகைப்படுத்தியை உருவாக்க ஒரு போட்டி விளையாட்டு "விரைவு, வரையவும்!" யாண்டெக்ஸ் டெவலப்பர் ரோமன் விளாசோவ் அடங்கிய அணி, போட்டியில் நான்காவது இடத்தைப் பிடித்தது. ஜனவரி மாதம் நடைபெற்ற இயந்திர கற்றல் பயிற்சியில், ரோமன் தனது குழுவின் யோசனைகள், வகைப்படுத்தியின் இறுதி செயலாக்கம் மற்றும் அவரது எதிரிகளின் சுவாரஸ்யமான நடைமுறைகளைப் பகிர்ந்து கொண்டார்.


- அனைவருக்கும் வணக்கம்! என் பெயர் ரோமா விளாசோவ், இன்று நான் உங்களுக்கு விரைவு, வரைதல் பற்றி கூறுவேன்! Doodle Recognition Challenge.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

எங்கள் அணியில் ஐந்து பேர் இருந்தனர். இணைப்பு காலக்கெடுவுக்கு முன்பே நான் சேர்ந்தேன். துரதிர்ஷ்டம், கொஞ்சம் அசைந்தோம், ஆனால் பண நிலையிலிருந்து நாங்கள் அசைந்தோம், அவர்கள் தங்க நிலையிலிருந்து அசைந்தோம். நாங்கள் கௌரவமான நான்காவது இடத்தைப் பிடித்தோம்.

(போட்டியின் போது, ​​அணிகள் ஒரு மதிப்பீட்டில் தங்களைக் கவனித்துக்கொண்டன, இது முன்மொழியப்பட்ட தரவுத் தொகுப்பின் ஒரு பகுதியில் காட்டப்பட்ட முடிவுகளின் அடிப்படையில் உருவாக்கப்பட்டது. இறுதி மதிப்பீடு, தரவுத்தொகுப்பின் மற்றொரு பகுதியில் உருவாக்கப்பட்டது. இது அவ்வாறு செய்யப்படுகிறது. போட்டியில் பங்கேற்பாளர்கள் குறிப்பிட்ட தரவுகளுடன் தங்கள் அல்காரிதம்களை சரிசெய்வதில்லை.எனவே, இறுதிப் போட்டியில், மதிப்பீடுகளுக்கு இடையில் மாறும்போது, ​​நிலைகள் சிறிது குலுக்கப்படும் (ஆங்கிலத்தில் இருந்து ஷேக் அப் - கலக்க): மற்ற தரவுகளில், முடிவு மாறலாம். வித்தியாசமாக இருக்க வேண்டும்.முதல் மூன்று இடங்களுக்குள் ரோமன் அணி முதலிடம் பிடித்தது.இந்நிலையில், முதல் மூன்று இடங்கள் பணம், பணமதிப்பீட்டு மண்டலம், முதல் மூன்று இடங்களுக்கு மட்டுமே ரொக்கப் பரிசு வழங்கப்பட்டது.குலுக்கல்லுக்குப் பிறகு, அணி ஏற்கனவே இருந்தது. நான்காவது இடம்.அதே போல் மற்ற அணி வெற்றி, தங்கம் நிலையை இழந்தது.- எட்.)

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

எவ்ஜெனி பாபக்னின் ஒரு கிராண்ட்மாஸ்டரைப் பெற்றார், இவான் சோசின் ஒரு மாஸ்டரைப் பெற்றார், ரோமன் சோலோவிவ் ஒரு கிராண்ட்மாஸ்டராக இருந்தார், அலெக்ஸ் பரினோவ் ஒரு மாஸ்டர் பெற்றார், நான் ஒரு நிபுணரானேன், இப்போது நான் ஏற்கனவே ஒரு மாஸ்டர்.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

இது என்ன குயிக், டிரா? இது Google வழங்கும் சேவையாகும். AI ஐ பிரபலப்படுத்தும் இலக்கை Google கொண்டிருந்தது மற்றும் இந்த சேவையின் மூலம் நரம்பியல் நெட்வொர்க்குகள் எவ்வாறு செயல்படுகின்றன என்பதைக் காட்ட விரும்புகிறது. நீங்கள் அங்கு சென்று, வரைவோம் என்பதைக் கிளிக் செய்து, புதிய பக்கம் தோன்றும். நீங்கள் 20 வினாடிகளில் ஜிக்ஜாக் வரைய முயற்சிக்கிறீர்கள், எடுத்துக்காட்டாக, இங்கே உள்ளது போல. நீங்கள் வெற்றியடைந்தால், பிணையம் இது ஒரு ஜிக்ஜாக் என்று கூறுகிறது, நீங்கள் முன்னேறுங்கள். அப்படிப்பட்ட படங்கள் ஆறுதான்.

நீங்கள் வரைந்ததை Google இன் நெட்வொர்க் அடையாளம் காணத் தவறினால், பணியின் மீது ஒரு குறுக்கு வைக்கப்படும். ஒரு வரைபடம் நெட்வொர்க்கால் அங்கீகரிக்கப்பட்டதா இல்லையா என்பது எதிர்காலத்தில் என்ன அர்த்தம் என்பதை நான் பின்னர் கூறுவேன்.

இந்த சேவையானது அதிக எண்ணிக்கையிலான பயனர்களை சேகரித்தது, மேலும் பயனர்கள் வரைந்த அனைத்து படங்களும் பதிவு செய்யப்பட்டன.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

கிட்டத்தட்ட 50 மில்லியன் படங்களை சேகரிக்க முடிந்தது. இதிலிருந்து, எங்கள் போட்டிக்கான ரயில் மற்றும் சோதனை தேதி உருவாக்கப்பட்டது. ஒரு காரணத்திற்காக, தேர்வில் உள்ள தரவுகளின் அளவு மற்றும் வகுப்புகளின் எண்ணிக்கை ஆகியவை தடிமனான எழுத்துக்களில் முன்னிலைப்படுத்தப்படுகின்றன. அவர்களைப் பற்றி சிறிது நேரம் கழித்து சொல்கிறேன்.

தரவு வடிவம் பின்வருமாறு இருந்தது. இவை RGB படங்கள் மட்டுமல்ல, தோராயமாகச் சொன்னால், பயனர் செய்த எல்லாவற்றின் பதிவு. வார்த்தை எங்கள் இலக்கு, நாட்டுக்குறியீடு என்பது டூடுலின் ஆசிரியர் எங்கிருந்து வந்தார், நேர முத்திரை நேரம். அங்கீகரிக்கப்பட்ட லேபிள், Google இலிருந்து படத்தை நெட்வொர்க் அங்கீகரித்ததா இல்லையா என்பதைக் காட்டுகிறது. மற்றும் வரைதல் என்பது ஒரு வரிசை, பயனர் புள்ளிகளுடன் வரைந்த வளைவின் தோராயமாகும். மற்றும் நேரங்கள். படம் வரையத் தொடங்கிய நேரம் இது.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

தரவு இரண்டு வடிவங்களில் வழங்கப்பட்டது. இது முதல் வடிவம், இரண்டாவது எளிமைப்படுத்தப்பட்டது. அவர்கள் அங்கிருந்து நேரத்தை வெட்டி, இந்த புள்ளிகளின் தொகுப்பை சிறிய புள்ளிகளுடன் தோராயமாக்கினர். இதற்காக அவர்கள் பயன்படுத்தினர் டக்ளஸ்-பெக்கர் அல்காரிதம். உங்களிடம் ஒரு நேர்கோட்டை தோராயமாக மதிப்பிடும் பெரிய புள்ளிகள் உள்ளன, ஆனால் உண்மையில் நீங்கள் இந்த வரியை இரண்டு புள்ளிகளுடன் தோராயமாக மதிப்பிடலாம். இது அல்காரிதம் யோசனை.

தரவு பின்வருமாறு விநியோகிக்கப்பட்டது. எல்லாம் சீரானது, ஆனால் சில வெளிப்புறங்கள் உள்ளன. நாங்கள் சிக்கலைத் தீர்த்தபோது, ​​​​நாங்கள் அதைப் பார்க்கவில்லை. முக்கிய விஷயம் என்னவென்றால், உண்மையில் குறைவான வகுப்புகள் எதுவும் இல்லை, நாங்கள் எடையுள்ள மாதிரிகள் மற்றும் தரவு மிகைப்படுத்தல் செய்ய வேண்டியதில்லை.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

படங்கள் எப்படி இருந்தன? இது "விமானம்" வகுப்பு மற்றும் அங்கீகரிக்கப்பட்ட மற்றும் அங்கீகரிக்கப்படாத லேபிள்களுடன் அதிலிருந்து எடுத்துக்காட்டுகள். அவற்றின் விகிதம் 1 முதல் 9 வரை எங்கோ இருந்தது. நீங்கள் பார்க்கிறபடி, தரவு மிகவும் சத்தமாக உள்ளது. அது ஒரு விமானம் என்று நான் நினைக்கிறேன். நீங்கள் அங்கீகரிக்கப்படவில்லை என்று பார்த்தால், பெரும்பாலான சந்தர்ப்பங்களில் அது சத்தம் மட்டுமே. யாரோ ஒருவர் "விமானம்" என்று எழுத முயன்றார், ஆனால் வெளிப்படையாக பிரெஞ்சு மொழியில்.

பெரும்பாலான பங்கேற்பாளர்கள் வெறுமனே கட்டங்களை எடுத்து, RGB படங்களாக இந்த வரிகளின் வரிசையிலிருந்து தரவை வரைந்து, அவற்றை நெட்வொர்க்கில் எறிந்தனர். நான் ஏறக்குறைய அதே வழியில் வரைந்தேன்: நான் வண்ணத் தட்டுகளை எடுத்து, ஒரு வண்ணத்தில் முதல் வரியை வரைந்தேன், அது இந்தத் தட்டுகளின் தொடக்கத்தில் இருந்தது, கடைசி வரி மற்றொன்றுடன், தட்டு முடிவில் இருந்தது, மற்றும் அவற்றுக்கிடையே இருந்தது. இந்தத் தட்டுகளைப் பயன்படுத்தி எல்லா இடங்களிலும் இடைச்செருகல் செய்தேன். மூலம், நீங்கள் முதல் ஸ்லைடில் வரைந்ததை விட இது சிறந்த முடிவைக் கொடுத்தது - கருப்பு நிறத்தில்.

இவான் சோசின் போன்ற மற்ற குழு உறுப்பினர்கள் வரைவதற்கு சற்று வித்தியாசமான அணுகுமுறைகளை முயற்சித்தனர். ஒரு சேனலில் அவர் ஒரு சாம்பல் படத்தை வரைந்தார், மற்றொரு சேனலின் மூலம் அவர் தொடக்கத்திலிருந்து இறுதி வரை 32 முதல் 255 வரை சாய்வுடன் ஒவ்வொரு பக்கத்தையும் வரைந்தார், மேலும் மூன்றாவது சேனலின் மூலம் அவர் 32 முதல் 255 வரையிலான அனைத்து ஸ்ட்ரோக்குகளிலும் சாய்வு வரைந்தார்.

மற்றொரு சுவாரஸ்யமான விஷயம் என்னவென்றால், அலெக்ஸ் பாரினோவ் நாட்டுக்குறியீட்டைப் பயன்படுத்தி நெட்வொர்க்கில் தகவல்களைப் பதிவேற்றினார்.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

போட்டியில் பயன்படுத்தப்படும் அளவீடு சராசரி சராசரி துல்லியம். போட்டிக்கான இந்த அளவீட்டின் சாராம்சம் என்ன? நீங்கள் மூன்று கணிப்புகளைக் கொடுக்கலாம், இந்த மூன்றில் சரியான முன்கணிப்பு இல்லை என்றால், உங்களுக்கு 0 கிடைக்கும். சரியான ஒன்று இருந்தால், அதன் வரிசை கணக்கில் எடுத்துக்கொள்ளப்படும். இலக்கு முடிவு உங்கள் கணிப்பு வரிசையால் வகுக்கப்படும் 1 ஆக கணக்கிடப்படும். எடுத்துக்காட்டாக, நீங்கள் மூன்று முன்கணிப்பாளர்களை உருவாக்கியுள்ளீர்கள், மேலும் சரியானது முதல் ஒன்று, நீங்கள் 1 ஐ 1 ஆல் வகுத்து 1 ஐப் பெறுவீர்கள். முன்கணிப்பாளர் சரியாகவும் அதன் வரிசை 2 ஆகவும் இருந்தால், 1 ஐ 2 ஆல் வகுத்தால், உங்களுக்கு 0,5 கிடைக்கும். சரி, முதலியன.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

தரவு முன் செயலாக்கத்துடன் - படங்களை எப்படி வரையலாம் மற்றும் பல - நாங்கள் கொஞ்சம் முடிவு செய்துள்ளோம். நாங்கள் என்ன கட்டிடக்கலைகளைப் பயன்படுத்தினோம்? PNASNet, SENet போன்ற கொழுப்பு கட்டமைப்புகளையும், SE-Res-NeXt போன்ற ஏற்கனவே உள்ள உன்னதமான கட்டமைப்புகளையும் பயன்படுத்த முயற்சித்தோம், அவை அதிகளவில் புதிய போட்டிகளுக்குள் நுழைகின்றன. ரெஸ்நெட் மற்றும் டென்ஸ்நெட் ஆகியவையும் இருந்தன.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

இதை எப்படி கற்பித்தோம்? நாங்கள் எடுத்த அனைத்து மாடல்களும் இமேஜ்நெட்டில் முன் பயிற்சி பெற்றவை. நிறைய தரவு இருந்தாலும், 50 மில்லியன் படங்கள் இருந்தாலும், நீங்கள் இமேஜ்நெட்டில் முன் பயிற்சி பெற்ற பிணையத்தை எடுத்துக் கொண்டால், புதிதாகப் பயிற்சியளித்ததை விட அது சிறந்த முடிவுகளைக் காட்டியது.

நாங்கள் என்ன கற்பித்தல் நுட்பங்களைப் பயன்படுத்தினோம்? இது Cosing Annealing with Warm Restarts, இதைப் பற்றி சிறிது நேரம் கழித்து பேசுவேன். இது எனது சமீபத்திய அனைத்து போட்டிகளிலும் நான் பயன்படுத்தும் ஒரு நுட்பமாகும், மேலும் அவற்றுடன் ஒரு நல்ல குறைந்தபட்சத்தை அடைய கட்டங்களை நன்றாகப் பயிற்றுவிப்பதாக மாறிவிடும்.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

அடுத்து பீடபூமியில் கற்றல் வீதத்தைக் குறைக்கவும். நீங்கள் நெட்வொர்க்கைப் பயிற்றுவிக்கத் தொடங்குகிறீர்கள், ஒரு குறிப்பிட்ட கற்றல் விகிதத்தை அமைக்கிறீர்கள், தொடர்ந்து கற்பிக்கிறீர்கள், மேலும் உங்கள் இழப்பு படிப்படியாக ஒரு குறிப்பிட்ட மதிப்பை அடைகிறது. இதை நீங்கள் சரிபார்க்கவும், எடுத்துக்காட்டாக, பத்து சகாப்தங்களாக இழப்பு மாறவில்லை. உங்கள் கற்றல் வீதத்தை சில மதிப்பில் குறைத்து, தொடர்ந்து கற்கிறீர்கள். இது மீண்டும் சிறிது குறைகிறது, குறைந்தபட்சம் ஒன்றுசேர்கிறது, மேலும் கற்றல் விகிதத்தை மீண்டும் குறைக்கிறீர்கள், மேலும் உங்கள் நெட்வொர்க் இறுதியாக ஒன்றிணைக்கும் வரை.

அடுத்தது ஒரு சுவாரஸ்யமான நுட்பம்: கற்றல் வீதத்தை சிதைக்காதீர்கள், தொகுதி அளவை அதிகரிக்கவும். அதே பெயரில் ஒரு கட்டுரை உள்ளது. நீங்கள் ஒரு நெட்வொர்க்கைப் பயிற்றுவிக்கும் போது, ​​கற்றல் விகிதத்தைக் குறைக்க வேண்டியதில்லை, நீங்கள் தொகுதி அளவை அதிகரிக்கலாம்.

இந்த நுட்பத்தை, அலெக்ஸ் பாரினோவ் பயன்படுத்தினார். அவர் 408 க்கு சமமான தொகுதியுடன் தொடங்கினார், மேலும் அவரது நெட்வொர்க் சில பீடபூமியை அடைந்ததும், அவர் தொகுதி அளவை இரட்டிப்பாக்கினார்.

உண்மையில், அவரது தொகுதி அளவு என்ன மதிப்பை எட்டியது என்பது எனக்கு நினைவில் இல்லை, ஆனால் சுவாரஸ்யமான விஷயம் என்னவென்றால், Kaggle இல் அதே நுட்பத்தைப் பயன்படுத்திய அணிகள் இருந்தன, அவற்றின் தொகுதி அளவு சுமார் 10000 ஆகும். மேலும், ஆழ்ந்த கற்றலுக்கான நவீன கட்டமைப்புகள் போன்றவை. உதாரணமாக, PyTorch, இதை மிக எளிதாக செய்ய அனுமதிக்கிறது. நீங்கள் உங்கள் தொகுப்பை உருவாக்கி, அதை முழுவதுமாக நெட்வொர்க்கில் சமர்ப்பிக்கவில்லை, ஆனால் அதை உங்கள் வீடியோ அட்டையில் பொருந்தும் வகையில் துண்டுகளாகப் பிரித்து, சாய்வுகளைக் கணக்கிட்டு, முழு தொகுதிக்கான சாய்வையும் கணக்கிட்ட பிறகு, புதுப்பிக்கவும் எடைகள்.

மூலம், இந்த போட்டியில் பெரிய தொகுதி அளவுகள் இன்னும் சேர்க்கப்பட்டுள்ளன, ஏனெனில் தரவு மிகவும் சத்தமாக இருந்தது, மேலும் ஒரு பெரிய தொகுதி அளவு சாய்வை இன்னும் துல்லியமாக தோராயமாக மதிப்பிட உதவியது.

போலி லேபிளிங் பயன்படுத்தப்பட்டது, பெரும்பாலும் ரோமன் சோலோவியேவ் பயன்படுத்தினார். அவர் சோதனையில் இருந்து பாதி தரவுகளை தொகுதிகளாக எடுத்து, அத்தகைய தொகுதிகளில் கட்டத்தைப் பயிற்றுவித்தார்.

படங்களின் அளவு முக்கியமானது, ஆனால் உண்மை என்னவென்றால், உங்களிடம் நிறைய தரவு உள்ளது, நீங்கள் நீண்ட நேரம் பயிற்சி செய்ய வேண்டும், உங்கள் படத்தின் அளவு மிகவும் பெரியதாக இருந்தால், நீங்கள் மிக நீண்ட நேரம் பயிற்சி செய்வீர்கள். ஆனால் இது உங்கள் இறுதி வகைப்படுத்தியின் தரத்தில் அதிகம் சேர்க்கவில்லை, எனவே சில வகையான வர்த்தகத்தைப் பயன்படுத்துவது மதிப்புக்குரியது. மேலும் பெரிய அளவில் இல்லாத படங்களை மட்டுமே முயற்சித்தோம்.

எப்படி எல்லாம் கற்றுக்கொண்டது? முதலில், சிறிய அளவிலான படங்கள் எடுக்கப்பட்டன, அவற்றில் பல சகாப்தங்கள் இயக்கப்பட்டன, இதற்கு நிறைய நேரம் பிடித்தது. பின்னர் பெரிய அளவிலான படங்கள் வழங்கப்பட்டன, நெட்வொர்க் பயிற்சியளிக்கப்பட்டது, பின்னர் இன்னும் அதிகமாக, இன்னும் அதிகமாக, அதை புதிதாகப் பயிற்றுவிக்காமல், அதிக நேரத்தை வீணாக்காமல் இருக்க வேண்டும்.

மேம்படுத்திகள் பற்றி. நாங்கள் SGD மற்றும் Adam ஐப் பயன்படுத்தினோம். இந்த வழியில் பொது லீடர்போர்டில் 0,941-0,946 வேகத்தைக் கொடுத்த ஒற்றை மாதிரியைப் பெற முடிந்தது, இது மிகவும் நல்லது.

நீங்கள் மாடல்களை ஏதாவது ஒரு வழியில் இணைத்தால், நீங்கள் 0,951 ஐப் பெறுவீர்கள். நீங்கள் இன்னும் ஒரு நுட்பத்தைப் பயன்படுத்தினால், நாங்கள் பெற்றதைப் போலவே, பொதுப் பலகையில் 0,954 மதிப்பெண்களைப் பெறுவீர்கள். ஆனால் பின்னர் அதைப் பற்றி மேலும். மாடல்களை நாங்கள் எவ்வாறு சேகரித்தோம், அத்தகைய இறுதி வேகத்தை எவ்வாறு அடைய முடிந்தது என்பதை அடுத்து நான் உங்களுக்குச் சொல்கிறேன்.

அடுத்து வார்ம் ரீஸ்டார்ட்களுடன் கோசிங் அனீலிங் அல்லது வார்ம் ரீஸ்டார்ட்களுடன் ஸ்டோகாஸ்டிக் கிரேடியன்ட் டிசென்ட் பற்றி பேச விரும்புகிறேன். தோராயமாகச் சொன்னால், கொள்கையளவில், நீங்கள் எந்த ஆப்டிமைசரையும் பயன்படுத்தலாம், ஆனால் விஷயம் இதுதான்: நீங்கள் ஒரு நெட்வொர்க்கைப் பயிற்றுவித்து, படிப்படியாக அது குறைந்தபட்சமாகச் சென்றால், எல்லாம் சரியாகிவிடும், நீங்கள் ஒரு நெட்வொர்க்கைப் பெறுவீர்கள், அது சில தவறுகளைச் செய்கிறது, ஆனால் நீங்கள் கொஞ்சம் வித்தியாசமாக பயிற்சி செய்யலாம். நீங்கள் சில ஆரம்ப கற்றல் விகிதத்தை அமைத்து, இந்த சூத்திரத்தின்படி படிப்படியாகக் குறைப்பீர்கள். நீங்கள் அதைக் குறைக்கிறீர்கள், உங்கள் நெட்வொர்க் குறைந்தபட்சம் வரும், பிறகு எடைகளைச் சேமித்து, பயிற்சியின் தொடக்கத்தில் இருந்த கற்றல் விகிதத்தை மீண்டும் அமைக்கவும், இதன் மூலம் இந்த குறைந்தபட்சத்திலிருந்து எங்காவது மேல்நோக்கிச் சென்று, மீண்டும் உங்கள் கற்றல் விகிதத்தைக் குறைக்கவும்.

எனவே, நீங்கள் ஒரே நேரத்தில் பல குறைந்தபட்சங்களைப் பார்வையிடலாம், அதில் உங்கள் இழப்பு, கூட்டல் அல்லது கழித்தல், ஒரே மாதிரியாக இருக்கும். ஆனால் உண்மை என்னவென்றால், இந்த எடைகள் கொண்ட நெட்வொர்க்குகள் உங்கள் தேதியில் வெவ்வேறு பிழைகளைக் கொடுக்கும். அவற்றைச் சராசரியாகக் கணக்கிடுவதன் மூலம், நீங்கள் ஒருவித தோராயத்தைப் பெறுவீர்கள், மேலும் உங்கள் வேகம் அதிகமாக இருக்கும்.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

எங்கள் மாதிரிகளை நாங்கள் எவ்வாறு சேகரித்தோம் என்பது பற்றி. விளக்கக்காட்சியின் தொடக்கத்தில், தேர்வில் உள்ள தரவுகளின் அளவு மற்றும் வகுப்புகளின் எண்ணிக்கையில் கவனம் செலுத்தச் சொன்னேன். சோதனைத் தொகுப்பில் உள்ள இலக்குகளின் எண்ணிக்கையுடன் 1ஐச் சேர்த்து, வகுப்புகளின் எண்ணிக்கையால் வகுத்தால், நீங்கள் எண் 330 ஐப் பெறுவீர்கள், இது மன்றத்தில் எழுதப்பட்டது - தேர்வில் உள்ள வகுப்புகள் சமநிலையில் உள்ளன. இதைப் பயன்படுத்தலாம்.

இதன் அடிப்படையில், ரோமன் சோலோவிவ் ஒரு மெட்ரிக்கைக் கொண்டு வந்தார், நாங்கள் அதை ப்ராக்ஸி ஸ்கோர் என்று அழைத்தோம், இது லீடர்போர்டுடன் நன்றாக தொடர்புடையது. புள்ளி: நீங்கள் ஒரு கணிப்பு செய்கிறீர்கள், உங்கள் முன்கணிப்பாளர்களில் முதல் 1 ஐ எடுத்து ஒவ்வொரு வகுப்பிற்கும் உள்ள பொருட்களின் எண்ணிக்கையை எண்ணுங்கள். அடுத்து, ஒவ்வொரு மதிப்பிலிருந்தும் 330ஐக் கழித்து, அதன் விளைவாக வரும் முழுமையான மதிப்புகளைச் சேர்க்கவும்.

பின்வரும் மதிப்புகள் பெறப்பட்டன. இது ஒரு ஆய்வு லீடர்போர்டை உருவாக்காமல், உள்நாட்டில் சரிபார்க்கவும், எங்கள் குழுமங்களுக்கான குணகங்களைத் தேர்ந்தெடுக்கவும் எங்களுக்கு உதவியது.

ஒரு குழுமத்துடன் நீங்கள் அத்தகைய வேகத்தைப் பெறலாம். நான் வேறு என்ன செய்ய முடியும்? உங்கள் தேர்வில் உள்ள வகுப்புகள் சமநிலையில் உள்ளன என்ற தகவலை நீங்கள் பயன்படுத்தியுள்ளீர்கள் என்று வைத்துக்கொள்வோம்.

சமநிலை வித்தியாசமாக இருந்தது. அவற்றில் ஒரு உதாரணம் - முதல் இடத்தைப் பிடித்த தோழர்களிடமிருந்து சமநிலைப்படுத்துதல்.

என்ன செய்தோம்? எங்கள் சமநிலை மிகவும் எளிமையானது, இது எவ்ஜெனி பாபாக்னினால் பரிந்துரைக்கப்பட்டது. நாங்கள் முதலில் எங்கள் கணிப்புகளை முதல் 1 மற்றும் அவர்களிடமிருந்து தேர்வு செய்தவர்களைத் தேர்ந்தெடுத்தோம் - அதனால் வகுப்புகளின் எண்ணிக்கை 330 ஐத் தாண்டவில்லை. ஆனால் சில வகுப்புகளில் நீங்கள் 330 க்கும் குறைவான முன்கணிப்பாளர்களுடன் முடிவடையும். சரி, முதல் 2 மற்றும் முதல் 3 என வரிசைப்படுத்துவோம். , மற்றும் நாங்கள் வேட்பாளர்களைத் தேர்ந்தெடுப்போம்.

முதல் இடத்தின் சமநிலையிலிருந்து நமது சமநிலை எவ்வாறு வேறுபட்டது? அவர்கள் மிகவும் பிரபலமான வகுப்பை எடுத்து, அந்த வகுப்பின் நிகழ்தகவுகளை சில சிறிய எண்ணிக்கையால் குறைத்து, அந்த வகுப்பு மிகவும் பிரபலமாகாத வரை, மீண்டும் மீண்டும் செய்யும் அணுகுமுறையைப் பயன்படுத்தினர். அடுத்த மிகவும் பிரபலமான வகுப்பை நாங்கள் எடுத்தோம். எனவே அனைத்து வகுப்புகளின் எண்ணிக்கையும் சமமாக மாறும் வரை அவர்கள் தொடர்ந்து அவற்றைக் குறைத்தனர்.

ரயில் நெட்வொர்க்குகளுக்கு அனைவரும் பிளஸ் அல்லது மைனஸ் ஒன் அணுகுமுறையைப் பயன்படுத்தினர், ஆனால் எல்லோரும் சமநிலையைப் பயன்படுத்தவில்லை. சமநிலையைப் பயன்படுத்தி, நீங்கள் தங்கத்திற்குச் செல்லலாம், நீங்கள் அதிர்ஷ்டசாலியாக இருந்தால், பணத்திற்குச் செல்லலாம்.

ஒரு தேதியை முன்கூட்டியே செயலாக்குவது எப்படி? எல்லோரும் தேதியை முன்கூட்டியே செயலாக்கினர், கூட்டல் அல்லது கழித்தல், அதே வழியில் - கையால் செய்யப்பட்ட அம்சங்களை உருவாக்குதல், வெவ்வேறு ஸ்ட்ரோக் வண்ணங்களுடன் நேரத்தை குறியாக்கம் செய்ய முயற்சித்தல் போன்றவை. 8வது இடத்தைப் பிடித்த அலெக்ஸி நோஸ்ட்ரின்-ப்ளாட்னிட்ஸ்கி இதைப் பற்றி பேசினார்.

கையால் எழுதப்பட்ட வரைபடங்களின் வகைப்பாடு. Yandex இல் அறிக்கை

அவர் அதை வித்தியாசமாக செய்தார். உங்களுடைய இந்த கைவினைப் பொருட்கள் அனைத்தும் வேலை செய்யாது, நீங்கள் அதைச் செய்யத் தேவையில்லை, உங்கள் நெட்வொர்க் இதையெல்லாம் கற்றுக் கொள்ள வேண்டும் என்று அவர் கூறினார். அதற்கு பதிலாக, உங்கள் தரவை முன்கூட்டியே செயலாக்கும் கற்றல் தொகுதிகளை அவர் கொண்டு வந்தார். அவர் அசல் தரவை முன்செயலாக்காமல் அவற்றில் வீசினார் - புள்ளி ஒருங்கிணைப்புகள் மற்றும் நேரங்கள்.

பின்னர் அவர் ஆயங்களின் அடிப்படையில் வித்தியாசத்தை எடுத்து, நேரங்களின் அடிப்படையில் அனைத்தையும் சராசரியாகக் கணக்கிட்டார். மேலும் அவர் ஒரு நீண்ட மேட்ரிக்ஸைக் கொண்டு வந்தார். அவர் 1xn அளவிலான மேட்ரிக்ஸைப் பெறுவதற்கு பலமுறை அதற்கு 64D கன்வல்யூஷனைப் பயன்படுத்தினார், அங்கு n என்பது மொத்த புள்ளிகளின் எண்ணிக்கை, மேலும் 64 ஆனது சேனல்களின் எண்ணிக்கையை ஏற்கும் எந்த கன்வல்யூஷனல் நெட்வொர்க்கின் லேயருக்கும் அதன் விளைவாக வரும் மேட்ரிக்ஸை ஊட்டுவதற்காக உருவாக்கப்பட்டது. - 64. அவர் 64xn மேட்ரிக்ஸைப் பெற்றார், பின்னர் இதிலிருந்து சில அளவிலான டென்சரை உருவாக்க வேண்டியிருந்தது, இதனால் சேனல்களின் எண்ணிக்கை 64 க்கு சமமாக இருக்கும். அவர் X, Y புள்ளிகளை 0 முதல் 32 வரையிலான வரம்பில் இயல்பாக்கினார். 32x32 அளவுள்ள டென்சர். அவர் ஏன் 32x32 வேண்டும் என்று எனக்குத் தெரியவில்லை, அது அப்படியே நடந்தது. இந்த ஒருங்கிணைப்பில் அவர் 64xn அளவிலான இந்த மேட்ரிக்ஸின் ஒரு பகுதியை வைத்தார். எனவே இது 32x32x64 டென்சருடன் முடிந்தது, அதை நீங்கள் மேலும் உங்கள் கன்வல்யூஷனல் நியூரல் நெட்வொர்க்கில் வைக்கலாம். அவ்வளவுதான் நான் சொல்ல விரும்பினேன்.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்