யாண்டெக்ஸ் ரெசிடென்ட் புரோகிராம், அல்லது அனுபவம் வாய்ந்த பின்தங்கியவர் எப்படி எம்எல் இன்ஜினியர் ஆக முடியும்

யாண்டெக்ஸ் ரெசிடென்ட் புரோகிராம், அல்லது அனுபவம் வாய்ந்த பின்தங்கியவர் எப்படி எம்எல் இன்ஜினியர் ஆக முடியும்

அனுபவம் வாய்ந்த பின்தள டெவலப்பர்களுக்காக இயந்திரக் கற்றலில் வசிப்பிட திட்டத்தை யாண்டெக்ஸ் திறக்கிறது. நீங்கள் C++/Python இல் நிறைய எழுதியிருந்தால், MLக்கு இந்த அறிவைப் பயன்படுத்த விரும்பினால், நடைமுறை ஆராய்ச்சி செய்வது மற்றும் அனுபவமிக்க வழிகாட்டிகளை வழங்குவது எப்படி என்பதை நாங்கள் உங்களுக்குக் கற்பிப்போம். நீங்கள் முக்கிய Yandex சேவைகளில் பணியாற்றுவீர்கள் மற்றும் நேரியல் மாதிரிகள் மற்றும் சாய்வு அதிகரிப்பு, பரிந்துரை அமைப்புகள், படங்கள், உரை மற்றும் ஒலியை பகுப்பாய்வு செய்வதற்கான நரம்பியல் நெட்வொர்க்குகள் போன்ற பகுதிகளில் திறன்களைப் பெறுவீர்கள். ஆஃப்லைனிலும் ஆன்லைனிலும் அளவீடுகளைப் பயன்படுத்தி உங்கள் மாடல்களை எவ்வாறு சரியாக மதிப்பிடுவது என்பதையும் நீங்கள் கற்றுக் கொள்வீர்கள்.

திட்டத்தின் காலம் ஒரு வருடம் ஆகும், இதில் பங்கேற்பாளர்கள் யாண்டெக்ஸின் இயந்திர நுண்ணறிவு மற்றும் ஆராய்ச்சித் துறையில் பணிபுரிவார்கள், அத்துடன் விரிவுரைகள் மற்றும் கருத்தரங்குகளில் கலந்துகொள்வார்கள். பங்கேற்பு ஊதியம் மற்றும் முழுநேர வேலையை உள்ளடக்கியது: வாரத்திற்கு 40 மணிநேரம், இந்த ஆண்டு ஜூலை 1 முதல். விண்ணப்பங்கள் இப்போது திறக்கப்பட்டுள்ளன மற்றும் மே 1 வரை நீடிக்கும். 

இப்போது இன்னும் விரிவாக - நாங்கள் எந்த வகையான பார்வையாளர்களுக்காக காத்திருக்கிறோம், வேலை செயல்முறை என்னவாக இருக்கும் மற்றும் பொதுவாக, ஒரு பின்-இறுதி நிபுணர் ML இல் ஒரு தொழிலுக்கு எப்படி மாறலாம் என்பது பற்றி.

திசைக்

எடுத்துக்காட்டாக, கூகுள் மற்றும் ஃபேஸ்புக் உட்பட பல நிறுவனங்கள் ரெசிடென்சி திட்டங்களைக் கொண்டுள்ளன. அவை முக்கியமாக ஜூனியர் மற்றும் மிட்-லெவல் நிபுணர்களை இலக்காகக் கொண்டுள்ளன, அவர்கள் ML ஆராய்ச்சியை நோக்கி ஒரு படி எடுக்க முயற்சி செய்கிறார்கள். எங்கள் திட்டம் வேறுபட்ட பார்வையாளர்களுக்கானது. தொழில்துறை இயந்திரக் கற்றல் சிக்கல்களைத் தீர்ப்பதில் விஞ்ஞானியின் திறன்களை அல்ல - நடைமுறைத் திறன்களைப் பெற, ஏற்கனவே போதுமான அனுபவத்தைப் பெற்ற மற்றும் அவர்களின் திறன்களில் அவர்கள் ML க்கு மாற வேண்டும் என்பதை உறுதியாக அறிந்த பின்தள டெவலப்பர்களை நாங்கள் அழைக்கிறோம். இளம் ஆராய்ச்சியாளர்களை நாங்கள் ஆதரிக்கவில்லை என்று இது அர்த்தப்படுத்துவதில்லை. அவர்களுக்காக ஒரு தனி நிகழ்ச்சியை ஏற்பாடு செய்துள்ளோம். பரிசு Ilya Segalovich பெயரிடப்பட்டது, இது Yandex இல் வேலை செய்ய உங்களை அனுமதிக்கிறது.

குடியிருப்பாளர் எங்கே வேலை செய்வார்?

இயந்திர நுண்ணறிவு மற்றும் ஆராய்ச்சித் துறையில், நாமே திட்ட யோசனைகளை உருவாக்குகிறோம். உத்வேகத்தின் முக்கிய ஆதாரம் அறிவியல் இலக்கியம், கட்டுரைகள் மற்றும் ஆராய்ச்சி சமூகத்தின் போக்குகள். விஞ்ஞானிகளால் முன்மொழியப்பட்ட முறைகளை எவ்வாறு மேம்படுத்தலாம் அல்லது விரிவுபடுத்தலாம் என்பதைப் பார்த்து, நானும் எனது சகாக்களும் நாங்கள் படித்ததை பகுப்பாய்வு செய்கிறோம். அதே நேரத்தில், நாம் ஒவ்வொருவரும் அவரது அறிவு மற்றும் ஆர்வங்களின் பகுதியை கணக்கில் எடுத்துக்கொள்கிறோம், அவர் முக்கியமானதாகக் கருதும் பகுதிகளின் அடிப்படையில் பணியை உருவாக்குகிறோம். ஒரு திட்டத்திற்கான யோசனை பொதுவாக வெளிப்புற ஆராய்ச்சி மற்றும் ஒருவரின் சொந்த திறன்களின் முடிவுகளின் சந்திப்பில் பிறக்கிறது.

இந்த அமைப்பு நல்லது, ஏனெனில் இது Yandex சேவைகளின் தொழில்நுட்ப சிக்கல்களை அவை எழுவதற்கு முன்பே தீர்க்கிறது. ஒரு சேவை சிக்கலை எதிர்கொள்ளும்போது, ​​​​அதன் பிரதிநிதிகள் எங்களிடம் வருகிறார்கள், பெரும்பாலும் நாங்கள் ஏற்கனவே தயாரித்த தொழில்நுட்பங்களை எடுத்துக்கொள்வார்கள், எஞ்சியிருப்பது தயாரிப்பில் சரியாகப் பயன்படுத்தப்பட வேண்டும். ஏதாவது தயாராக இல்லை என்றால், நாம் எங்கு "தோண்டத் தொடங்கலாம்" மற்றும் எந்த கட்டுரைகளில் தீர்வு காண வேண்டும் என்பதை விரைவாக நினைவில் கொள்வோம். நமக்குத் தெரியும், விஞ்ஞான அணுகுமுறை ராட்சதர்களின் தோள்களில் நிற்பது.

என்ன செய்ய

Yandex இல் - குறிப்பாக எங்கள் நிர்வாகத்தில் கூட - ML இன் அனைத்து தொடர்புடைய பகுதிகளும் உருவாக்கப்படுகின்றன. பல்வேறு வகையான தயாரிப்புகளின் தரத்தை மேம்படுத்துவதே எங்கள் குறிக்கோள், மேலும் இது புதிய அனைத்தையும் சோதிக்க ஒரு ஊக்கமாக செயல்படுகிறது. கூடுதலாக, புதிய சேவைகள் தொடர்ந்து தோன்றும். எனவே விரிவுரைத் திட்டமானது தொழில்துறை வளர்ச்சியில் இயந்திரக் கற்றலின் அனைத்து முக்கிய (நன்கு நிரூபிக்கப்பட்ட) பகுதிகளையும் கொண்டுள்ளது. பாடத்தின் எனது பகுதியைத் தொகுக்கும்போது, ​​ஸ்கூல் ஆஃப் டேட்டா அனாலிசிஸில் எனது கற்பித்தல் அனுபவத்தையும், மற்ற SHAD ஆசிரியர்களின் பொருட்கள் மற்றும் பணிகளையும் பயன்படுத்தினேன். எனது சகாக்களும் அவ்வாறே செய்தார்கள் என்பது எனக்குத் தெரியும்.

முதல் மாதங்களில், பாடத்திட்டத்தின் படி பயிற்சி உங்கள் வேலை நேரத்தில் தோராயமாக 30%, பின்னர் சுமார் 10% ஆகும். இருப்பினும், ML மாடல்களுடன் பணிபுரிவது அனைத்து தொடர்புடைய செயல்முறைகளையும் விட தோராயமாக நான்கு மடங்கு குறைவாக எடுக்கும் என்பதை புரிந்து கொள்ள வேண்டியது அவசியம். பின்தளத்தைத் தயாரித்தல், தரவைப் பெறுதல், முன்செயலாக்கத்திற்கான பைப்லைனை எழுதுதல், குறியீட்டை மேம்படுத்துதல், குறிப்பிட்ட வன்பொருளுக்கு ஏற்ப மாற்றுதல் போன்றவை இதில் அடங்கும். ஒரு ML பொறியாளர், நீங்கள் விரும்பினால், ஒரு முழு-ஸ்டாக் டெவலப்பர் (இயந்திரக் கற்றலுக்கு அதிக முக்கியத்துவம் கொடுத்தால் மட்டுமே) , ஒரு பிரச்சனையை ஆரம்பம் முதல் இறுதி வரை தீர்க்கும் திறன் கொண்டது. ஆயத்த மாதிரியுடன் கூட, நீங்கள் இன்னும் பல செயல்களைச் செய்ய வேண்டியிருக்கும்: பல இயந்திரங்களில் அதன் செயல்பாட்டிற்கு இணையாக, ஒரு கைப்பிடி, நூலகம் அல்லது சேவையின் கூறுகளின் வடிவத்தில் செயல்படுத்தலைத் தயாரிக்கவும்.

மாணவர் தேர்வு
முதலில் பேக்கண்ட் டெவலப்பராக வேலை செய்வதன் மூலம் ML இன்ஜினியராக மாறுவது நல்லது என்ற எண்ணத்தில் நீங்கள் இருந்திருந்தால், இது உண்மையல்ல. சேவைகளை மேம்படுத்துவதில் உண்மையான அனுபவம் இல்லாமல் அதே ShAD இல் பதிவுசெய்தல், கற்றல் மற்றும் சந்தையில் தேவை அதிகமாக உள்ளது. பல யாண்டெக்ஸ் வல்லுநர்கள் தங்கள் தற்போதைய நிலைகளில் இந்த வழியில் முடிந்தது. பட்டப்படிப்பை முடித்த உடனேயே உங்களுக்கு ML துறையில் வேலை வழங்க ஏதேனும் நிறுவனம் தயாராக இருந்தால், நீங்களும் இந்த வாய்ப்பை ஏற்க வேண்டும். அனுபவம் வாய்ந்த வழிகாட்டியுடன் ஒரு நல்ல குழுவில் சேர முயற்சி செய்யுங்கள் மற்றும் நிறைய கற்றுக்கொள்ள தயாராகுங்கள்.

பொதுவாக ML செய்வதிலிருந்து உங்களைத் தடுப்பது எது?

ஒரு பின்தங்கியிருப்பவர் ML பொறியியலாளராக ஆசைப்பட்டால், அவர் வசிப்பிடத் திட்டத்தைக் கணக்கில் எடுத்துக் கொள்ளாமல் - வளர்ச்சியின் இரண்டு பகுதிகளிலிருந்து தேர்வு செய்யலாம்.

முதலாவதாக, சில கல்விப் பாடத்தின் ஒரு பகுதியாகப் படிக்கவும். பாடங்கள் Coursera அடிப்படை நுட்பங்களைப் புரிந்துகொள்வதற்கு உங்களை நெருக்கமாகக் கொண்டுவரும், ஆனால் போதுமான அளவிற்கு தொழிலில் மூழ்குவதற்கு, நீங்கள் அதிக நேரத்தை செலவிட வேண்டும். உதாரணமாக, ShAD இல் பட்டதாரி. பல ஆண்டுகளாக, ShAD நேரடியாக இயந்திரக் கற்றலில் வெவ்வேறு எண்ணிக்கையிலான படிப்புகளைக் கொண்டிருந்தது - சராசரியாக, சுமார் எட்டு. பட்டதாரிகளின் கருத்து உட்பட அவை ஒவ்வொன்றும் மிகவும் முக்கியமானவை மற்றும் பயனுள்ளவை. 

இரண்டாவதாக, நீங்கள் ஒன்று அல்லது மற்றொரு ML அல்காரிதத்தை செயல்படுத்த வேண்டிய போர் திட்டங்களில் பங்கேற்கலாம். இருப்பினும், தகவல் தொழில்நுட்ப மேம்பாட்டு சந்தையில் இதுபோன்ற திட்டங்கள் மிகக் குறைவு: பெரும்பாலான பணிகளில் இயந்திர கற்றல் பயன்படுத்தப்படுவதில்லை. ML தொடர்பான வாய்ப்புகளை தீவிரமாக ஆராய்ந்து வரும் வங்கிகளில் கூட, ஒரு சிலர் மட்டுமே தரவு பகுப்பாய்வில் ஈடுபட்டுள்ளனர். இந்த அணிகளில் ஒன்றில் உங்களால் சேர முடியாவிட்டால், உங்களின் ஒரே வழி உங்கள் சொந்த திட்டத்தைத் தொடங்குவது (பெரும்பாலும், நீங்கள் உங்கள் சொந்த காலக்கெடுவை அமைப்பீர்கள், மேலும் இதற்கு போர் தயாரிப்பு பணிகளுடன் எந்த தொடர்பும் இல்லை) அல்லது போட்டியிடத் தொடங்குங்கள் கக்கிள்.

உண்மையில், மற்ற சமூக உறுப்பினர்களுடன் இணைந்து, போட்டிகளில் உங்களை முயற்சிக்கவும் ஒப்பீட்டளவில் எளிதானது - குறிப்பாக நீங்கள் பயிற்சி மற்றும் Coursera இல் குறிப்பிடப்பட்டுள்ள படிப்புகள் மூலம் உங்கள் திறன்களை காப்புப் பிரதி எடுத்தால். ஒவ்வொரு போட்டிக்கும் ஒரு காலக்கெடு உள்ளது - இது உங்களுக்கு ஊக்கமளிக்கும் மற்றும் IT நிறுவனங்களில் இதே போன்ற அமைப்புக்கு உங்களை தயார்படுத்தும். இது ஒரு நல்ல வழி - இருப்பினும், இது உண்மையான செயல்முறைகளிலிருந்து சிறிது விவாகரத்து செய்யப்பட்டுள்ளது. Kaggle இல் உங்களுக்கு முன்-செயலாக்கப்பட்ட தரவு வழங்கப்படுகிறது, இருப்பினும் எப்போதும் சரியானதாக இல்லாவிட்டாலும், தரவு; தயாரிப்புக்கான பங்களிப்பைப் பற்றி சிந்திக்க முன்வர வேண்டாம்; மற்றும் மிக முக்கியமாக, அவர்களுக்கு உற்பத்திக்கு ஏற்ற தீர்வுகள் தேவையில்லை. உங்கள் அல்காரிதம்கள் வேலை செய்யும் மற்றும் மிகவும் துல்லியமாக இருக்கும், ஆனால் உங்கள் மாதிரிகள் மற்றும் குறியீடு வெவ்வேறு பகுதிகளிலிருந்து ஃபிராங்கண்ஸ்டைன் ஒன்றாக தைக்கப்பட்டதைப் போல இருக்கும் - ஒரு தயாரிப்பு திட்டத்தில், முழு அமைப்பும் மிக மெதுவாக வேலை செய்யும், புதுப்பிக்க மற்றும் விரிவாக்க கடினமாக இருக்கும் (உதாரணமாக, மொழி மற்றும் குரல் வழிமுறைகள் எப்போதுமே மொழி வளர்ச்சியடையும் போது ஓரளவு மீண்டும் எழுதப்படும்). பட்டியலிடப்பட்ட வேலையை நீங்களே செய்ய முடியும் என்பதில் நிறுவனங்கள் ஆர்வமாக உள்ளன (தீர்வின் ஆசிரியராக நீங்கள் இதைச் செய்ய முடியும் என்பது தெளிவாகிறது), ஆனால் உங்கள் சக ஊழியர்களால் கூட. விளையாட்டு மற்றும் தொழில்துறை நிரலாக்கத்திற்கு இடையிலான வேறுபாடு விவாதிக்கப்படுகிறது много, மற்றும் Kaggle துல்லியமாக "விளையாட்டு வீரர்களுக்கு" கல்வி கற்பிக்கிறார் - அது மிகச் சிறப்பாகச் செய்தாலும், அவர்கள் சில அனுபவங்களைப் பெற அனுமதிக்கிறது.

நான் இரண்டு சாத்தியமான வளர்ச்சி வழிகளை விவரித்தேன் - கல்வித் திட்டங்கள் மூலம் பயிற்சி மற்றும் "போரில்" பயிற்சி, எடுத்துக்காட்டாக Kaggle இல். வதிவிட திட்டம் இந்த இரண்டு முறைகளின் கலவையாகும். ShAD மட்டத்தில் விரிவுரைகள் மற்றும் கருத்தரங்குகள், அதே போல் உண்மையான போராட்டத் திட்டங்கள் உங்களுக்காகக் காத்திருக்கின்றன.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்