Yandex නේවාසික වැඩසටහන, හෝ පළපුරුදු පසුබිම්කරුවෙකු ML ඉංජිනේරුවෙකු වන්නේ කෙසේද

Yandex නේවාසික වැඩසටහන, හෝ පළපුරුදු පසුබිම්කරුවෙකු ML ඉංජිනේරුවෙකු වන්නේ කෙසේද

Yandex පළපුරුදු පසුපෙළ සංවර්ධකයින් සඳහා යන්ත්‍ර ඉගෙනීමේ නේවාසික වැඩසටහනක් විවෘත කරයි. ඔබ C++/Python හි බොහෝ දේ ලියා ඇත්නම් සහ මෙම දැනුම ML වෙත යෙදීමට අවශ්‍ය නම්, අපි ඔබට ප්‍රායෝගික පර්යේෂණ කරන ආකාරය සහ පළපුරුදු උපදේශකයින් සපයන ආකාරය කියා දෙන්නෙමු. ඔබ ප්‍රධාන Yandex සේවාවන්හි වැඩ කරන අතර රේඛීය ආකෘති සහ ශ්‍රේණිය වැඩි කිරීම, නිර්දේශ පද්ධති, රූප, පෙළ සහ ශබ්ද විශ්ලේෂණය සඳහා ස්නායු ජාල වැනි ක්ෂේත්‍රවල කුසලතා ලබා ගනී. නොබැඳි සහ මාර්ගගත ප්‍රමිතික භාවිතයෙන් ඔබේ ආකෘති නිසි ලෙස ඇගයීමට ලක් කරන්නේ කෙසේදැයි ඔබ ඉගෙන ගනු ඇත.

වැඩසටහනේ කාලසීමාව වසරක් වන අතර, එම කාලය තුළ සහභාගිවන්නන් Yandex හි යන්ත්‍ර බුද්ධි හා පර්යේෂණ දෙපාර්තමේන්තුවේ සේවය කරනු ඇති අතර දේශන සහ සම්මන්ත්‍රණවලට සහභාගී වේ. සහභාගීත්වය ගෙවනු ලබන අතර පූර්ණ කාලීන වැඩ ඇතුළත් වේ: සතියකට පැය 40, මේ වසරේ ජූලි 1 සිට. අයදුම්පත් දැන් විවෘතයි සහ මැයි 1 දක්වා පවතිනු ඇත. 

දැන් වඩාත් විස්තරාත්මකව - අප බලා සිටින්නේ කුමන ආකාරයේ ප්‍රේක්ෂක පිරිසක්ද, වැඩ ක්‍රියාවලිය කුමක් වේද සහ පොදුවේ ගත් කල, පසුගාමී විශේෂඥයෙකුට ML හි වෘත්තියකට මාරු විය හැක්කේ කෙසේද යන්න ගැන.

අවධානය යොමු කරන්න

බොහෝ සමාගම් වල නේවාසික වැඩසටහන් ඇත, උදාහරණයක් ලෙස, Google සහ Facebook. ඔවුන් ප්‍රධාන වශයෙන් ඉලක්ක කර ඇත්තේ ML පර්යේෂණ සඳහා පියවරක් ගැනීමට උත්සාහ කරන කනිෂ්ඨ සහ මධ්‍යම මට්ටමේ විශේෂඥයින් වෙතය. අපගේ වැඩසටහන වෙනස් ප්‍රේක්ෂකයින් සඳහා ය. කාර්මික යන්ත්‍ර ඉගෙනීමේ ගැටළු විසඳීමේදී ප්‍රායෝගික කුසලතා - විද්‍යාඥයකුගේ කුසලතා නොව - ප්‍රායෝගික කුසලතා ලබා ගැනීම සඳහා ඔවුන්ගේ නිපුණතා තුළ ML වෙත මාරු විය යුතු බව දැනටමත් ප්‍රමාණවත් අත්දැකීම් ලබා ඇති පසුපෙළ සංවර්ධකයින්ට අපි ආරාධනා කරමු. අපි තරුණ පර්යේෂකයන්ට සහාය නොදක්වන බව මින් අදහස් නොවේ. අපි ඔවුන් වෙනුවෙන් වෙනම වැඩසටහනක් සංවිධානය කර තිබෙනවා - වාරික Yandex හි වැඩ කිරීමට ඔබට ඉඩ සලසන Ilya Segalovich නමින් නම් කර ඇත.

පදිංචිකරු වැඩ කරන්නේ කොහේද?

යන්ත්‍ර බුද්ධි හා පර්යේෂණ දෙපාර්තමේන්තුවේ අපි විසින්ම ව්‍යාපෘති අදහස් වර්ධනය කරමු. ආශ්වාදයේ ප්‍රධාන මූලාශ්‍රය වන්නේ විද්‍යාත්මක සාහිත්‍යය, ලිපි සහ පර්යේෂණ ප්‍රජාවේ ප්‍රවණතා ය. මගේ සගයන් සහ මම විද්‍යාඥයින් විසින් යෝජනා කරන ලද ක්‍රම වැඩිදියුණු කිරීමට හෝ පුළුල් කිරීමට හැකි ආකාරය දෙස බලා අප කියවන දේ විශ්ලේෂණය කරන්නෙමු. ඒ අතරම, අප සෑම කෙනෙකුම ඔහුගේ දැනුම සහ රුචිකත්වයන් සැලකිල්ලට ගනී, ඔහු වැදගත් යැයි සලකන ක්ෂේත්‍ර මත පදනම්ව කාර්යය සකස් කරයි. ව්‍යාපෘතියක් සඳහා වන අදහස සාමාන්‍යයෙන් උපත ලබන්නේ බාහිර පර්යේෂණවල ප්‍රතිඵල සහ තමාගේම නිපුණතා ඡේදනය වීමෙනි.

Yandex සේවාවන්හි තාක්ෂණික ගැටළු පැන නැගීමට පෙර පවා එය බොහෝ දුරට විසඳන බැවින් මෙම පද්ධතිය හොඳයි. සේවාවක් ගැටලුවකට මුහුණ දෙන විට, එහි නියෝජිතයන් අප වෙත පැමිණේ, බොහෝ විට අප දැනටමත් සකස් කර ඇති තාක්ෂණයන් ලබා ගැනීමට ඉඩ ඇති අතර, ඉතිරිව ඇත්තේ නිෂ්පාදනයේ නිවැරදිව යෙදීමයි. යමක් සුදානම් නැතිනම්, අපට “කැණීම් ආරම්භ කළ හැක්කේ” කොතැනින්ද යන්න සහ විසඳුම් සෙවිය යුත්තේ කුමන ලිපිවලද යන්න අපි අවම වශයෙන් ඉක්මනින් මතක තබා ගනිමු. අප දන්නා පරිදි, විද්‍යාත්මක ප්‍රවේශය වන්නේ යෝධයන්ගේ කර මත නැගී සිටීමයි.

කුමක් කරන්න ද

Yandex හි - සහ විශේෂයෙන් අපගේ කළමනාකරණයේ පවා - ML හි සියලුම අදාළ ක්ෂේත්‍ර සංවර්ධනය වෙමින් පවතී. අපගේ ඉලක්කය වන්නේ විවිධාකාර නිෂ්පාදනවල ගුණාත්මක භාවය වැඩිදියුණු කිරීම වන අතර, මෙය නව සෑම දෙයක්ම පරීක්ෂා කිරීමට දිරිගැන්වීමක් ලෙස සේවය කරයි. ඊට අමතරව, නව සේවාවන් නිතිපතා දිස්වේ. එබැවින් දේශන වැඩසටහන කාර්මික සංවර්ධනයේ යන්ත්‍ර ඉගෙනීමේ ප්‍රධාන (හොඳින් ඔප්පු කරන ලද) ක්ෂේත්‍ර අඩංගු වේ. පාඨමාලාවේ මගේ කොටස සම්පාදනය කිරීමේදී, මම දත්ත විශ්ලේෂණ පාසලේ මගේ ඉගැන්වීමේ අත්දැකීම් මෙන්ම අනෙකුත් SHAD ගුරුවරුන්ගේ ද්‍රව්‍ය සහ වැඩ භාවිතා කළෙමි. මගේ සගයන් ද එසේ කළ බව මම දනිමි.

පළමු මාසවලදී, පාඨමාලා වැඩසටහනට අනුව පුහුණුව ඔබේ වැඩ කරන කාලයෙන් ආසන්න වශයෙන් 30% ක්, පසුව 10% ක් පමණ වේ. කෙසේ වෙතත්, ML මාදිලි සමඟ වැඩ කිරීම සියලු ආශ්‍රිත ක්‍රියාවලීන්ට වඩා දළ වශයෙන් හතර ගුණයකින් අඩුවෙන් දිගටම කරගෙන යනු ඇති බව වටහා ගැනීම වැදගත්ය. මේවාට පසුපෙළ සකස් කිරීම, දත්ත ලබා ගැනීම, එය පෙර සැකසීම සඳහා නල මාර්ගයක් ලිවීම, කේතය ප්‍රශස්ත කිරීම, නිශ්චිත දෘඪාංගවලට අනුගත වීම යනාදිය ඇතුළත් වේ. ML ඉංජිනේරුවෙකු ඔබ කැමති නම්, සම්පූර්ණ තොග සංවර්ධකයෙකි (යන්ත්‍ර ඉගෙනීම කෙරෙහි වැඩි අවධානයක් යොමු කරමින් පමණි) , ආරම්භයේ සිට අවසානය දක්වා ගැටලුවක් විසඳීමට හැකියාව ඇත. සූදානම් කළ ආකෘතියක් සමඟ වුවද, ඔබට තවත් ක්‍රියා ගණනාවක් කිරීමට අවශ්‍ය වනු ඇත: යන්ත්‍ර කිහිපයක් හරහා එය ක්‍රියාත්මක කිරීම සමාන්තර කරන්න, හසුරුවක, පුස්තකාලයක හෝ සේවාවේම සංරචක ආකාරයෙන් ක්‍රියාත්මක කිරීමක් සූදානම් කරන්න.

ශිෂ්ය තේරීම
ඔබ මුලින්ම පසුපෙළ සංවර්ධකයෙකු ලෙස වැඩ කිරීමෙන් ML ඉංජිනේරුවෙකු වීම වඩා හොඳ යැයි ඔබ සිතුවේ නම්, මෙය සත්‍ය නොවේ. සේවා සංවර්ධනය කිරීම, ඉගෙනීම සහ වෙළඳපොලේ අතිශයින්ම ඉල්ලුමක් ඇති බවට සැබෑ අත්දැකීම් නොමැතිව එකම ShAD සඳහා ලියාපදිංචි වීම විශිෂ්ට විකල්පයකි. බොහෝ Yandex විශේෂඥයින් ඔවුන්ගේ වර්තමාන තනතුරු මේ ආකාරයෙන් අවසන් විය. උපාධිය ලැබීමෙන් පසු ඔබට ML ක්ෂේත්‍රයේ රැකියාවක් ලබා දීමට ඕනෑම සමාගමක් සූදානම් නම්, ඔබත් එම දීමනාව පිළිගත යුතුය. පළපුරුදු උපදේශකයෙකු සමඟ හොඳ කණ්ඩායමකට ඇතුළු වීමට උත්සාහ කර බොහෝ දේ ඉගෙන ගැනීමට සූදානම් වන්න.

සාමාන්‍යයෙන් ML කිරීමෙන් ඔබව වළක්වන්නේ කුමක්ද?

පසුබිම්කරුවෙකු ML ඉංජිනේරුවෙකු වීමට අපේක්ෂා කරන්නේ නම්, ඔහුට නේවාසික වැඩසටහන සැලකිල්ලට නොගෙන සංවර්ධන ක්ෂේත්‍ර දෙකකින් තෝරා ගත හැකිය.

පළමුව, යම් අධ්‍යාපනික පාඨමාලාවක කොටසක් ලෙස අධ්‍යයනය කරන්න. පාඩම් Coursera ඔබව මූලික ශිල්පීය ක්‍රම අවබෝධ කර ගැනීමට සමීප කරවනු ඇත, නමුත් ප්‍රමාණවත් තරම් වෘත්තියේ ගිල්වීමට නම්, ඔබ ඒ සඳහා වැඩි කාලයක් කැප කළ යුතුය. උදාහරණයක් ලෙස, ShAD උපාධිය. වසර ගණනාවක් පුරා, ShAD හට යන්ත්‍ර ඉගෙනීම පිළිබඳ සෘජුවම වෙනස් පාඨමාලා සංඛ්‍යාවක් තිබුණි - සාමාන්‍යයෙන්, අටක් පමණ. උපාධිධාරීන්ගේ මතය ඇතුළුව ඒවායින් එක් එක් ඇත්ත වශයෙන්ම වැදගත් හා ප්රයෝජනවත් වේ. 

දෙවනුව, ඔබට එක් හෝ තවත් ML ඇල්ගොරිතමයක් ක්‍රියාත්මක කිරීමට අවශ්‍ය සටන් ව්‍යාපෘතිවලට සහභාගී විය හැකිය. කෙසේ වෙතත්, තොරතුරු තාක්ෂණ සංවර්ධන වෙළඳපොලේ එවැනි ව්යාපෘති ඉතා ස්වල්පයක් ඇත: බොහෝ කාර්යයන් සඳහා යන්ත්ර ඉගෙනීම භාවිතා නොවේ. ML ආශ්‍රිත අවස්ථා සක්‍රියව ගවේෂණය කරන බැංකු වල පවා දත්ත විශ්ලේෂණයේ යෙදී සිටින්නේ ස්වල්ප දෙනෙක් පමණි. ඔබට මෙම කණ්ඩායම් වලින් එකකට සම්බන්ධ වීමට නොහැකි වූයේ නම්, ඔබේ එකම විකල්පය වන්නේ ඔබේම ව්‍යාපෘතියක් ආරම්භ කිරීමයි (බොහෝ විට, ඔබ ඔබේම නියමිත කාලසීමාවන් සකසනු ඇත, සහ මෙය සටන් නිෂ්පාදන කාර්යයන් සමඟ එතරම් සම්බන්ධයක් නැත) හෝ තරඟ කිරීම ආරම්භ කරන්න. කග්ගල්.

ඇත්ත වශයෙන්ම, අනෙකුත් ප්‍රජා සාමාජිකයින් සමඟ එකතු වී තරඟ සඳහා ඔබම උත්සාහ කරන්න සාපේක්ෂව පහසුයි - විශේෂයෙන් ඔබ පුහුණුවීම් සහ Coursera හි සඳහන් පාඨමාලා සමඟ ඔබේ කුසලතා උපස්ථ කරන්නේ නම්. සෑම තරඟයකටම නියමිත කාල සීමාවක් ඇත - එය ඔබට දිරිගැන්වීමක් වන අතර තොරතුරු තාක්ෂණ සමාගම්වල සමාන පද්ධතියක් සඳහා ඔබව සූදානම් කරනු ඇත. මෙය හොඳ ක්‍රමයකි - කෙසේ වෙතත්, එය සැබෑ ක්‍රියාවලීන්ගෙන් ටිකක් දික්කසාද වී ඇත. Kaggle මත ඔබට පෙර-සැකසුම් කර ඇත, නමුත් සෑම විටම පරිපූර්ණ නොවේ, දත්ත; නිෂ්පාදනයට දායකත්වය ගැන සිතීමට ඉදිරිපත් නොවන්න; සහ වඩාත්ම වැදගත් දෙය නම්, ඔවුන් නිෂ්පාදනය සඳහා සුදුසු විසඳුම් අවශ්ය නොවේ. ඔබේ ඇල්ගොරිතම බොහෝ විට ක්‍රියා කරයි සහ ඉතා නිවැරදි වනු ඇත, නමුත් ඔබේ ආකෘති සහ කේතය ෆ්‍රැන්කන්ස්ටයින් විවිධ කොටස් වලින් එකට මැසීම වැනි වනු ඇත - නිෂ්පාදන ව්‍යාපෘතියකදී, සම්පූර්ණ ව්‍යුහය ඉතා සෙමින් ක්‍රියා කරයි, එය යාවත්කාලීන කිරීමට සහ පුළුල් කිරීමට අපහසු වනු ඇත (උදාහරණයක් ලෙස, භාෂාව වර්ධනය වන විට භාෂාව සහ හඬ ඇල්ගොරිතම සෑම විටම අර්ධ වශයෙන් නැවත ලියනු ලැබේ). ලැයිස්තුගත කර ඇති කාර්යයන් ඔබට පමණක් නොව (විසඳුමේ කතුවරයා ලෙස ඔබට මෙය කළ හැකි බව පැහැදිලිය) පමණක් නොව ඔබේ ඕනෑම සගයෙකුටද කළ හැකි බව සමාගම් උනන්දු වෙති. ක්රීඩා සහ කාර්මික වැඩසටහන් අතර වෙනස සාකච්ඡා කෙරේ много, සහ Kaggle නිශ්චිතවම “ක්‍රීඩක ක්‍රීඩිකාවන්” දැනුවත් කරයි - එය ඉතා හොඳින් කළත්, ඔවුන්ට යම් අත්දැකීමක් ලබා ගැනීමට ඉඩ සලසයි.

මම හැකි සංවර්ධන මාර්ග දෙකක් විස්තර කළෙමි - අධ්‍යාපනික වැඩසටහන් හරහා පුහුණුව සහ “සටන් කිරීමේ” පුහුණුව, උදාහරණයක් ලෙස Kaggle හි. නේවාසික වැඩසටහන මෙම ක්‍රම දෙකෙහි එකතුවකි. ShAD මට්ටමේ දේශන සහ සම්මන්ත්‍රණ මෙන්ම සැබවින්ම සටන්කාමී ව්‍යාපෘති ඔබ බලා සිටී.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න