Programm Residenti Yandex, jew Kif Backender b'Esperjenza Jista' Issir Inġinier ML

Programm Residenti Yandex, jew Kif Backender b'Esperjenza Jista' Issir Inġinier ML

Yandex qed tiftaħ programm ta 'residenza fit-tagħlim tal-magni għal żviluppaturi backend b'esperjenza. Jekk ktibt ħafna f'C++/Python u trid tapplika dan l-għarfien għall-ML, allura aħna ngħallmu kif tagħmel riċerka prattika u nipprovdu konsulenti b'esperjenza. Int se taħdem fuq is-servizzi ewlenin ta 'Yandex u tikseb ħiliet f'oqsma bħal mudelli lineari u spinta tal-gradjent, sistemi ta' rakkomandazzjoni, netwerks newrali għall-analiżi ta 'immaġini, test u ħoss. Se titgħallem ukoll kif tevalwa sew il-mudelli tiegħek billi tuża metriċi offline u online.

It-tul tal-programm huwa ta 'sena, li matulha l-parteċipanti se jaħdmu fid-dipartiment tal-intelliġenza tal-magni u r-riċerka ta' Yandex, kif ukoll jattendu lekċers u seminars. Il-parteċipazzjoni titħallas u tinvolvi xogħol full-time: 40 siegħa fil-ġimgħa, li jibdew mill-1 ta’ Lulju ta’ din is-sena. L-applikazzjonijiet issa huma miftuħa u se jdum sa l-1 ta’ Mejju. 

U issa f'aktar dettall - dwar x'tip ta 'udjenza qed nistennew, x'se jkun il-proċess tax-xogħol u, b'mod ġenerali, kif speċjalista back-end jista' jaqleb għal karriera fl-ML.

Iffoka

Ħafna kumpaniji għandhom Programmi ta’ Residenza, inklużi, pereżempju, Google u Facebook. Dawn huma prinċipalment immirati għal speċjalisti ta' livell żgħir u medju li qed jippruvaw jagħmlu pass lejn ir-riċerka ML. Il-programm tagħna huwa għal udjenza differenti. Aħna nistiednu lill-iżviluppaturi backend li diġà kisbu biżżejjed esperjenza u jafu żgur li fil-kompetenzi tagħhom jeħtieġ li jaqilbu lejn l-ML, biex jiksbu ħiliet prattiċi - u mhux il-ħiliet ta' xjenzat - biex isolvu problemi ta' tagħlim tal-magni industrijali. Dan ma jfissirx li aħna ma nappoġġjawx riċerkaturi żgħażagħ. organizzajna programm separat għalihom - primjum msemmi għal Ilya Segalovich, li jippermettilek ukoll taħdem f'Yandex.

Fejn se jaħdem ir-resident?

Fid-Dipartiment ta 'l-Intelliġenza u r-Riċerka tal-Magni, aħna nfusna niżviluppaw ideat ta' proġetti. Is-sors ewlieni ta’ ispirazzjoni huwa l-letteratura xjentifika, l-artikoli u t-tendenzi fil-komunità tar-riċerka. Jien u l-kollegi tiegħi nanalizzaw dak li naqraw, inħarsu lejn kif nistgħu ntejbu jew nespandu l-metodi proposti mix-xjenzati. Fl-istess ħin, kull wieħed minna jqis il-qasam tal-għarfien u l-interessi tiegħu, jifformula l-kompitu bbażat fuq l-oqsma li jqis importanti. L-idea għal proġett normalment titwieled fl-intersezzjoni tar-riżultati tar-riċerka esterna u l-kompetenzi tiegħu stess.

Din is-sistema hija tajba għax issolvi l-problemi teknoloġiċi tas-servizzi Yandex anki qabel ma jinqalgħu. Meta servizz jiffaċċja problema, ir-rappreżentanti tiegħu jiġu għandna, x'aktarx li jieħdu t-teknoloġiji li diġà ppreparajna, li kulma jibqa 'hu li jiġu applikati b'mod korrett fil-prodott. Jekk xi ħaġa mhix lesta, mill-inqas niftakru malajr fejn nistgħu "nibdew inħaffru" u f'liema artikoli nfittxu soluzzjoni. Kif nafu, l-approċċ xjentifiku huwa li toqgħod fuq l-ispallejn tal-ġganti.

X'tagħmel

F'Yandex - u anke speċifikament fil-ġestjoni tagħna - l-oqsma rilevanti kollha tal-ML qed jiġu żviluppati. L-għan tagħna huwa li ntejbu l-kwalità ta 'varjetà wiesgħa ta' prodotti, u dan iservi bħala inċentiv biex tittestja kollox ġdid. Barra minn hekk, servizzi ġodda jidhru regolarment. Allura l-programm tal-lectures fih l-oqsma ewlenin kollha (ppruvati sew) tat-tagħlim tal-magni fl-iżvilupp industrijali. Meta kkumpilajt il-parti tiegħi tal-kors, użajt l-esperjenza tiegħi ta’ tagħlim fl-Iskola tal-Analiżi tad-Data, kif ukoll il-materjali u x-xogħol ta’ għalliema oħra SHAD. Naf li l-kollegi tiegħi għamlu l-istess.

Fl-ewwel xhur, it-taħriġ skont il-programm tal-kors se jammonta għal madwar 30% tal-ħin tax-xogħol tiegħek, imbagħad madwar 10%. Madankollu, huwa importanti li wieħed jifhem li l-ħidma mal-mudelli ML infushom se tkompli tieħu madwar erba 'darbiet inqas mill-proċessi assoċjati kollha. Dawn jinkludu t-tħejjija tal-backend, ir-riċeviment tad-dejta, il-kitba ta' pipeline għall-ipproċessar minn qabel, l-ottimizzazzjoni tal-kodiċi, l-adattament għal hardware speċifiku, eċċ. Inġinier ML huwa, jekk tixtieq, żviluppatur full-stack (biss b'enfasi akbar fuq it-tagħlim tal-magni) , kapaċi ssolvi problema mill-bidu sat-tmiem. Anke b'mudell lest, probabbilment ikollok bżonn tagħmel numru ta 'aktar azzjonijiet: parallelizza l-eżekuzzjoni tiegħu fuq diversi magni, ipprepara implimentazzjoni fil-forma ta' manku, librerija, jew komponenti tas-servizz innifsu.

Għażla tal-istudenti
Jekk kont taħt l-impressjoni li huwa aħjar li ssir inġinier ML billi l-ewwel taħdem bħala żviluppatur backend, dan mhux minnu. Ir-reġistrazzjoni fl-istess ShAD mingħajr esperjenza reali fl-iżvilupp tas-servizzi, it-tagħlim u li ssir domanda kbira fis-suq hija għażla eċċellenti. Ħafna speċjalisti Yandex spiċċaw fil-pożizzjonijiet attwali tagħhom b'dan il-mod. Jekk xi kumpanija hija lesta li toffrilek impjieg fil-qasam tal-ML immedjatament wara l-gradwazzjoni, probabbilment għandek taċċetta l-offerta wkoll. Ipprova tidħol f'tim tajjeb b'parrinu b'esperjenza u lesti biex titgħallem ħafna.

X'inhu normalment jipprevjeni milli tagħmel ML?

Jekk backender jaspira li jsir inġinier ML, jista 'jagħżel minn żewġ oqsma ta' żvilupp - mingħajr ma jqis il-programm ta 'residenza.

L-ewwelnett, studja bħala parti minn xi kors edukattiv. Il-lezzjonijiet Coursera ser iġġib eqreb lejn il-fehim tat-tekniki bażiċi, iżda biex tgħaddas ruħek fil-professjoni sa ċertu punt, trid tiddedika ħafna aktar ħin għaliha. Per eżempju, gradwat minn ShAD. Matul is-snin, ShAD kellu numru differenti ta 'korsijiet direttament fuq it-tagħlim tal-magni - bħala medja, madwar tmienja. Kull wieħed minnhom huwa verament importanti u utli, inkluż fl-opinjoni tal-gradwati. 

It-tieni, tista 'tieħu sehem fi proġetti ta' miġġielda fejn għandek bżonn timplimenta algoritmu ML wieħed jew ieħor. Madankollu, hemm ftit ħafna proġetti bħal dawn fis-suq tal-iżvilupp tal-IT: it-tagħlim tal-magni ma jintużax fil-biċċa l-kbira tal-kompiti. Anke f'banek li qed jesploraw b'mod attiv opportunitajiet relatati mal-ML, ftit biss huma involuti fl-analiżi tad-dejta. Jekk ma stajtx tingħaqad ma' wieħed minn dawn it-timijiet, l-unika għażla tiegħek hija li jew tibda l-proġett tiegħek stess (fejn, x'aktarx, se tistabbilixxi l-iskadenzi tiegħek, u dan ftit għandu x'jaqsam mal-kompiti tal-produzzjoni tal-ġlieda kontra), jew tibda tikkompeti fuq Kaggle.

Tabilħaqq, ingħaqad ma' membri oħra tal-komunità u pprova lilek innifsek f'kompetizzjonijiet relattivament faċli - speċjalment jekk issaħħaħ il-ħiliet tiegħek bit-taħriġ u l-korsijiet imsemmija fuq Coursera. Kull kompetizzjoni għandha skadenza - se sservi bħala inċentiv għalik u tippreparak għal sistema simili fil-kumpaniji tal-IT. Dan huwa mod tajjeb - li, madankollu, huwa wkoll ftit divorzjat minn proċessi reali. Fuq Kaggle tingħata data ipproċessata minn qabel, għalkemm mhux dejjem perfetta; ma toffrix li taħseb dwar il-kontribuzzjoni għall-prodott; u l-aktar importanti, ma jeħtiġux soluzzjonijiet adattati għall-produzzjoni. L-algoritmi tiegħek probabbilment se jaħdmu u jkunu preċiżi ħafna, iżda l-mudelli u l-kodiċi tiegħek se jkunu bħal Frankenstein meħjuta flimkien minn partijiet differenti - fi proġett ta 'produzzjoni, l-istruttura kollha taħdem bil-mod wisq, se jkun diffiċli li taġġorna u tespandi (per eżempju, l-algoritmi tal-lingwa u tal-vuċi dejjem se jinkitbu mill-ġdid parzjalment hekk kif tiżviluppa l-lingwa). Kumpaniji huma interessati fil-fatt li x-xogħol elenkat jista 'jsir mhux biss minnek stess (huwa ċar li inti, bħala l-awtur tas-soluzzjoni, tista' tagħmel dan), iżda wkoll minn kwalunkwe wieħed mill-kollegi tiegħek. Id-differenza bejn l-isports u l-ipprogrammar industrijali hija diskussa много, u Kaggle jeduka preċiżament "atleti" - anke jekk jagħmel dan tajjeb ħafna, li jippermettilhom jiksbu xi esperjenza.

Iddeskrivejt żewġ linji possibbli ta 'żvilupp - taħriġ permezz ta' programmi edukattivi u taħriġ "fil-ġlieda", pereżempju fuq Kaggle. Il-programm ta’ residenza huwa taħlita ta’ dawn iż-żewġ metodi. Lekċers u seminars fil-livell ta' ShAD, kif ukoll proġetti tassew ta' ġlieda, jistennewk.

Sors: www.habr.com

Żid kumment