Yandex atver maŔīnmÄcÄ«bas rezidences programmu pieredzÄjuÅ”iem aizmugursistÄmas izstrÄdÄtÄjiem. Ja esi daudz rakstÄ«jis C++/Python valodÄ un vÄlies Ŕīs zinÄÅ”anas pielietot ML, tad mÄs Tev iemÄcÄ«sim veikt praktiskus pÄtÄ«jumus un nodroÅ”inÄsim pieredzÄjuÅ”us mentorus. JÅ«s strÄdÄsit pie galvenajiem Yandex pakalpojumiem un iegÅ«sit prasmes tÄdÄs jomÄs kÄ lineÄrie modeļi un gradientu paaugstinÄÅ”ana, ieteikumu sistÄmas, neironu tÄ«kli attÄlu, teksta un skaÅas analÄ«zei. JÅ«s arÄ« uzzinÄsit, kÄ pareizi novÄrtÄt savus modeļus, izmantojot metriku bezsaistÄ un tieÅ”saistÄ.
Programmas ilgums ir viens gads, kura laikÄ dalÄ«bnieki strÄdÄs Yandex maŔīntelpas un pÄtniecÄ«bas nodaļÄ, kÄ arÄ« apmeklÄs lekcijas un seminÄrus. DalÄ«ba ir apmaksÄta un ietver pilnas slodzes darbu: 40 stundas nedÄļÄ, sÄkot ar Ŕī gada 1. jÅ«liju.
Un tagad sÄ«kÄk - par to, kÄdu auditoriju gaidÄm, kÄds bÅ«s darba process un vispÄr, kÄ back-end speciÄlists var pÄrslÄgties uz karjeru ML.
OrientÄÅ”anÄs
Daudziem uzÅÄmumiem ir rezidences programmas, tostarp, piemÄram, Google un Facebook. Tie galvenokÄrt ir vÄrsti uz jaunÄkÄ un vidÄjÄ lÄ«meÅa speciÄlistiem, kuri cenÅ”as spert soli pretÄ« ML pÄtniecÄ«bai. MÅ«su programma ir paredzÄta citai auditorijai. AicinÄm aizmugursistÄmas izstrÄdÄtÄjus, kuri jau ir uzkrÄjuÅ”i pietiekami daudz pieredzes un droÅ”i zina, ka savÄs kompetencÄs viÅiem ir jÄvirzÄs uz ML, lai iegÅ«tu praktiskas iemaÅas, nevis zinÄtnieka prasmes, risinot rÅ«pnieciskÄs maŔīnmÄcÄ«Å”anÄs problÄmas. Tas nenozÄ«mÄ, ka mÄs neatbalstÄm jaunos pÄtniekus. MÄs esam viÅiem organizÄjuÅ”i atseviŔķu programmu -
Kur rezidents strÄdÄs?
MaŔīninteliÄ£ences un pÄtniecÄ«bas nodaÄ¼Ä mÄs paÅ”i izstrÄdÄjam projektu idejas. Galvenais iedvesmas avots ir zinÄtniskÄ literatÅ«ra, raksti un tendences pÄtnieku aprindÄs. MÄs ar kolÄÄ£iem analizÄjam lasÄ«to, meklÄjot, kÄ mÄs varam uzlabot vai paplaÅ”inÄt zinÄtnieku piedÄvÄtÄs metodes. TajÄ paÅ”Ä laikÄ katrs no mums Åem vÄrÄ savu zinÄÅ”anu un intereÅ”u jomu, formulÄ uzdevumu, pamatojoties uz jomÄm, kuras viÅÅ” uzskata par svarÄ«gÄm. Ideja par projektu parasti dzimst ÄrÄjo pÄtÄ«jumu rezultÄtu un paÅ”u kompetenÄu krustpunktÄ.
Å Ä« sistÄma ir laba, jo tÄ lielÄ mÄrÄ atrisina Yandex pakalpojumu tehnoloÄ£iskÄs problÄmas pat pirms to raÅ”anÄs. Kad serviss saskaras ar problÄmu, pie mums ierodas tÄ pÄrstÄvji, kuri, visticamÄk, paÅem mÅ«su jau sagatavotÄs tehnoloÄ£ijas, kuras atliek tikai pareizi iestrÄdÄt produktÄ. Ja kaut kas nebÅ«s gatavs, tad vismaz Ätri atcerÄsimies, kur var āsÄkt raktā un kuros rakstos meklÄt risinÄjumu. KÄ zinÄms, zinÄtniskÄ pieeja ir stÄvÄt uz milžu pleciem.
Ko darīt
UzÅÄmumÄ Yandex ā un pat Ä«paÅ”i mÅ«su vadÄ«bÄ ā tiek izstrÄdÄtas visas atbilstoÅ”Äs ML jomas. MÅ«su mÄrÄ·is ir uzlabot visdažÄdÄko produktu kvalitÄti, un tas kalpo kÄ stimuls pÄrbaudÄ«t visu jauno. TurklÄt regulÄri parÄdÄs jauni pakalpojumi. TÄtad lekciju programmÄ ir visas galvenÄs (labi pÄrbaudÄ«tÄs) maŔīnmÄcÄ«bas jomas rÅ«pnieciskajÄ attÄ«stÄ«bÄ. Veidojot savu kursa daļu, izmantoju savu pasniegÅ”anas pieredzi Datu analÄ«zes skolÄ, kÄ arÄ« citu SHAD pasniedzÄju materiÄlus un darbu. Es zinu, ka mani kolÄÄ£i darÄ«ja tÄpat.
Pirmajos mÄneÅ”os apmÄcÄ«ba pÄc kursu programmas veidos aptuveni 30% no JÅ«su darba laika, pÄc tam ap 10%. TomÄr ir svarÄ«gi saprast, ka darbs ar paÅ”iem ML modeļiem arÄ« turpmÄk prasÄ«s aptuveni Äetras reizes mazÄk nekÄ visi saistÄ«tie procesi. Tie ietver aizmugursistÄmas sagatavoÅ”anu, datu saÅemÅ”anu, konveijera rakstÄ«Å”anu to pirmapstrÄdei, koda optimizÄÅ”anu, pielÄgoÅ”anos noteiktai aparatÅ«rai utt. ML inženieris, ja vÄlaties, ir pilnas kaudzes izstrÄdÄtÄjs (tikai ar lielÄku uzsvaru uz maŔīnmÄcÄ«Å”anos). , spÄj atrisinÄt problÄmu no sÄkuma lÄ«dz beigÄm. Pat ar gatavu modeli, iespÄjams, bÅ«s jÄveic vÄl vairÄkas darbÄ«bas: paralÄli tÄ izpildei vairÄkÄs iekÄrtÄs, jÄsagatavo implementÄcija roktura, bibliotÄkas vai paÅ”a pakalpojuma komponentu veidÄ.
Studentu izvÄle
Ja jums radÄs iespaids, ka labÄk ir kļūt par ML inženieri, vispirms strÄdÄjot par aizmugursistÄmas izstrÄdÄtÄju, tÄ nav taisnÄ«ba. Lieliska iespÄja ir reÄ£istrÄties tajÄ paÅ”Ä SHAD bez reÄlas pieredzes pakalpojumu izstrÄdÄ, mÄcÄ«ties un kļūt ļoti pieprasÄ«tam tirgÅ«. TÄdÄ veidÄ daudzi Yandex speciÄlisti nokļuva paÅ”reizÄjÄs amatos. Ja kÄds uzÅÄmums ir gatavs piedÄvÄt darbu ML jomÄ uzreiz pÄc studiju beigÅ”anas, iespÄjams, arÄ« jums vajadzÄtu pieÅemt piedÄvÄjumu. MÄÄ£iniet iekļūt labÄ komandÄ ar pieredzÄjuÅ”u mentoru un esiet gatavi daudz mÄcÄ«ties.
Kas jums parasti traucÄ nodarboties ar ML?
Ja aizmugure vÄlas kļūt par ML inženieri, viÅÅ” var izvÄlÄties no divÄm attÄ«stÄ«bas jomÄm ā neÅemot vÄrÄ rezidentÅ«ras programmu.
PirmkÄrt, mÄcieties kÄda izglÄ«tÄ«bas kursa ietvaros.
OtrkÄrt, var piedalÄ«ties kaujas projektos, kur nepiecieÅ”ams ieviest vienu vai otru ML algoritmu. TomÄr IT izstrÄdes tirgÅ« ir ļoti maz Å”Ädu projektu: maŔīnmÄcÄ«ba netiek izmantota lielÄkajÄ daÄ¼Ä uzdevumu. Pat bankÄs, kas aktÄ«vi pÄta ar ML saistÄ«tas iespÄjas, tikai dažas nodarbojas ar datu analÄ«zi. Ja jÅ«s nevarÄjÄt pievienoties kÄdai no Ŕīm komandÄm, jÅ«su vienÄ«gÄ iespÄja ir vai nu sÄkt savu projektu (kur, visticamÄk, jÅ«s pats noteiksiet savus termiÅus, un tam ir maz sakara ar kaujas ražoÅ”anas uzdevumiem), vai arÄ« sÄkt sacensties Kaggle.
Patiesi, sadarbojieties ar citiem kopienas locekļiem un izmÄÄ£iniet sevi sacensÄ«bÄs
Es aprakstÄ«ju divus iespÄjamos attÄ«stÄ«bas virzienus - apmÄcÄ«bu, izmantojot izglÄ«tÄ«bas programmas, un apmÄcÄ«bu "kaujÄ", piemÄram, uz Kaggle. Rezidences programma ir Å”o divu metožu kombinÄcija. JÅ«s gaida lekcijas un seminÄri ShaD lÄ«menÄ«, kÄ arÄ« patiesi kaujinieciski projekti.
Avots: www.habr.com