Yandex Resident Program, o Giunsa ang Usa ka Eksperyensiyadong Backender Mahimong usa ka ML Engineer

Yandex Resident Program, o Giunsa ang Usa ka Eksperyensiyadong Backender Mahimong usa ka ML Engineer

Ang Yandex nag-abli og residency program sa machine learning para sa mga eksperyensiyadong backend developers. Kung daghan ka na nagsulat sa C++/Python ug gusto nimo nga i-apply kini nga kahibalo sa ML, unya tudloan ka namon kung giunsa ang paghimo sa praktikal nga panukiduki ug paghatag mga eksperyensiyado nga mga magtutudlo. Magtrabaho ka sa mga yawe nga serbisyo sa Yandex ug makakuha mga kahanas sa mga lugar sama sa linear nga mga modelo ug gradient boosting, mga sistema sa rekomendasyon, mga neural network alang sa pag-analisar sa mga imahe, teksto ug tunog. Makakat-on ka usab kung unsaon pagtimbang-timbang sa husto ang imong mga modelo gamit ang mga sukatan sa offline ug online.

Ang gidugayon sa programa usa ka tuig, diin ang mga partisipante magtrabaho sa departamento sa paniktik sa makina ug panukiduki sa Yandex, ingon man motambong sa mga lektyur ug seminar. Ang partisipasyon gibayran ug naglakip sa full-time nga trabaho: 40 ka oras kada semana, sugod sa Hulyo 1 ning tuiga. Ang mga aplikasyon bukas na ug molungtad hangtod Mayo 1. 

Ug karon sa mas detalyado - mahitungod sa unsa nga matang sa mamiminaw ang atong gihulat, unsa ang proseso sa trabaho ug, sa kinatibuk-an, sa unsa nga paagi ang usa ka back-end nga espesyalista makabalhin sa usa ka karera sa ML.

orientasyon

Daghang mga kompanya ang adunay Residency Programs, lakip, pananglitan, Google ug Facebook. Sila nag-una nga gitumong sa mga junior ug mid-level nga mga espesyalista nga naningkamot sa paghimo sa usa ka lakang padulong sa panukiduki sa ML. Ang among programa kay para sa lahi nga audience. Among gidapit ang mga backend developers nga nakabaton na ug igong kasinatian ug nakahibalo nga sa ilang mga katakos kinahanglan silang mobalhin ngadto sa ML, aron makabaton ug praktikal nga mga kahanas - ug dili ang mga kahanas sa usa ka siyentista - sa pagsulbad sa mga problema sa pagkat-on sa industriyal nga makina. Wala kini magpasabot nga dili namo suportahan ang mga batan-ong tigdukiduki. Nag-organisar kami og usa ka lahi nga programa alang kanila - premium ginganlan sunod sa Ilya Segalovich, nga nagtugot usab kanimo sa pagtrabaho sa Yandex.

Asa man magtrabaho ang residente?

Sa Department of Machine Intelligence and Research, kami mismo ang naghimo og mga ideya sa proyekto. Ang nag-unang tinubdan sa inspirasyon mao ang siyentipikong literatura, mga artikulo, ug mga uso sa komunidad sa panukiduki. Ang akong mga kauban ug ako nag-analisar sa among gibasa, nagtan-aw kung unsaon namo pagpalambo o pagpalapad ang mga pamaagi nga gisugyot sa mga siyentipiko. Sa samang higayon, ang matag usa kanato naghunahuna sa iyang dapit sa kahibalo ug interes, nagporma sa buluhaton base sa mga dapit nga iyang giisip nga importante. Ang ideya alang sa usa ka proyekto sa kasagaran natawo sa intersection sa mga resulta sa gawas nga panukiduki ug sa kaugalingon nga mga katakus.

Maayo kini nga sistema tungod kay kadaghanan niini nagsulbad sa mga problema sa teknolohiya sa mga serbisyo sa Yandex bisan sa wala pa kini motungha. Kung ang usa ka serbisyo nag-atubang sa usa ka problema, ang mga representante niini moabut kanamo, lagmit nga kuhaon ang mga teknolohiya nga among giandam na, nga ang nahabilin mao ang husto nga paggamit sa produkto. Kung adunay usa ka butang nga dili andam, labing menos dali natong mahinumduman kung diin kita "makasugod sa pagkalot" ug diin ang mga artikulo mangita usa ka solusyon. Sama sa atong nahibal-an, ang siyentipikanhong pamaagi mao ang pagbarug sa mga abaga sa mga higante.

Unsay buhaton

Sa Yandex - ug ilabi na sa among pagdumala - ang tanan nga may kalabutan nga mga bahin sa ML gipalambo. Ang atong tumong mao ang pagpalambo sa kalidad sa usa ka halapad nga matang sa mga produkto, ug kini nagsilbi nga usa ka insentibo sa pagsulay sa tanan nga bag-o. Dugang pa, ang mga bag-ong serbisyo kanunay nga makita. Mao nga ang programa sa lecture naglangkob sa tanan nga yawe (maayo nga napamatud-an) nga mga bahin sa pagkat-on sa makina sa pag-uswag sa industriya. Sa pagtipon sa akong bahin sa kurso, akong gigamit ang akong kasinatian sa pagtudlo sa School of Data Analysis, ingon man ang mga materyales ug trabaho sa ubang mga magtutudlo sa SHAD. Nahibal-an ko nga gibuhat usab sa akong mga kauban.

Sa unang mga bulan, ang pagbansay sumala sa programa sa kurso mag-asoy sa gibana-bana nga 30% sa imong oras sa pagtrabaho, unya mga 10%. Bisan pa, hinungdanon nga masabtan nga ang pagtrabaho sa mga modelo sa ML sa ilang kaugalingon magpadayon nga mokuha ug gibana-bana nga upat ka beses nga mas gamay kaysa sa tanan nga mga kauban nga proseso. Naglakip kini sa pag-andam sa backend, pagdawat sa datos, pagsulat sa pipeline alang sa preprocessing niini, pag-optimize sa code, pagpahiangay sa piho nga hardware, ug uban pa. , makahimo sa pagsulbad sa usa ka problema gikan sa sinugdanan hangtud sa katapusan. Bisan pa sa usa ka andam nga modelo, lagmit kinahanglan nimo nga buhaton ang daghang mga aksyon: iparehas ang pagpatuman niini sa daghang mga makina, pag-andam usa ka pagpatuman sa porma sa usa ka kuptanan, usa ka librarya, o mga sangkap sa serbisyo mismo.

Pagpili sa estudyante
Kung naa ka sa impresyon nga mas maayo nga mahimong usa ka inhenyero sa ML pinaagi sa una nga pagtrabaho ingon usa ka developer sa backend, dili kini tinuod. Ang pag-enrol sa parehas nga ShAD nga wala’y tinuud nga kasinatian sa pagpalambo sa mga serbisyo, pagkat-on ug pagkahimong labi nga gipangayo sa merkado usa ka maayo kaayo nga kapilian. Daghang mga espesyalista sa Yandex ang natapos sa ilang mga posisyon karon niining paagiha. Kung adunay bisan unsang kompanya nga andam nga motanyag kanimo usa ka trabaho sa natad sa ML pagkahuman sa gradwasyon, kinahanglan nimo nga dawaton usab ang tanyag. Sulayi ang pagsulod sa usa ka maayong team nga adunay usa ka eksperyensiyado nga magtutudlo ug pag-andam sa pagkat-on og daghan.

Unsa ang kasagarang nagpugong kanimo sa pagbuhat sa ML?

Kung ang usa ka backender nagtinguha nga mahimong usa ka inhenyero sa ML, makapili siya gikan sa duha ka bahin sa pag-uswag - nga wala gikonsiderar ang programa sa pagpuyo.

Una, pagtuon isip bahin sa pipila ka kurso sa edukasyon. Ang mga leksyon Ang Coursera magdala kanimo nga mas duol sa pagsabut sa mga batakang teknik, apan aron isubsob ang imong kaugalingon sa propesyon sa igo nga gidak-on, kinahanglan nimo nga igugol ang daghang oras niini. Pananglitan, mogradwar sa ShAD. Sulod sa mga katuigan, ang ShAD adunay lahi nga gidaghanon sa mga kurso nga direkta sa pagkat-on sa makina - sa kasagaran, mga walo. Ang matag usa kanila hinungdanon ug mapuslanon, lakip sa opinyon sa mga gradwado. 

Ikaduha, mahimo ka nga moapil sa mga proyekto sa kombat diin kinahanglan nimo nga ipatuman ang usa o lain nga algorithm sa ML. Bisan pa, gamay ra ang ingon nga mga proyekto sa merkado sa pagpalambo sa IT: ang pagkat-on sa makina wala gigamit sa kadaghanan nga mga buluhaton. Bisan sa mga bangko nga aktibo nga nagsuhid sa mga oportunidad nga may kalabotan sa ML, pipila ra ang nag-apil sa pagtuki sa datos. Kung dili ka makaapil sa usa niini nga mga team, ang imong kapilian mao ang pagsugod sa imong kaugalingon nga proyekto (diin, lagmit, magtakda ka sa imong kaugalingon nga mga tagal, ug kini wala’y kalabotan sa mga buluhaton sa produksiyon sa kombat), o magsugod sa kompetisyon Kaggle.

Sa tinuud, pakig-uban sa ubang mga miyembro sa komunidad ug sulayi ang imong kaugalingon sa mga kompetisyon medyo sayon - labi na kung gisuportahan nimo ang imong kahanas sa pagbansay ug ang nahisgutan nga mga kurso sa Coursera. Ang matag kompetisyon adunay deadline - kini magsilbi nga insentibo alang kanimo ug mag-andam kanimo alang sa susamang sistema sa mga kompanya sa IT. Kini usa ka maayo nga paagi - nga, bisan pa, usa usab ka gamay nga diborsyo gikan sa tinuod nga mga proseso. Sa Kaggle gihatagan ka nga pre-processed, bisan dili kanunay perpekto, data; ayaw pagtanyag nga maghunahuna bahin sa kontribusyon sa produkto; ug labaw sa tanan, wala sila magkinahanglan og mga solusyon nga angay alang sa produksyon. Ang imong mga algorithm tingali molihok ug tukma kaayo, apan ang imong mga modelo ug code mahisama sa Frankenstein nga gitahi gikan sa lainlaing mga bahin - sa usa ka proyekto sa produksiyon, ang tibuuk nga istruktura molihok nga hinay kaayo, lisud ang pag-update ug pagpalapad (pananglitan, Ang mga algorithm sa pinulongan ug tingog kanunay nga partially rewritten samtang ang pinulongan molambo). Ang mga kompanya interesado sa kamatuoran nga ang trabaho nga gilista mahimo dili lamang sa imong kaugalingon (klaro nga ikaw, isip tagsulat sa solusyon, makahimo niini), apan usab sa bisan kinsa sa imong mga kauban. Gihisgutan ang kalainan tali sa sports ug industriyal nga programa usa ka daghan, ug si Kaggle nag-edukar sa tukma nga "mga atleta" - bisan kung kini maayo kaayo, nagtugot kanila nga makaangkon og pipila ka kasinatian.

Gihulagway nako ang duha ka posible nga linya sa kalamboan - pagbansay pinaagi sa mga programa sa edukasyon ug pagbansay "sa kombat", pananglitan sa Kaggle. Ang programa sa residency usa ka kombinasyon niining duha ka pamaagi. Ang mga lektyur ug seminar sa lebel sa ShAD, ingon man ang tinuud nga kombati nga mga proyekto, naghulat kanimo.

Source: www.habr.com

Idugang sa usa ka comment