Mpango wa Mkazi wa Yandex, au Jinsi Mfadhili Mwenye Uzoefu Anaweza Kuwa Mhandisi wa ML

Mpango wa Mkazi wa Yandex, au Jinsi Mfadhili Mwenye Uzoefu Anaweza Kuwa Mhandisi wa ML

Yandex inafungua mpango wa ukaaji katika kujifunza kwa mashine kwa watengenezaji wenye uzoefu. Ikiwa umeandika mengi katika C++/Python na unataka kutumia ujuzi huu kwa ML, basi tutakufundisha jinsi ya kufanya utafiti wa vitendo na kutoa washauri wenye ujuzi. Utafanya kazi kwenye huduma muhimu za Yandex na kupata ujuzi katika maeneo kama vile miundo ya mstari na uongezaji wa upinde rangi, mifumo ya mapendekezo, mitandao ya neva ya kuchanganua picha, maandishi na sauti. Pia utajifunza jinsi ya kutathmini ipasavyo miundo yako kwa kutumia vipimo nje ya mtandao na mtandaoni.

Muda wa programu ni mwaka mmoja, ambapo washiriki watafanya kazi katika idara ya akili ya mashine na utafiti wa Yandex, pamoja na kuhudhuria mihadhara na semina. Ushiriki hulipwa na unahusisha kazi ya wakati wote: saa 40 kwa wiki, kuanzia Julai 1 mwaka huu. Maombi sasa yamefunguliwa na itadumu hadi Mei 1. 

Na sasa kwa undani zaidi - kuhusu aina gani ya watazamaji tunasubiri, mchakato wa kazi utakuwa nini na, kwa ujumla, jinsi mtaalamu wa nyuma anaweza kubadili kazi katika ML.

Kuzingatia

Makampuni mengi yana Mipango ya Ukaazi, ikiwa ni pamoja na, kwa mfano, Google na Facebook. Zinalenga wataalamu wa ngazi ya chini na wa kati ambao wanajaribu kuchukua hatua kuelekea utafiti wa ML. Kipindi chetu ni cha hadhira tofauti. Tunawaalika wasanidi wa hali ya nyuma ambao tayari wamepata uzoefu wa kutosha na wanajua kwa hakika kwamba katika umahiri wao wanahitaji kuhama kuelekea ML, ili kupata ujuzi wa vitendo - na si ujuzi wa mwanasayansi - katika kutatua matatizo ya kujifunza mashine ya viwanda. Hii haimaanishi kuwa hatuwaungi mkono watafiti wachanga. Tumewaandalia programu tofauti - malipo jina lake baada ya Ilya Segalovich, ambayo pia inakuwezesha kufanya kazi katika Yandex.

Mkazi atafanya kazi wapi?

Katika Idara ya Ujasusi na Utafiti wa Mashine, sisi wenyewe hutengeneza mawazo ya mradi. Chanzo kikuu cha msukumo ni fasihi ya kisayansi, makala, na mienendo katika jumuiya ya utafiti. Mimi na wenzangu tunachambua tunachosoma, tukiangalia jinsi tunavyoweza kuboresha au kupanua mbinu zinazopendekezwa na wanasayansi. Wakati huo huo, kila mmoja wetu anazingatia eneo lake la maarifa na masilahi, huunda kazi kulingana na maeneo ambayo anaona ni muhimu. Wazo la mradi kawaida huzaliwa kwenye makutano ya matokeo ya utafiti wa nje na uwezo wa mtu mwenyewe.

Mfumo huu ni mzuri kwa sababu kwa kiasi kikubwa hutatua matatizo ya teknolojia ya huduma za Yandex hata kabla ya kutokea. Wakati huduma inakabiliwa na tatizo, wawakilishi wake wanakuja kwetu, uwezekano mkubwa wa kuchukua teknolojia ambazo tumetayarisha tayari, ambayo yote iliyobaki ni kutumika kwa usahihi katika bidhaa. Ikiwa kitu hakiko tayari, angalau tutakumbuka haraka ambapo tunaweza "kuanza kuchimba" na katika makala gani kutafuta suluhisho. Kama tunavyojua, mbinu ya kisayansi ni kusimama kwenye mabega ya majitu.

Nini cha kufanya

Katika Yandex - na hata hasa katika usimamizi wetu - maeneo yote muhimu ya ML yanatengenezwa. Lengo letu ni kuboresha ubora wa aina mbalimbali za bidhaa, na hii hutumika kama motisha ya kujaribu kila kitu kipya. Kwa kuongeza, huduma mpya zinaonekana mara kwa mara. Kwa hivyo programu ya mihadhara ina maeneo yote muhimu (yaliyothibitishwa vizuri) ya kujifunza kwa mashine katika maendeleo ya viwanda. Wakati wa kuandaa sehemu yangu ya kozi, nilitumia uzoefu wangu wa kufundisha katika Shule ya Uchambuzi wa Data, pamoja na nyenzo na kazi ya walimu wengine wa SHAD. Ninajua kwamba wenzangu walifanya vivyo hivyo.

Katika miezi ya kwanza, mafunzo kulingana na mpango wa kozi yatahesabu takriban 30% ya wakati wako wa kufanya kazi, kisha karibu 10%. Hata hivyo, ni muhimu kuelewa kwamba kufanya kazi na mifano ya ML wenyewe itaendelea kuchukua takriban mara nne chini ya taratibu zote zinazohusiana. Hizi ni pamoja na kuandaa mazingira ya nyuma, kupokea data, kuandika bomba kwa ajili ya kuichakata mapema, kuboresha msimbo, kurekebisha maunzi mahususi, n.k. Mhandisi wa ML, ukipenda, ni msanidi programu kamili (akiwa na msisitizo mkubwa wa kujifunza kwa mashine) , yenye uwezo wa kutatua tatizo kuanzia mwanzo hadi mwisho. Hata kwa mfano uliotengenezwa tayari, labda utahitaji kufanya idadi ya vitendo zaidi: kusawazisha utekelezaji wake kwenye mashine kadhaa, kuandaa utekelezaji kwa namna ya kushughulikia, maktaba, au vipengele vya huduma yenyewe.

Chaguo la mwanafunzi
Ikiwa ulikuwa na maoni kuwa ni bora kuwa mhandisi wa ML kwa kufanya kazi kwanza kama msanidi wa nyuma, hii si kweli. Kujiandikisha katika Shad sawa bila uzoefu halisi katika kuendeleza huduma, kujifunza na kuwa na mahitaji makubwa kwenye soko ni chaguo bora. Wataalamu wengi wa Yandex waliishia katika nafasi zao za sasa kwa njia hii. Ikiwa kampuni yoyote iko tayari kukupa kazi katika uwanja wa ML mara tu baada ya kuhitimu, labda unapaswa kukubali ofa hiyo pia. Jaribu kuingia katika timu nzuri na mshauri mwenye uzoefu na uwe tayari kujifunza mengi.

Ni nini kawaida hukuzuia kufanya ML?

Ikiwa msaidizi anatamani kuwa mhandisi wa ML, anaweza kuchagua kutoka kwa maeneo mawili ya maendeleo - bila kuzingatia mpango wa ukaaji.

Kwanza, soma kama sehemu ya kozi fulani ya elimu. Masomo Coursera itakuleta karibu na kuelewa mbinu za kimsingi, lakini ili kujiingiza katika taaluma hiyo kwa kiwango cha kutosha, unahitaji kutumia wakati mwingi zaidi kwake. Kwa mfano, mhitimu kutoka Shad. Kwa miaka mingi, ShaD ilikuwa na idadi tofauti ya kozi moja kwa moja kwenye ujifunzaji wa mashine - kwa wastani, kama nane. Kila mmoja wao ni muhimu sana na muhimu, pamoja na maoni ya wahitimu. 

Pili, unaweza kushiriki katika miradi ya mapigano ambapo unahitaji kutekeleza algorithm moja au nyingine ya ML. Hata hivyo, kuna miradi michache sana kwenye soko la maendeleo ya IT: kujifunza kwa mashine haitumiwi katika kazi nyingi. Hata katika benki ambazo zinachunguza kikamilifu fursa zinazohusiana na ML, ni wachache tu wanaohusika katika uchambuzi wa data. Iwapo hukuweza kujiunga na mojawapo ya timu hizi, chaguo lako pekee ni ama kuanzisha mradi wako mwenyewe (ambapo, kuna uwezekano mkubwa, utaweka makataa yako mwenyewe, na hii haihusiani sana na kazi za uzalishaji wa mapigano), au kuanza kushindana. Kaggle.

Hakika, ungana na wanajamii wengine na ujaribu mwenyewe katika mashindano rahisi kiasi - haswa ikiwa utahifadhi nakala ya ujuzi wako na mafunzo na kozi zilizotajwa kwenye Coursera. Kila shindano lina tarehe ya mwisho - litatumika kama motisha kwako na kukutayarisha kwa mfumo kama huo katika kampuni za TEHAMA. Hii ni njia nzuri - ambayo, hata hivyo, pia ni talaka kidogo kutoka kwa michakato halisi. Kwenye Kaggle unapewa data iliyochakatwa mapema, ingawa sio kamili kila wakati; usitoe kufikiria juu ya mchango wa bidhaa; na muhimu zaidi, hazihitaji ufumbuzi unaofaa kwa uzalishaji. Algorithms yako labda itafanya kazi na kuwa sahihi sana, lakini mifano na nambari zako zitakuwa kama Frankenstein iliyounganishwa kutoka sehemu tofauti - katika mradi wa uzalishaji, muundo wote utafanya kazi polepole sana, itakuwa ngumu kusasisha na kupanua (kwa mfano, nk). algoriti za lugha na sauti zitaandikwa upya kila wakati kadri lugha inavyoendelea). Makampuni yanavutiwa na ukweli kwamba kazi iliyoorodheshwa inaweza kufanywa sio tu na wewe mwenyewe (ni wazi kuwa wewe, kama mwandishi wa suluhisho, unaweza kufanya hivyo), lakini pia na mwenzako yeyote. Tofauti kati ya michezo na programu ya viwanda inajadiliwa mengi, na Kaggle huelimisha "wanariadha" kwa usahihi - hata ikiwa hufanya vizuri sana, kuwaruhusu kupata uzoefu fulani.

Nilielezea njia mbili zinazowezekana za maendeleo - mafunzo kupitia programu za elimu na mafunzo "katika mapigano", kwa mfano kwenye Kaggle. Mpango wa ukaazi ni mchanganyiko wa njia hizi mbili. Mihadhara na semina katika ngazi ya Shad, pamoja na miradi ya kweli ya kupambana, inakungoja.

Chanzo: mapenzi.com

Kuongeza maoni