Programi Resident Yandex, ose Si një Backender me përvojë mund të bëhet një inxhinier ML

Programi Resident Yandex, ose Si një Backender me përvojë mund të bëhet një inxhinier ML

Yandex po hap një program rezidencial në mësimin e makinerive për zhvilluesit me përvojë të backend. Nëse keni shkruar shumë në C++/Python dhe dëshironi ta aplikoni këtë njohuri në ML, atëherë ne do t'ju mësojmë se si të bëni kërkime praktike dhe të ofrojmë mentorë me përvojë. Do të punoni në shërbimet kryesore Yandex dhe do të fitoni aftësi në fusha të tilla si modelet lineare dhe rritja e gradientit, sistemet e rekomandimeve, rrjetet nervore për analizimin e imazheve, tekstit dhe zërit. Ju gjithashtu do të mësoni se si të vlerësoni siç duhet modelet tuaja duke përdorur metrikë jashtë linje dhe në internet.

Kohëzgjatja e programit është një vit, gjatë të cilit pjesëmarrësit do të punojnë në departamentin e inteligjencës dhe kërkimit të makinerive të Yandex, si dhe do të marrin pjesë në leksione dhe seminare. Pjesëmarrja është me pagesë dhe përfshin punë me kohë të plotë: 40 orë në javë, duke filluar nga 1 korriku i këtij viti. Aplikimet tani janë të hapura dhe do të zgjasë deri më 1 maj. 

Dhe tani më në detaje - për atë lloj audiencë që presim, cili do të jetë procesi i punës dhe, në përgjithësi, se si një specialist i fundit mund të kalojë në një karrierë në ML.

directionality

Shumë kompani kanë Programe Rezidenciale, duke përfshirë, për shembull, Google dhe Facebook. Ato u drejtohen kryesisht specialistëve të rinj dhe të nivelit të mesëm, të cilët po përpiqen të hedhin një hap drejt kërkimit të ML. Programi ynë është për një audiencë tjetër. Ne ftojmë zhvillues backend që kanë fituar tashmë mjaft përvojë dhe e dinë me siguri se në kompetencat e tyre ata duhet të kalojnë drejt ML, për të fituar aftësi praktike - dhe jo aftësitë e një shkencëtari - në zgjidhjen e problemeve industriale të mësimit të makinerive. Kjo nuk do të thotë se ne nuk mbështesim studiuesit e rinj. Ne kemi organizuar një program të veçantë për ta - premium me emrin Ilya Segalovich, i cili gjithashtu ju lejon të punoni në Yandex.

Ku do të punojë banori?

Në Departamentin e Inteligjencës dhe Kërkimit të Makinerisë, ne vetë zhvillojmë ide projektesh. Burimi kryesor i frymëzimit është literatura shkencore, artikujt dhe tendencat në komunitetin e kërkimit. Unë dhe kolegët e mi analizojmë atë që lexojmë, duke parë se si mund të përmirësojmë ose zgjerojmë metodat e propozuara nga shkencëtarët. Në të njëjtën kohë, secili prej nesh merr parasysh fushën e tij të njohurive dhe interesave, formulon detyrën bazuar në fushat që ai i konsideron të rëndësishme. Ideja për një projekt zakonisht lind në kryqëzimin e rezultateve të kërkimit të jashtëm dhe kompetencave të dikujt.

Ky sistem është i mirë sepse zgjidh në masë të madhe problemet teknologjike të shërbimeve Yandex edhe para se të lindin. Kur një shërbim përballet me një problem, përfaqësuesit e tij vijnë tek ne, me shumë mundësi për të marrë teknologjitë që kemi përgatitur tashmë, të cilat mbetet vetëm të aplikohen saktë në produkt. Nëse diçka nuk është gati, të paktën do të kujtojmë shpejt se ku mund të "fillojmë të gërmojmë" dhe në cilët artikuj të kërkojmë një zgjidhje. Siç e dimë, qasja shkencore është të qëndrosh mbi supet e gjigantëve.

Çfarë duhet bërë

Në Yandex - dhe madje veçanërisht në menaxhimin tonë - të gjitha fushat përkatëse të ML janë duke u zhvilluar. Qëllimi ynë është të përmirësojmë cilësinë e një shumëllojshmërie të gjerë produktesh, dhe kjo shërben si një nxitje për të testuar gjithçka të re. Përveç kësaj, shërbimet e reja shfaqen rregullisht. Pra, programi i leksioneve përmban të gjitha fushat kryesore (të vërtetuara mirë) të mësimit të makinerive në zhvillimin industrial. Gjatë përpilimit të pjesës sime të kursit, përdora përvojën time të mësimdhënies në Shkollën e Analizës së të Dhënave, si dhe materialet dhe punën e mësuesve të tjerë të SHAD. E di që kolegët e mi kanë bërë të njëjtën gjë.

Në muajt e parë, trajnimi sipas programit të kursit do të përbëjë afërsisht 30% të kohës suaj të punës, pastaj rreth 10%. Megjithatë, është e rëndësishme të kuptohet se puna me vetë modelet ML do të vazhdojë të marrë afërsisht katër herë më pak se të gjitha proceset e lidhura. Këto përfshijnë përgatitjen e backend-it, marrjen e të dhënave, shkrimin e një tubacioni për përpunimin paraprak të tij, optimizimin e kodit, përshtatjen me harduerin specifik, etj. Një inxhinier ML është, nëse dëshironi, një zhvillues i plotë (vetëm me një theks më të madh në mësimin e makinerive) , në gjendje të zgjidhë një problem nga fillimi në fund. Edhe me një model të gatshëm, ndoshta do t'ju duhet të bëni një sërë veprimesh të tjera: paralelizoni ekzekutimin e tij në disa makina, përgatitni një zbatim në formën e një doreze, një biblioteke ose përbërës të vetë shërbimit.

Zgjedhja e studentit
Nëse keni pasur përshtypjen se është më mirë të bëheni një inxhinier ML duke punuar fillimisht si një zhvillues backend, kjo nuk është e vërtetë. Regjistrimi në të njëjtin SAD pa përvojë reale në zhvillimin e shërbimeve, të mësuarit dhe duke u bërë jashtëzakonisht i kërkuar në treg është një opsion i shkëlqyer. Shumë specialistë të Yandex përfunduan në pozicionet e tyre aktuale në këtë mënyrë. Nëse ndonjë kompani është e gatshme t'ju ofrojë një punë në fushën e ML menjëherë pas diplomimit, ndoshta duhet ta pranoni edhe ju ofertën. Mundohuni të futeni në një ekip të mirë me një mentor me përvojë dhe përgatituni të mësoni shumë.

Çfarë ju pengon zakonisht të bëni ML?

Nëse një mbështetës aspiron të bëhet një inxhinier ML, ai mund të zgjedhë nga dy fusha zhvillimi - pa marrë parasysh programin e qëndrimit.

Së pari, studio si pjesë e ndonjë kursi arsimor. Mësimet Coursera do t'ju sjellë më afër kuptimit të teknikave bazë, por për t'u zhytur në profesion në një masë të mjaftueshme, duhet t'i kushtoni shumë më tepër kohë. Për shembull, të diplomuar nga ShAD. Me kalimin e viteve, ShAD kishte një numër të ndryshëm kursesh drejtpërdrejt në mësimin e makinerive - mesatarisht, rreth tetë. Secila prej tyre është me të vërtetë e rëndësishme dhe e dobishme, duke përfshirë edhe mendimin e të diplomuarve. 

Së dyti, ju mund të merrni pjesë në projekte luftarake ku duhet të zbatoni një ose një algoritëm tjetër ML. Megjithatë, ka shumë pak projekte të tilla në tregun e zhvillimit të IT: mësimi i makinerive nuk përdoret në shumicën e detyrave. Edhe në bankat që po eksplorojnë në mënyrë aktive mundësitë e lidhura me PP, vetëm disa janë të angazhuara në analizën e të dhënave. Nëse nuk keni mundur të bashkoheni me një nga këto ekipe, opsioni juaj i vetëm është ose të filloni projektin tuaj (ku, me shumë mundësi, do të vendosni vetë afatet tuaja, dhe kjo ka pak të bëjë me detyrat e prodhimit luftarak), ose të filloni të konkurroni në Kaggle.

Në të vërtetë, bashkohuni me anëtarët e tjerë të komunitetit dhe provoni veten në gara relativisht e lehtë - veçanërisht nëse i mbështetni aftësitë tuaja me trajnime dhe kurset e përmendura në Coursera. Çdo konkurs ka një afat - ai do të shërbejë si një nxitje për ju dhe do t'ju përgatisë për një sistem të ngjashëm në kompanitë e IT. Kjo është një mënyrë e mirë - e cila, megjithatë, është gjithashtu pak e shkëputur nga proceset reale. Në Kaggle ju jepen të dhëna të parapërpunuara, megjithëse jo gjithmonë perfekte; mos ofroni të mendoni për kontributin në produkt; dhe më e rëndësishmja, ato nuk kërkojnë zgjidhje të përshtatshme për prodhim. Algoritmet tuaja ndoshta do të funksionojnë dhe do të jenë shumë të sakta, por modelet dhe kodi juaj do të jenë si Frankenstein të bashkuar nga pjesë të ndryshme - në një projekt prodhimi, e gjithë struktura do të funksionojë shumë ngadalë, do të jetë e vështirë të përditësohet dhe zgjerohet (për shembull, algoritmet e gjuhës dhe zërit gjithmonë do të rishkruhen pjesërisht ndërsa gjuha zhvillohet). Kompanitë janë të interesuara për faktin që puna e listuar mund të bëhet jo vetëm nga ju vetë (është e qartë se ju, si autor i zgjidhjes, mund ta bëni këtë), por edhe nga ndonjë nga kolegët tuaj. Diskutohet ndryshimi midis programimit sportiv dhe atij industrial много, dhe Kaggle edukon pikërisht "atletët" - edhe nëse e bën atë shumë mirë, duke i lejuar ata të fitojnë përvojë.

Përshkrova dy linja të mundshme zhvillimi - trajnimi përmes programeve arsimore dhe trajnimi "në luftim", për shembull në Kaggle. Programi i qëndrimit është një kombinim i këtyre dy metodave. Ju presin leksione dhe seminare në nivel ShAD, si dhe projekte vërtet luftarake.

Burimi: www.habr.com

Shto një koment