Yandex Resident Program eli Kuinka kokeneesta taustatyöstä voi tulla ML-insinööri

Yandex Resident Program eli Kuinka kokeneesta taustatyöstä voi tulla ML-insinööri

Yandex avaa koneoppimisen residenssiohjelman kokeneille taustakehittäjille. Jos olet kirjoittanut paljon C++/Pythonilla ja haluat soveltaa tätä tietämystäsi ML:ssä, opetamme sinua tekemään käytännön tutkimusta ja tarjoamme kokeneita mentoreita. Työskentelet Yandexin keskeisten palveluiden parissa ja hankit taitoja sellaisilla aloilla kuin lineaariset mallit ja gradientin tehostaminen, suositusjärjestelmät, hermoverkot kuvien, tekstin ja äänen analysointiin. Opit myös arvioimaan mallejasi oikein mittareiden avulla offline-tilassa ja online-tilassa.

Ohjelman kesto on yksi vuosi, jonka aikana osallistujat työskentelevät Yandexin koneäly- ja tutkimusosastolla sekä osallistuvat luentoihin ja seminaareihin. Osallistuminen on palkallista ja sisältää kokopäivätyötä: 40 tuntia viikossa, tämän vuoden heinäkuun 1. päivästä alkaen. Hakemukset ovat nyt auki ja kestää toukokuun 1. päivään. 

Ja nyt tarkemmin - millaista yleisöä odotamme, millainen työprosessi tulee olemaan ja ylipäätään kuinka taustaasiantuntija voi vaihtaa uralle ML:ssä.

suuntatoiminto

Monilla yrityksillä on residenssiohjelmat, mukaan lukien esimerkiksi Google ja Facebook. Ne on suunnattu pääasiassa juniori- ja keskitason asiantuntijoille, jotka yrittävät ottaa askeleen kohti ML-tutkimusta. Ohjelmamme on suunnattu eri yleisölle. Kutsumme mukaan taustakehittäjät, jotka ovat jo saaneet riittävästi kokemusta ja tietävät varmasti, että heidän on pätevyydessään siirtymässä kohti ML, hankkimaan käytännön taitoja - ei tiedemiehen taitoja - teollisuuden koneoppimisongelmien ratkaisemisessa. Tämä ei tarkoita, että emme tue nuoria tutkijoita. Olemme järjestäneet heille erillisen ohjelman - palkkio nimetty Ilja Segalovichin mukaan, mikä mahdollistaa myös työskentelyn Yandexissä.

Missä asukas työskentelee?

Koneälyn ja tutkimuksen osastolla kehitämme itse projekti-ideoita. Pääasiallinen inspiraation lähde on tieteellinen kirjallisuus, artikkelit ja tutkimusyhteisön suuntaukset. Kollegani ja minä analysoimme lukemamme ja pohdimme, kuinka voimme parantaa tai laajentaa tutkijoiden ehdottamia menetelmiä. Samalla jokainen meistä ottaa huomioon oman osaamisalueensa ja kiinnostuksen kohteensa, muotoilee tehtävän tärkeiksi katsomiensa alueiden perusteella. Idea projektista syntyy yleensä ulkopuolisen tutkimuksen tulosten ja oman osaamisen risteyksessä.

Tämä järjestelmä on hyvä, koska se ratkaisee suurelta osin Yandex-palvelujen teknologiset ongelmat jo ennen niiden syntymistä. Kun palvelu kohtaa ongelman, sen edustajat tulevat luoksemme, todennäköisimmin ottamaan valmiiksi valmistamamme tekniikat, joita ei tarvitse muuta kuin soveltaa oikein tuotteeseen. Jos jokin ei ole valmis, muistamme ainakin nopeasti, mistä voimme "aloittaa kaivamisen" ja mistä artikkeleista etsiä ratkaisua. Kuten tiedämme, tieteellinen lähestymistapa on seistä jättiläisten harteilla.

Mitä tehdä

Yandexissä - ja jopa erityisesti johdossamme - kehitetään kaikkia asiaankuuluvia ML:n osa-alueita. Tavoitteenamme on parantaa monenlaisten tuotteiden laatua, mikä toimii kannustimena testata kaikkea uutta. Lisäksi uusia palveluita ilmestyy säännöllisesti. Luento-ohjelma sisältää siis kaikki teollisen kehityksen koneoppimisen keskeiset (hyvin todistetut) osa-alueet. Kurssiosuuttani kootaessani käytin opetuskokemustani Data Analysis Schoolissa sekä muiden SHAD-opettajien materiaaleja ja töitä. Tiedän, että kollegani tekivät samoin.

Ensimmäisinä kuukausina kurssiohjelman mukaisen koulutuksen osuus työajasta on noin 30 %, sitten noin 10 %. On kuitenkin tärkeää ymmärtää, että itse ML-mallien kanssa työskentely vie jatkossakin noin neljä kertaa vähemmän kuin kaikki niihin liittyvät prosessit. Näitä ovat taustaohjelman valmistelu, tietojen vastaanottaminen, liukuhihnan kirjoittaminen sen esikäsittelyä varten, koodin optimointi, mukauttaminen tiettyyn laitteistoon jne. ML-insinööri on, jos haluat, täyden pinon kehittäjä (vain koneoppimisen painopisteenä) , joka pystyy ratkaisemaan ongelman alusta loppuun. Jopa valmiilla mallilla joudut todennäköisesti tekemään useita muita toimintoja: rinnastamaan sen suoritus useissa koneissa, valmistelemaan toteutusta kahvan, kirjaston tai itse palvelun komponenttien muodossa.

Opiskelijan valinta
Jos sait sen vaikutelman, että on parempi ryhtyä ML-insinööriksi työskentelemällä ensin taustakehittäjänä, tämä ei pidä paikkaansa. Ilmoittautuminen samaan ShaD:iin ilman todellista kokemusta palveluiden kehittämisestä, oppimisesta ja markkinoiden erittäin kysytyksi tulemisesta on erinomainen vaihtoehto. Monet Yandex-asiantuntijat päätyivät nykyisiin tehtäviinsä tällä tavalla. Jos jokin yritys on valmis tarjoamaan sinulle työtä ML-alalta heti valmistumisen jälkeen, sinunkin pitäisi luultavasti hyväksyä tarjous. Yritä päästä hyvään tiimiin kokeneen mentorin kanssa ja valmistaudu oppimaan paljon.

Mikä yleensä estää sinua tekemästä ML:ää?

Jos backender haluaa ML-insinööriksi, hän voi valita kahdesta kehittämisalueesta - ottamatta huomioon residenssiohjelmaa.

Ensinnäkin opiskele osana koulutuskurssia. Oppitunnit Coursera vie sinut lähemmäksi perustekniikoiden ymmärtämistä, mutta uppoutuaksesi ammattiin riittävästi, sinun on käytettävä siihen paljon enemmän aikaa. Valmistu esimerkiksi Shadista. Vuosien varrella ShaD:lla oli eri määrä kursseja suoraan koneoppimisesta – keskimäärin noin kahdeksan. Jokainen niistä on todella tärkeä ja hyödyllinen, myös valmistuneiden mielestä. 

Toiseksi voit osallistua taisteluprojekteihin, joissa sinun on otettava käyttöön yksi tai toinen ML-algoritmi. IT-kehitysmarkkinoilla tällaisia ​​projekteja on kuitenkin hyvin vähän: koneoppimista ei käytetä useimmissa tehtävissä. Jopa pankeissa, jotka tutkivat aktiivisesti ML:n mahdollisuuksia, vain harvat ovat mukana tietojen analysoinnissa. Jos et päässyt liittymään johonkin näistä joukkueista, ainoa vaihtoehtosi on joko aloittaa oma projekti (jossa todennäköisesti asetat omat määräajat, ja tällä ei ole juurikaan tekemistä taistelutuotannon tehtävien kanssa) tai alkaa kilpailla Kaggle.

Todellakin, liity muiden yhteisön jäsenten kanssa ja kokeile itseäsi kilpailuissa suhteellisen helppoa - varsinkin jos tuet osaamistasi koulutuksella ja mainituilla Courseran kursseilla. Jokaisella kilpailulla on määräaika - se toimii sinulle kannustimena ja valmistaa sinut samanlaiseen järjestelmään IT-yrityksissä. Tämä on hyvä tapa - joka kuitenkin on myös hieman erotettu todellisista prosesseista. Kagglessa sinulle annetaan esikäsiteltyä, vaikkakaan ei aina täydellistä dataa; älä tarjoa ajatella panosta tuotteeseen; ja mikä tärkeintä, ne eivät vaadi tuotantoon sopivia ratkaisuja. Algoritmisi todennäköisesti toimivat ja ovat erittäin tarkkoja, mutta mallisi ja koodisi ovat kuin Frankenstein, jotka on ommeltu yhteen eri osista - tuotantoprojektissa koko rakenne toimii liian hitaasti, sitä on vaikea päivittää ja laajentaa (esim. kieli- ja äänialgoritmit kirjoitetaan aina osittain uudelleen kielen kehittyessä). Yritykset ovat kiinnostuneita siitä, että lueteltuja töitä ei voi tehdä vain sinä itse (on selvää, että sinä ratkaisun tekijänä voit tehdä tämän), vaan myös kuka tahansa kollegoistasi. Urheilun ja teollisen ohjelmoinnin eroa käsitellään много, ja Kaggle kouluttaa täsmälleen "urheilijoita" - vaikka se tekisikin sen erittäin hyvin, jolloin he saavat kokemusta.

Kuvasin kahta mahdollista kehityslinjaa - koulutusta koulutusohjelmien kautta ja koulutusta "taistelussa", esimerkiksi Kagglessa. Residenssiohjelma on näiden kahden menetelmän yhdistelmä. Sinua odottavat luennot ja seminaarit ShaD-tasolla sekä aidosti taistelutahtoiset projektit.

Lähde: will.com

Lisää kommentti