Yandex avaa koneoppimisen residenssiohjelman kokeneille taustakehittäjille. Jos olet kirjoittanut paljon C++/Pythonilla ja haluat soveltaa tätä tietämystäsi ML:ssä, opetamme sinua tekemään käytännön tutkimusta ja tarjoamme kokeneita mentoreita. Työskentelet Yandexin keskeisten palveluiden parissa ja hankit taitoja sellaisilla aloilla kuin lineaariset mallit ja gradientin tehostaminen, suositusjärjestelmät, hermoverkot kuvien, tekstin ja äänen analysointiin. Opit myös arvioimaan mallejasi oikein mittareiden avulla offline-tilassa ja online-tilassa.
Ohjelman kesto on yksi vuosi, jonka aikana osallistujat työskentelevät Yandexin koneäly- ja tutkimusosastolla sekä osallistuvat luentoihin ja seminaareihin. Osallistuminen on palkallista ja sisältää kokopäivätyötä: 40 tuntia viikossa, tämän vuoden heinäkuun 1. päivästä alkaen.
Ja nyt tarkemmin - millaista yleisöä odotamme, millainen työprosessi tulee olemaan ja ylipäätään kuinka taustaasiantuntija voi vaihtaa uralle ML:ssä.
suuntatoiminto
Monilla yrityksillä on residenssiohjelmat, mukaan lukien esimerkiksi Google ja Facebook. Ne on suunnattu pääasiassa juniori- ja keskitason asiantuntijoille, jotka yrittävät ottaa askeleen kohti ML-tutkimusta. Ohjelmamme on suunnattu eri yleisölle. Kutsumme mukaan taustakehittäjät, jotka ovat jo saaneet riittävästi kokemusta ja tietävät varmasti, että heidän on pätevyydessään siirtymässä kohti ML, hankkimaan käytännön taitoja - ei tiedemiehen taitoja - teollisuuden koneoppimisongelmien ratkaisemisessa. Tämä ei tarkoita, että emme tue nuoria tutkijoita. Olemme järjestäneet heille erillisen ohjelman -
Missä asukas työskentelee?
Koneälyn ja tutkimuksen osastolla kehitämme itse projekti-ideoita. Pääasiallinen inspiraation lähde on tieteellinen kirjallisuus, artikkelit ja tutkimusyhteisön suuntaukset. Kollegani ja minä analysoimme lukemamme ja pohdimme, kuinka voimme parantaa tai laajentaa tutkijoiden ehdottamia menetelmiä. Samalla jokainen meistä ottaa huomioon oman osaamisalueensa ja kiinnostuksen kohteensa, muotoilee tehtävän tärkeiksi katsomiensa alueiden perusteella. Idea projektista syntyy yleensä ulkopuolisen tutkimuksen tulosten ja oman osaamisen risteyksessä.
Tämä järjestelmä on hyvä, koska se ratkaisee suurelta osin Yandex-palvelujen teknologiset ongelmat jo ennen niiden syntymistä. Kun palvelu kohtaa ongelman, sen edustajat tulevat luoksemme, todennäköisimmin ottamaan valmiiksi valmistamamme tekniikat, joita ei tarvitse muuta kuin soveltaa oikein tuotteeseen. Jos jokin ei ole valmis, muistamme ainakin nopeasti, mistä voimme "aloittaa kaivamisen" ja mistä artikkeleista etsiä ratkaisua. Kuten tiedämme, tieteellinen lähestymistapa on seistä jättiläisten harteilla.
Mitä tehdä
Yandexissä - ja jopa erityisesti johdossamme - kehitetään kaikkia asiaankuuluvia ML:n osa-alueita. Tavoitteenamme on parantaa monenlaisten tuotteiden laatua, mikä toimii kannustimena testata kaikkea uutta. Lisäksi uusia palveluita ilmestyy säännöllisesti. Luento-ohjelma sisältää siis kaikki teollisen kehityksen koneoppimisen keskeiset (hyvin todistetut) osa-alueet. Kurssiosuuttani kootaessani käytin opetuskokemustani Data Analysis Schoolissa sekä muiden SHAD-opettajien materiaaleja ja töitä. Tiedän, että kollegani tekivät samoin.
Ensimmäisinä kuukausina kurssiohjelman mukaisen koulutuksen osuus työajasta on noin 30 %, sitten noin 10 %. On kuitenkin tärkeää ymmärtää, että itse ML-mallien kanssa työskentely vie jatkossakin noin neljä kertaa vähemmän kuin kaikki niihin liittyvät prosessit. Näitä ovat taustaohjelman valmistelu, tietojen vastaanottaminen, liukuhihnan kirjoittaminen sen esikäsittelyä varten, koodin optimointi, mukauttaminen tiettyyn laitteistoon jne. ML-insinööri on, jos haluat, täyden pinon kehittäjä (vain koneoppimisen painopisteenä) , joka pystyy ratkaisemaan ongelman alusta loppuun. Jopa valmiilla mallilla joudut todennäköisesti tekemään useita muita toimintoja: rinnastamaan sen suoritus useissa koneissa, valmistelemaan toteutusta kahvan, kirjaston tai itse palvelun komponenttien muodossa.
Opiskelijan valinta
Jos sait sen vaikutelman, että on parempi ryhtyä ML-insinööriksi työskentelemällä ensin taustakehittäjänä, tämä ei pidä paikkaansa. Ilmoittautuminen samaan ShaD:iin ilman todellista kokemusta palveluiden kehittämisestä, oppimisesta ja markkinoiden erittäin kysytyksi tulemisesta on erinomainen vaihtoehto. Monet Yandex-asiantuntijat päätyivät nykyisiin tehtäviinsä tällä tavalla. Jos jokin yritys on valmis tarjoamaan sinulle työtä ML-alalta heti valmistumisen jälkeen, sinunkin pitäisi luultavasti hyväksyä tarjous. Yritä päästä hyvään tiimiin kokeneen mentorin kanssa ja valmistaudu oppimaan paljon.
Mikä yleensä estää sinua tekemästä ML:ää?
Jos backender haluaa ML-insinööriksi, hän voi valita kahdesta kehittämisalueesta - ottamatta huomioon residenssiohjelmaa.
Ensinnäkin opiskele osana koulutuskurssia.
Toiseksi voit osallistua taisteluprojekteihin, joissa sinun on otettava käyttöön yksi tai toinen ML-algoritmi. IT-kehitysmarkkinoilla tällaisia projekteja on kuitenkin hyvin vähän: koneoppimista ei käytetä useimmissa tehtävissä. Jopa pankeissa, jotka tutkivat aktiivisesti ML:n mahdollisuuksia, vain harvat ovat mukana tietojen analysoinnissa. Jos et päässyt liittymään johonkin näistä joukkueista, ainoa vaihtoehtosi on joko aloittaa oma projekti (jossa todennäköisesti asetat omat määräajat, ja tällä ei ole juurikaan tekemistä taistelutuotannon tehtävien kanssa) tai alkaa kilpailla Kaggle.
Todellakin, liity muiden yhteisön jäsenten kanssa ja kokeile itseäsi kilpailuissa
Kuvasin kahta mahdollista kehityslinjaa - koulutusta koulutusohjelmien kautta ja koulutusta "taistelussa", esimerkiksi Kagglessa. Residenssiohjelma on näiden kahden menetelmän yhdistelmä. Sinua odottavat luennot ja seminaarit ShaD-tasolla sekä aidosti taistelutahtoiset projektit.
Lähde: will.com