Yandex íbúaáætlun, eða hvernig reyndur bakvörður getur orðið ML verkfræðingur

Yandex íbúaáætlun, eða hvernig reyndur bakvörður getur orðið ML verkfræðingur

Yandex er að opna búsetuáætlun í vélanámi fyrir reynda bakenda forritara. Ef þú hefur skrifað mikið í C++/Python og vilt nýta þessa þekkingu í ML, þá munum við kenna þér hvernig á að gera hagnýtar rannsóknir og útvega reynda leiðbeinendur. Þú munt vinna að lykilþjónustu Yandex og öðlast færni á sviðum eins og línulegum líkönum og hallauppörvun, meðmælakerfi, taugakerfi til að greina myndir, texta og hljóð. Þú munt einnig læra hvernig á að meta líkönin þín rétt með því að nota mæligildi án nettengingar og á netinu.

Lengd námsins er eitt ár, þar sem þátttakendur munu starfa í vélgreind og rannsóknardeild Yandex, auk þess að sækja fyrirlestra og málstofur. Þátttaka er greidd og felur í sér fullt starf: 40 stundir á viku, frá 1. júlí á þessu ári. Nú er opið fyrir umsóknir og stendur til 1. maí. 

Og nú nánar - um hvers konar áhorfendur við erum að bíða eftir, hvert vinnuferlið verður og almennt hvernig bakendasérfræðingur getur skipt yfir í feril í ML.

Beinleiki

Mörg fyrirtæki eru með búsetuáætlun, þar á meðal til dæmis Google og Facebook. Þeim er einkum beint að sérfræðingum á yngri og meðalstigi sem eru að reyna að stíga skref í átt að ML rannsóknum. Dagskráin okkar er fyrir aðra áhorfendur. Við bjóðum bakendahönnuðum sem hafa þegar öðlast næga reynslu og vita með vissu að í hæfni sinni þurfa þeir að færa sig í átt að ML, til að öðlast hagnýta færni - en ekki færni vísindamanns - við að leysa iðnaðar vélanámsvandamál. Þetta þýðir ekki að við styðjum ekki unga vísindamenn. Við höfum skipulagt sérstaka dagskrá fyrir þá - yfirverði nefnd eftir Ilya Segalovich, sem gerir þér einnig kleift að vinna í Yandex.

Hvar mun íbúinn vinna?

Í vélagreind og rannsóknadeild þróum við sjálf verkefnishugmyndir. Helsta innblásturinn er vísindarit, greinar og stefnur í rannsóknarsamfélaginu. Ég og félagar mínir greinum það sem við lesum, skoðum hvernig við getum bætt eða útvíkkað þær aðferðir sem vísindamenn leggja til. Á sama tíma tekur hvert og eitt okkar mið af þekkingar- og áhugasviði sínu, mótar verkefnið út frá þeim sviðum sem hann telur mikilvæg. Hugmyndin að verkefni er venjulega fædd á mótum niðurstöður utanaðkomandi rannsókna og eigin hæfni.

Þetta kerfi er gott vegna þess að það leysir að mestu leyti tæknileg vandamál Yandex þjónustu jafnvel áður en þau koma upp. Þegar þjónusta stendur frammi fyrir vandamálum, koma fulltrúar hennar til okkar, líklegast til að taka þá tækni sem við höfum þegar undirbúið, sem allt sem eftir er er að vera rétt beitt í vörunni. Ef eitthvað er ekki tilbúið munum við að minnsta kosti fljótt muna hvar við getum „byrjað að grafa“ og í hvaða greinum á að leita að lausn. Eins og við vitum er vísindaleg nálgun sú að standa á herðum risa.

Hvað skal gera

Hjá Yandex - og jafnvel sérstaklega í stjórnun okkar - er verið að þróa öll viðeigandi svið ML. Markmið okkar er að bæta gæði margs konar vöru og þetta er hvatning til að prófa allt nýtt. Auk þess kemur reglulega fram ný þjónusta. Þannig að fyrirlestraráætlunin inniheldur öll lykil (vel sannað) svið vélanáms í iðnaðarþróun. Við samantekt á hluta námskeiðsins nýtti ég kennslureynslu mína við Gagnagreiningarskólann, sem og efni og vinnu annarra SHAD kennara. Ég veit að samstarfsmenn mínir gerðu slíkt hið sama.

Fyrstu mánuðina mun þjálfun samkvæmt námskeiðinu vera um það bil 30% af vinnutíma þínum, síðan um 10%. Hins vegar er mikilvægt að skilja að vinna með ML-líkönin sjálf mun halda áfram að taka um það bil fjórum sinnum minna en öll tengd ferli. Þetta felur í sér að undirbúa bakendann, taka á móti gögnum, skrifa leiðslu fyrir forvinnslu þeirra, fínstilla kóða, aðlaga sig að sérstökum vélbúnaði o.s.frv. ML verkfræðingur er, ef þú vilt, verktaki í fullri stafla (aðeins með meiri áherslu á vélanám) , fær um að leysa vandamál frá upphafi til enda. Jafnvel með tilbúnu líkani þarftu líklega að gera fleiri aðgerðir: samsíða framkvæmd þess á nokkrum vélum, undirbúa útfærslu í formi handfangs, bókasafns eða íhluta þjónustunnar sjálfrar.

Val nemenda
Ef þér fannst betra að verða ML verkfræðingur með því að vinna fyrst sem bakenda verktaki, þá er þetta ekki satt. Að skrá sig í sama ShAD án raunverulegrar reynslu í að þróa þjónustu, læra og verða mjög eftirsóttur á markaðnum er frábær kostur. Margir Yandex sérfræðingar enduðu í núverandi stöðu sinni með þessum hætti. Ef eitthvert fyrirtæki er tilbúið að bjóða þér starf á sviði ML strax eftir útskrift ættir þú líklega að samþykkja tilboðið líka. Reyndu að komast í gott teymi með reyndum leiðbeinanda og búðu þig undir að læra mikið.

Hvað kemur venjulega í veg fyrir að þú stundir ML?

Ef bakþjónn stefnir að því að verða ML verkfræðingur getur hann valið á milli tveggja þróunarsviða - án þess að taka tillit til búsetuáætlunarinnar.

Í fyrsta lagi, nám sem hluti af einhverju fræðsluáfangi. Kennslustundir Coursera mun færa þig nær því að skilja grunntæknina, en til að sökkva þér nægilega vel inn í fagið þarftu að verja miklu meiri tíma í það. Til dæmis, útskrifast frá ShAD. Í gegnum árin var ShAD með mismunandi fjölda námskeiða beint um vélanám - að meðaltali um átta. Hver þeirra er mjög mikilvæg og gagnleg, þar á meðal að mati útskriftarnema. 

Í öðru lagi geturðu tekið þátt í bardagaverkefnum þar sem þú þarft að innleiða eitt eða annað ML reiknirit. Hins vegar eru mjög fá slík verkefni á upplýsingatækniþróunarmarkaði: vélanám er ekki notað í flestum verkefnum. Jafnvel í bönkum sem eru virkir að kanna ML-tengd tækifæri, eru aðeins fáir þátttakendur í gagnagreiningu. Ef þú gast ekki gengið til liðs við eitt af þessum teymum, þá er eini möguleikinn þinn annað hvort að hefja þitt eigið verkefni (þar sem þú setur líklegast þín eigin tímamörk, og þetta hefur lítið með bardagaframleiðsluverkefni að gera), eða byrja að keppa á Kaggla.

Reyndar, taktu saman með öðrum meðlimum samfélagsins og reyndu sjálfur í keppnum tiltölulega auðvelt - sérstaklega ef þú styður kunnáttu þína með þjálfun og nefndum námskeiðum á Coursera. Hver keppni hefur frest - hún mun þjóna þér sem hvatning og undirbúa þig fyrir svipað kerfi í upplýsingatæknifyrirtækjum. Þetta er góð leið - sem er þó líka svolítið fráskilin raunverulegum ferlum. Á Kaggle færðu fyrirfram unnin, þó ekki alltaf fullkomin, gögn; ekki bjóðast til að hugsa um framlag til vörunnar; og síðast en ekki síst, þeir þurfa ekki lausnir sem henta fyrir framleiðslu. Reikniritin þín munu líklega virka og vera mjög nákvæm, en líkönin þín og kóðinn verða eins og Frankenstein saumað saman úr mismunandi hlutum - í framleiðsluverkefni mun öll uppbyggingin vinna of hægt, það verður erfitt að uppfæra og stækka (td, tungumál og radd reiknirit verða alltaf endurskrifuð að hluta eftir því sem tungumálið þróast). Fyrirtæki hafa áhuga á því að verkið sem skráð er getur ekki aðeins verið unnið af þér sjálfur (það er ljóst að þú, sem höfundur lausnarinnar, getur gert þetta), heldur einnig af einhverjum samstarfsmönnum þínum. Fjallað er um muninn á íþrótta- og iðnaðarforritun много, og Kaggle fræðir einmitt „íþróttamenn“ - jafnvel þótt það geri það mjög vel, sem gerir þeim kleift að öðlast smá reynslu.

Ég lýsti tveimur mögulegum þróunarlínum - þjálfun í gegnum fræðsluáætlanir og þjálfun "í bardaga", til dæmis á Kaggle. Búsetunámið er sambland af þessum tveimur aðferðum. Fyrirlestrar og málstofur á ShAD stigi, svo og sannarlega baráttuverkefni, bíða þín.

Heimild: www.habr.com

Bæta við athugasemd