Eto Olugbe Yandex, tabi Bii Afẹyinti ti o ni iriri Ṣe Le Di Onimọ-ẹrọ ML

Eto Olugbe Yandex, tabi Bii Afẹyinti ti o ni iriri Ṣe Le Di Onimọ-ẹrọ ML

Yandex n ṣii eto ibugbe ni ẹkọ ẹrọ fun awọn oludasilẹ ti o ni iriri. Ti o ba ti kọ pupọ ni C ++/Python ati pe o fẹ lati lo imọ yii si ML, lẹhinna a yoo kọ ọ bi o ṣe le ṣe iwadi ti o wulo ati pese awọn alamọran ti o ni iriri. Iwọ yoo ṣiṣẹ lori awọn iṣẹ Yandex bọtini ati ki o jèrè awọn ọgbọn ni awọn agbegbe bii awọn awoṣe laini ati igbega gradient, awọn eto iṣeduro, awọn nẹtiwọọki nkankikan fun itupalẹ awọn aworan, ọrọ ati ohun. Iwọ yoo tun kọ ẹkọ bi o ṣe le ṣe iṣiro awọn awoṣe rẹ daradara nipa lilo awọn metiriki offline ati lori ayelujara.

Iye akoko eto naa jẹ ọdun kan, lakoko eyiti awọn olukopa yoo ṣiṣẹ ni oye ẹrọ ati ẹka iwadi ti Yandex, ati lọ si awọn ikowe ati awọn apejọ. Ikopa ti wa ni sisan ati ki o kan iṣẹ ni kikun akoko: 40 wakati fun ọsẹ, ti o bere July 1 ti odun yi. Awọn ohun elo ti ṣii bayi ati pe yoo wa titi di May 1. 

Ati ni bayi ni awọn alaye diẹ sii - nipa iru awọn olugbo ti a n duro de, kini ilana iṣẹ yoo jẹ ati, ni gbogbogbo, bawo ni alamọja-ipari-pada le yipada si iṣẹ ni ML.

Idojukọ

Ọpọlọpọ awọn ile-iṣẹ ni Awọn eto ibugbe, pẹlu, fun apẹẹrẹ, Google ati Facebook. Wọn jẹ ifọkansi ni pataki si awọn alamọja kekere ati aarin ti o ngbiyanju lati ṣe igbesẹ kan si iwadii ML. Eto wa fun olugbo ti o yatọ. A pe awọn olupilẹṣẹ ẹhin ti o ti ni iriri to tẹlẹ ati mọ daju pe ninu awọn agbara wọn wọn nilo lati yipada si ọna ML, lati ni awọn ọgbọn iṣe - kii ṣe awọn ọgbọn ti onimọ-jinlẹ - ni ipinnu awọn iṣoro ikẹkọ ẹrọ ile-iṣẹ. Eyi ko tumọ si pe a ko ṣe atilẹyin fun awọn oluwadi ọdọ. A ti ṣeto eto lọtọ fun wọn - joju ti a npè ni lẹhin Ilya Segalovich, eyiti o tun fun ọ laaye lati ṣiṣẹ ni Yandex.

Nibo ni olugbe yoo ṣiṣẹ?

Ninu Ẹka Imọye ti Ẹrọ ati Iwadi, awa funra wa ni idagbasoke awọn imọran iṣẹ akanṣe. Orisun akọkọ ti awokose jẹ iwe imọ-jinlẹ, awọn nkan, ati awọn aṣa ni agbegbe iwadii. Emi ati awọn ẹlẹgbẹ mi ṣe itupalẹ ohun ti a ka, ni wiwo bi a ṣe le ṣe ilọsiwaju tabi faagun awọn ọna ti awọn onimọ-jinlẹ dabaa. Ni akoko kanna, olukuluku wa ṣe akiyesi agbegbe ti imọ ati awọn ifẹ, ṣe agbekalẹ iṣẹ-ṣiṣe ti o da lori awọn agbegbe ti o ka pataki. Ero fun ise agbese kan ni a maa n bi ni ikorita ti awọn abajade iwadi ti ita ati awọn agbara ti ara ẹni.

Eto yii dara nitori pe o yanju awọn iṣoro imọ-ẹrọ ti awọn iṣẹ Yandex paapaa ṣaaju ki wọn to dide. Nigbati iṣẹ ba dojukọ iṣoro kan, awọn aṣoju rẹ wa si wa, o ṣeese lati mu awọn imọ-ẹrọ ti a ti pese tẹlẹ, eyiti gbogbo ohun ti o ku ni lati lo ni deede ninu ọja naa. Ti ohun kan ko ba ṣetan, o kere ju a yoo ranti ibi ti a ti le "bẹrẹ n walẹ" ati ninu awọn nkan wo lati wa ojutu kan. Gẹgẹbi a ti mọ, ọna ijinle sayensi ni lati duro lori awọn ejika ti awọn omiran.

Kin ki nse

Ni Yandex - ati paapaa pataki ninu iṣakoso wa - gbogbo awọn agbegbe ti o yẹ ti ML ti wa ni idagbasoke. Ibi-afẹde wa ni lati mu didara awọn ọja lọpọlọpọ lọpọlọpọ, ati pe eyi ṣiṣẹ bi iwuri lati ṣe idanwo ohun gbogbo tuntun. Ni afikun, awọn iṣẹ tuntun han nigbagbogbo. Nitorinaa eto ikẹkọ ni gbogbo awọn bọtini (ti a fihan daradara) awọn agbegbe ti ẹkọ ẹrọ ni idagbasoke ile-iṣẹ. Nigbati o ba n ṣajọ apakan mi ti iṣẹ-ẹkọ, Mo lo iriri ikẹkọ mi ni Ile-iwe ti Itupalẹ Data, ati awọn ohun elo ati iṣẹ ti awọn olukọ SHAD miiran. Mo mọ pe awọn ẹlẹgbẹ mi ṣe kanna.

Ni awọn oṣu akọkọ, ikẹkọ ni ibamu si eto iṣẹ-ẹkọ yoo ṣe akọọlẹ fun isunmọ 30% ti akoko iṣẹ rẹ, lẹhinna nipa 10%. Sibẹsibẹ, o ṣe pataki lati ni oye pe ṣiṣẹ pẹlu awọn awoṣe ML funrara wọn yoo tẹsiwaju lati gba to igba mẹrin kere ju gbogbo awọn ilana ti o somọ lọ. Iwọnyi pẹlu murasilẹ ẹhin, gbigba data, kikọ opo gigun ti epo fun iṣaju rẹ, koodu ti o dara julọ, ni ibamu si ohun elo kan pato, bbl. Onimọ-ẹrọ ML jẹ, ti o ba fẹ, olupilẹṣẹ akopọ ni kikun (nikan pẹlu tcnu nla lori kikọ ẹrọ) , o lagbara lati yanju iṣoro kan lati ibẹrẹ si ipari. Paapaa pẹlu awoṣe ti a ti ṣetan, iwọ yoo nilo lati ṣe nọmba awọn iṣe diẹ sii: ṣe afiwe ipaniyan rẹ kọja awọn ẹrọ pupọ, mura imuse kan ni irisi mimu, ile-ikawe, tabi awọn paati iṣẹ funrararẹ.

Aṣayan ọmọ ile-iwe
Ti o ba wa labẹ iwunilori pe o dara julọ lati di ẹlẹrọ ML nipa ṣiṣe akọkọ bi oluṣe idagbasoke, eyi kii ṣe otitọ. Iforukọsilẹ ni SHAD kanna laisi iriri gidi ni awọn iṣẹ idagbasoke, kikọ ẹkọ ati di pupọ ni ibeere lori ọja jẹ aṣayan ti o tayọ. Ọpọlọpọ awọn alamọja ni Yandex pari ni awọn ipo lọwọlọwọ wọn ni ọna yii. Ti ile-iṣẹ eyikeyi ba ṣetan lati fun ọ ni iṣẹ ni aaye ti ML lẹsẹkẹsẹ lẹhin ayẹyẹ ipari ẹkọ, o yẹ ki o gba ipese paapaa. Gbiyanju lati wọle si ẹgbẹ ti o dara pẹlu olutọran ti o ni iriri ati murasilẹ lati kọ ẹkọ pupọ.

Kini nigbagbogbo ṣe idiwọ fun ọ lati ṣe ML?

Ti o ba ti a backender aspires lati di ohun ML ẹlẹrọ, o le yan lati meji awọn agbegbe ti idagbasoke - lai mu sinu iroyin awọn ibugbe.

Ni akọkọ, ikẹkọ gẹgẹbi apakan ti diẹ ninu iṣẹ ikẹkọ. Awọn ẹkọ Coursera yoo mu ọ sunmọ lati ni oye awọn imọ-ẹrọ ipilẹ, ṣugbọn lati fi ara rẹ bọmi ninu iṣẹ naa si iye to, o nilo lati ya akoko pupọ sii si. Fun apẹẹrẹ, gboye lati SHAD. Ni awọn ọdun, ShaAD ni nọmba oriṣiriṣi ti awọn iṣẹ ikẹkọ taara lori ikẹkọ ẹrọ - ni apapọ, bii mẹjọ. Ọkọọkan wọn ṣe pataki gaan ati iwulo, pẹlu ninu ero ti awọn ọmọ ile-iwe giga. 

Ni ẹẹkeji, o le kopa ninu awọn iṣẹ akanṣe ija nibiti o nilo lati ṣe ọkan tabi omiiran ML algorithm. Sibẹsibẹ, diẹ ninu awọn iru awọn iṣẹ akanṣe lori ọja idagbasoke IT: ẹkọ ẹrọ ko lo ninu awọn iṣẹ ṣiṣe pupọ julọ. Paapaa ni awọn ile-ifowopamọ ti o n ṣawari awọn anfani ti o ni ibatan ML, diẹ diẹ ni o ṣiṣẹ ni itupalẹ data. Ti o ko ba le darapọ mọ ọkan ninu awọn ẹgbẹ wọnyi, aṣayan nikan ni lati bẹrẹ iṣẹ ti ara rẹ (nibiti, o ṣeese, iwọ yoo ṣeto awọn akoko ipari tirẹ, ati pe eyi ko ni diẹ lati ṣe pẹlu awọn iṣẹ iṣelọpọ ija), tabi bẹrẹ idije lori Kaggle.

Nitootọ, darapọ pẹlu awọn ọmọ ẹgbẹ agbegbe miiran ki o gbiyanju ararẹ ni awọn idije jo mo rorun - ni pataki ti o ba ṣe afẹyinti awọn ọgbọn rẹ pẹlu ikẹkọ ati awọn iṣẹ ikẹkọ ti a mẹnuba lori Coursera. Idije kọọkan ni akoko ipari - yoo ṣiṣẹ bi imoriya fun ọ ati murasilẹ fun eto iru kan ni awọn ile-iṣẹ IT. Eyi jẹ ọna ti o dara - eyiti, sibẹsibẹ, tun jẹ ikọsilẹ kekere lati awọn ilana gidi. Lori Kaggle o ti fun ni iṣaaju-ilana, botilẹjẹpe kii ṣe pipe nigbagbogbo, data; maṣe funni lati ronu nipa ilowosi si ọja naa; ati ṣe pataki julọ, wọn ko nilo awọn solusan ti o dara fun iṣelọpọ. Awọn algoridimu rẹ yoo ṣiṣẹ ati pe o peye gaan, ṣugbọn awọn awoṣe ati koodu rẹ yoo dabi Frankenstein ti a so pọ lati awọn ẹya oriṣiriṣi - ninu iṣẹ iṣelọpọ kan, gbogbo eto yoo ṣiṣẹ laiyara pupọ, yoo nira lati ṣe imudojuiwọn ati faagun (fun apẹẹrẹ, ede ati awọn algoridimu ohun yoo nigbagbogbo tunkọ ni apakan bi ede ti ndagba). Awọn ile-iṣẹ nifẹ si otitọ pe iṣẹ ti a ṣe akojọ le ṣee ṣe kii ṣe nipasẹ iwọ funrararẹ (o han gbangba pe iwọ, bi onkọwe ti ojutu, le ṣe eyi), ṣugbọn tun nipasẹ eyikeyi awọn ẹlẹgbẹ rẹ. Iyatọ laarin awọn ere idaraya ati siseto ile-iṣẹ jẹ ijiroro pupo, ati Kaggle kọ ẹkọ ni deede “awọn elere idaraya” - paapaa ti o ba ṣe daradara, gbigba wọn laaye lati ni iriri diẹ.

Mo ṣe apejuwe awọn laini idagbasoke meji ti o ṣeeṣe - ikẹkọ nipasẹ awọn eto ẹkọ ati ikẹkọ “ni ija”, fun apẹẹrẹ lori Kaggle. Eto ibugbe jẹ apapo awọn ọna meji wọnyi. Awọn ikowe ati awọn apejọ ni ipele SHAD, ati awọn iṣẹ akanṣe ija nitootọ, n duro de ọ.

orisun: www.habr.com

Fi ọrọìwòye kun