Clár Cónaitheach Yandex, nó Conas is Féidir le hInnealtóir ML a bheith ina Chúntóir Taithí

Clár Cónaitheach Yandex, nó Conas is Féidir le hInnealtóir ML a bheith ina Chúntóir Taithí

Tá Yandex ag oscailt clár cónaitheachta san fhoghlaim meaisín d'fhorbróirí inneall a bhfuil taithí acu. Má tá go leor scríofa agat in C++/Python agus más mian leat an t-eolas seo a chur i bhfeidhm ar ML, múinfimid duit conas taighde praiticiúil a dhéanamh agus meantóirí le taithí a sholáthar. Oibreoidh tú ar phríomhsheirbhísí Yandex agus gheobhaidh tú scileanna i réimsí cosúil le samhlacha líneacha agus treisiú grádáin, córais mholta, líonraí néaracha chun íomhánna, téacs agus fuaim a anailísiú. Foghlaimeoidh tú freisin conas do mhúnlaí a mheas i gceart ag baint úsáide as méadracht as líne agus ar líne.

Is é ré an chláir ná bliain amháin, ar lena linn a bheidh rannpháirtithe ag obair i roinn faisnéise agus taighde meaisín Yandex, chomh maith le freastal ar léachtaí agus ar sheimineáir. Íoctar an rannpháirtíocht agus bíonn obair lánaimseartha i gceist: 40 uair sa tseachtain, ag tosú ar 1 Iúil na bliana seo. Tá iarratais oscailte anois agus mairfidh sé go dtí an 1 Bealtaine. 

Agus anois níos mine - faoi cén cineál lucht féachana a bhfuil muid ag fanacht, cad a bheidh ar an bpróiseas oibre agus, go ginearálta, conas is féidir le speisialtóir deireadh cúil aistriú chuig gairme i ML.

Fócas

Tá Cláir Chónaitheachta ag go leor cuideachtaí, lena n-áirítear, mar shampla, Google agus Facebook. Tá siad dírithe go príomha ar speisialtóirí sóisearacha agus meánleibhéil atá ag iarraidh céim a ghlacadh i dtreo taighde ML. Tá ár gclár do lucht féachana difriúil. Iarraimid ar fhorbróirí inneall a bhfuil go leor taithí faighte acu cheana féin agus a bhfuil a fhios acu go cinnte go gcaithfidh siad ina n-inniúlachtaí bogadh i dtreo ML, chun scileanna praiticiúla a fháil - agus ní scileanna eolaí - chun fadhbanna foghlama meaisín tionsclaíocha a réiteach. Ní chiallaíonn sé seo nach dtugaimid tacaíocht do thaighdeoirí óga. Tá clár ar leith eagraithe againn dóibh - préimh ainmnithe i ndiaidh Ilya Segalovich, a ligeann duit a bheith ag obair i Yandex freisin.

Cá n-oibreoidh an cónaitheoir?

Sa Roinn Inneall Faisnéise agus Taighde, déanaimid féin smaointe tionscadail a fhorbairt. Is í an phríomhfhoinse inspioráide ná litríocht eolaíoch, ailt, agus treochtaí sa phobal taighde. Déanann mo chomhghleacaithe agus mé féin anailís ar an méid a léigh muid, ag féachaint ar conas is féidir linn na modhanna atá molta ag eolaithe a fheabhsú nó a leathnú. Ag an am céanna, cuireann gach duine againn a réimse eolais agus leasanna san áireamh, déanann sé an tasc a fhoirmiú bunaithe ar na réimsí a mheasann sé a bheith tábhachtach. De ghnáth is ag crosbhealach thorthaí taighde seachtrach agus inniúlachtaí an duine féin a thagann an smaoineamh do thionscadal.

Tá an córas seo go maith toisc go réitíonn sé den chuid is mó fadhbanna teicneolaíochta na seirbhísí Yandex fiú sula dtagann siad chun cinn. Nuair a bhíonn fadhb ag seirbhís, tagann a hionadaithe chugainn, is dóichí go nglacfaidh siad na teicneolaíochtaí atá ullmhaithe againn cheana féin, rud atá fágtha le cur i bhfeidhm i gceart sa táirge. Mura bhfuil rud éigin réidh, cuimhneoimid go tapa ar a laghad ar na háiteanna ar féidir linn “tosú ar an tochailt” agus cad iad na hailt a lorgóidh réiteach. Mar is eol dúinn, is é an cur chuige eolaíoch ná seasamh ar ghuaillí na bhfathach.

Cad atá le déanamh

Ag Yandex - agus fiú go sonrach inár mbainistíocht - tá gach réimse ábhartha de ML á fhorbairt. Is é an sprioc atá againn ná cáilíocht raon leathan táirgí a fheabhsú, agus feidhmíonn sé seo mar dhreasacht chun gach rud nua a thástáil. Ina theannta sin, tagann seirbhísí nua le feiceáil go rialta. Mar sin tá na príomhréimsí (dea-chruthaithe) den mheaisínfhoghlaim i bhforbairt thionsclaíoch sa chlár léachtaí. Agus mo chuid den chúrsa á cur le chéile agam, d’úsáid mé mo thaithí teagaisc sa Scoil Anailíse Sonraí, chomh maith le hábhair agus obair mhúinteoirí SHAD eile. Tá a fhios agam go ndearna mo chomhghleacaithe an rud céanna.

Sna chéad mhíonna, beidh oiliúint de réir chlár an chúrsa freagrach as thart ar 30% de do chuid ama oibre, ansin thart ar 10%. Mar sin féin, tá sé tábhachtach a thuiscint go dtógfaidh oibriú leis na samhlacha ML iad féin thart ar cheithre huaire níos lú ná na próisis ghaolmhara ar fad. Áirítear orthu seo an t-inneall a ullmhú, sonraí a fháil, píblíne a scríobh chun é a réamhphróiseáil, cód a bharrfheabhsú, oiriúnú do chrua-earraí sonracha, etc. Is forbróir cruach iomlán é innealtóir ML, más mian leat (ach béim níos mó ar mheaisínfhoghlaim) , in ann fadhb a réiteach ó thús go deireadh. Fiú amháin le múnla réamhdhéanta, is dócha go mbeidh ort roinnt gníomhartha eile a dhéanamh: cur i gcrích a chomhthreomharú thar roinnt meaisíní, ullmhaigh cur i bhfeidhm i bhfoirm hanla, leabharlann, nó comhpháirteanna den tseirbhís féin.

Rogha na mac léinn
Má bhí tú den tuairim go bhfuil sé níos fearr a bheith i d'innealtóir ML trí oibriú ar dtús mar fhorbróir inneall, níl sé seo fíor. Is rogha iontach é clárú sa SAD céanna gan fíor-thaithí ar sheirbhísí a fhorbairt, foghlaim agus éirí an-mhór éileamh ar an margadh. Chríochnaigh go leor speisialtóirí Yandex ina bpoist reatha ar an mbealach seo. Má tá cuideachta ar bith réidh chun post a thairiscint duit i réimse an ML díreach tar éis na céime, is dócha gur cheart duit glacadh leis an tairiscint freisin. Déan iarracht dul isteach i bhfoireann mhaith le meantóir le taithí agus bí réidh le go leor a fhoghlaim.

Cad a chuireann cosc ​​ort ML a dhéanamh de ghnáth?

Má tá sé ag dréim le backender a bheith ina innealtóir ML, féadfaidh sé rogha a dhéanamh ó dhá réimse forbartha - gan an clár cónaitheachta a chur san áireamh.

Ar dtús, déan staidéar mar chuid de chúrsa oideachais éigin. Ceachtanna Tabharfaidh Coursera níos gaire duit na teicnící bunúsacha a thuiscint, ach chun tú féin a thumadh go leor sa ghairm, ní mór duit i bhfad níos mó ama a chaitheamh air. Mar shampla, céim amach ó ShAD. Thar na blianta, bhí líon éagsúil cúrsaí ag ShAD go díreach ar mheaisínfhoghlaim - timpeall ocht gcinn ar an meán. Tá gach ceann acu i ndáiríre tábhachtach agus úsáideach, lena n-áirítear i dtuairim na gcéimithe. 

Ar an dara dul síos, is féidir leat páirt a ghlacadh i dtionscadail chomhrac nuair is gá duit algartam ML amháin nó eile a chur i bhfeidhm. Mar sin féin, is beag tionscadal den sórt sin atá ar an margadh forbartha TF: ní úsáidtear meaisínfhoghlaim i bhformhór na dtascanna. Fiú i mbainc atá ag iniúchadh deiseanna a bhaineann le ML go gníomhach, níl ach roinnt bheag díobh i mbun anailíse sonraí. Mura raibh tú in ann a bheith páirteach i gceann de na foirne seo, is é an t-aon rogha atá agat ná do thionscadal féin a thosú (nuair is dócha go socróidh tú do spriocdhátaí féin, agus níl mórán baint aige seo le tascanna táirgeachta comhraic), nó tosú san iomaíocht ar. Kaggle.

Go deimhin, téigh i gcomhar le baill eile den phobal agus bain triail as tú féin i gcomórtais sách éasca - go háirithe má thacaíonn tú do scileanna le hoiliúint agus leis na cúrsaí atá luaite ar Coursera. Tá spriocdháta ag gach comórtas - feidhmeoidh sé mar dhreasacht duit agus ullmhóidh sé tú do chóras comhchosúil i gcomhlachtaí TF. Is bealach maith é seo - atá, áfach, beagán colscartha freisin ó phróisis fíor. Ar Kaggle tugtar sonraí réamhphróiseáilte duit, cé nach mbíonn siad foirfe i gcónaí; ná a thairiscint smaoineamh ar an méid a chuireann sé leis an táirge; agus is tábhachtaí fós, ní éilíonn siad réitigh atá oiriúnach le haghaidh táirgeadh. Is dócha go n-oibreoidh do halgartaim agus go mbeidh siad thar a bheith cruinn, ach beidh do mhúnlaí agus do chód cosúil le Frankenstein fuaite le chéile ó chodanna éagsúla - i dtionscadal táirgthe, oibreoidh an struchtúr iomlán ró-mhall, beidh sé deacair é a nuashonrú agus a leathnú (mar shampla, déanfar halgartaim teanga agus gutha a athscríobh i bpáirt i gcónaí de réir mar a fhorbraíonn an teanga). Tá suim ag cuideachtaí sa bhfíric gur féidir an obair atá liostaithe a dhéanamh ní hamháin leat féin (tá sé soiléir gur féidir leatsa, mar údar an réitigh, é seo a dhéanamh), ach freisin ag aon cheann de do chomhghleacaithe. Pléitear an difríocht idir cláir spóirt agus tionsclaíochta много, agus cuireann Kaggle oideachas cruinn ar “lúthchleasaithe” - fiú má dhéanann sé go han-mhaith é, rud a ligeann dóibh roinnt taithí a fháil.

Rinne mé cur síos ar dhá líne forbartha féideartha - oiliúint trí chláir oideachais agus oiliúint “sa chomhrac”, mar shampla ar Kaggle. Is meascán den dá mhodh seo an clár cónaitheachta. Tá léachtaí agus seimineáir ag leibhéal ShAD, chomh maith le tionscadail atá fíor-chomhraic, ag fanacht leat.

Foinse: will.com

Add a comment