Rhaglen Preswylydd Yandex, neu Sut y Gall Cefnogwr Profiadol Ddod yn Beiriannydd ML

Rhaglen Preswylydd Yandex, neu Sut y Gall Cefnogwr Profiadol Ddod yn Beiriannydd ML

Mae Yandex yn agor rhaglen breswyl mewn dysgu peirianyddol ar gyfer datblygwyr backend profiadol. Os ydych wedi ysgrifennu llawer yn C++/Python ac eisiau cymhwyso'r wybodaeth hon i ML, yna byddwn yn eich dysgu sut i wneud ymchwil ymarferol a darparu mentoriaid profiadol. Byddwch yn gweithio ar wasanaethau Yandex allweddol ac yn ennill sgiliau mewn meysydd fel modelau llinol a hybu graddiant, systemau argymell, rhwydweithiau niwral ar gyfer dadansoddi delweddau, testun a sain. Byddwch hefyd yn dysgu sut i werthuso'ch modelau yn gywir gan ddefnyddio metrigau all-lein ac ar-lein.

Hyd y rhaglen yw blwyddyn, pan fydd cyfranogwyr yn gweithio yn adran gwybodaeth peiriannau ac ymchwil Yandex, yn ogystal â mynychu darlithoedd a seminarau. Mae cyfranogiad yn cael ei dalu ac yn cynnwys gwaith llawn amser: 40 awr yr wythnos, gan ddechrau Gorffennaf 1 eleni. Mae ceisiadau nawr ar agor a bydd yn para tan Fai 1. 

Ac yn awr yn fwy manwl - am ba fath o gynulleidfa rydym yn aros amdani, beth fydd y broses waith ac, yn gyffredinol, sut y gall arbenigwr pen-ôl newid i yrfa yn ML.

Ffocws

Mae gan lawer o gwmnïau Raglenni Preswyl, gan gynnwys, er enghraifft, Google a Facebook. Maent wedi'u hanelu'n bennaf at arbenigwyr lefel iau a chanol sy'n ceisio cymryd cam tuag at ymchwil ML. Mae ein rhaglen ar gyfer cynulleidfa wahanol. Rydym yn gwahodd datblygwyr backend sydd eisoes wedi ennill digon o brofiad ac yn gwybod yn sicr bod angen iddynt, yn eu cymwyseddau, symud tuag at ML, i ennill sgiliau ymarferol - ac nid sgiliau gwyddonydd - wrth ddatrys problemau dysgu peiriannau diwydiannol. Nid yw hyn yn golygu nad ydym yn cefnogi ymchwilwyr ifanc. Rydym wedi trefnu rhaglen ar wahân ar eu cyfer - premiwm a enwyd ar ôl Ilya Segalovich, sydd hefyd yn caniatáu ichi weithio yn Yandex.

Ble bydd y preswylydd yn gweithio?

Yn yr Adran Cudd-wybodaeth ac Ymchwil Peiriannau, rydym ni ein hunain yn datblygu syniadau prosiect. Y brif ffynhonnell ysbrydoliaeth yw llenyddiaeth wyddonol, erthyglau, a thueddiadau yn y gymuned ymchwil. Mae fy nghydweithwyr a minnau’n dadansoddi’r hyn a ddarllenwn, gan edrych ar sut y gallwn wella neu ehangu’r dulliau a gynigir gan wyddonwyr. Ar yr un pryd, mae pob un ohonom yn ystyried ei faes gwybodaeth a diddordebau, yn llunio'r dasg yn seiliedig ar y meysydd y mae'n eu hystyried yn bwysig. Mae’r syniad am brosiect fel arfer yn cael ei eni ar groesffordd canlyniadau ymchwil allanol a’ch cymwyseddau eich hun.

Mae'r system hon yn dda oherwydd ei bod i raddau helaeth yn datrys problemau technolegol gwasanaethau Yandex hyd yn oed cyn iddynt godi. Pan fydd gwasanaeth yn wynebu problem, mae ei gynrychiolwyr yn dod atom, yn fwyaf tebygol o gymryd y technolegau yr ydym eisoes wedi'u paratoi, sef y cyfan sydd ar ôl i'w gymhwyso'n gywir yn y cynnyrch. Os nad yw rhywbeth yn barod, byddwn o leiaf yn cofio'n gyflym lle gallwn "ddechrau cloddio" ac ym mha erthyglau i chwilio am ateb. Fel y gwyddom, y dull gwyddonol yw sefyll ar ysgwyddau cewri.

Beth i'w wneud

Yn Yandex - a hyd yn oed yn benodol yn ein rheolaeth - mae holl feysydd perthnasol ML yn cael eu datblygu. Ein nod yw gwella ansawdd amrywiaeth eang o gynhyrchion, ac mae hyn yn gymhelliant i brofi popeth newydd. Yn ogystal, mae gwasanaethau newydd yn ymddangos yn rheolaidd. Felly mae'r rhaglen ddarlithoedd yn cynnwys yr holl feysydd allweddol (profedig) o ddysgu peirianyddol mewn datblygiad diwydiannol. Wrth lunio fy rhan o’r cwrs, defnyddiais fy mhrofiad addysgu yn yr Ysgol Dadansoddi Data, yn ogystal â deunyddiau a gwaith athrawon SHAD eraill. Gwn fod fy nghydweithwyr wedi gwneud yr un peth.

Yn ystod y misoedd cyntaf, bydd hyfforddiant yn ôl rhaglen y cwrs yn cyfrif am tua 30% o'ch amser gwaith, yna tua 10%. Fodd bynnag, mae'n bwysig deall y bydd gweithio gyda'r modelau ML eu hunain yn parhau i gymryd tua phedair gwaith yn llai na'r holl brosesau cysylltiedig. Mae'r rhain yn cynnwys paratoi'r ôl-wyneb, derbyn data, ysgrifennu piblinell ar gyfer ei ragbrosesu, optimeiddio'r cod, addasu i galedwedd penodol, ac ati. Mae peiriannydd ML, os dymunwch, yn ddatblygwr pentwr llawn (dim ond gyda mwy o bwyslais ar ddysgu peiriant) , gallu datrys problem o'r dechrau i'r diwedd. Hyd yn oed gyda model parod, mae'n debyg y bydd angen i chi wneud nifer o gamau eraill: cyfochri ei weithrediad ar draws sawl peiriant, paratoi gweithrediad ar ffurf handlen, llyfrgell, neu gydrannau o'r gwasanaeth ei hun.

Dewis myfyrwyr
Pe baech dan yr argraff ei bod yn well dod yn beiriannydd ML trwy weithio'n gyntaf fel datblygwr backend, nid yw hyn yn wir. Mae cofrestru yn yr un ShAD heb brofiad gwirioneddol o ddatblygu gwasanaethau, dysgu a dod yn hynod o alw ar y farchnad yn opsiwn rhagorol. Daeth llawer o arbenigwyr Yandex i ben yn eu swyddi presennol fel hyn. Os oes unrhyw gwmni yn barod i gynnig swydd i chi ym maes ML yn syth ar ôl graddio, mae'n debyg y dylech chi dderbyn y cynnig hefyd. Ceisiwch ymuno â thîm da gyda mentor profiadol a pharatowch i ddysgu llawer.

Beth sydd fel arfer yn eich atal rhag gwneud ML?

Os yw cefnogwr yn dyheu am fod yn beiriannydd ML, gall ddewis o ddau faes datblygu - heb ystyried y rhaglen breswyl.

Yn gyntaf, astudiwch fel rhan o ryw gwrs addysgol. Y gwersi Bydd Coursera yn dod â chi'n agosach at ddeall y technegau sylfaenol, ond i ymgolli yn y proffesiwn i raddau digonol, mae angen i chi neilltuo llawer mwy o amser iddo. Er enghraifft, graddiwch o ShAD. Dros y blynyddoedd, roedd gan ShAD nifer wahanol o gyrsiau yn uniongyrchol ar ddysgu peirianyddol - tua wyth ar gyfartaledd. Mae pob un ohonynt yn wirioneddol bwysig a defnyddiol, gan gynnwys ym marn graddedigion. 

Yn ail, gallwch chi gymryd rhan mewn prosiectau ymladd lle mae angen i chi weithredu un neu'r llall algorithm ML. Fodd bynnag, ychydig iawn o brosiectau o'r fath sydd ar y farchnad datblygu TG: ni ddefnyddir dysgu peirianyddol yn y rhan fwyaf o dasgau. Hyd yn oed mewn banciau sy'n ymchwilio i gyfleoedd sy'n gysylltiedig ag ML, dim ond ychydig sy'n ymwneud â dadansoddi data. Os nad oeddech yn gallu ymuno ag un o'r timau hyn, eich unig opsiwn yw naill ai cychwyn eich prosiect eich hun (lle, yn fwyaf tebygol, byddwch yn gosod eich terfynau amser eich hun, ac nid oes gan hyn fawr ddim i'w wneud â thasgau cynhyrchu ymladd), neu ddechrau cystadlu ar Kaggle.

Yn wir, ymunwch ag aelodau eraill o'r gymuned a rhowch gynnig ar gystadlaethau gymharol hawdd - yn enwedig os ydych yn cefnogi eich sgiliau gyda hyfforddiant a'r cyrsiau a grybwyllir ar Coursera. Mae gan bob cystadleuaeth derfyn amser - bydd yn gymhelliant i chi ac yn eich paratoi ar gyfer system debyg mewn cwmnïau TG. Mae hon yn ffordd dda - sydd, fodd bynnag, hefyd ychydig yn ysgaru oddi wrth brosesau go iawn. Ar Kaggle rhoddir data wedi'i brosesu ymlaen llaw i chi, er nad yw bob amser yn berffaith; peidiwch â chynnig meddwl am y cyfraniad at y cynnyrch; ac yn bwysicaf oll, nid oes angen atebion sy'n addas ar gyfer cynhyrchu arnynt. Mae'n debyg y bydd eich algorithmau'n gweithio ac yn hynod gywir, ond bydd eich modelau a'ch cod fel Frankenstein wedi'u pwytho at ei gilydd o wahanol rannau - mewn prosiect cynhyrchu, bydd y strwythur cyfan yn gweithio'n rhy araf, bydd yn anodd ei ddiweddaru a'i ehangu (er enghraifft, bydd algorithmau iaith a llais bob amser yn cael eu hailysgrifennu'n rhannol wrth i'r iaith ddatblygu). Mae gan gwmnïau ddiddordeb yn y ffaith y gall y gwaith a restrir gael ei wneud nid yn unig gennych chi'ch hun (mae'n amlwg y gallwch chi, fel awdur y datrysiad, wneud hyn), ond hefyd gan unrhyw un o'ch cydweithwyr. Trafodir y gwahaniaeth rhwng rhaglenni chwaraeon a diwydiannol много, ac mae Kaggle yn addysgu “athletwyr” yn union - hyd yn oed os yw'n ei wneud yn dda iawn, gan ganiatáu iddynt ennill rhywfaint o brofiad.

Disgrifiais ddwy linell ddatblygiad bosibl - hyfforddiant trwy raglenni addysgol a hyfforddiant “mewn ymladd”, er enghraifft ar Kaggle. Mae'r rhaglen breswyl yn gyfuniad o'r ddau ddull hyn. Mae darlithoedd a seminarau ar lefel ShAD, yn ogystal â phrosiectau gwirioneddol ymladdgar, yn aros amdanoch chi.

Ffynhonnell: hab.com

Ychwanegu sylw