Яндекс Резидент программасы же Тажрыйбалуу Бэкендер кантип ML Инженери боло алат

Яндекс Резидент программасы же Тажрыйбалуу Бэкендер кантип ML Инженери боло алат

Яндекс тажрыйбалуу иштеп чыгуучулар үчүн машина үйрөнүү боюнча резидентура программасын ачып жатат. Эгерде сиз C++/Python тилинде көп жазган болсоңуз жана бул билимди MLде колдонгуңуз келсе, анда биз сизге практикалык изилдөө жүргүзүүнү үйрөтөбүз жана тажрыйбалуу насаатчыларды сунуштайбыз. Сиз негизги Яндекс кызматтарында иштейсиз жана сызыктуу моделдер жана градиентти жогорулатуу, рекомендация системалары, сүрөттөрдү, текстти жана үндү талдоо үчүн нейрон тармактары сыяктуу тармактарда көндүмдөрдү аласыз. Ошондой эле сиз офлайн жана онлайн метрикаларды колдонуу менен моделдериңизди туура баалоону үйрөнөсүз.

Программанын мөөнөтү бир жыл, анын ичинде катышуучулар Яндекстин машиналык чалгындоо жана изилдөө бөлүмүндө иштешет, ошондой эле лекцияларга жана семинарларга катышышат. Катышуу акы төлөнөт жана толук убакытта иштөөнү камтыйт: ушул жылдын 40-июлунан баштап жумасына 1 саат. Тиркемелер азыр ачык жана 1-майга чейин созулат. 

Ал эми азыр кененирээк - биз кандай аудиторияны күтүп жатабыз, иш процесси кандай болот жана жалпысынан, бэк-энд адиси кантип ML карьерасына өтүшү мүмкүн.

directionality

Көптөгөн компаниялардын Резиденттик программалары бар, анын ичинде, мисалы, Google жана Facebook. Алар негизинен ML изилдөөсүнө кадам таштоого аракет кылган кенже жана орто деңгээлдеги адистерге багытталган. Биздин программа башка аудитория үчүн. Биз буга чейин жетиштүү тажрыйбага ээ болгон бэкенддерди иштеп чыгуучуларды чакырабыз, алар өз компетенцияларында MLге өтүшү керек, өндүрүштүк машиналарды үйрөнүү маселелерин чечүүдө илимпоздун көндүмдөрүн эмес, практикалык көндүмдөрдү алуу керек. Бул жаш изилдөөчүлөрдү колдобойбуз дегенди билдирбейт. Биз алар үчүн өзүнчө программа уюштурдук - премиум Илья Сегаловичтин аты менен аталган, бул дагы Яндексте иштөөгө мүмкүндүк берет.

Тургун кайда иштейт?

Машина чалгындоо жана изилдөө бөлүмүндө биз өзүбүз долбоор идеяларын иштеп чыгабыз. Илхамдын негизги булагы болуп илимий адабияттар, макалалар жана изилдөө коомчулугундагы тенденциялар саналат. Мен жана менин кесиптештерим окугандарыбызды талдап, илимпоздор сунуштаган ыкмаларды кантип өркүндөтүүгө же кеңейтүүгө болорун карап чыгабыз. Ошол эле учурда, ар бирибиз өзүнүн билим чөйрөсүн жана кызыкчылыктарын эске алып, ал маанилүү деп эсептеген тармактардын негизинде тапшырманы түзөт. Долбоор идеясы, адатта, тышкы изилдөөлөрдүн натыйжалары менен өзүнүн компетенциясынын кесилишинде пайда болот.

Бул система жакшы, анткени ал Yandex кызматтарынын технологиялык көйгөйлөрүн алар пайда боло электе эле чечет. Кызмат көйгөйгө туш болгондо, анын өкүлдөрү бизге келишет, кыязы, биз даярдаган технологияларды алышат, ал эми буюмда туура колдонулушу гана калды. Эгер бир нерсе даяр эмес болсо, биз, жок эле дегенде, тез арада биз "казууну" кайдан баштай аларыбызды жана чечимди кайсы макалалардан издешибиз керектигин эстеп калабыз. Белгилүү болгондой, илимий ыкма алптардын ийининде туруу.

Эмне кылуу керек

Яндексте, ал тургай, биздин жетекчиликте - MLдин бардык тиешелүү багыттары иштелип жатат. Биздин максат — продук-циянын кеп турдуу ассорти-ментинин сапатын жогорулатуу, бул бардык жацы нерселерди сыноо учун стимул болуп кызмат кылат. Мындан тышкары, жаңы кызматтар үзгүлтүксүз пайда болот. Ошентип, лекция программасы өнөр жайды өнүктүрүүдө машинаны үйрөнүүнүн бардык негизги (жакшы далилденген) багыттарын камтыйт. Курстун бөлүгүн түзүүдө мен Маалыматтарды талдоо мектебиндеги окутуу тажрыйбамды, ошондой эле башка SHAD мугалимдеринин материалдарын жана иштерин колдондум. Менин кесиптештерим да ушундай кылышканын билем.

Биринчи айларда курстун программасы боюнча окутуу жумуш убактысынын болжол менен 30%ын, андан кийин 10%ке жакынын түзөт. Бирок, ML моделдери менен иштөө бардык байланышкан процесстерге караганда болжол менен төрт эсе аз талап кылаарын түшүнүү маанилүү. Аларга бэкэндди даярдоо, маалыматтарды кабыл алуу, аны алдын ала иштетүү үчүн конвейерди жазуу, кодду оптималдаштыруу, белгилүү бир жабдыкка ыңгайлаштыруу ж.б. , көйгөйдү башынан аягына чейин чечүүгө жөндөмдүү. Даяр модел менен да, балким, сизге дагы бир катар аракеттерди жасоо керек болот: анын аткарылышын бир нече машиналарда параллелдештириңиз, тутка, китепкана же кызматтын компоненттери түрүндө ишке ашырууну даярдаңыз.

Студенттик тандоо
Эгер сиз адегенде бэкенддик иштеп чыгуучу болуп иштеп, ML инженери болуу жакшы деп ойлосоңуз, бул туура эмес. Кызматтарды өнүктүрүү, үйрөнүү жана рынокто өтө суроо-талапка ээ болуу боюнча реалдуу тажрыйбасы жок эле бир эле ШАДга катталуу - эң сонун вариант. Көптөгөн Яндекс адистери ушул жол менен азыркы кызматтарына ээ болушту. Эгерде кайсы бир компания сизге окууну аяктагандан кийин дароо ML тармагында жумуш сунуштоого даяр болсо, сиз да сунушту кабыл алышыңыз керек. Тажрыйбалуу насаатчы менен жакшы командага кирүүгө аракет кылыңыз жана көп нерсени үйрөнүүгө даяр болуңуз.

ML жасоого көбүнчө эмне тоскоол болот?

Эгерде колдоочу ML инженери болууну кааласа, ал өнүгүүнүн эки багытын тандап алат - резидентура программасын эске албастан.

Биринчиден, кандайдыр бир билим берүү курсунун бир бөлүгү катары окуу. Сабактар Coursera сизди негизги ыкмаларды түшүнүүгө жакындатат, бирок бул кесипке жетиштүү деңгээлде кириш үчүн ага көбүрөөк убакыт бөлүү керек. Мисалы, ШАДды бүтүргөн. Жылдар бою, ShAD түздөн-түз машинаны үйрөнүү боюнча ар кандай курстарга ээ болгон - орточо эсеп менен сегизге жакын. Алардын ар бири чынында эле маанилүү жана пайдалуу, анын ичинде бүтүрүүчүлөрдүн пикири боюнча. 

Экинчиден, сиз тигил же бул ML алгоритмин ишке ашыруу керек болгон согуштук долбоорлорго катыша аласыз. Бирок, IT өнүктүрүү рыногунда мындай долбоорлор абдан аз: машина үйрөнүү көпчүлүк тапшырмаларда колдонулбайт. Ал тургай, жигердүү ML байланыштуу мүмкүнчүлүктөрдү изилдеп жаткан банктарда, бир нече гана маалыматтарды талдоо менен алектенет. Эгер сиз бул командалардын бирине кошула албасаңыз, анда сиздин жалгыз вариантыңыз - же өзүңүздүн долбооруңузду баштоо (бул жерде, балким, сиз өз мөөнөттөрүңүздү белгилейсиз жана бул согуштук өндүрүштүк тапшырмалар менен эч кандай байланышы жок) же атаандаша баштаңыз. Kaggle.

Чынында эле, коомчулуктун башка мүчөлөрү менен биригип, мелдештерде өзүңүздү сынап көрүңүз салыштырмалуу жеңил - өзгөчө Coursera боюнча тренинг жана айтылган курстар менен өз жөндөмүңүздү бекемдесеңиз. Ар бир сынактын мөөнөтү бар - ал сиз үчүн стимул болуп кызмат кылат жана IT-компаниялардагы ушундай системага даярдайт. Бул жакшы жол - бирок, ал ошондой эле реалдуу процесстерден бир аз ажыратылган. Kaggle боюнча сизге алдын ала иштетилген, ар дайым идеалдуу болбосо да, маалыматтар берилет; буюмга кошкон салымы жөнүндө ойлонууну сунуш кылбаңыз; жана эң негизгиси, алар өндүрүшкө ылайыктуу чечимдерди талап кылбайт. Сиздин алгоритмдериңиз иштеп, абдан так болушу мүмкүн, бирок моделдериңиз жана кодуңуз ар кайсы бөлүктөрдөн тигилген Франкенштейн сыяктуу болот - өндүрүш долбоорунда бүт структура өтө жай иштейт, аны жаңыртуу жана кеңейтүү кыйынга турат (мисалы, тил жана үн алгоритмдери тилдин өнүгүшүнө жараша ар дайым жарым-жартылай кайра жазылат). Компаниялар саналып өткөн иштерди сиз өзүңүз гана эмес (бул чечимдин автору катары сиз жасай ала турганыңыз анык), ошондой эле кесиптештериңиздин ар бири тарабынан аткарылышы мүмкүн экендигине кызыкдар. Спорт менен өнөр жайлык программалоонун айырмасы талкууланат много, жана Kaggle так "спортчуларды" тарбиялайт - бул абдан жакшы болсо да, аларга кандайдыр бир тажрыйба алууга мүмкүнчүлүк берет.

Мен өнүгүүнүн эки мүмкүн болгон линиясын сүрөттөп бердим - билим берүү программалары аркылуу машыгуу жана "согушта", мисалы, Кагглда. Резидентура программасы бул эки ыкманын айкалышы. Сизди ШАД деңгээлиндеги лекциялар жана семинарлар, ошондой эле чыныгы күрөш долбоорлору күтөт.

Source: www.habr.com

Комментарий кошуу