Яндекс тажрыйбалуу иштеп чыгуучулар үчүн машина үйрөнүү боюнча резидентура программасын ачып жатат. Эгерде сиз C++/Python тилинде көп жазган болсоңуз жана бул билимди MLде колдонгуңуз келсе, анда биз сизге практикалык изилдөө жүргүзүүнү үйрөтөбүз жана тажрыйбалуу насаатчыларды сунуштайбыз. Сиз негизги Яндекс кызматтарында иштейсиз жана сызыктуу моделдер жана градиентти жогорулатуу, рекомендация системалары, сүрөттөрдү, текстти жана үндү талдоо үчүн нейрон тармактары сыяктуу тармактарда көндүмдөрдү аласыз. Ошондой эле сиз офлайн жана онлайн метрикаларды колдонуу менен моделдериңизди туура баалоону үйрөнөсүз.
Программанын мөөнөтү бир жыл, анын ичинде катышуучулар Яндекстин машиналык чалгындоо жана изилдөө бөлүмүндө иштешет, ошондой эле лекцияларга жана семинарларга катышышат. Катышуу акы төлөнөт жана толук убакытта иштөөнү камтыйт: ушул жылдын 40-июлунан баштап жумасына 1 саат.
Ал эми азыр кененирээк - биз кандай аудиторияны күтүп жатабыз, иш процесси кандай болот жана жалпысынан, бэк-энд адиси кантип ML карьерасына өтүшү мүмкүн.
directionality
Көптөгөн компаниялардын Резиденттик программалары бар, анын ичинде, мисалы, Google жана Facebook. Алар негизинен ML изилдөөсүнө кадам таштоого аракет кылган кенже жана орто деңгээлдеги адистерге багытталган. Биздин программа башка аудитория үчүн. Биз буга чейин жетиштүү тажрыйбага ээ болгон бэкенддерди иштеп чыгуучуларды чакырабыз, алар өз компетенцияларында MLге өтүшү керек, өндүрүштүк машиналарды үйрөнүү маселелерин чечүүдө илимпоздун көндүмдөрүн эмес, практикалык көндүмдөрдү алуу керек. Бул жаш изилдөөчүлөрдү колдобойбуз дегенди билдирбейт. Биз алар үчүн өзүнчө программа уюштурдук -
Тургун кайда иштейт?
Машина чалгындоо жана изилдөө бөлүмүндө биз өзүбүз долбоор идеяларын иштеп чыгабыз. Илхамдын негизги булагы болуп илимий адабияттар, макалалар жана изилдөө коомчулугундагы тенденциялар саналат. Мен жана менин кесиптештерим окугандарыбызды талдап, илимпоздор сунуштаган ыкмаларды кантип өркүндөтүүгө же кеңейтүүгө болорун карап чыгабыз. Ошол эле учурда, ар бирибиз өзүнүн билим чөйрөсүн жана кызыкчылыктарын эске алып, ал маанилүү деп эсептеген тармактардын негизинде тапшырманы түзөт. Долбоор идеясы, адатта, тышкы изилдөөлөрдүн натыйжалары менен өзүнүн компетенциясынын кесилишинде пайда болот.
Бул система жакшы, анткени ал Yandex кызматтарынын технологиялык көйгөйлөрүн алар пайда боло электе эле чечет. Кызмат көйгөйгө туш болгондо, анын өкүлдөрү бизге келишет, кыязы, биз даярдаган технологияларды алышат, ал эми буюмда туура колдонулушу гана калды. Эгер бир нерсе даяр эмес болсо, биз, жок эле дегенде, тез арада биз "казууну" кайдан баштай аларыбызды жана чечимди кайсы макалалардан издешибиз керектигин эстеп калабыз. Белгилүү болгондой, илимий ыкма алптардын ийининде туруу.
Эмне кылуу керек
Яндексте, ал тургай, биздин жетекчиликте - MLдин бардык тиешелүү багыттары иштелип жатат. Биздин максат — продук-циянын кеп турдуу ассорти-ментинин сапатын жогорулатуу, бул бардык жацы нерселерди сыноо учун стимул болуп кызмат кылат. Мындан тышкары, жаңы кызматтар үзгүлтүксүз пайда болот. Ошентип, лекция программасы өнөр жайды өнүктүрүүдө машинаны үйрөнүүнүн бардык негизги (жакшы далилденген) багыттарын камтыйт. Курстун бөлүгүн түзүүдө мен Маалыматтарды талдоо мектебиндеги окутуу тажрыйбамды, ошондой эле башка SHAD мугалимдеринин материалдарын жана иштерин колдондум. Менин кесиптештерим да ушундай кылышканын билем.
Биринчи айларда курстун программасы боюнча окутуу жумуш убактысынын болжол менен 30%ын, андан кийин 10%ке жакынын түзөт. Бирок, ML моделдери менен иштөө бардык байланышкан процесстерге караганда болжол менен төрт эсе аз талап кылаарын түшүнүү маанилүү. Аларга бэкэндди даярдоо, маалыматтарды кабыл алуу, аны алдын ала иштетүү үчүн конвейерди жазуу, кодду оптималдаштыруу, белгилүү бир жабдыкка ыңгайлаштыруу ж.б. , көйгөйдү башынан аягына чейин чечүүгө жөндөмдүү. Даяр модел менен да, балким, сизге дагы бир катар аракеттерди жасоо керек болот: анын аткарылышын бир нече машиналарда параллелдештириңиз, тутка, китепкана же кызматтын компоненттери түрүндө ишке ашырууну даярдаңыз.
Студенттик тандоо
Эгер сиз адегенде бэкенддик иштеп чыгуучу болуп иштеп, ML инженери болуу жакшы деп ойлосоңуз, бул туура эмес. Кызматтарды өнүктүрүү, үйрөнүү жана рынокто өтө суроо-талапка ээ болуу боюнча реалдуу тажрыйбасы жок эле бир эле ШАДга катталуу - эң сонун вариант. Көптөгөн Яндекс адистери ушул жол менен азыркы кызматтарына ээ болушту. Эгерде кайсы бир компания сизге окууну аяктагандан кийин дароо ML тармагында жумуш сунуштоого даяр болсо, сиз да сунушту кабыл алышыңыз керек. Тажрыйбалуу насаатчы менен жакшы командага кирүүгө аракет кылыңыз жана көп нерсени үйрөнүүгө даяр болуңуз.
ML жасоого көбүнчө эмне тоскоол болот?
Эгерде колдоочу ML инженери болууну кааласа, ал өнүгүүнүн эки багытын тандап алат - резидентура программасын эске албастан.
Биринчиден, кандайдыр бир билим берүү курсунун бир бөлүгү катары окуу.
Экинчиден, сиз тигил же бул ML алгоритмин ишке ашыруу керек болгон согуштук долбоорлорго катыша аласыз. Бирок, IT өнүктүрүү рыногунда мындай долбоорлор абдан аз: машина үйрөнүү көпчүлүк тапшырмаларда колдонулбайт. Ал тургай, жигердүү ML байланыштуу мүмкүнчүлүктөрдү изилдеп жаткан банктарда, бир нече гана маалыматтарды талдоо менен алектенет. Эгер сиз бул командалардын бирине кошула албасаңыз, анда сиздин жалгыз вариантыңыз - же өзүңүздүн долбооруңузду баштоо (бул жерде, балким, сиз өз мөөнөттөрүңүздү белгилейсиз жана бул согуштук өндүрүштүк тапшырмалар менен эч кандай байланышы жок) же атаандаша баштаңыз. Kaggle.
Чынында эле, коомчулуктун башка мүчөлөрү менен биригип, мелдештерде өзүңүздү сынап көрүңүз
Мен өнүгүүнүн эки мүмкүн болгон линиясын сүрөттөп бердим - билим берүү программалары аркылуу машыгуу жана "согушта", мисалы, Кагглда. Резидентура программасы бул эки ыкманын айкалышы. Сизди ШАД деңгээлиндеги лекциялар жана семинарлар, ошондой эле чыныгы күрөш долбоорлору күтөт.
Source: www.habr.com