Yandex резидент хөтөлбөр, эсвэл туршлагатай ивээн тэтгэгч хэрхэн ML инженер болох вэ

Yandex резидент хөтөлбөр, эсвэл туршлагатай ивээн тэтгэгч хэрхэн ML инженер болох вэ

Yandex нь туршлагатай backend хөгжүүлэгчдэд зориулж машин сургалтын чиглэлээр оршин суух хөтөлбөрийг нээж байна. Хэрэв та C++/Python хэл дээр их зүйл бичсэн бөгөөд энэ мэдлэгээ ML-д хэрэгжүүлэхийг хүсвэл бид танд хэрхэн практик судалгаа хийхийг зааж, туршлагатай зөвлөгчөөр хангах болно. Та Yandex-ийн үндсэн үйлчилгээн дээр ажиллаж, шугаман загвар, градиент нэмэгдүүлэх, зөвлөмжийн систем, зураг, текст, дуу чимээг шинжлэх мэдрэлийн сүлжээ зэрэг чиглэлээр ур чадвар эзэмших болно. Мөн та офлайн болон онлайн хэмжүүр ашиглан загвараа хэрхэн зөв үнэлэх талаар сурах болно.

Хөтөлбөрийн үргэлжлэх хугацаа нь нэг жил бөгөөд энэ хугацаанд оролцогчид Yandex-ийн машин тагнуул, судалгааны хэлтэст ажиллахаас гадна лекц, семинарт оролцоно. Оролцох нь төлбөртэй бөгөөд бүтэн цагаар ажилладаг: долоо хоногт 40 цаг, энэ оны 1-р сарын XNUMX-ээс эхлэн. Одоо програмууд нээлттэй байна 1-р сарын XNUMX хүртэл үргэлжилнэ. 

Одоо бид ямар үзэгчдийг хүлээж байгаа, ажлын явц ямар байх, ерөнхийдөө арын мэргэжилтэн хэрхэн ML-ийн карьер руу шилжих талаар илүү дэлгэрэнгүй авч үзье.

Удирдамж

Олон компаниуд Google, Facebook зэрэг Оршин суух хөтөлбөртэй байдаг. Эдгээр нь голчлон ML судалгаанд нэг алхам хийхийг оролдож буй бага, дунд түвшний мэргэжилтнүүдэд чиглэгддэг. Манай нэвтрүүлэг өөр үзэгчдэд зориулагдсан. Бид хангалттай туршлага хуримтлуулсан бөгөөд үйлдвэрлэлийн машин сургалтын асуудлыг шийдвэрлэхэд эрдэмтний ур чадвар биш харин практик ур чадвар эзэмшүүлэхийн тулд ML рүү шилжих хэрэгтэй гэдгийг баттай мэддэг backend хөгжүүлэгчдийг урьж байна. Энэ нь залуу судлаачдыг дэмжихгүй гэсэн үг биш. Бид тэдэнд зориулж тусдаа хөтөлбөр зохион байгуулсан. шагнал Илья Сегаловичийн нэрэмжит бөгөөд энэ нь таныг Yandex-д ажиллах боломжийг олгодог.

Оршин суугч хаана ажиллах вэ?

Машины тагнуул, судалгааны хэлтэст бид өөрсдөө төслийн санааг боловсруулдаг. Урам зориг өгөх гол эх сурвалж нь шинжлэх ухааны ном зохиол, нийтлэл, судалгааны нийгэмлэгийн чиг хандлага юм. Хамтран ажиллагсад бид хоёр уншсан зүйлдээ дүн шинжилгээ хийж, эрдэмтдийн санал болгож буй аргуудыг хэрхэн сайжруулах, өргөжүүлэх талаар судалж үздэг. Үүний зэрэгцээ бидний хүн нэг бүр өөрийн мэдлэг, сонирхлын чиглэлийг харгалзан үзэж, чухал гэж үзсэн чиглэлээр нь даалгавраа боловсруулдаг. Төслийн санаа нь ихэвчлэн гадны судалгааны үр дүн болон өөрийн чадамжийн огтлолцол дээр төрдөг.

Энэ систем нь Yandex үйлчилгээний технологийн асуудлыг үүсэхээс нь өмнө шийддэг учраас сайн юм. Аливаа үйлчилгээ асуудалтай тулгарвал түүний төлөөлөгчид бидэн дээр ирдэг бөгөөд бидний бэлтгэсэн технологиудыг авч, бүтээгдэхүүндээ зөв хэрэглэх л үлддэг. Хэрэв ямар нэг зүйл бэлэн болоогүй бол бид хаанаас "ухаж" эхлэх, ямар нийтлэлээс шийдэл хайхаа хурдан санах болно. Бидний мэдэж байгаагаар шинжлэх ухааны арга барил бол аварга том хүмүүсийн мөрөн дээр зогсох явдал юм.

Юу хийх вэ

Yandex-д, тэр ч байтугай манай удирдлагад - ML-ийн холбогдох бүх чиглэлийг боловсруулж байна. Бидний зорилго бол олон төрлийн бүтээгдэхүүний чанарыг сайжруулах явдал бөгөөд энэ нь бүх шинэ зүйлийг туршиж үзэх хөшүүрэг болдог. Үүнээс гадна шинэ үйлчилгээ байнга гарч ирдэг. Тиймээс лекцийн хөтөлбөр нь үйлдвэрлэлийн хөгжилд машин сургалтын бүх гол (сайн батлагдсан) чиглэлүүдийг агуулдаг. Хичээлийн нэг хэсгийг эмхэтгэхдээ би Өгөгдлийн шинжилгээний сургуульд багшлах туршлагаа болон бусад ШАД багш нарын материал, ажлыг ашигласан. Хамт ажиллагсад маань ч тэгж байсныг би мэднэ.

Эхний саруудад сургалтын хөтөлбөрийн дагуу сургалт нь таны ажлын цагийн 30 орчим хувийг, дараа нь 10 орчим хувийг эзэлнэ. Гэсэн хэдий ч ML загваруудтай ажиллах нь холбогдох бүх процессоос ойролцоогоор дөрөв дахин бага байх болно гэдгийг ойлгох нь чухал юм. Үүнд backend бэлтгэх, өгөгдөл хүлээн авах, түүнийг урьдчилан боловсруулахад зориулж дамжуулах шугам бичих, кодыг оновчтой болгох, тодорхой техник хангамжид дасан зохицох гэх мэт орно. ML инженер бол хэрэв хүсвэл бүрэн стек хөгжүүлэгч (зөвхөн машин сурахад илүү анхаардаг) юм. , асуудлыг эхнээс нь дуустал шийдвэрлэх чадвартай. Бэлэн загвартай байсан ч гэсэн та хэд хэдэн үйлдлүүдийг хийх шаардлагатай болно: түүний гүйцэтгэлийг хэд хэдэн машин дээр зэрэгцүүлэн тохируулах, бариул, номын сан эсвэл үйлчилгээний бүрэлдэхүүн хэсгүүдийн хэлбэрээр хэрэгжилтийг бэлтгэх.

Оюутны сонголт
Хэрэв та эхлээд backend хөгжүүлэгчээр ажилласнаар ML инженер болсон нь дээр гэсэн сэтгэгдэл төрж байсан бол энэ нь үнэн биш юм. Үйлчилгээг хөгжүүлэх, сурч боловсрох, зах зээл дээр маш эрэлт хэрэгцээтэй болох бодит туршлагагүй нэг ШАД-д элсэх нь маш сайн сонголт юм. Яндексийн олон мэргэжилтнүүд ийм байдлаар одоогийн албан тушаалдаа хүрсэн. Хэрэв ямар нэгэн компани сургуулиа төгсөөд шууд ML чиглэлээр ажил санал болгоход бэлэн байгаа бол та ч гэсэн саналыг хүлээн авах хэрэгтэй байх. Туршлагатай зөвлөгчтэй сайн багт орж, их зүйл сурахад бэлэн байгаарай.

Таныг ML хийхэд юу саад болдог вэ?

Хэрэв ивээн тэтгэгч нь ML инженер болохыг хүсч байвал хөгжлийн хоёр чиглэлээс сонгох боломжтой - оршин суух хөтөлбөрийг харгалзахгүйгээр.

Нэгдүгээрт, зарим боловсролын сургалтын нэг хэсэг болгон суралцах. Хичээлүүд Coursera нь таныг үндсэн техникийг ойлгоход ойртуулах болно, гэхдээ энэ мэргэжлийг хангалттай хэмжээгээр шингээхийн тулд та түүнд илүү их цаг зарцуулах хэрэгтэй. Жишээлбэл, ШАД төгссөн. Жилийн туршид ShAD нь машин сургалтын чиглэлээр өөр өөр тооны сургалттай байсан - дунджаар найм орчим. Тэд тус бүр нь төгсөгчдийн үзэж байгаагаар үнэхээр чухал бөгөөд хэрэгцээтэй байдаг. 

Хоёрдугаарт, та нэг буюу өөр ML алгоритмыг хэрэгжүүлэх шаардлагатай байлдааны төслүүдэд оролцож болно. Гэсэн хэдий ч мэдээллийн технологийн хөгжлийн зах зээл дээр ийм төслүүд маш цөөхөн байдаг: машин сургалтыг ихэнх ажилд ашигладаггүй. ML-тэй холбоотой боломжуудыг идэвхтэй судалж байгаа банкуудад ч цөөн хэдэн нь мэдээлэлд дүн шинжилгээ хийдэг. Хэрэв та эдгээр багуудын аль нэгэнд нэгдэж чадаагүй бол таны цорын ганц сонголт бол өөрийн төслөө эхлүүлэх (хамгийн их магадлалтай бол та эцсийн хугацааг өөрөө тогтоох бөгөөд энэ нь байлдааны үйлдвэрлэлийн даалгавартай огт хамаагүй) эсвэл тэмцээнд оролцож эхлэх явдал юм. Kaggle.

Үнэхээр бусад нийгэмлэгийн гишүүдтэй нэгдэж, тэмцээнд өөрийгөө сорьж үзээрэй харьцангуй хялбар - ялангуяа та Coursera дээрх сургалт, сургалтаар ур чадвараа нөхөж байгаа бол. Тэмцээн бүр эцсийн хугацаатай байдаг - энэ нь танд урамшуулал болж, мэдээллийн технологийн компаниудад ижил төстэй системд бэлтгэх болно. Энэ бол сайн арга бөгөөд энэ нь бодит үйл явцаас бага зэрэг салсан юм. Kaggle дээр та үргэлж төгс биш ч гэсэн урьдчилан боловсруулсан өгөгдөл өгдөг; бүтээгдэхүүнд оруулах хувь нэмрийн талаар бодохыг бүү санал болго; хамгийн чухал нь тэд үйлдвэрлэхэд тохиромжтой шийдэл шаарддаггүй. Таны алгоритмууд ажиллах бөгөөд өндөр нарийвчлалтай байх болно, гэхдээ таны загварууд болон кодууд нь өөр өөр хэсгүүдээс оёсон Франкенштейн шиг байх болно - үйлдвэрлэлийн төсөлд бүх бүтэц хэтэрхий удаан ажиллах болно, үүнийг шинэчлэх, өргөжүүлэхэд хэцүү байх болно (жишээлбэл, хэл болон дуу хоолойн алгоритмууд нь хэл хөгжихийн хэрээр хэсэгчлэн дахин бичигдэх болно). Жагсаалтад орсон ажлыг зөвхөн та өөрөө хийхээс гадна (шийдлийн зохиогчийн хувьд та үүнийг хийж чадна гэдэг нь тодорхой байна), таны хамт олон ч бас хийж болохыг компаниуд сонирхож байна. Спорт ба үйлдвэрлэлийн програмчлалын ялгааг авч үздэг много, мөн Kaggle яг "тамирчдыг" сургадаг - энэ нь үүнийг маш сайн хийдэг байсан ч тэдэнд туршлага хуримтлуулах боломжийг олгодог.

Би хөгжлийн хоёр боломжит чиглэлийг тодорхойлсон - боловсролын хөтөлбөрөөр дамжуулан сургалт, "байлдааны" сургалт, жишээлбэл, Каггл. Оршин суух хөтөлбөр нь эдгээр хоёр аргын хослол юм. ШАД-ын түвшний лекц, семинарууд, мөн жинхэнэ тэмцэлтэй төслүүд таныг хүлээж байна.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх