Yandex Rezident Proqramı və ya Təcrübəli Baxıcı Necə ML Mühəndisi Ola bilər

Yandex Rezident Proqramı və ya Təcrübəli Baxıcı Necə ML Mühəndisi Ola bilər

Yandex təcrübəli backend tərtibatçıları üçün maşın öyrənməsində rezidentura proqramı açır. Əgər siz C++/Python-da çox yazmısınızsa və bu bilikləri ML-də tətbiq etmək istəyirsinizsə, o zaman biz sizə praktiki tədqiqat aparmağı öyrədəcəyik və təcrübəli mentorlar təqdim edəcəyik. Siz əsas Yandex xidmətləri üzərində işləyəcək və xətti modellər və gradient gücləndirmə, tövsiyə sistemləri, şəkillərin, mətnin və səsin təhlili üçün neyron şəbəkələri kimi sahələrdə bacarıqlar əldə edəcəksiniz. Siz həmçinin oflayn və onlayn ölçülərdən istifadə edərək modellərinizi düzgün qiymətləndirməyi öyrənəcəksiniz.

Proqramın müddəti bir ildir və bu müddət ərzində iştirakçılar Yandex-in maşın kəşfiyyatı və tədqiqat şöbəsində işləyəcək, həmçinin mühazirə və seminarlarda iştirak edəcəklər. İştirak ödənişlidir və tam ştatlı işi əhatə edir: bu ilin 40 iyulundan başlayaraq həftədə 1 saat. Müraciətlər artıq açıqdır və mayın 1-dək davam edəcək. 

İndi isə daha ətraflı - hansı auditoriyanı gözlədiyimiz, iş prosesinin necə olacağı və ümumiyyətlə, back-end mütəxəssisinin ML sahəsində karyeraya necə keçə biləcəyi haqqında.

Fokus

Bir çox şirkətlərin, məsələn, Google və Facebook da daxil olmaqla Rezidentura Proqramları var. Onlar əsasən ML tədqiqatına doğru addım atmağa çalışan kiçik və orta səviyyəli mütəxəssislərə yönəlib. Proqramımız fərqli tamaşaçılar üçündür. Artıq kifayət qədər təcrübə qazanmış və sənaye maşın öyrənmə problemlərinin həllində alim bacarıqlarını deyil, praktiki bacarıqlar əldə etmək üçün öz səlahiyyətlərində ML-yə keçməli olduqlarını dəqiq bilən backend tərtibatçılarını dəvət edirik. Bu o demək deyil ki, biz gənc tədqiqatçılara dəstək vermirik. Onlar üçün ayrıca proqram təşkil etmişik - mükafat İlya Seqaloviç adına, bu da Yandex-də işləməyə imkan verir.

Sakin harada işləyəcək?

Maşın Kəşfiyyatı və Tədqiqat Departamentində biz özümüz layihə ideyalarını inkişaf etdiririk. Əsas ilham mənbəyi elmi ədəbiyyat, məqalələr və tədqiqat cəmiyyətindəki tendensiyalardır. Həmkarlarım və mən oxuduqlarımızı təhlil edirik, alimlərin təklif etdiyi metodları necə təkmilləşdirə və ya genişləndirə biləcəyimizə baxırıq. Eyni zamanda, hər birimiz öz bilik sahəsini və maraqlarını nəzərə alır, vacib hesab etdiyi sahələr əsasında vəzifəni formalaşdırır. Layihə ideyası adətən xarici tədqiqatların nəticələri ilə öz səlahiyyətlərinin kəsişməsində yaranır.

Bu sistem yaxşıdır, çünki o, Yandex xidmətlərinin texnoloji problemlərini hələ yaranmamışdan əvvəl həll edir. Xidmət problemlə üzləşdikdə, onun nümayəndələri bizə müraciət edirlər, çox güman ki, bizim artıq hazırladığımız texnologiyaları götürəcəklər ki, bunun da məhsulda düzgün tətbiq edilməsi qalır. Bir şey hazır deyilsə, ən azı harada "qazmağa başlaya biləcəyimizi" və hansı məqalələrdə həll yolu axtaracağımızı tez xatırlayacağıq. Bildiyimiz kimi, elmi yanaşma nəhənglərin çiynində durmaqdır.

Nə etməli

Yandex-də - və hətta bizim rəhbərliyimizdə - ML-nin bütün müvafiq sahələri inkişaf etdirilir. Məqsədimiz geniş çeşiddə məhsulların keyfiyyətini artırmaqdır və bu, hər şeyi yeni sınamaq üçün stimul rolunu oynayır. Bundan əlavə, mütəmadi olaraq yeni xidmətlər görünür. Beləliklə, mühazirə proqramı sənaye inkişafında maşın öyrənməsinin bütün əsas (yaxşı sübut edilmiş) sahələrini ehtiva edir. Kursun öz hissəsini tərtib edərkən, Mən Məlumatların Təhlili Məktəbindəki tədris təcrübəmdən, eləcə də digər SHAD müəllimlərinin materiallarından və işlərindən istifadə etdim. Mən bilirəm ki, həmkarlarım da belə edirdilər.

İlk aylarda kurs proqramına uyğun təlim iş vaxtınızın təxminən 30%-ni, sonra isə təxminən 10%-ni təşkil edəcək. Bununla belə, başa düşmək lazımdır ki, ML modelləri ilə işləmək bütün əlaqəli proseslərdən təxminən dörd dəfə az vaxt aparmağa davam edəcək. Bunlara arxa planın hazırlanması, məlumatların qəbulu, onun əvvəlcədən işlənməsi üçün boru xəttinin yazılması, kodun optimallaşdırılması, xüsusi aparata uyğunlaşma və s. daxildir. ML mühəndisi, istəsəniz, tam stack tərtibatçısıdır (yalnız maşın öyrənməsinə daha çox diqqət yetirməklə) , problemi başdan sona həll edə bilən. Hətta hazır bir modellə belə, yəqin ki, bir sıra daha çox hərəkət etməli olacaqsınız: onun icrasını bir neçə maşında paralelləşdirmək, tutacaq, kitabxana və ya xidmətin özünün komponentləri şəklində bir tətbiq hazırlamaq.

Tələbə seçimi
Əgər əvvəlcə backend developer kimi işləyərək ML mühəndisi olmağın daha yaxşı olduğu təəssüratı altında olsaydınız, bu doğru deyil. Xidmətlərin inkişaf etdirilməsi, öyrənilməsi və bazarda son dərəcə tələbatlı olmaq üzrə real təcrübəsi olmadan eyni ŞAD-da qeydiyyatdan keçmək əla seçimdir. Bir çox Yandex mütəxəssisləri bu şəkildə hazırkı mövqelərinə gəldilər. Əgər hər hansı şirkət məzun olduqdan dərhal sonra sizə ML sahəsində iş təklif etməyə hazırdırsa, yəqin ki, siz də təklifi qəbul etməlisiniz. Təcrübəli mentorla yaxşı bir komandaya daxil olmağa çalışın və çox şey öyrənməyə hazır olun.

ML ilə məşğul olmağa adətən nə mane olur?

Bir dəstəkçi ML mühəndisi olmağa can atırsa, o, iki inkişaf sahəsindən birini seçə bilər - rezidentura proqramını nəzərə almadan.

Birincisi, bəzi təhsil kursunun bir hissəsi kimi oxuyun. Dərslər Coursera sizi əsas texnikaları başa düşməyə yaxınlaşdıracaq, lakin kifayət qədər peşəyə qərq olmaq üçün ona daha çox vaxt ayırmaq lazımdır. Məsələn, ŞAD-ı bitir. İllər ərzində ŞAD birbaşa maşın öyrənməsi üzrə fərqli sayda kurslara malik idi - orta hesabla təxminən səkkiz. Onların hər biri həqiqətən vacib və faydalıdır, o cümlədən məzunların fikrincə. 

İkincisi, bu və ya digər ML alqoritmini həyata keçirməyiniz lazım olan döyüş layihələrində iştirak edə bilərsiniz. Bununla belə, İT inkişaf bazarında belə layihələr çox azdır: maşın öyrənməsi əksər tapşırıqlarda istifadə edilmir. Hətta ML ilə bağlı imkanları aktiv şəkildə araşdıran banklarda belə, yalnız bir neçəsi məlumatların təhlili ilə məşğul olur. Əgər bu komandalardan birinə qoşula bilmirsinizsə, yeganə seçiminiz ya öz layihənizə başlamaqdır (burada, çox güman ki, öz son tarixlərinizi təyin edəcəksiniz və bunun döyüş istehsalı tapşırıqları ilə heç bir əlaqəsi yoxdur) və ya yarışa başlamaqdır. Kaggle.

Həqiqətən, digər icma üzvləri ilə birləşin və özünüzü yarışlarda sınayın nisbətən asan - xüsusən də Coursera-da təlim və qeyd olunan kurslarla bacarıqlarınızı dəstəkləsəniz. Hər bir müsabiqənin son müddəti var - bu, sizin üçün stimul rolunu oynayacaq və sizi İT şirkətlərində oxşar sistemə hazırlayacaq. Bu, yaxşı bir yoldur - bununla belə, real proseslərdən bir az ayrılır. Kaggle-da həmişə mükəmməl olmasa da, əvvəlcədən işlənmiş məlumatlar verilir; məhsula töhfə haqqında düşünməyi təklif etməyin; və ən əsası, istehsal üçün uyğun həllər tələb etmirlər. Alqoritmləriniz yəqin ki, işləyəcək və yüksək dəqiqlikdə olacaq, lakin modelləriniz və kodunuz müxtəlif hissələrdən bir-birinə tikilmiş Frankenşteyn kimi olacaq - istehsal layihəsində bütün struktur çox yavaş işləyəcək, yeniləmək və genişləndirmək çətin olacaq (məsələn, dil və səs alqoritmləri dil inkişaf etdikcə həmişə qismən yenidən yazılacaq). Şirkətlər maraqlıdır ki, sadalanan işləri təkcə siz özünüz yox (həllin müəllifi kimi siz bunu edə biləcəyiniz aydındır), həm də hər hansı həmkarınız tərəfindən həyata keçirilə bilər. İdman və sənaye proqramlaşdırması arasındakı fərq müzakirə olunur много, və Kaggle dəqiq "idmançılar" yetişdirir - hətta bunu çox yaxşı etsə də, onlara müəyyən təcrübə qazanmağa imkan verir.

Mən iki mümkün inkişaf xəttini təsvir etdim - təhsil proqramları vasitəsilə təlim və "döyüşdə" təlim, məsələn, Kaggle. Rezidentura proqramı bu iki metodun birləşməsidir. Sizi ŞAD səviyyəsində mühazirələr və seminarlar, eləcə də həqiqətən döyüşkən layihələr gözləyir.

Mənbə: www.habr.com

Добавить комментарий