Yandex-ը մեքենայական ուսուցման ռեզիդենտական ծրագիր է բացում փորձառու backend ծրագրավորողների համար: Եթե դուք շատ բան եք գրել C++/Python-ում և ցանկանում եք այս գիտելիքները կիրառել ML-ում, ապա մենք ձեզ կսովորեցնենք, թե ինչպես կատարել գործնական հետազոտություններ և կտրամադրենք փորձառու մենթորներ։ Դուք կաշխատեք Yandex-ի հիմնական ծառայությունների վրա և ձեռք կբերեք հմտություններ այնպիսի ոլորտներում, ինչպիսիք են գծային մոդելները և գրադիենտի խթանումը, առաջարկությունների համակարգերը, պատկերների, տեքստի և ձայնի վերլուծության նեյրոնային ցանցերը: Դուք նաև կսովորեք, թե ինչպես ճիշտ գնահատել ձեր մոդելները՝ օգտագործելով չափումները անցանց և առցանց:
Ծրագրի տևողությունը մեկ տարի է, որի ընթացքում մասնակիցները կաշխատեն Yandex-ի մեքենայական հետախուզության և հետազոտական բաժնում, ինչպես նաև կմասնակցեն դասախոսությունների և սեմինարների։ Մասնակցությունը վճարովի է և ներառում է լրիվ դրույքով աշխատանք՝ շաբաթական 40 ժամ՝ սկսած այս տարվա հուլիսի 1-ից։
Իսկ հիմա ավելի մանրամասն՝ այն մասին, թե ինչպիսի լսարանի ենք սպասում, ինչպիսին կլինի աշխատանքային գործընթացը և, առհասարակ, ինչպես կարող է back-end մասնագետը անցնել ՄԼ ոլորտում կարիերայի:
Կենտրոնանալ
Շատ ընկերություններ ունեն ռեզիդենտության ծրագրեր, ներառյալ, օրինակ, Google-ը և Facebook-ը: Դրանք հիմնականում ուղղված են կրտսեր և միջին մակարդակի մասնագետներին, ովքեր փորձում են քայլ անել դեպի ՓԼ հետազոտություն: Մեր ծրագիրը այլ հանդիսատեսի համար է։ Հրավիրում ենք backend-ի ծրագրավորողներին, ովքեր արդեն բավականաչափ փորձ են ձեռք բերել և հաստատ գիտեն, որ իրենց իրավասություններում նրանք պետք է անցնեն դեպի ML, ձեռք բերեն գործնական հմտություններ, և ոչ թե գիտնականի հմտություններ՝ արդյունաբերական մեքենայական ուսուցման խնդիրները լուծելու համար: Սա չի նշանակում, որ մենք չենք աջակցում երիտասարդ հետազոտողներին։ Մենք նրանց համար առանձին ծրագիր ենք կազմակերպել.
Որտե՞ղ է աշխատելու բնակիչը.
Մեքենաների հետախուզության և հետազոտությունների բաժնում մենք ինքներս մշակում ենք նախագծային գաղափարներ: Ոգեշնչման հիմնական աղբյուրը գիտական գրականությունն է, հոդվածները և հետազոտական համայնքի միտումները: Ես և իմ գործընկերները վերլուծում ենք այն, ինչ կարդում ենք՝ նայելով, թե ինչպես կարող ենք բարելավել կամ ընդլայնել գիտնականների առաջարկած մեթոդները: Միևնույն ժամանակ, մեզանից յուրաքանչյուրը հաշվի է առնում իր գիտելիքների և հետաքրքրությունների ոլորտը, ձևակերպում է առաջադրանքը՝ ելնելով այն ոլորտներից, որոնք նա կարևոր է համարում։ Ծրագրի գաղափարը սովորաբար ծնվում է արտաքին հետազոտության արդյունքների և սեփական իրավասությունների խաչմերուկում:
Այս համակարգը լավն է, քանի որ այն մեծապես լուծում է Yandex-ի ծառայությունների տեխնոլոգիական խնդիրները նույնիսկ դրանց առաջացումը: Երբ ծառայությունը բախվում է խնդրի, նրա ներկայացուցիչները գալիս են մեզ մոտ՝ ամենայն հավանականությամբ վերցնելու մեր արդեն պատրաստած տեխնոլոգիաները, որոնք մնում է ապրանքի մեջ ճիշտ կիրառվել։ Եթե ինչ-որ բան պատրաստ չէ, մենք գոնե արագ կհիշենք, թե որտեղից կարող ենք «սկսել փորել» և որ հոդվածներում լուծում փնտրել։ Ինչպես գիտենք, գիտական մոտեցումը հսկաների ուսերին կանգնելն է։
Ինչ անել
Yandex-ում, և նույնիսկ կոնկրետ մեր մենեջմենթում, մշակվում են ML-ի բոլոր համապատասխան ոլորտները: Մեր նպատակն է բարելավել ապրանքների լայն տեսականի որակը, և դա խթան է հանդիսանում ամեն նորը փորձարկելու համար: Բացի այդ, պարբերաբար հայտնվում են նոր ծառայություններ։ Այսպիսով, դասախոսական ծրագիրը պարունակում է արդյունաբերական զարգացման մեքենայական ուսուցման բոլոր հիմնական (լավ ապացուցված) ոլորտները: Դասընթացի իմ մասը կազմելիս ես օգտագործել եմ իմ դասավանդման փորձը Տվյալների վերլուծության դպրոցում, ինչպես նաև SHAD-ի մյուս ուսուցիչների նյութերն ու աշխատանքը: Գիտեմ, որ իմ գործընկերներն էլ են այդպես վարվել։
Առաջին ամիսներին դասընթացի ծրագրի համաձայն վերապատրաստումը կկազմի ձեր աշխատաժամանակի մոտավորապես 30%-ը, այնուհետև մոտ 10%-ը։ Այնուամենայնիվ, կարևոր է հասկանալ, որ ML մոդելների հետ աշխատելը կշարունակի մոտավորապես չորս անգամ ավելի քիչ պահանջել, քան բոլոր հարակից գործընթացները: Դրանք ներառում են հետին պլանի պատրաստում, տվյալների ստացում, դրա նախնական մշակման համար խողովակաշար գրել, կոդի օպտիմիզացում, հատուկ սարքաշարի հարմարեցում և այլն: ML ինժեները, եթե ցանկանում եք, ամբողջական փաթեթ մշակող է (միայն մեքենայական ուսուցման ավելի մեծ շեշտադրմամբ): , կարող է խնդիր լուծել սկզբից մինչև վերջ: Նույնիսկ պատրաստի մոդելի դեպքում, հավանաբար ձեզ հարկավոր կլինի մի շարք այլ գործողություններ կատարել՝ զուգահեռացնել դրա կատարումը մի քանի մեքենաների վրա, պատրաստել իրականացում բռնակի, գրադարանի կամ հենց ծառայության բաղադրիչների տեսքով:
Ուսանողի ընտրություն
Եթե դուք այնպիսի տպավորություն էիք, որ ավելի լավ է դառնալ ML ինժեներ՝ նախ աշխատելով որպես backend-ի ծրագրավորող, դա ճիշտ չէ: Միևնույն SAD-ում գրանցվելն առանց ծառայությունների զարգացման իրական փորձի, սովորելու և շուկայում չափազանց պահանջված դառնալը հիանալի տարբերակ է: Yandex-ի շատ մասնագետներ այս կերպ հայտնվեցին իրենց ներկայիս պաշտոններում։ Եթե որևէ ընկերություն պատրաստ է ձեզ աշխատանք առաջարկել ML ոլորտում ուսումն ավարտելուց անմիջապես հետո, հավանաբար դուք նույնպես պետք է ընդունեք առաջարկը: Փորձեք լավ թիմ մտնել փորձառու մենթորի հետ և պատրաստվեք շատ բան սովորել:
Ի՞նչն է սովորաբար խանգարում ձեզ ML անել:
Եթե backender-ը ձգտում է դառնալ ML ինժեներ, նա կարող է ընտրել զարգացման երկու ոլորտներից՝ առանց հաշվի առնելու ռեզիդենտության ծրագիրը:
Նախ, սովորեք որպես ինչ-որ կրթական դասընթացի մաս:
Երկրորդ, դուք կարող եք մասնակցել մարտական նախագծերին, որտեղ դուք պետք է իրականացնեք այս կամ այն ML ալգորիթմը: Այնուամենայնիվ, ՏՏ զարգացման շուկայում նման նախագծերը շատ քիչ են. մեքենայական ուսուցումը չի օգտագործվում առաջադրանքների մեծ մասում: Նույնիսկ այն բանկերում, որոնք ակտիվորեն ուսումնասիրում են ՓԼ-ի հետ կապված հնարավորությունները, միայն մի քանիսն են զբաղվում տվյալների վերլուծությամբ: Եթե չկարողացաք միանալ այս թիմերից մեկին, ձեր միակ տարբերակը կամ սկսել ձեր սեփական նախագիծը (որտեղ, ամենայն հավանականությամբ, դուք ինքներդ կսահմանեք վերջնաժամկետները, և դա քիչ առնչություն ունի մարտական արտադրության առաջադրանքների հետ), կամ սկսել մրցել։ Kaggle.
Իրոք, միավորվեք համայնքի այլ անդամների հետ և փորձեք ինքներդ ձեզ մրցույթներում
Ես նկարագրեցի զարգացման երկու հնարավոր գիծ՝ վերապատրաստում կրթական ծրագրերի միջոցով և ուսուցում «մարտական», օրինակ՝ Kaggle-ում: Կացության ծրագիրը այս երկու մեթոդների համակցությունն է: Ձեզ սպասում են դասախոսություններ և սեմինարներ ՇԱԴ մակարդակով, ինչպես նաև իսկապես մարտական նախագծեր:
Source: www.habr.com