Yandex Resident ծրագիր կամ ինչպես փորձառու Backender-ը կարող է դառնալ ML ինժեներ

Yandex Resident ծրագիր կամ ինչպես փորձառու Backender-ը կարող է դառնալ ML ինժեներ

Yandex-ը մեքենայական ուսուցման ռեզիդենտական ​​ծրագիր է բացում փորձառու backend ծրագրավորողների համար: Եթե ​​դուք շատ բան եք գրել C++/Python-ում և ցանկանում եք այս գիտելիքները կիրառել ML-ում, ապա մենք ձեզ կսովորեցնենք, թե ինչպես կատարել գործնական հետազոտություններ և կտրամադրենք փորձառու մենթորներ։ Դուք կաշխատեք Yandex-ի հիմնական ծառայությունների վրա և ձեռք կբերեք հմտություններ այնպիսի ոլորտներում, ինչպիսիք են գծային մոդելները և գրադիենտի խթանումը, առաջարկությունների համակարգերը, պատկերների, տեքստի և ձայնի վերլուծության նեյրոնային ցանցերը: Դուք նաև կսովորեք, թե ինչպես ճիշտ գնահատել ձեր մոդելները՝ օգտագործելով չափումները անցանց և առցանց:

Ծրագրի տևողությունը մեկ տարի է, որի ընթացքում մասնակիցները կաշխատեն Yandex-ի մեքենայական հետախուզության և հետազոտական ​​բաժնում, ինչպես նաև կմասնակցեն դասախոսությունների և սեմինարների։ Մասնակցությունը վճարովի է և ներառում է լրիվ դրույքով աշխատանք՝ շաբաթական 40 ժամ՝ սկսած այս տարվա հուլիսի 1-ից։ Հայտերն այժմ բաց են եւ կտեւի մինչեւ մայիսի 1-ը։ 

Իսկ հիմա ավելի մանրամասն՝ այն մասին, թե ինչպիսի լսարանի ենք սպասում, ինչպիսին կլինի աշխատանքային գործընթացը և, առհասարակ, ինչպես կարող է back-end մասնագետը անցնել ՄԼ ոլորտում կարիերայի:

Կենտրոնանալ

Շատ ընկերություններ ունեն ռեզիդենտության ծրագրեր, ներառյալ, օրինակ, Google-ը և Facebook-ը: Դրանք հիմնականում ուղղված են կրտսեր և միջին մակարդակի մասնագետներին, ովքեր փորձում են քայլ անել դեպի ՓԼ հետազոտություն: Մեր ծրագիրը այլ հանդիսատեսի համար է։ Հրավիրում ենք backend-ի ծրագրավորողներին, ովքեր արդեն բավականաչափ փորձ են ձեռք բերել և հաստատ գիտեն, որ իրենց իրավասություններում նրանք պետք է անցնեն դեպի ML, ձեռք բերեն գործնական հմտություններ, և ոչ թե գիտնականի հմտություններ՝ արդյունաբերական մեքենայական ուսուցման խնդիրները լուծելու համար: Սա չի նշանակում, որ մենք չենք աջակցում երիտասարդ հետազոտողներին։ Մենք նրանց համար առանձին ծրագիր ենք կազմակերպել. մրցանակ Իլյա Սեգալովիչի անունով, որը նաև թույլ է տալիս աշխատել Յանդեքսում։

Որտե՞ղ է աշխատելու բնակիչը.

Մեքենաների հետախուզության և հետազոտությունների բաժնում մենք ինքներս մշակում ենք նախագծային գաղափարներ: Ոգեշնչման հիմնական աղբյուրը գիտական ​​գրականությունն է, հոդվածները և հետազոտական ​​համայնքի միտումները: Ես և իմ գործընկերները վերլուծում ենք այն, ինչ կարդում ենք՝ նայելով, թե ինչպես կարող ենք բարելավել կամ ընդլայնել գիտնականների առաջարկած մեթոդները: Միևնույն ժամանակ, մեզանից յուրաքանչյուրը հաշվի է առնում իր գիտելիքների և հետաքրքրությունների ոլորտը, ձևակերպում է առաջադրանքը՝ ելնելով այն ոլորտներից, որոնք նա կարևոր է համարում։ Ծրագրի գաղափարը սովորաբար ծնվում է արտաքին հետազոտության արդյունքների և սեփական իրավասությունների խաչմերուկում:

Այս համակարգը լավն է, քանի որ այն մեծապես լուծում է Yandex-ի ծառայությունների տեխնոլոգիական խնդիրները նույնիսկ դրանց առաջացումը: Երբ ծառայությունը բախվում է խնդրի, նրա ներկայացուցիչները գալիս են մեզ մոտ՝ ամենայն հավանականությամբ վերցնելու մեր արդեն պատրաստած տեխնոլոգիաները, որոնք մնում է ապրանքի մեջ ճիշտ կիրառվել։ Եթե ​​ինչ-որ բան պատրաստ չէ, մենք գոնե արագ կհիշենք, թե որտեղից կարող ենք «սկսել փորել» և որ հոդվածներում լուծում փնտրել։ Ինչպես գիտենք, գիտական ​​մոտեցումը հսկաների ուսերին կանգնելն է։

Ինչ անել

Yandex-ում, և նույնիսկ կոնկրետ մեր մենեջմենթում, մշակվում են ML-ի բոլոր համապատասխան ոլորտները: Մեր նպատակն է բարելավել ապրանքների լայն տեսականի որակը, և դա խթան է հանդիսանում ամեն նորը փորձարկելու համար: Բացի այդ, պարբերաբար հայտնվում են նոր ծառայություններ։ Այսպիսով, դասախոսական ծրագիրը պարունակում է արդյունաբերական զարգացման մեքենայական ուսուցման բոլոր հիմնական (լավ ապացուցված) ոլորտները: Դասընթացի իմ մասը կազմելիս ես օգտագործել եմ իմ դասավանդման փորձը Տվյալների վերլուծության դպրոցում, ինչպես նաև SHAD-ի մյուս ուսուցիչների նյութերն ու աշխատանքը: Գիտեմ, որ իմ գործընկերներն էլ են այդպես վարվել։

Առաջին ամիսներին դասընթացի ծրագրի համաձայն վերապատրաստումը կկազմի ձեր աշխատաժամանակի մոտավորապես 30%-ը, այնուհետև մոտ 10%-ը։ Այնուամենայնիվ, կարևոր է հասկանալ, որ ML մոդելների հետ աշխատելը կշարունակի մոտավորապես չորս անգամ ավելի քիչ պահանջել, քան բոլոր հարակից գործընթացները: Դրանք ներառում են հետին պլանի պատրաստում, տվյալների ստացում, դրա նախնական մշակման համար խողովակաշար գրել, կոդի օպտիմիզացում, հատուկ սարքաշարի հարմարեցում և այլն: ML ինժեները, եթե ցանկանում եք, ամբողջական փաթեթ մշակող է (միայն մեքենայական ուսուցման ավելի մեծ շեշտադրմամբ): , կարող է խնդիր լուծել սկզբից մինչև վերջ: Նույնիսկ պատրաստի մոդելի դեպքում, հավանաբար ձեզ հարկավոր կլինի մի շարք այլ գործողություններ կատարել՝ զուգահեռացնել դրա կատարումը մի քանի մեքենաների վրա, պատրաստել իրականացում բռնակի, գրադարանի կամ հենց ծառայության բաղադրիչների տեսքով:

Ուսանողի ընտրություն
Եթե ​​դուք այնպիսի տպավորություն էիք, որ ավելի լավ է դառնալ ML ինժեներ՝ նախ աշխատելով որպես backend-ի ծրագրավորող, դա ճիշտ չէ: Միևնույն SAD-ում գրանցվելն առանց ծառայությունների զարգացման իրական փորձի, սովորելու և շուկայում չափազանց պահանջված դառնալը հիանալի տարբերակ է: Yandex-ի շատ մասնագետներ այս կերպ հայտնվեցին իրենց ներկայիս պաշտոններում։ Եթե ​​որևէ ընկերություն պատրաստ է ձեզ աշխատանք առաջարկել ML ոլորտում ուսումն ավարտելուց անմիջապես հետո, հավանաբար դուք նույնպես պետք է ընդունեք առաջարկը: Փորձեք լավ թիմ մտնել փորձառու մենթորի հետ և պատրաստվեք շատ բան սովորել:

Ի՞նչն է սովորաբար խանգարում ձեզ ML անել:

Եթե ​​backender-ը ձգտում է դառնալ ML ինժեներ, նա կարող է ընտրել զարգացման երկու ոլորտներից՝ առանց հաշվի առնելու ռեզիդենտության ծրագիրը:

Նախ, սովորեք որպես ինչ-որ կրթական դասընթացի մաս: Դասերը Coursera-ն ձեզ ավելի կմոտեցնի հիմնական տեխնիկան հասկանալուն, բայց մասնագիտության մեջ բավականաչափ խորասուզվելու համար հարկավոր է շատ ավելի շատ ժամանակ հատկացնել դրան: Օրինակ՝ ավարտել ՇԱԴ-ը։ Տարիների ընթացքում ShAD-ն ուներ տարբեր թվով դասընթացներ ուղղակիորեն մեքենայական ուսուցման վերաբերյալ՝ միջինը մոտ ութ: Դրանցից յուրաքանչյուրն իսկապես կարևոր և օգտակար է, այդ թվում՝ շրջանավարտների կարծիքով։ 

Երկրորդ, դուք կարող եք մասնակցել մարտական ​​​​նախագծերին, որտեղ դուք պետք է իրականացնեք այս կամ այն ​​ML ալգորիթմը: Այնուամենայնիվ, ՏՏ զարգացման շուկայում նման նախագծերը շատ քիչ են. մեքենայական ուսուցումը չի օգտագործվում առաջադրանքների մեծ մասում: Նույնիսկ այն բանկերում, որոնք ակտիվորեն ուսումնասիրում են ՓԼ-ի հետ կապված հնարավորությունները, միայն մի քանիսն են զբաղվում տվյալների վերլուծությամբ: Եթե ​​չկարողացաք միանալ այս թիմերից մեկին, ձեր միակ տարբերակը կամ սկսել ձեր սեփական նախագիծը (որտեղ, ամենայն հավանականությամբ, դուք ինքներդ կսահմանեք վերջնաժամկետները, և դա քիչ առնչություն ունի մարտական ​​արտադրության առաջադրանքների հետ), կամ սկսել մրցել։ Kaggle.

Իրոք, միավորվեք համայնքի այլ անդամների հետ և փորձեք ինքներդ ձեզ մրցույթներում համեմատաբար հեշտ - հատկապես, եթե դուք կրկնօրինակում եք ձեր հմտությունները վերապատրաստման և Coursera-ում նշված դասընթացների միջոցով: Յուրաքանչյուր մրցույթ ունի վերջնաժամկետ՝ այն ձեզ համար խթան կհանդիսանա և ձեզ կնախապատրաստի ՏՏ ընկերություններում նմանատիպ համակարգին: Սա լավ միջոց է, որը, սակայն, նույնպես մի փոքր բաժանված է իրական գործընթացներից։ Kaggle-ում ձեզ տրվում են նախապես մշակված, թեև ոչ միշտ կատարյալ տվյալներ. մի առաջարկեք մտածել ապրանքի ներդրման մասին. եւ որ ամենակարեւորն է, դրանք արտադրության համար հարմար լուծումներ չեն պահանջում։ Ձեր ալգորիթմները, հավանաբար, կաշխատեն և շատ ճշգրիտ կլինեն, բայց ձեր մոդելներն ու կոդը նման կլինեն Ֆրանկենշտեյնին, որոնք կարված են տարբեր մասերից. արտադրական նախագծում ամբողջ կառուցվածքը կաշխատի չափազանց դանդաղ, դժվար կլինի թարմացնել և ընդլայնել (օրինակ. լեզվի և ձայնի ալգորիթմները միշտ մասամբ կվերագրվեն, երբ լեզուն զարգանա): Ընկերություններին հետաքրքրում է, որ թվարկված աշխատանքը կարող է անել ոչ միայն դուք ինքներդ (պարզ է, որ դուք՝ որպես լուծման հեղինակ, կարող եք դա անել), այլ նաև ձեր գործընկերներից որևէ մեկը։ Քննարկվում է սպորտի և արդյունաբերական ծրագրավորման տարբերությունը շատև Քագլը կրթում է հենց «մարզիկներին», նույնիսկ եթե դա շատ լավ է անում՝ թույլ տալով նրանց որոշակի փորձ ձեռք բերել:

Ես նկարագրեցի զարգացման երկու հնարավոր գիծ՝ վերապատրաստում կրթական ծրագրերի միջոցով և ուսուցում «մարտական», օրինակ՝ Kaggle-ում: Կացության ծրագիրը այս երկու մեթոդների համակցությունն է: Ձեզ սպասում են դասախոսություններ և սեմինարներ ՇԱԴ մակարդակով, ինչպես նաև իսկապես մարտական ​​նախագծեր:

Source: www.habr.com

Добавить комментарий