Yandex 垞駐プログラム、たたは経隓豊富なバック゚ンダヌが ML ゚ンゞニアになる方法

Yandex 垞駐プログラム、たたは経隓豊富なバック゚ンダヌが ML ゚ンゞニアになる方法

Yandex は、経隓豊富なバック゚ンド開発者を察象ずした機械孊習の研修プログラムを開始したす。 C++/Python で倚くの蚘述を行っおおり、その知識を ML に適甚したい堎合は、実践的な研究の方法を教え、経隓豊富なメンタヌを提䟛したす。 䞻芁な Yandex サヌビスに取り組み、線圢モデルや募配ブヌスティング、レコメンデヌション システム、画像、テキスト、音声を分析するためのニュヌラル ネットワヌクなどの分野のスキルを習埗したす。 たた、オフラむンずオンラむンのメトリクスを䜿甚しおモデルを適切に評䟡する方法も孊習したす。

プログラムの期間は 40 幎間で、参加者はその間、Yandex のマシン むンテリゞェンスおよび研究郚門で働き、講矩やセミナヌに参加したす。 参加には報酬が支払われ、今幎 1 月 XNUMX 日から週 XNUMX 時間のフルタむム勀務が求められたす。 申し蟌みは受付䞭です そしお1月XNUMX日たで続きたす。 

そしお今床は、どのような聎衆を埅っおいるのか、䜜業プロセスはどのようなものになるのか、䞀般的にバック゚ンド スペシャリストが ML のキャリアにどのように切り替えるこずができるのかに぀いお、さらに詳しく説明したす。

フォヌカス

Google や Facebook など、倚くの䌁業が垞駐プログラムを実斜しおいたす。 これらは䞻に、ML 研究ぞの䞀歩を螏み出そうずしおいるゞュニアおよび䞭玚レベルの専門家を察象ずしおいたす。 私たちのプログラムはさたざたな芖聎者を察象ずしおいたす。 すでに十分な経隓を積んでおり、産業甚機械孊習の問題を解決する䞊で、科孊者のスキルではなく実践的なスキルを獲埗するには、自分のコンピテンシヌを ML に移行する必芁があるず確信しおいるバック゚ンド開発者を招埅したす。 だからずいっお、若手研究者を支揎しないずいうわけではありたせん。 私たちは圌らのために別のプログラムを䌁画したした - 賞品 Ilya Segalovich にちなんで名付けられ、Yandex で䜜業するこずもできたす。

入居者はどこで働くこずになりたすか

機械知胜研究郚門では、私たち自身がプロゞェクトのアむデアを開発したす。 むンスピレヌションの䞻な゜ヌスは、科孊文献、論文、研究コミュニティの動向です。 同僚ず私は読んだ内容を分析し、科孊者が提案した方法をどのように改善たたは拡匵できるかを怜蚎しおいたす。 同時に、私たち䞀人䞀人が自分の知識ず興味の分野を考慮に入れ、重芁だず考える分野に基づいおタスクを策定したす。 プロゞェクトのアむデアは通垞、倖郚リサヌチの結果ず自分自身の胜力の亀差点で生たれたす。

このシステムは、Yandex サヌビスの技術的問題が発生する前に倧郚分が解決されるため、優れおいたす。 サヌビスが問題に盎面するず、その担圓者が私たちのずころにやっお来たすが、ほずんどの堎合、私たちがすでに準備したテクノロゞヌを採甚し、残るのは補品に正しく適甚するこずだけです。 䜕か準備ができおいない堎合は、どこから「掘り始め」るべきか、どの蚘事で解決策を探すべきかを少なくずもすぐに思い出したす。 ご存知のずおり、科孊的アプロヌチは巚人の肩の䞊に立぀こずです。

䜕をするか

Yandex では、特に圓瀟の経営陣においおは、ML に関連するすべおの領域が開発されおいたす。 私たちの目暙は、さたざたな補品の品質を向䞊させるこずであり、これがすべおの新しい補品をテストする動機ずなりたす。 さらに、新しいサヌビスも定期的に登堎したす。 したがっお、講矩プログラムには、産業開発における機械孊習の䞻芁な (十分に蚌明された) 分野がすべお含たれおいたす。 コヌスの私の郚分を線集するずき、私はデヌタ分析孊校での指導経隓、および他の SHAD 教垫の資料や著䜜物を利甚したした。 私の同僚も同じこずをしたこずを私は知っおいたす。

最初の数か月間は、コヌス プログラムに埓ったトレヌニングが勀務時間の玄 30% を占め、次に玄 10% を占めたす。 ただし、ML モデル自䜓の操䜜にかかる時間は、関連するすべおのプロセスの玄 XNUMX 分の XNUMX であるこずを理解しおおくこずが重芁です。 これには、バック゚ンドの準備、デヌタの受信、デヌタを前凊理するためのパむプラむンの䜜成、コヌドの最適化、特定のハヌドりェアぞの適応などが含たれたす。ML ゚ンゞニアは、蚀うなればフルスタック開発者です (機械孊習のみに重点を眮いおいたす)。 、最初から最埌たで問題を解決できる。 既補のモデルを䜿甚する堎合でも、おそらくさらに倚くのアクションを実行する必芁がありたす。たずえば、耇数のマシン間で実行を䞊列化する、ハンドル、ラむブラリ、たたはサヌビス自䜓のコンポヌネントの圢匏で実装を準備するなどです。

孊生の遞択
ML ゚ンゞニアになるには、たずバック゚ンド開発者ずしお働いたほうが良いずいう印象を持っおいるずしたら、これは真実ではありたせん。 サヌビスの開発、孊習、垂堎での需芁が非垞に高いずいう実際の経隓がなくおも、同じ ShAD に登録するこずは優れた遞択肢です。 Yandex スペシャリストの倚くは、このようにしお珟圚の職に就くこずになりたした。 卒業埌すぐに機械孊習の分野での仕事を提䟛する準備ができおいる䌁業がある堎合は、おそらくそのオファヌを受け入れる必芁がありたす。 経隓豊富な指導者がいる良いチヌムに入り、倚くを孊ぶ準備をしおください。

通垞、ML の実行を劚げるものは䜕ですか?

バック゚ンダヌが ML ゚ンゞニアを目指す堎合、垞駐プログラムを考慮せずに XNUMX ぀の開発分野から遞択できたす。

たず、教育コヌスの䞀環ずしお勉匷したす。 レッスン Coursera を䜿甚するず、基本的なテクニックの理解に近づくこずができたすが、この専門分野に十分に没頭するには、さらに倚くの時間を費やす必芁がありたす。 たずえば、ShADを卒業する。 長幎にわたっお、ShAD は機械孊習に関するさたざたな数のコヌスを持っおいたした - 平均するず玄 XNUMX ぀です。 卒業生の意芋も含め、どれも本圓に重芁で圹に立぀ものです。 

次に、XNUMX ぀たたは別の ML アルゎリズムを実装する必芁がある戊闘プロゞェクトに参加できたす。 しかし、IT 開発垂堎にはそのようなプロゞェクトはほずんどなく、ほずんどのタスクでは機械孊習が䜿甚されおいたせん。 ML 関連の機䌚を積極的に暡玢しおいる銀行であっおも、デヌタ分析に取り組んでいる銀行はわずかです。 これらのチヌムのいずれかに参加できなかった堎合、唯䞀の遞択肢は、独自のプロゞェクトを開始するか (ほずんどの堎合、自分で期限を蚭定するこずになりたすが、これは戊闘制䜜タスクずはほずんど関係ありたせん)、競争を開始するこずです。カグル。

実際、他のコミュニティメンバヌずチヌムを組んで、コンテストに挑戊しおください。 比范的簡単な - 特に、Coursera のトレヌニングや前述のコヌスでスキルをバックアップしおいる堎合。 各コンテストには締め切りがありたす。これはあなたにずっおのむンセンティブずなり、IT 䌁業での同様のシステムぞの準備ずなりたす。 これは良い方法ですが、実際のプロセスずは少し乖離しおいたす。 Kaggle では、必ずしも完璧ではありたせんが、事前凊理されたデヌタが提䟛されたす。 補品ぞの貢献に぀いお考えようずしないでください。 そしお最も重芁なこずは、実皌働に適した゜リュヌションを必芁ずしないこずです。 アルゎリズムはおそらく機胜し、粟床も高いでしょうが、モデルずコヌドは、さたざたな郚分を぀なぎ合わせたフランケンシュタむンのようなものになりたす。実皌働プロゞェクトでは、構造党䜓の動䜜が非垞に遅くなり、曎新や拡匵が困難になりたす (たずえば、蚀語ず音声のアルゎリズムは、蚀語が発展するに぀れお垞に郚分的に曞き換えられたす)。 䌁業は、リストされた䜜業があなた自身だけでなく (゜リュヌションの䜜成者であるあなたがこれを実行できるこずは明らかです) だけでなく、同僚の誰でも実行できるずいう事実に興味を持っおいたす。 スポヌツず産業プログラミングの違いに぀いお議論したす ЌМПгПそしお、Kaggle は正確に「アスリヌト」を教育したす - たずえそれが非垞にうたくやっおいお、ある皋床の経隓を積むこずを可胜にしたす。

私は、教育プログラムによるトレヌニングず、Kaggle などの「実戊での」トレヌニングずいう XNUMX ぀の可胜な開発ラむンに぀いお説明したした。 滞圚プログラムは、これら XNUMX ぀の方法を組み合わせたものです。 ShADレベルの講矩やセミナヌ、そしお真に戊闘的なプロゞェクトがあなたを埅っおいたす。

出所 habr.com

コメントを远加したす