Program Warga Yandex, utawa Kepiye Backender sing Berpengalaman Bisa Dadi Insinyur ML

Program Warga Yandex, utawa Kepiye Backender sing Berpengalaman Bisa Dadi Insinyur ML

Yandex mbukak program residensi ing machine learning kanggo pangembang backend sing berpengalaman. Yen sampeyan wis nulis akeh ing C ++ / Python lan pengin aplikasi kawruh iki kanggo ML, banjur kita bakal mulang sampeyan carane nindakake riset praktis lan nyedhiyani mentor experienced. Sampeyan bakal nggarap layanan Yandex kunci lan entuk katrampilan ing wilayah kayata model linear lan peningkatan kecerunan, sistem rekomendasi, jaringan saraf kanggo nganalisa gambar, teks lan swara. Sampeyan uga bakal sinau babagan cara ngevaluasi model kanthi bener nggunakake metrik offline lan online.

Durasi program kasebut setaun, sajrone para peserta bakal kerja ing departemen intelijen mesin lan riset Yandex, uga melu kuliah lan seminar. Partisipasi dibayar lan kalebu kerja full-time: 40 jam saben minggu, wiwit tanggal 1 Juli taun iki. Aplikasi saiki mbukak lan bakal tetep nganti 1 Mei. 

Lan saiki luwih rinci - babagan pamirsa apa sing kita tunggu, apa proses kerja lan, umume, kepiye spesialis back-end bisa ngalih menyang karir ing ML.

Fokus

Akeh perusahaan duwe Program Residensi, kalebu, contone, Google lan Facebook. Utamane ditujokake kanggo spesialis tingkat junior lan pertengahan sing nyoba njupuk langkah menyang riset ML. Program kita kanggo pamirsa sing beda. Kita ngajak pangembang backend sing wis entuk pengalaman sing cukup lan ngerti manawa ing kompetensi dheweke kudu pindhah menyang ML, kanggo entuk katrampilan praktis - lan dudu katrampilan ilmuwan - kanggo ngrampungake masalah pembelajaran mesin industri. Iki ora ateges kita ora ndhukung peneliti enom. Kita wis ngatur program kapisah kanggo wong-wong mau - premium dijenengi sawise Ilya Segalovich, sing uga ngidini sampeyan bisa kerja ing Yandex.

Ing endi warga bakal kerja?

Ing Departemen Intelijen lan Riset Mesin, kita dhewe ngembangake ide proyek. Sumber inspirasi utama yaiku sastra ilmiah, artikel, lan tren ing komunitas riset. Aku lan kanca-kanca nganalisa apa sing diwaca, ndeleng kepiye carane bisa nambah utawa nggedhekake metode sing diusulake para ilmuwan. Ing wektu sing padha, saben kita nganggep wilayah kawruh lan kapentingan, ngrumusake tugas adhedhasar wilayah sing dianggep penting. Gagasan kanggo proyek biasane lair ing persimpangan asil riset eksternal lan kompetensi dhewe.

Sistem iki apik amarga umume ngatasi masalah teknologi layanan Yandex sanajan sadurunge muncul. Nalika layanan ngadhepi masalah, wakil-wakile teka menyang kita, paling kamungkinan kanggo njupuk teknologi sing wis disiapake, sing isih kudu ditrapake kanthi bener ing produk kasebut. Yen ana sing durung siyap, paling ora bakal cepet-cepet ngelingi ing ngendi kita bisa "miwiti ngeduk" lan artikel sing kudu golek solusi. Kaya sing kita ngerteni, pendekatan ilmiah yaiku ngadeg ing pundhak raksasa.

Apa sing kudu ditindakake

Ing Yandex - lan malah khusus ing manajemen kita - kabeh wilayah ML sing relevan dikembangake. Tujuane yaiku ningkatake kualitas macem-macem produk, lan iki minangka insentif kanggo nyoba kabeh sing anyar. Kajaba iku, layanan anyar katon ajeg. Dadi program kuliah ngemot kabeh area kunci (kabuktian) mesin learning ing pangembangan industri. Nalika nyusun bagean kursus, aku nggunakake pengalaman mulang ing Sekolah Analisis Data, uga materi lan karya guru SHAD liyane. Aku ngerti yen kanca-kancaku uga nindakake perkara sing padha.

Ing sasi kapisan, latihan miturut program kursus bakal kira-kira 30% wektu kerja sampeyan, banjur udakara 10%. Nanging, penting kanggo ngerti manawa nggarap model ML dhewe bakal terus njupuk kira-kira kaping papat kurang saka kabeh proses sing ana gandhengane. Iki kalebu nyiapake backend, nampa data, nulis pipa kanggo preprocessing, ngoptimalake kode, adaptasi karo hardware tartamtu, lan sapiturute. Insinyur ML, yen sampeyan seneng, pangembang full-stack (mung luwih fokus ing machine learning). , bisa ngatasi masalah saka wiwitan nganti rampung. Malah karo model siap-digawe, sampeyan mbokmenawa kudu nindakake sawetara tumindak liyane: parallelize eksekusi ing sawetara mesin, nyiapake implementasine ing wangun gagang, perpustakaan, utawa komponen saka layanan dhewe.

Pilihan siswa
Yen sampeyan duwe kesan yen luwih becik dadi insinyur ML kanthi kerja dadi pangembang backend, iki ora bener. Ndhaptar ing ShAD sing padha tanpa pengalaman nyata ing ngembangake layanan, sinau lan dadi dikarepake ing pasar minangka pilihan sing apik. Akeh spesialis Yandex rampung ing posisi saiki kanthi cara iki. Yen ana perusahaan sing siap nawarake sampeyan kerja ing bidang ML sanalika sawise lulus, sampeyan uga kudu nampa tawaran kasebut. Coba mlebu tim sing apik karo mentor sing berpengalaman lan siyap sinau akeh.

Apa sing biasane ngalangi sampeyan nindakake ML?

Yen backender kepengin dadi insinyur ML, dheweke bisa milih saka rong wilayah pembangunan - tanpa njupuk program residensi.

Kaping pisanan, sinau minangka bagean saka sawetara kursus pendidikan. Pawulangan Coursera bakal nyedhaki sampeyan ngerti teknik dhasar, nanging kanggo nyemplungake profesi kasebut kanthi cukup, sampeyan kudu nyawisake wektu luwih akeh. Contone, lulusan saka ShAD. Sajrone pirang-pirang taun, ShAD duwe macem-macem kursus langsung babagan pembelajaran mesin - rata-rata, udakara wolung. Saben wong pancen penting lan migunani, kalebu ing pendapat lulusan. 

Kapindho, sampeyan bisa njupuk bagΓ©yan ing proyek pertempuran ngendi sampeyan kudu ngleksanakake siji utawa algoritma ML liyane. Nanging, ana sawetara proyek kasebut ing pasar pangembangan IT: sinau mesin ora digunakake ing umume tugas. Malah ing bank-bank sing aktif njelajah kesempatan sing gegandhengan karo ML, mung sawetara sing melu analisis data. Yen sampeyan ora bisa melu salah siji saka tim iki, siji-sijine pilihan kanggo miwiti proyek dhewe (ing ngendi, paling kamungkinan, sampeyan bakal nyetel tenggat wektu dhewe, lan iki ora ana hubungane karo tugas produksi pertempuran), utawa miwiti saingan ing. Kaggle.

Pancen, gabung karo anggota komunitas liyane lan coba dhewe ing kompetisi relatif gampang - utamane yen sampeyan nggawe serep katrampilan kanthi latihan lan kursus sing kasebut ing Coursera. Saben kompetisi duwe tenggat wektu - bakal dadi insentif kanggo sampeyan lan nyiapake sampeyan kanggo sistem sing padha ing perusahaan IT. Iki minangka cara sing apik - sing, nanging uga rada pegatan saka proses nyata. Ing Kaggle sampeyan diwenehi data sing wis diproses, sanajan ora mesthi sampurna; aja nawarake kanggo mikir babagan kontribusi kanggo produk; lan sing paling penting, dheweke ora mbutuhake solusi sing cocog kanggo produksi. Algoritma sampeyan mbokmenawa bakal bisa lan akurat banget, nanging model lan kode sampeyan bakal kaya Frankenstein sing digabung saka macem-macem bagean - ing proyek produksi, kabeh struktur bakal mlaku alon-alon, bakal angel nganyari lan nggedhekake (contone, Algoritma basa lan swara bakal tansah sebagian ditulis maneh nalika basa berkembang). Perusahaan kasengsem ing kasunyatan manawa karya sing kadhaptar bisa ditindakake ora mung sampeyan dhewe (jelas yen sampeyan, minangka penulis solusi, bisa nindakake iki), nanging uga dening kanca-kanca. Bedane olahraga lan program industri dibahas ΠΌΠ½ΠΎΠ³ΠΎ, lan Kaggle ngajari kanthi tepat "atlit" - sanajan nindakake kanthi apik, ngidini dheweke entuk pengalaman.

Aku nerangake rong baris pangembangan - latihan liwat program pendidikan lan latihan "ing pertempuran", contone ing Kaggle. Program residensi minangka kombinasi saka rong cara kasebut. Kuliah lan seminar ing tingkat ShAD, uga proyèk-proyèk tenan combative, nunggu sampeyan.

Source: www.habr.com

Add a comment