Yandex Yerleşik Programı veya Deneyimli Bir Destekleyici Nasıl ML Mühendisi Olabilir?

Yandex Yerleşik Programı veya Deneyimli Bir Destekleyici Nasıl ML Mühendisi Olabilir?

Yandex, deneyimli arka uç geliştiricileri için makine öğrenimi alanında bir uzmanlık programı açıyor. C++/Python'da çok şey yazdıysanız ve bu bilgiyi makine öğrenimine uygulamak istiyorsanız, o zaman size nasıl pratik araştırma yapacağınızı ve deneyimli mentorlar sağlayacağınızı öğreteceğiz. Temel Yandex hizmetleri üzerinde çalışacak ve doğrusal modeller ve gradyan artırma, öneri sistemleri, görüntü, metin ve ses analizine yönelik sinir ağları gibi alanlarda beceriler kazanacaksınız. Ayrıca, çevrimdışı ve çevrimiçi metrikleri kullanarak modellerinizi nasıl doğru şekilde değerlendireceğinizi de öğreneceksiniz.

Programın süresi bir yıl olup, katılımcılar Yandex'in makine zekası ve araştırma departmanında çalışacak, ders ve seminerlere katılacaklardır. Katılım ücretlidir ve tam zamanlı çalışmayı içerir: Bu yılın 40 Temmuz'undan itibaren haftada 1 saat. Başvurular açıldı ve 1 Mayıs'a kadar sürecek. 

Ve şimdi daha ayrıntılı olarak - ne tür bir izleyici kitlesini beklediğimiz, iş sürecinin ne olacağı ve genel olarak bir arka uç uzmanının makine öğrenimi alanında bir kariyere nasıl geçebileceği hakkında.

yön

Google ve Facebook gibi pek çok şirketin İkamet Programları vardır. Çoğunlukla makine öğrenimi araştırmalarına doğru bir adım atmaya çalışan genç ve orta düzey uzmanları hedef alıyorlar. Programımız farklı bir kitleye yöneliktir. Halihazırda yeterli deneyim kazanmış olan ve endüstriyel makine öğrenimi sorunlarını çözmede bir bilim insanının becerilerini değil, pratik beceriler kazanmak için yetkinliklerinde makine öğrenimine geçmeleri gerektiğinden emin olan arka uç geliştiricilerini davet ediyoruz. Bu genç araştırmacıları desteklemediğimiz anlamına gelmiyor. Onlar için ayrı bir program düzenledik. ödül Adını Yandex'de çalışmanıza da olanak tanıyan Ilya Segalovich'ten alıyor.

Vatandaş nerede çalışacak?

Makine Zekası ve Araştırma Departmanında proje fikirlerini kendimiz geliştiriyoruz. İlhamın ana kaynağı bilimsel literatür, makaleler ve araştırma topluluğundaki eğilimlerdir. Meslektaşlarım ve ben okuduklarımızı analiz ederek bilim adamlarının önerdiği yöntemleri nasıl geliştirebileceğimize veya genişletebileceğimize bakıyoruz. Aynı zamanda her birimiz kendi bilgi ve ilgi alanlarını dikkate alır, önemli olduğunu düşündüğü alanlara göre görevi formüle eder. Bir proje fikri genellikle dış araştırma sonuçlarının ve kişinin kendi yetkinliklerinin kesişiminden doğar.

Bu sistem iyidir çünkü Yandex hizmetlerinin teknolojik sorunlarını daha ortaya çıkmadan büyük ölçüde çözmektedir. Bir hizmet bir sorunla karşılaştığında temsilcileri bize gelir ve büyük olasılıkla hazırladığımız teknolojileri alır ve geriye kalan tek şey üründe doğru şekilde uygulanmasıdır. Bir şey hazır değilse, en azından nerede “kazmaya başlayabileceğimizi” ve hangi makalelerde çözüm arayacağımızı hızlı bir şekilde hatırlayacağız. Bildiğimiz gibi bilimsel yaklaşım devlerin omuzlarında durmaktır.

Ne yapalım

Yandex'de ve hatta özellikle bizim yönetimimizde, makine öğreniminin ilgili tüm alanları geliştirilmektedir. Amacımız geniş bir ürün yelpazesinin kalitesini artırmaktır ve bu, yeni olan her şeyi test etme konusunda bir teşvik görevi görür. Ayrıca düzenli olarak yeni hizmetler ortaya çıkıyor. Dolayısıyla ders programı, endüstriyel gelişimde makine öğreniminin tüm önemli (kanıtlanmış) alanlarını içerir. Kursun bana düşen kısmını derlerken, Veri Analizi Okulu'ndaki öğretim deneyimimin yanı sıra diğer SHAD öğretmenlerinin materyallerinden ve çalışmalarından yararlandım. Meslektaşlarımın da aynısını yaptığını biliyorum.

İlk aylarda kurs programına göre eğitim çalışma sürenizin yaklaşık %30'unu, daha sonra ise yaklaşık %10'unu oluşturacaktır. Ancak, ML modelleriyle çalışmanın, ilgili tüm süreçlerden yaklaşık dört kat daha az zaman almaya devam edeceğini anlamak önemlidir. Bunlar arasında arka ucun hazırlanması, veri alınması, ön işleme için bir işlem hattı yazılması, kodun optimize edilmesi, belirli donanıma uyum sağlanması vb. yer alır. Bir makine öğrenimi mühendisi, isterseniz tam kapsamlı bir geliştiricidir (yalnızca makine öğrenimine daha fazla vurgu yapan) Bir sorunu baştan sona çözebilme yeteneğine sahip. Hazır bir modelle bile, muhtemelen birkaç eylem daha yapmanız gerekecektir: yürütmesini birkaç makinede paralel hale getirin, bir tanıtıcı, kitaplık veya hizmetin bileşenleri biçiminde bir uygulama hazırlayın.

Öğrenci seçimi
Önce arka uç geliştiricisi olarak çalışarak makine öğrenimi mühendisi olmanın daha iyi olduğu izlenimine kapıldıysanız, bu doğru değil. Hizmetleri geliştirme, öğrenme ve piyasada son derece talep görme konusunda gerçek bir deneyime sahip olmadan aynı ShAD'ye kaydolmak mükemmel bir seçenektir. Pek çok Yandex uzmanı bu şekilde mevcut pozisyonlarına geldi. Mezun olduktan hemen sonra herhangi bir şirket size makine öğrenimi alanında iş teklif etmeye hazırsa, muhtemelen siz de bu teklifi kabul etmelisiniz. Deneyimli bir mentorla iyi bir takıma girmeye çalışın ve çok şey öğrenmeye hazırlanın.

Makine öğrenimi yapmanızı genellikle engelleyen şey nedir?

Eğer bir destekçi makine öğrenimi mühendisi olmayı arzuluyorsa, uzmanlık programını hesaba katmadan iki gelişim alanı arasından seçim yapabilir.

İlk olarak, bazı eğitim kurslarının bir parçası olarak çalışın. Dersler Coursera sizi temel teknikleri anlamaya daha da yaklaştıracak, ancak kendinizi mesleğe yeterince kaptırmak için ona çok daha fazla zaman ayırmanız gerekiyor. Örneğin ShAD'den mezun olun. Yıllar geçtikçe, ShAD'ın doğrudan makine öğrenimi üzerine farklı sayıda kursu vardı; ortalama olarak yaklaşık sekiz. Mezunların görüşü de dahil olmak üzere her biri gerçekten önemli ve faydalıdır. 

İkincisi, şu veya bu ML algoritmasını uygulamanız gereken savaş projelerinde yer alabilirsiniz. Ancak BT geliştirme pazarında bu türden çok az proje var: çoğu görevde makine öğrenimi kullanılmıyor. Makine öğrenimiyle ilgili fırsatları aktif olarak araştıran bankalarda bile yalnızca birkaçı veri analiziyle ilgileniyor. Bu ekiplerden birine katılamadıysanız, tek seçeneğiniz ya kendi projenizi başlatmak (burada büyük olasılıkla kendi son tarihlerinizi belirleyeceksiniz ve bunun savaş üretim görevleriyle pek ilgisi yok) ya da yarışmaya başlamaktır. Kaggle.

Gerçekten de diğer topluluk üyeleriyle takım kurun ve yarışmalarda kendinizi deneyin nispeten kolay - özellikle de becerilerinizi Coursera'da eğitim ve bahsedilen kurslarla desteklerseniz. Her yarışmanın bir son tarihi vardır; bu sizin için bir teşvik görevi görecek ve sizi BT şirketlerindeki benzer bir sisteme hazırlayacaktır. Bu iyi bir yoldur - ancak aynı zamanda gerçek süreçlerden de biraz farklıdır. Kaggle'da size her zaman mükemmel olmasa da önceden işlenmiş veriler verilir; ürüne katkıyı düşünmeyi teklif etmeyin; ve en önemlisi üretime uygun çözümlere ihtiyaç duymazlar. Algoritmalarınız muhtemelen çalışacak ve son derece doğru olacaktır, ancak modelleriniz ve kodunuz farklı parçalardan birleştirilmiş Frankenstein gibi olacaktır - bir üretim projesinde tüm yapı çok yavaş çalışacak, güncellenmesi ve genişletilmesi zor olacaktır (örneğin, dil ve ses algoritmaları, dil geliştikçe her zaman kısmen yeniden yazılacaktır). Şirketler, listelenen işin yalnızca sizin tarafınızdan değil (çözümün yazarı olarak bunu yapabileceğiniz açıktır) aynı zamanda meslektaşlarınızdan herhangi biri tarafından da yapılabileceği gerçeğiyle ilgilenmektedir. Spor ve endüstriyel programlama arasındaki fark tartışılıyor çokve Kaggle tam olarak "sporcuları" eğitiyor - bunu çok iyi yapsa ve onların biraz deneyim kazanmalarına izin verse bile.

İki olası gelişim hattını tanımladım - eğitim programları aracılığıyla eğitim ve örneğin Kaggle'da "savaşta" eğitim. İhtisas programı bu iki yöntemin birleşimidir. ShAD düzeyinde dersler ve seminerlerin yanı sıra gerçekten mücadeleci projeler sizi bekliyor.

Kaynak: habr.com

Yorum ekle