برنامج Yandex المقيم، أو كيف يمكن أن يصبح أحد المساعدين ذوي الخبرة مهندسًا لتعلم الآلة

برنامج Yandex المقيم، أو كيف يمكن أن يصبح أحد المساعدين ذوي الخبرة مهندسًا لتعلم الآلة

تفتتح Yandex برنامج إقامة في التعلم الآلي لمطوري الواجهة الخلفية ذوي الخبرة. إذا كنت قد كتبت الكثير بلغة C++/Python وترغب في تطبيق هذه المعرفة على تعلم الآلة، فسنعلمك كيفية إجراء بحث عملي وتوفير مرشدين ذوي خبرة. ستعمل على خدمات Yandex الرئيسية وستكتسب مهارات في مجالات مثل النماذج الخطية وتعزيز التدرج وأنظمة التوصية والشبكات العصبية لتحليل الصور والنصوص والصوت. سوف تتعلم أيضًا كيفية تقييم نماذجك بشكل صحيح باستخدام المقاييس عبر الإنترنت وغير متصل.

مدة البرنامج سنة واحدة، سيعمل خلالها المشاركون في قسم الذكاء الآلي والأبحاث في ياندكس، بالإضافة إلى حضور المحاضرات والندوات. المشاركة مدفوعة الأجر وتتضمن العمل بدوام كامل: 40 ساعة في الأسبوع، بدءًا من 1 يوليو من هذا العام. التطبيقات مفتوحة الآن ويستمر حتى 1 مايو. 

والآن بمزيد من التفاصيل - حول نوع الجمهور الذي ننتظره، وما هي عملية العمل، وبشكل عام، كيف يمكن لأخصائي الواجهة الخلفية التحول إلى مهنة في ML.

الاتجاهية

لدى العديد من الشركات برامج إقامة، بما في ذلك، على سبيل المثال، Google وFacebook. وهي تستهدف بشكل أساسي المتخصصين المبتدئين والمتوسطين الذين يحاولون اتخاذ خطوة نحو أبحاث تعلم الآلة. برنامجنا مخصص لجمهور مختلف. نحن ندعو مطوري الواجهة الخلفية الذين اكتسبوا بالفعل خبرة كافية ويعرفون على وجه اليقين أنه في كفاءاتهم يحتاجون إلى التحول نحو تعلم الآلة، لاكتساب مهارات عملية - وليس مهارات العلماء - في حل مشكلات تعلم الآلة الصناعية. وهذا لا يعني أننا لا ندعم الباحثين الشباب. لقد قمنا بتنظيم برنامج منفصل لهم - جائزة يحمل اسم Ilya Segalovich، والذي يسمح لك أيضًا بالعمل في Yandex.

أين سيعمل المقيم؟

في قسم الذكاء الآلي والأبحاث، نقوم بأنفسنا بتطوير أفكار المشاريع. المصدر الرئيسي للإلهام هو المؤلفات العلمية والمقالات والاتجاهات في مجتمع البحث. أقوم أنا وزملائي بتحليل ما نقرأه، ونبحث في كيفية تحسين أو توسيع الأساليب التي يقترحها العلماء. وفي الوقت نفسه، يأخذ كل واحد منا في الاعتبار مجال معارفه واهتماماته، ويصوغ المهمة بناءً على المجالات التي يعتبرها مهمة. عادةً ما تولد فكرة المشروع عند تقاطع نتائج البحث الخارجي مع كفاءات الفرد.

يعد هذا النظام جيدًا لأنه يحل إلى حد كبير المشكلات التكنولوجية لخدمات Yandex حتى قبل ظهورها. عندما تواجه خدمة ما مشكلة ما، يأتي ممثلوها إلينا، ومن المرجح أن يأخذوا التقنيات التي أعددناها بالفعل، والتي لا يزال يتعين تطبيقها بشكل صحيح في المنتج. إذا لم يكن هناك شيء جاهز، فسوف نتذكر بسرعة على الأقل أين يمكننا "البدء في الحفر" وفي أي المقالات يجب البحث عن حل. وكما نعلم فإن المنهج العلمي هو الوقوف على أكتاف العمالقة.

ما يجب القيام به

في Yandex - وحتى في إدارتنا على وجه التحديد - يتم تطوير جميع المجالات ذات الصلة بتعلم الآلة. هدفنا هو تحسين جودة مجموعة واسعة من المنتجات، وهذا بمثابة حافز لاختبار كل ما هو جديد. وبالإضافة إلى ذلك، تظهر خدمات جديدة بانتظام. لذا فإن برنامج المحاضرة يحتوي على جميع المجالات الرئيسية (المثبتة) للتعلم الآلي في التنمية الصناعية. عند تجميع الجزء الخاص بي من الدورة، استخدمت خبرتي في التدريس في كلية تحليل البيانات، بالإضافة إلى المواد وعمل مدرسي SHAD الآخرين. أعلم أن زملائي فعلوا الشيء نفسه.

في الأشهر الأولى، سيشكل التدريب وفقًا لبرنامج الدورة حوالي 30٪ من وقت عملك، ثم حوالي 10٪. ومع ذلك، من المهم أن نفهم أن العمل مع نماذج تعلم الآلة نفسها سيستمر في العمل بمعدل أقل بأربع مرات تقريبًا من جميع العمليات المرتبطة بها. يتضمن ذلك إعداد الواجهة الخلفية، وتلقي البيانات، وكتابة مسار للمعالجة المسبقة لها، وتحسين التعليمات البرمجية، والتكيف مع أجهزة معينة، وما إلى ذلك. يعتبر مهندس تعلم الآلة، إذا أردت، مطورًا متكاملاً (فقط مع التركيز بشكل أكبر على التعلم الآلي) قادر على حل المشكلة من البداية إلى النهاية. حتى مع النموذج الجاهز، ربما ستحتاج إلى القيام بعدد من الإجراءات الإضافية: موازنة تنفيذه عبر عدة أجهزة، أو إعداد التنفيذ على شكل مقبض، أو مكتبة، أو مكونات الخدمة نفسها.

اختيار الطالب
إذا كان لديك انطباع بأنه من الأفضل أن تصبح مهندس تعلم الآلة من خلال العمل أولاً كمطور للواجهة الخلفية، فهذا غير صحيح. يعد التسجيل في نفس ShAD دون خبرة حقيقية في تطوير الخدمات والتعلم وزيادة الطلب عليها في السوق خيارًا ممتازًا. انتهى الأمر بالعديد من المتخصصين في Yandex إلى مناصبهم الحالية بهذه الطريقة. إذا كانت أي شركة مستعدة لتقدم لك وظيفة في مجال تعلم الآلة مباشرة بعد التخرج، فمن المحتمل أن تقبل العرض أيضًا. حاول الانضمام إلى فريق جيد مع مرشد ذي خبرة واستعد لتعلم الكثير.

ما الذي يمنعك عادة من القيام بتعلم الآلة؟

إذا كان أحد الداعمين يطمح إلى أن يصبح مهندس تعلم الآلة، فيمكنه الاختيار من بين مجالين للتطوير - دون مراعاة برنامج الإقامة.

أولا، الدراسة كجزء من بعض الدورات التعليمية. الدروس ستقربك كورسيرا من فهم التقنيات الأساسية، ولكن لتنغمس في المهنة إلى حد كافٍ، تحتاج إلى تخصيص المزيد من الوقت لها. على سبيل المثال، تخرج من SAD. على مر السنين، كان لدى ShAD عدد مختلف من الدورات التدريبية مباشرة حول التعلم الآلي - في المتوسط، حوالي ثمانية. كل واحد منهم مهم ومفيد حقا، بما في ذلك في رأي الخريجين. 

ثانيا، يمكنك المشاركة في المشاريع القتالية حيث تحتاج إلى تنفيذ خوارزمية ML واحدة أو أخرى. ومع ذلك، هناك عدد قليل جدًا من هذه المشاريع في سوق تطوير تكنولوجيا المعلومات: لا يتم استخدام التعلم الآلي في معظم المهام. حتى في البنوك التي تستكشف الفرص المتعلقة بتعلم الآلة بشكل فعال، لا يشارك سوى عدد قليل منها في تحليل البيانات. إذا لم تتمكن من الانضمام إلى أحد هذه الفرق، فإن خيارك الوحيد هو إما أن تبدأ مشروعك الخاص (حيث، على الأرجح، ستحدد المواعيد النهائية الخاصة بك، وهذا لا علاقة له بمهام الإنتاج القتالية)، أو البدء في المنافسة على كاجل.

في الواقع، تعاون مع أعضاء المجتمع الآخرين وجرب نفسك في المسابقات سهل نسبيا - خاصةً إذا كنت تدعم مهاراتك بالتدريب والدورات المذكورة على كورسيرا. لكل مسابقة موعد نهائي - سيكون بمثابة حافز لك وإعدادك لنظام مماثل في شركات تكنولوجيا المعلومات. هذه طريقة جيدة - ولكنها أيضًا منفصلة قليلاً عن العمليات الحقيقية. في Kaggle، يتم إعطاؤك بيانات تمت معالجتها مسبقًا، وإن لم تكن مثالية دائمًا؛ لا تعرض التفكير في المساهمة في المنتج؛ والأهم من ذلك أنها لا تتطلب حلولاً مناسبة للإنتاج. من المحتمل أن تعمل الخوارزميات الخاصة بك وتكون دقيقة للغاية، ولكن النماذج والتعليمات البرمجية الخاصة بك ستكون مثل فرانكنشتاين الذي تم تجميعه معًا من أجزاء مختلفة - في مشروع الإنتاج، ستعمل البنية بأكملها ببطء شديد، وسيكون من الصعب تحديثها وتوسيعها (على سبيل المثال، ستتم دائمًا إعادة كتابة خوارزميات اللغة والصوت جزئيًا مع تطور اللغة). تهتم الشركات بحقيقة أن العمل المدرج لا يمكن القيام به بنفسك فقط (من الواضح أنك تستطيع القيام بذلك بصفتك مؤلف الحل)، ولكن أيضًا بواسطة أي من زملائك. تمت مناقشة الفرق بين البرمجة الرياضية والصناعية كثير، وتقوم Kaggle بتعليم "الرياضيين" بدقة - حتى لو كانت تفعل ذلك بشكل جيد للغاية، مما يسمح لهم باكتساب بعض الخبرة.

لقد وصفت خطين محتملين للتطوير - التدريب من خلال البرامج التعليمية والتدريب "في القتال"، على سبيل المثال في Kaggle. برنامج الإقامة هو مزيج من هاتين الطريقتين. تنتظركم محاضرات وندوات على مستوى SAD، بالإضافة إلى مشاريع قتالية حقيقية.

المصدر: www.habr.com

إضافة تعليق