Yandex ريزيڊنٽ پروگرام، يا ڪيئن هڪ تجربيڪار پٺاڻ ايم ايل انجنيئر بڻجي سگهي ٿو

Yandex ريزيڊنٽ پروگرام، يا ڪيئن هڪ تجربيڪار پٺاڻ ايم ايل انجنيئر بڻجي سگهي ٿو

Yandex تجربيڪار پس منظر ڊولپرز لاءِ مشين لرننگ ۾ رهائشي پروگرام کولي رهيو آهي. جيڪڏهن توهان C++/Python ۾ گهڻو ڪجهه لکيو آهي ۽ هن علم کي ML تي لاڳو ڪرڻ چاهيو ٿا، ته پوءِ اسان توهان کي سيکارينداسين ته عملي تحقيق ڪيئن ڪجي ۽ تجربيڪار استادن کي مهيا ڪجي. توهان اهم Yandex خدمتن تي ڪم ڪندا ۽ علائقن ۾ مهارت حاصل ڪندا جيئن ته لڪير جا ماڊل ۽ گريڊيئنٽ بوسٽنگ، سفارشي سسٽم، تصويرن، ٽيڪسٽ ۽ آواز جو تجزيو ڪرڻ لاءِ نيورل نيٽ ورڪ. توهان پڻ سکندا ته ڪيئن صحيح طريقي سان توهان جي ماڊلز جو اندازو لڳايو ميٽرڪس آف لائن ۽ آن لائن استعمال ڪندي.

پروگرام جو عرصو هڪ سال آهي، جنهن دوران شرڪت ڪندڙ Yandex جي مشين انٽيليجنس ۽ ريسرچ ڊپارٽمينٽ ۾ ڪم ڪندا، گڏوگڏ ليڪچرز ۽ سيمينارن ۾ شرڪت ڪندا. شموليت ادا ڪئي وئي آهي ۽ مڪمل وقت جو ڪم شامل آهي: 40 ڪلاڪ في هفتي، هن سال جي جولاء 1 کان شروع ٿيندي. درخواستون ھاڻي کليل آھن ۽ 1 مئي تائين جاري رهندو. 

۽ ھاڻي وڌيڪ تفصيل ۾ - بابت اسان ڪھڙي قسم جي سامعين جو انتظار ڪري رھيا آھيون، ڪم جو عمل ڪھڙو ھوندو ۽ عام طور تي، ڪيئن ھڪڙو پٺتي پيل اسپيشلسٽ ML ۾ ڪيريئر ڏانھن رخ ڪري سگھي ٿو.

فڪر

ڪيتريون ئي ڪمپنيون آهن رهائشي پروگرام، بشمول، مثال طور، گوگل ۽ فيسبوڪ. اهي خاص طور تي جونيئر ۽ وچين سطح جي ماهرن جو مقصد آهن جيڪي ايم ايل تحقيق ڏانهن قدم کڻڻ جي ڪوشش ڪري رهيا آهن. اسان جو پروگرام مختلف سامعين لاءِ آهي. اسان بيڪ اينڊ ڊولپرز کي دعوت ڏيون ٿا جن اڳ ۾ ئي ڪافي تجربو حاصل ڪيو آهي ۽ پڪ ڄاڻون ٿا ته انهن کي ML ڏانهن موٽڻ جي ضرورت آهي، عملي صلاحيتون حاصل ڪرڻ لاءِ - ۽ نه هڪ سائنسدان جون صلاحيتون - صنعتي مشين جي سکيا جا مسئلا حل ڪرڻ ۾. هن جو مطلب اهو ناهي ته اسان نوجوان محققن جي حمايت نه ڪندا آهيون. اسان انهن لاءِ هڪ الڳ پروگرام ترتيب ڏنو آهي. پريميئم نالو Ilya Segalovich جي نالي سان، جيڪو توهان کي Yandex ۾ ڪم ڪرڻ جي اجازت ڏئي ٿو.

رهاڪو ڪٿي ڪم ڪندو؟

مشين انٽيليجنس ۽ ريسرچ ڊپارٽمينٽ ۾، اسان پاڻ پروجيڪٽ خيالن کي ترقي ڪريون ٿا. انسپائريشن جو مکيه ذريعو سائنسي ادب، مقالا، ۽ تحقيقي ڪميونٽي ۾ رجحانات آهن. منهنجا ساٿي ۽ مان تجزيو ڪريون ٿا جيڪو اسان پڙهون ٿا، اهو ڏسي رهيا آهيون ته اسان سائنسدانن جي تجويز ڪيل طريقن کي ڪيئن بهتر يا وڌائي سگهون ٿا. ساڳئي وقت، اسان مان هر هڪ پنهنجي علم ۽ مفادن جي شعبي کي نظر ۾ رکندي، انهن علائقن جي بنياد تي ڪم کي ترتيب ڏئي ٿو جن کي هو اهم سمجهي ٿو. پروجيڪٽ لاءِ خيال عام طور تي خارجي تحقيق جي نتيجن ۽ پنهنجي صلاحيتن جي چونڪ تي پيدا ٿيندو آهي.

اهو سسٽم سٺو آهي ڇاڪاڻ ته اهو گهڻو ڪري Yandex خدمتن جي ٽيڪنالاجي مسئلن کي حل ڪري ٿو جيتوڻيڪ اهي پيدا ٿيڻ کان اڳ. جڏهن هڪ خدمت ڪنهن مسئلي کي منهن ڏئي ٿي، ان جا نمائندا اسان وٽ ايندا آهن، گهڻو ڪري اهي ٽيڪنالاجيون وٺي ويندا آهن جيڪي اسان اڳ ۾ ئي تيار ڪيون آهن، جيڪا باقي رهي ٿي پروڊڪٽ ۾ صحيح طريقي سان لاڳو ڪئي وڃي. جيڪڏهن ڪجهه تيار نه آهي، اسان گهٽ ۾ گهٽ جلدي ياد ڪنداسين جتي اسان "کڏڻ شروع ڪري سگهون ٿا" ۽ ڪهڙي مضمونن ۾ حل ڳولڻ لاء. جيئن ته اسان ڄاڻون ٿا، سائنسي طريقو آهي جنات جي ڪلهن تي بيهڻ.

ڇا ڪجي

Yandex تي - ۽ اڃا به خاص طور تي اسان جي انتظام ۾ - ML جا سڀ لاڳاپيل علائقا ترقي ڪري رهيا آهن. اسان جو مقصد مختلف قسم جي پروڊڪٽس جي معيار کي بهتر بڻائڻ آهي، ۽ اهو ڪم ڪري ٿو هڪ ترغيب جي طور تي هر نئين شيءِ کي جانچڻ لاءِ. ان کان سواء، نئين خدمتون باقاعده ظاهر ٿيندا آهن. تنهن ڪري ليڪچر پروگرام صنعتي ترقي ۾ مشين لرننگ جي سڀني اهم (سٺو ثابت ٿيل) علائقن تي مشتمل آهي. ڪورس جي منهنجي حصي کي گڏ ڪرڻ وقت، مون ڊيٽا جي تجزيي جي اسڪول ۾ پنهنجي تدريسي تجربي سان گڏوگڏ ٻين SHAD استادن جو مواد ۽ ڪم استعمال ڪيو. مون کي خبر آهي ته منهنجي ساٿين به ائين ئي ڪيو.

پهرين مهينن ۾، ڪورس پروگرام جي مطابق تربيت توهان جي ڪم ڪندڙ وقت جي تقريبن 30٪ جي حساب سان ٿيندي، پوء اٽڪل 10٪. بهرحال، اهو سمجهڻ ضروري آهي ته ML ماڊلز سان ڪم ڪرڻ پاڻ کي لڳ ڀڳ چار ڀيرا گهٽ لڳندو سڀني لاڳاپيل عملن کان. انهن ۾ شامل آهي پس منظر تيار ڪرڻ، ڊيٽا حاصل ڪرڻ، ان کي اڳڀرائي ڪرڻ لاءِ پائپ لائن لکڻ، ڪوڊ کي بهتر ڪرڻ، مخصوص هارڊويئر کي ترتيب ڏيڻ، وغيره. هڪ ايم ايل انجنيئر آهي، جيڪڏهن توهان چاهيو ته، هڪ مڪمل اسٽيڪ ڊولپر (صرف مشين جي سکيا تي وڌيڪ زور ڏيڻ سان) ، شروع کان آخر تائين مسئلو حل ڪرڻ جي قابل. جيتوڻيڪ هڪ تيار ٿيل ماڊل سان، توهان کي شايد ڪجهه وڌيڪ عمل ڪرڻ جي ضرورت پوندي: ڪيترن ئي مشينن تي ان جي عمل کي متوازي ڪريو، هڪ عمل درآمد تيار ڪريو هڪ هينڊل، لائبريري، يا خدمت جي اجزاء جي صورت ۾.

شاگردن جي چونڊ
جيڪڏهن توهان اهو تاثر هيٺ هئا ته اهو بهتر آهي ته هڪ ايم ايل انجنيئر ٿيڻ کان پهريان هڪ پس منظر ڊولپر جي حيثيت سان ڪم ڪري، اهو سچ ناهي. ساڳي SAD ۾ داخلا حاصل ڪرڻ بغير حقيقي تجربي جي خدمتن کي ترقي ڪرڻ ۾، سکڻ ۽ مارڪيٽ تي انتهائي طلب ۾ ٿيڻ هڪ بهترين اختيار آهي. ڪيترائي Yandex ماهرن ھن طريقي سان پنھنجي موجوده پوزيشن ۾ ختم ٿي ويا. جيڪڏهن ڪا ڪمپني گريجوئيشن کان پوءِ فوري طور تي ايم ايل جي فيلڊ ۾ توهان کي نوڪري پيش ڪرڻ لاءِ تيار آهي، توهان کي شايد اها آڇ قبول ڪرڻ گهرجي. هڪ تجربيڪار مرشد سان سٺي ٽيم ۾ شامل ٿيڻ جي ڪوشش ڪريو ۽ گهڻو ڪجهه سکڻ لاءِ تيار ٿي وڃو.

ڇا عام طور تي توهان کي ايم ايل ڪرڻ کان روڪي ٿو؟

جيڪڏهن هڪ پٺاڻ هڪ ايم ايل انجنيئر ٿيڻ جو خواهشمند آهي، هو ترقي جي ٻن علائقن مان چونڊ ڪري سگهي ٿو - بغير رهائش واري پروگرام جي اڪائونٽ ۾.

پهرين، ڪجهه تعليمي ڪورس جي حصي طور پڙهو. سبق ڪورسرا توهان کي بنيادي ٽيڪنالاجي کي سمجهڻ جي ويجهو آڻيندو، پر پنهنجو پاڻ کي ڪافي حد تائين پيش ڪرڻ ۾ وسارڻ لاء، توهان کي ان لاء گهڻو وقت وقف ڪرڻو پوندو. مثال طور، SAD مان گريجوئيٽ. ڪيترن سالن کان، SAD سڌو سنئون مشين لرننگ تي ڪورسز جو هڪ مختلف تعداد هو - سراسري طور تي، اٽڪل اٺ. انهن مان هر هڪ واقعي اهم ۽ مفيد آهي، بشمول گريجوئيشن جي راء ۾. 

ٻيو، توهان جنگي منصوبن ۾ حصو وٺي سگهو ٿا جتي توهان کي هڪ يا ٻيو ML الگورتھم لاڳو ڪرڻ جي ضرورت آهي. بهرحال، آئي ٽي ڊولپمينٽ مارڪيٽ تي تمام ٿورا اهڙا منصوبا آهن: مشين لرننگ اڪثر ڪمن ۾ استعمال نه ٿيندي آهي. جيتوڻيڪ بينڪن ۾ جيڪي فعال طور تي ڳولي رهيا آهن ايم ايل سان لاڳاپيل موقعا، صرف چند ڊيٽا جي تجزيي ۾ مصروف آهن. جيڪڏهن توهان انهن مان ڪنهن هڪ ٽيم ۾ شامل ٿيڻ جي قابل نه هئا، توهان جو واحد اختيار آهي يا ته توهان جي پنهنجي منصوبي کي شروع ڪريو (جتي، گهڻو ڪري، توهان پنهنجون آخري وقت مقرر ڪندا، ۽ ان جو جنگي پيداوار جي ڪمن سان ٿورو تعلق آهي)، يا مقابلو شروع ڪريو. ڪگل.

درحقيقت، ٻين ڪميونٽي جي ميمبرن سان گڏ ٽيم ٺاهيو ۽ پاڻ کي مقابلي ۾ ڪوشش ڪريو نسبتا آسان - خاص طور تي جيڪڏهن توهان پنهنجي صلاحيتن کي تربيت سان گڏ ڪيو ۽ ڪورسرا تي ذڪر ڪيل ڪورسز. هر مقابلي جي هڪ آخري تاريخ هوندي آهي - اهو توهان لاءِ هڪ ترغيب جي طور تي ڪم ڪندو ۽ توهان کي آئي ٽي ڪمپنين ۾ ساڳئي نظام لاءِ تيار ڪندو. اهو هڪ سٺو طريقو آهي - جيڪو، جيتوڻيڪ، حقيقي عملن کان ٿورو طلاق پڻ آهي. Kaggle تي توهان کي پهريان کان پروسيس ٿيل ڏنو ويو آهي، جيتوڻيڪ هميشه مڪمل ناهي، ڊيٽا؛ پيداوار ۾ حصو وٺڻ جي باري ۾ سوچڻ جي آڇ نه ڪريو؛ ۽ سڀ کان اهم، انهن کي پيداوار لاء مناسب حل جي ضرورت ناهي. توهان جا الگورٿم شايد ڪم ڪندا ۽ انتهائي درست هوندا، پر توهان جا ماڊل ۽ ڪوڊ مختلف حصن مان ٺهيل فرينڪنسٽن وانگر هوندا - هڪ پيداواري منصوبي ۾، سڄو ڍانچو تمام سست ڪم ڪندو، ان کي اپڊيٽ ڪرڻ ۽ وڌائڻ ڏکيو ٿيندو (مثال طور، ٻولي ۽ آواز جي الگورتھم هميشه جزوي طور تي ٻيهر لکندا ويندا جيئن ٻولي ترقي ڪندي). ڪمپنيون انهي حقيقت ۾ دلچسپي رکن ٿيون ته فهرست ڪيل ڪم نه رڳو توهان پاڻ ڪري سگهو ٿا (اهو واضح آهي ته توهان، حل جي ليکڪ جي حيثيت ۾، اهو ڪري سگهو ٿا)، پر توهان جي ڪنهن به ساٿي طرفان پڻ. راندين ۽ صنعتي پروگرامنگ جي وچ ۾ فرق بحث ڪيو ويو آهي много، ۽ ڪاگل خاص طور تي ”ايٿليٽس“ کي تعليم ڏئي ٿو - جيتوڻيڪ اهو اهو تمام سٺو ڪري ٿو ، انهن کي ڪجهه تجربو حاصل ڪرڻ جي اجازت ڏئي ٿو.

مون ترقي جي ٻن ممڪن لائينن کي بيان ڪيو - تعليمي پروگرامن ذريعي تربيت ۽ تربيت "جنگ ۾"، مثال طور ڪگل تي. رهائشي پروگرام انهن ٻن طريقن جو هڪ ميلاپ آهي. SAD سطح تي ليڪچر ۽ سيمينار، گڏوگڏ واقعي جنگي منصوبا، توهان جو انتظار ڪندا.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو