چگونه آموزش یادگیری ماشین را در NSU سازماندهی کردم

نام من ساشا است و من عاشق یادگیری ماشینی و همچنین آموزش به مردم هستم. اکنون من بر برنامه های آموزشی در مرکز علوم کامپیوتر نظارت می کنم و برنامه کارشناسی در تجزیه و تحلیل داده ها را در دانشگاه ایالتی سن پترزبورگ هدایت می کنم. قبل از آن، او به عنوان یک تحلیلگر در Yandex و حتی قبل از آن به عنوان یک دانشمند کار می کرد: او در موسسه علوم کامپیوتر SB RAS به مدل سازی ریاضی مشغول بود.

در این پست می‌خواهم به شما بگویم که ایده راه‌اندازی آموزش یادگیری ماشین برای دانش‌آموزان، فارغ‌التحصیلان دانشگاه دولتی نووسیبیرسک و همه افراد دیگر چه شد.

چگونه آموزش یادگیری ماشین را در NSU سازماندهی کردم

من مدتهاست که می خواستم یک دوره ویژه در زمینه آمادگی برای مسابقات تجزیه و تحلیل داده ها در Kaggle و سایر سیستم عامل ها برگزار کنم. این یک ایده عالی به نظر می رسید:

  • دانش‌آموزان و هر علاقه‌مندی دانش تئوری را در عمل به کار می‌گیرند و در حل مسائل در مسابقات عمومی تجربه کسب می‌کنند.
  • دانشجویانی که در این گونه مسابقات در صدر قرار می گیرند تاثیر خوبی در جذابیت NSU برای متقاضیان، دانشجویان و فارغ التحصیلان دارند. در مورد آموزش برنامه نویسی ورزشی هم همین اتفاق می افتد.
  • این دوره ویژه کاملاً دانش بنیادی را تکمیل و گسترش می دهد: شرکت کنندگان به طور مستقل مدل های یادگیری ماشین را پیاده سازی می کنند و اغلب تیم هایی را تشکیل می دهند که در سطح جهانی با هم رقابت می کنند.
  • دانشگاه های دیگر قبلاً چنین آموزشی را انجام داده بودند، بنابراین من به موفقیت دوره ویژه در NSU امیدوار بودم.

راه اندازی

آکادمگورودوک نووسیبیرسک زمینه بسیار مناسبی برای چنین تلاش هایی دارد: دانشجویان، فارغ التحصیلان و معلمان مرکز علوم کامپیوتر و دانشکده های فنی قوی، به عنوان مثال، FIT، MMF، FF، پشتیبانی قوی از اداره NSU، جامعه فعال ODS، مهندسان با تجربه. و تحلیلگران از شرکت های مختلف IT. تقریباً در همان زمان، ما در مورد برنامه کمک هزینه از سرمایه گذاری بوتان - این صندوق از تیم هایی که نتایج خوبی در مسابقات ورزشی ML نشان می دهند حمایت می کند.

ما مخاطبانی را در NSU برای جلسات هفتگی پیدا کردیم، یک چت در تلگرام ایجاد کردیم و در 1 اکتبر به همراه دانشجویان و فارغ التحصیلان مرکز CS راه اندازی شد. 19 نفر به درس اول آمدند. شش نفر از آنها به طور منظم در تمرین شرکت کردند. در مجموع 31 نفر در طول سال تحصیلی حداقل یک بار در جلسه حاضر شدند.

نتایج اول

من و بچه ها با هم آشنا شدیم، تجربیات را با هم تبادل کردیم، در مورد مسابقات و یک برنامه تقریبی برای آینده بحث کردیم. خیلی سریع متوجه شدیم که مبارزه برای مکان در مسابقات تجزیه و تحلیل داده ها یک کار معمولی، طاقت فرسا، شبیه به کار تمام وقت بدون دستمزد، اما بسیار جالب و هیجان انگیز است. ، و فقط چند هفته بعد با در نظر گرفتن امتیاز عمومی در تیم ها متحد شوید. این کاری است که ما انجام دادیم! در طول آموزش حضوری، مدل ها، مقالات علمی و پیچیدگی های کتابخانه های پایتون را مورد بحث قرار دادیم و مشکلات را با هم حل کردیم.

نتایج ترم پاییز سه مدال نقره در دو مسابقه در Kaggle بود: شناسایی نمک TGS и طبقه بندی نجومی PLAsTiCC. و یک مقام سوم در مسابقه CFT برای تصحیح اشتباهات تایپی با اولین پول کسب شده (در پول به قول کگلرهای با تجربه).

یکی دیگر از نتایج غیرمستقیم بسیار مهم دوره ویژه راه اندازی و پیکربندی خوشه NSU VKI بود. قدرت محاسباتی آن به طور قابل توجهی عمر رقابتی ما را بهبود بخشیده است: 40 پردازنده، 755 گیگابایت رم، 8 پردازنده گرافیکی NVIDIA Tesla V100.

چگونه آموزش یادگیری ماشین را در NSU سازماندهی کردم

قبل از آن، ما تا جایی که می‌توانستیم زنده ماندیم: روی لپ‌تاپ‌های شخصی و رایانه‌های رومیزی، در Google Colab و Kaggle-kernels محاسبه می‌کردیم. حتی یک تیم یک اسکریپت خودنویس داشت که به طور خودکار مدل را ذخیره می کرد و محاسبه را که به دلیل محدودیت زمانی متوقف شده بود، دوباره شروع می کرد.

در ترم بهار، ما به جمع آوری، تبادل یافته های موفق و صحبت در مورد راه حل های خود برای رقابت ادامه دادیم. شرکت کنندگان علاقه مند جدید شروع به آمدن به ما کردند. در طول ترم بهار، ما موفق شدیم یک طلا، سه نقره و نه برنز در هشت مسابقه در Kaggle کسب کنیم: PetFinder, سانتاندر, تفکیک جنسیتی, شناسایی نهنگ, Quora, Google Landmarks و دیگران، برنز در چالش Recco، مقام سوم Changellenge>>Cup و مقام اول (دوباره پول) در مسابقات یادگیری ماشین در مسابقات قهرمانی برنامه نویسی از Yandex.

آنچه شرکت کنندگان آموزش می گویند

میخائیل کارچفسکی
من بسیار خوشحالم که چنین فعالیت هایی در سیبری انجام می شود، زیرا معتقدم شرکت در مسابقات سریع ترین راه برای تسلط بر ML است. برای چنین مسابقاتی، خرید سخت افزار بسیار گران است، اما در اینجا می توانید ایده ها را به صورت رایگان امتحان کنید.

کریل برودت
"قبل از ظهور آموزش ML ، من به استثنای مسابقات تمرینی و هندوها به طور خاص در مسابقات شرکت نمی کردم: از آنجایی که در زمینه ML کار داشتم و با آن آشنا بودم ، فایده ای در این نمی دیدم. ترم اول که دانشجو بودم. و با شروع از ترم دوم، به محض اینکه منابع محاسباتی موجود شد، به این فکر کردم که چرا شرکت نکنم. و من را درگیر کرد. وظیفه، داده ها و معیارها برای شما اختراع و آماده شده است، ادامه دهید و از تمام قدرت MO استفاده کنید، مدل ها و تکنیک های پیشرفته را بررسی کنید. اگر آموزش و به همان اندازه مهم منابع محاسباتی نبود، به این زودی شرکت نمی کردم.»

آندری شولف
"آموزش ML حضوری به من کمک کرد افراد همفکری را پیدا کنم که با آنها توانستم دانش خود را در زمینه یادگیری ماشین و تجزیه و تحلیل داده ها عمیق تر کنم. این همچنین یک گزینه عالی برای کسانی است که وقت آزاد زیادی برای تجزیه و تحلیل مستقل و غوطه ور شدن در موضوع مسابقات ندارند، اما همچنان می خواهند در این موضوع باشند."

به ما بپیوند

مسابقات در Kaggle و دیگر پلتفرم‌ها مهارت‌های عملی را تقویت می‌کنند و به سرعت به کارهای جالب در زمینه علم داده تبدیل می‌شوند. افرادی که در یک رقابت دشوار با هم شرکت کرده اند، اغلب همکار می شوند و به حل موفقیت آمیز مشکلات مربوط به کار ادامه می دهند. این اتفاق برای ما نیز افتاد: میخائیل کارچفسکی، همراه با یکی از دوستان تیم، با یک سیستم توصیه برای کار در همان شرکت رفتند.

با گذشت زمان، قصد داریم این فعالیت را با انتشارات علمی و شرکت در کنفرانس های یادگیری ماشینی گسترش دهیم. به عنوان شرکت کنندگان یا کارشناسان در نووسیبیرسک به ما بپیوندید - بنویسید به من یا کریل. آموزش های مشابهی را در شهرها و دانشگاه های خود ترتیب دهید.

در اینجا یک برگه تقلب کوچک برای کمک به شما در برداشتن اولین قدم ها آمده است:

  1. مکان و زمان مناسبی را برای کلاس های معمولی در نظر بگیرید. بهینه - 1-2 بار در هفته.
  2. برای شرکت کنندگان بالقوه علاقه مند در مورد جلسه اول بنویسید. اول از همه، اینها دانشجویان دانشگاه های فنی، شرکت کنندگان ODS هستند.
  3. یک چت برای بحث در مورد امور جاری شروع کنید: تلگرام، VK، WhatsApp یا هر پیام رسان دیگری که برای اکثر افراد مناسب است.
  4. یک طرح درس در دسترس عموم، فهرستی از مسابقات و شرکت کنندگان را حفظ کنید و نتایج را زیر نظر داشته باشید.
  5. قدرت محاسباتی رایگان یا کمک های مالی برای آن را در دانشگاه ها، موسسات تحقیقاتی یا شرکت های اطراف پیدا کنید.
  6. سود!

منبع: www.habr.com

اضافه کردن نظر