نام من ساشا است و من عاشق یادگیری ماشینی و همچنین آموزش به مردم هستم. اکنون من بر برنامه های آموزشی در مرکز علوم کامپیوتر نظارت می کنم و برنامه کارشناسی در تجزیه و تحلیل داده ها را در دانشگاه ایالتی سن پترزبورگ هدایت می کنم. قبل از آن، او به عنوان یک تحلیلگر در Yandex و حتی قبل از آن به عنوان یک دانشمند کار می کرد: او در موسسه علوم کامپیوتر SB RAS به مدل سازی ریاضی مشغول بود.
در این پست میخواهم به شما بگویم که ایده راهاندازی آموزش یادگیری ماشین برای دانشآموزان، فارغالتحصیلان دانشگاه دولتی نووسیبیرسک و همه افراد دیگر چه شد.
من مدتهاست که می خواستم یک دوره ویژه در زمینه آمادگی برای مسابقات تجزیه و تحلیل داده ها در Kaggle و سایر سیستم عامل ها برگزار کنم. این یک ایده عالی به نظر می رسید:
- دانشآموزان و هر علاقهمندی دانش تئوری را در عمل به کار میگیرند و در حل مسائل در مسابقات عمومی تجربه کسب میکنند.
- دانشجویانی که در این گونه مسابقات در صدر قرار می گیرند تاثیر خوبی در جذابیت NSU برای متقاضیان، دانشجویان و فارغ التحصیلان دارند. در مورد آموزش برنامه نویسی ورزشی هم همین اتفاق می افتد.
- این دوره ویژه کاملاً دانش بنیادی را تکمیل و گسترش می دهد: شرکت کنندگان به طور مستقل مدل های یادگیری ماشین را پیاده سازی می کنند و اغلب تیم هایی را تشکیل می دهند که در سطح جهانی با هم رقابت می کنند.
- دانشگاه های دیگر قبلاً چنین آموزشی را انجام داده بودند، بنابراین من به موفقیت دوره ویژه در NSU امیدوار بودم.
راه اندازی
آکادمگورودوک نووسیبیرسک زمینه بسیار مناسبی برای چنین تلاش هایی دارد: دانشجویان، فارغ التحصیلان و معلمان مرکز علوم کامپیوتر و دانشکده های فنی قوی، به عنوان مثال، FIT، MMF، FF، پشتیبانی قوی از اداره NSU، جامعه فعال ODS، مهندسان با تجربه. و تحلیلگران از شرکت های مختلف IT. تقریباً در همان زمان، ما در مورد برنامه کمک هزینه از
ما مخاطبانی را در NSU برای جلسات هفتگی پیدا کردیم، یک چت در تلگرام ایجاد کردیم و در 1 اکتبر به همراه دانشجویان و فارغ التحصیلان مرکز CS راه اندازی شد. 19 نفر به درس اول آمدند. شش نفر از آنها به طور منظم در تمرین شرکت کردند. در مجموع 31 نفر در طول سال تحصیلی حداقل یک بار در جلسه حاضر شدند.
نتایج اول
من و بچه ها با هم آشنا شدیم، تجربیات را با هم تبادل کردیم، در مورد مسابقات و یک برنامه تقریبی برای آینده بحث کردیم. خیلی سریع متوجه شدیم که مبارزه برای مکان در مسابقات تجزیه و تحلیل داده ها یک کار معمولی، طاقت فرسا، شبیه به کار تمام وقت بدون دستمزد، اما بسیار جالب و هیجان انگیز است. ، و فقط چند هفته بعد با در نظر گرفتن امتیاز عمومی در تیم ها متحد شوید. این کاری است که ما انجام دادیم! در طول آموزش حضوری، مدل ها، مقالات علمی و پیچیدگی های کتابخانه های پایتون را مورد بحث قرار دادیم و مشکلات را با هم حل کردیم.
نتایج ترم پاییز سه مدال نقره در دو مسابقه در Kaggle بود:
یکی دیگر از نتایج غیرمستقیم بسیار مهم دوره ویژه راه اندازی و پیکربندی خوشه NSU VKI بود. قدرت محاسباتی آن به طور قابل توجهی عمر رقابتی ما را بهبود بخشیده است: 40 پردازنده، 755 گیگابایت رم، 8 پردازنده گرافیکی NVIDIA Tesla V100.
قبل از آن، ما تا جایی که میتوانستیم زنده ماندیم: روی لپتاپهای شخصی و رایانههای رومیزی، در Google Colab و Kaggle-kernels محاسبه میکردیم. حتی یک تیم یک اسکریپت خودنویس داشت که به طور خودکار مدل را ذخیره می کرد و محاسبه را که به دلیل محدودیت زمانی متوقف شده بود، دوباره شروع می کرد.
در ترم بهار، ما به جمع آوری، تبادل یافته های موفق و صحبت در مورد راه حل های خود برای رقابت ادامه دادیم. شرکت کنندگان علاقه مند جدید شروع به آمدن به ما کردند. در طول ترم بهار، ما موفق شدیم یک طلا، سه نقره و نه برنز در هشت مسابقه در Kaggle کسب کنیم:
آنچه شرکت کنندگان آموزش می گویند
من بسیار خوشحالم که چنین فعالیت هایی در سیبری انجام می شود، زیرا معتقدم شرکت در مسابقات سریع ترین راه برای تسلط بر ML است. برای چنین مسابقاتی، خرید سخت افزار بسیار گران است، اما در اینجا می توانید ایده ها را به صورت رایگان امتحان کنید.
"قبل از ظهور آموزش ML ، من به استثنای مسابقات تمرینی و هندوها به طور خاص در مسابقات شرکت نمی کردم: از آنجایی که در زمینه ML کار داشتم و با آن آشنا بودم ، فایده ای در این نمی دیدم. ترم اول که دانشجو بودم. و با شروع از ترم دوم، به محض اینکه منابع محاسباتی موجود شد، به این فکر کردم که چرا شرکت نکنم. و من را درگیر کرد. وظیفه، داده ها و معیارها برای شما اختراع و آماده شده است، ادامه دهید و از تمام قدرت MO استفاده کنید، مدل ها و تکنیک های پیشرفته را بررسی کنید. اگر آموزش و به همان اندازه مهم منابع محاسباتی نبود، به این زودی شرکت نمی کردم.»
"آموزش ML حضوری به من کمک کرد افراد همفکری را پیدا کنم که با آنها توانستم دانش خود را در زمینه یادگیری ماشین و تجزیه و تحلیل داده ها عمیق تر کنم. این همچنین یک گزینه عالی برای کسانی است که وقت آزاد زیادی برای تجزیه و تحلیل مستقل و غوطه ور شدن در موضوع مسابقات ندارند، اما همچنان می خواهند در این موضوع باشند."
به ما بپیوند
مسابقات در Kaggle و دیگر پلتفرمها مهارتهای عملی را تقویت میکنند و به سرعت به کارهای جالب در زمینه علم داده تبدیل میشوند. افرادی که در یک رقابت دشوار با هم شرکت کرده اند، اغلب همکار می شوند و به حل موفقیت آمیز مشکلات مربوط به کار ادامه می دهند. این اتفاق برای ما نیز افتاد: میخائیل کارچفسکی، همراه با یکی از دوستان تیم، با یک سیستم توصیه برای کار در همان شرکت رفتند.
با گذشت زمان، قصد داریم این فعالیت را با انتشارات علمی و شرکت در کنفرانس های یادگیری ماشینی گسترش دهیم. به عنوان شرکت کنندگان یا کارشناسان در نووسیبیرسک به ما بپیوندید - بنویسید
در اینجا یک برگه تقلب کوچک برای کمک به شما در برداشتن اولین قدم ها آمده است:
- مکان و زمان مناسبی را برای کلاس های معمولی در نظر بگیرید. بهینه - 1-2 بار در هفته.
- برای شرکت کنندگان بالقوه علاقه مند در مورد جلسه اول بنویسید. اول از همه، اینها دانشجویان دانشگاه های فنی، شرکت کنندگان ODS هستند.
- یک چت برای بحث در مورد امور جاری شروع کنید: تلگرام، VK، WhatsApp یا هر پیام رسان دیگری که برای اکثر افراد مناسب است.
- یک طرح درس در دسترس عموم، فهرستی از مسابقات و شرکت کنندگان را حفظ کنید و نتایج را زیر نظر داشته باشید.
- قدرت محاسباتی رایگان یا کمک های مالی برای آن را در دانشگاه ها، موسسات تحقیقاتی یا شرکت های اطراف پیدا کنید.
- سود!
منبع: www.habr.com