Како организирав обука за машинско учење во НСУ

Моето име е Саша и сакам машинско учење, како и да учам луѓе. Сега ги надгледувам образовните програми во Центарот за компјутерски науки и ја насочувам дипломската програма за анализа на податоци на Државниот универзитет во Санкт Петербург. Пред тоа, тој работеше како аналитичар во Yandex, а уште порано како научник: се занимаваше со математичко моделирање на Институтот за компјутерски науки на SB RAS.

Во овој пост сакам да ви кажам што дојде од идејата за лансирање на обука за машинско учење за студенти, дипломирани студенти на Државниот универзитет во Новосибирск и сите други.

Како организирав обука за машинско учење во НСУ

Одамна сакав да организирам посебен курс за подготовка за натпревари за анализа на податоци на Kaggle и други платформи. Ова изгледаше како одлична идеја:

  • Студентите и сите заинтересирани ќе ги применат теоретските знаења во пракса и ќе стекнат искуство во решавање на проблеми на јавни конкурси.
  • Студентите кои се пласираат на врвот на ваквите натпревари имаат добар ефект врз атрактивноста на НСУ за апликантите, студентите и дипломираните студенти. Истото се случува и со тренингот за спортско програмирање.
  • Овој специјален курс совршено го надополнува и проширува основното знаење: учесниците самостојно спроведуваат модели за машинско учење и често формираат тимови кои се натпреваруваат на глобално ниво.
  • Други универзитети веќе имаа спроведено таква обука, па се надевав на успех на специјалниот курс во НСУ.

Стартувај

Академгородок од Новосибирск има многу плодна почва за такви потфати: студенти, дипломци и наставници на Центарот за компјутерски науки и силни технички факултети, на пример, FIT, MMF, FF, силна поддршка на администрацијата на NSU, активна ODS заедница, искусни инженери и аналитичари од различни ИТ компании. Отприлика во исто време дознавме за програмата за грантови од Ботан инвестиции — Фондот поддржува тимови кои покажуваат добри резултати во спортските натпревари во МЛ.

Најдовме публика во НСУ за неделни состаноци, создадовме разговор на Телеграм и започнавме на 1 октомври заедно со студенти и дипломирани студенти на ЦС центарот. На првата лекција дојдоа 19 луѓе. Шест од нив станаа редовни учесници на обуката. Вкупно, 31 лице дојдоа на состанокот барем еднаш во текот на академската година.

Први резултати

Јас и момците се запознавме, разменивме искуства, разговаравме за натпревари и груб план за иднината. Доста брзо сфативме дека борбата за места во натпреварите за анализа на податоци е редовна, исцрпувачка работа, слична на неплатената работа со полно работно време, но многу интересна и возбудлива 🙂 Еден од учесниците, Kaggle-master Maxim, нè советуваше прво да напредуваме на натпревари поединечно. , а само неколку недели подоцна обединете се во тимови, земајќи го предвид јавниот резултат. Тоа е она што го направивме! За време на обуката лице в лице, разговаравме за модели, научни написи и сложеноста на библиотеките на Python и заедно ги решававме проблемите.

Резултатите од есенскиот семестар беа три сребрени медали во две конкуренции на Kaggle: TGS идентификација на сол и Астрономска класификација на PLAsTiCC. И едно трето место на CFT натпреварот за поправање печатни грешки со првите освоени пари (во пари, како што велат искусни кеглери).

Друг многу важен индиректен резултат на специјалниот курс беше лансирањето и конфигурацијата на кластерот NSU VKI. Неговата компјутерска моќ значително го подобри нашиот конкурентен век: 40 процесори, 755 Gb RAM, 8 графички процесори NVIDIA Tesla V100.

Како организирав обука за машинско учење во НСУ

Пред тоа, преживеавме најдобро што можевме: пресметувавме на лични лаптопи и десктоп компјутери, во Google Colab и во Kaggle-kernels. Еден тим имаше дури и сам напишана скрипта што автоматски го зачувуваше моделот и ја рестартираше пресметката што престана поради временско ограничување.

Во пролетниот семестар продолживме да се собираме, да разменуваме успешни наоди и да разговараме за нашите решенија на натпреварот. Нови заинтересирани учесници почнаа да доаѓаат кај нас. Во текот на пролетниот семестар, успеавме да земеме едно златно, три сребрени и девет бронзени во осум натпревари на Kaggle: PetFinder, Сантандер, Родовата резолуција, Идентификација на кит, Quora, Google Landmarks и други, бронзени во Recco предизвик, трето место во Changellenge>>Куп и прво место (повторно во пари) на натпреварот за машинско учење на првенство во програмирање од Yandex.

Што велат учесниците во обуката

Михаил Карчевски
„Многу ми е драго што ваквите активности се спроведуваат овде во Сибир, бидејќи верувам дека учеството на натпревари е најбрзиот начин да се совлада МЛ. За вакви натпревари, хардверот е прилично скап за да се купи сам, но овде можете да пробате идеи бесплатно“.

Кирил Бродт
„Пред доаѓањето на обуката за МЛ, јас не учествував особено на натпревари со исклучок на тренинзи и натпревари во хинду: не ја видов поентата во ова, бидејќи имав работа во областа на МЛ и бев запознаен со тоа. Првиот семестар го посетував како студент. И почнувајќи од вториот семестар, штом станаа достапни компјутерските ресурси, си помислив, зошто да не учествувам. И ме закачи. Задачата, податоците и метриката беа измислени и подготвени за вас, продолжи и искористете ја целосната моќ на MO, проверете ги најсовремените модели и техники. Да не беше обуката и, исто толку важно, компјутерските ресурси, немаше да почнам да учествувам наскоро“.

Андреј Шевелев
„Обуката за ML лично ми помогна да најдам истомисленици, со кои можев да го продлабочам моето знаење во областа на машинско учење и анализа на податоци. Ова е исто така одлична опција за оние кои немаат многу слободно време самостојно да анализираат и да се нурнат во темата за натпревари, но сепак сакаат да бидат во темата“.

Придружи ни се

Натпреварите на Kaggle и други платформи ги усовршуваат практичните вештини и брзо се претвораат во интересна работа во областа на науката за податоци. Луѓето кои заедно учествувале во тежок натпревар често стануваат колеги и продолжуваат успешно да ги решаваат проблемите поврзани со работата. Ова ни се случи и нам: Михаил Карчевски, заедно со пријател од тимот, отидоа да работат во истата компанија на систем за препораки.

Со текот на времето, планираме да ја прошириме оваа активност со научни публикации и учество на конференции за машинско учење. Придружете ни се како учесници или експерти во Новосибирск - пишувајте ме или Кирил. Организирајте слични обуки во вашите градови и универзитети.

Еве мал лист за измама што ќе ви помогне да ги преземете првите чекори:

  1. Размислете за погодно место и време за редовни часови. Оптимално - 1-2 пати неделно.
  2. Пишете им на потенцијално заинтересираните учесници за првиот состанок. Пред сè, тоа се студенти на технички универзитети, учесници во ОДС.
  3. Започнете разговор за да разговарате за тековните работи: Telegram, VK, WhatsApp или кој било друг гласник погоден за повеќето.
  4. Одржувајте јавно достапен план за часови, список на натпревари и учесници и следете ги резултатите.
  5. Најдете бесплатна компјутерска моќ или грантови за неа во блиските универзитети, истражувачки институти или компании.
  6. ПРОИЗВОД!

Извор: www.habr.com

Додадете коментар