Kako sam organizovao obuku mašinskog učenja na NSU

Moje ime je Sasha i volim mašinsko učenje, kao i podučavanje ljudi. Sada nadgledam obrazovne programe u Centru za kompjuterske nauke i vodim diplomski program analize podataka na Državnom univerzitetu u Sankt Peterburgu. Prije toga radio je kao analitičar u Yandexu, a još ranije kao naučnik: bavio se matematičkim modeliranjem na Institutu za računarstvo SB RAS.

U ovom postu želim da vam kažem šta je došlo od ideje o pokretanju obuke mašinskog učenja za studente, diplomce Novosibirskog državnog univerziteta i sve ostale.

Kako sam organizovao obuku mašinskog učenja na NSU

Odavno sam želio organizirati poseban kurs o pripremi za takmičenja u analizi podataka na Kaggleu i drugim platformama. Ovo je izgledalo kao odlična ideja:

  • Studenti i svi zainteresovani će teorijska znanja primijeniti u praksi i steći iskustvo u rješavanju problema na javnim konkursima.
  • Studenti koji se plasiraju u sam vrh na ovakvim takmičenjima dobro utiču na atraktivnost NSU za kandidate, studente i diplomce. Ista stvar se dešava i sa treningom sportskog programiranja.
  • Ovaj specijalni kurs savršeno dopunjuje i proširuje osnovna znanja: učesnici samostalno implementiraju modele mašinskog učenja i često formiraju timove koji se takmiče na globalnom nivou.
  • Drugi univerziteti su već imali takvu obuku, pa sam se nadao uspjehu specijalnog kursa na NSU.

Запуск

Novosibirski Akademgorodok ima veoma plodno tlo za takve poduhvate: studenti, diplomci i nastavnici Centra za računarske nauke i jakih tehničkih fakulteta, na primer, FIT, MMF, FF, snažna podrška administracije NSU, aktivna ODS zajednica, iskusni inženjeri i analitičari iz raznih IT kompanija. Otprilike u isto vrijeme saznali smo za program grantova od Botan Investments — fond podržava timove koji pokazuju dobre rezultate u ML sportskim takmičenjima.

Našli smo publiku u NSU za nedeljne sastanke, napravili chat na Telegramu i pokrenuli 1. oktobra zajedno sa studentima i diplomcima CS centra. Na prvi čas je došlo 19 ljudi. Njih šest su postali redovni učesnici obuke. Ukupno je 31 osoba došla na sastanak barem jednom tokom akademske godine.

Prvi rezultati

Momci i ja smo se upoznali, razmijenili iskustva, razgovarali o takmičenjima i grubom planu za budućnost. Vrlo brzo smo shvatili da je borba za mjesta na takmičenjima za analizu podataka redovan, naporan posao, sličan neplaćenom punom radnom vremenu, ali vrlo zanimljiv i uzbudljiv 🙂 Jedan od učesnika, Kaggle-master Maxim, savjetovao nam je da prvo napredujemo pojedinačno na takmičenjima , a samo nekoliko sedmica kasnije ujediniti se u timove, vodeći računa o javnom rezultatu. To smo uradili! Tokom obuke licem u lice, razgovarali smo o modelima, naučnim člancima i zamršenostima Python biblioteka i zajedno rešavali probleme.

Rezultati jesenjeg semestra su tri srebrne medalje na dva takmičenja na Kaggleu: TGS identifikacija soli и PLASTICC Astronomska klasifikacija. I jedno treće mesto na CFT konkursu za ispravljanje grešaka u kucanju sa prvim osvojenim novcem (u novcu, kako kažu iskusni kegleri).

Još jedan vrlo važan indirektni rezultat specijalnog kursa bilo je pokretanje i konfiguracija klastera NSU VKI. Njegova računarska snaga značajno je poboljšala naš konkurentski život: 40 CPU-a, 755 Gb RAM-a, 8 NVIDIA Tesla V100 GPU-a.

Kako sam organizovao obuku mašinskog učenja na NSU

Pre toga smo preživljavali najbolje što smo mogli: računali smo na ličnim laptopima i desktopima, u Google Colab-u i u Kaggle-kernelima. Jedan tim je čak imao i sami napisanu skriptu koja je automatski sačuvala model i ponovo pokrenula proračun koji je zaustavljen zbog vremenskog ograničenja.

U proljetnom semestru nastavili smo da se okupljamo, razmjenjujemo uspješne nalaze i razgovaramo o našim rješenjima za takmičenje. Počeli su nam dolaziti novi zainteresovani učesnici. Tokom prolećnog semestra uspeli smo da osvojimo jedno zlato, tri srebra i devet bronzanih na osam takmičenja na Kaggleu: PetFinder, Santander, Rodna rezolucija, Whale Identification, Quora, Google Landmarks i drugi, bronzani u Recco izazov, treće mjesto u Changellenge>>Kupu i prvo mjesto (opet u novcu) na takmičenju u mašinskom učenju na prvenstvo u programiranju od Yandexa.

Šta kažu učesnici treninga

Mikhail Karchevsky
„Veoma mi je drago da se ovakve aktivnosti sprovode ovde u Sibiru, jer verujem da je učešće na takmičenjima najbrži način da se savlada ML. Za takva takmičenja, hardver je prilično skup za kupovinu, ali ovdje možete isprobati ideje besplatno.”

Kirill Brodt
„Prije pojave ML treninga nisam posebno učestvovao na takmičenjima, izuzev treninga i Hindu takmičenja: nisam vidio smisao u tome, pošto sam imao posao u oblasti ML-a, i bio sam upoznat sa tim. Prvi semestar sam pohađao kao student. A počevši od drugog semestra, čim su računarski resursi postali dostupni, pomislio sam, zašto ne bih učestvovao. I to me navuklo. Zadatak, podaci i metrika su izmišljeni i pripremljeni za vas, samo naprijed i koristite punu moć MO, provjerite najsavremenije modele i tehnike. Da nije bilo obuke i, što je jednako važno, računarskih resursa, ne bih uskoro počeo da učestvujem.”

Andrey Shevelev
„Lični ML trening mi je pomogao da pronađem istomišljenike, sa kojima sam mogao da produbim svoje znanje u oblasti mašinskog učenja i analize podataka. Ovo je također odlična opcija za one koji nemaju puno slobodnog vremena za samostalnu analizu i udubljivanje u temu takmičenja, a ipak žele biti u toj temi.”

pridruži nam se

Takmičenja na Kaggleu i drugim platformama usavršavaju praktične vještine i brzo se pretvaraju u zanimljiv rad u području nauke o podacima. Ljudi koji su zajedno učestvovali na teškom takmičenju često postaju kolege i nastavljaju da uspešno rešavaju probleme vezane za posao. To se dogodilo i nama: Mihail Karčevski je zajedno sa prijateljem iz tima otišao da radi u istoj kompaniji po sistemu preporuka.

Vremenom planiramo proširiti ovu aktivnost naučnim publikacijama i učešćem na konferencijama o mašinskom učenju. Pridružite nam se kao učesnici ili stručnjaci u Novosibirsku - pišite ja ili Kirill. Organizirajte sličnu obuku u svojim gradovima i univerzitetima.

Evo male varalice koja će vam pomoći da napravite prve korake:

  1. Razmislite o prikladnom mjestu i vremenu za redovnu nastavu. Optimalno - 1-2 puta sedmično.
  2. Pišite potencijalno zainteresovanim učesnicima o prvom sastanku. Prije svega, to su studenti tehničkih univerziteta, učesnici ODS-a.
  3. Započnite razgovor da razgovarate o aktuelnim poslovima: Telegram, VK, WhatsApp ili bilo koji drugi messenger koji je pogodan za većinu.
  4. Održavajte javno dostupan plan časova, listu takmičenja i učesnika i pratite rezultate.
  5. Pronađite besplatnu računarsku snagu ili grantove za nju na obližnjim univerzitetima, istraživačkim institutima ili kompanijama.
  6. PROFIT!

Izvor: www.habr.com

Dodajte komentar