Kako sam organizirao obuku strojnog učenja na NSU

Moje ime je Sasha i volim strojno učenje, kao i podučavanje ljudi. Sada nadgledam obrazovne programe u Centru za računalne znanosti i vodim diplomski studij analize podataka na Državnom sveučilištu St. Petersburg. Prije toga radio je kao analitičar u Yandexu, a još ranije kao znanstvenik: bavio se matematičkim modeliranjem u Institutu za informatiku SB RAS.

U ovom postu želim vam reći što je proizašlo iz ideje o pokretanju obuke strojnog učenja za studente, diplomante Novosibirskog državnog sveučilišta i sve ostale.

Kako sam organizirao obuku strojnog učenja na NSU

Već dugo želim organizirati poseban tečaj o pripremi za natjecanja u analizi podataka na Kaggleu i drugim platformama. Ovo se činilo kao odlična ideja:

  • Studenti i svi zainteresirani će teorijska znanja primijeniti u praksi i steći iskustvo u rješavanju problema na javnim natječajima.
  • Studenti koji se plasiraju u vrh na takvim natjecanjima dobro utječu na atraktivnost NSU za pristupnike, studente i diplomante. Ista stvar se događa s treningom sportskog programiranja.
  • Ovaj specijalni tečaj savršeno nadopunjuje i proširuje temeljna znanja: polaznici samostalno implementiraju modele strojnog učenja i često formiraju timove koji se natječu na globalnoj razini.
  • Druga su sveučilišta već provodila takvu obuku, pa sam se nadao uspjehu specijalnog tečaja na NSU-u.

lansiranje

Akademgorodok u Novosibirsku ima vrlo plodno tlo za takve napore: studenti, diplomanti i nastavnici Centra za informatiku i jake tehničke fakultete, na primjer, FIT, MMF, FF, snažnu podršku uprave NSU-a, aktivnu ODS zajednicu, iskusne inženjere te analitičari iz raznih IT tvrtki. Otprilike u isto vrijeme saznali smo za program bespovratnih sredstava od Botan Investments — fond podržava timove koji pokažu dobre rezultate u ML sportskim natjecanjima.

Pronašli smo publiku u NSU za tjedne sastanke, kreirali chat na Telegramu i pokrenuli 1. listopada zajedno sa studentima i diplomantima CS centra. Na prvi sat došlo je 19 ljudi. Njih šestero postali su redoviti polaznici edukacije. Ukupno je barem jednom tijekom akademske godine na susret došla 31 osoba.

Prvi rezultati

Dečki i ja smo se upoznali, razmijenili iskustva, razgovarali o natjecanjima i okvirnom planu za budućnost. Vrlo brzo smo shvatili da je borba za mjesta na natjecanjima iz analize podataka redovit, naporan posao, sličan neplaćenom punom radnom vremenu, ali vrlo zanimljiv i uzbudljiv 🙂 Jedan od sudionika, Kaggle-master Maxim, savjetovao nam je da prvo napredujemo na individualnim natjecanjima , a samo nekoliko tjedana kasnije ujedinjuju se u timove, uzimajući u obzir javni rezultat. To smo i učinili! Tijekom obuke licem u lice razgovarali smo o modelima, znanstvenim člancima i zamršenostima Python biblioteka te zajedno rješavali probleme.

Rezultati jesenskog semestra su tri srebrne medalje u dva natjecanja na Kaggleu: TGS Identifikacija soli и PLAsTiCC astronomska klasifikacija. I jedno treće mjesto na CFT natjecanju za ispravljanje tipfelera s prvim osvojenim novcem (in the money, kako kažu iskusni kegleri).

Drugi vrlo važan posredni rezultat specijalnog tečaja bilo je pokretanje i konfiguracija NSU VKI klastera. Njegova računalna snaga značajno je poboljšala naš konkurentski život: 40 CPU-a, 755 Gb RAM-a, 8 NVIDIA Tesla V100 GPU-a.

Kako sam organizirao obuku strojnog učenja na NSU

Prije toga smo preživljavali kako smo mogli: računali smo na osobnim prijenosnim i stolnim računalima, u Google Colabu i u Kaggle-kernelima. Jedan je tim čak imao skriptu koju su sami napisali koja je automatski spremala model i ponovno pokretala izračun koji je zaustavljen zbog vremenskog ograničenja.

U proljetnom semestru nastavili smo se okupljati, razmjenjivati ​​uspješna saznanja i razgovarati o našim rješenjima natječaja. Počeli su nam dolaziti novi zainteresirani polaznici. Tijekom proljetnog semestra uspjeli smo uzeti jedno zlato, tri srebra i devet bronci u osam natjecanja na Kaggleu: PetFinder, Santander, Rodna rezolucija, Identifikacija kitova, Quora, Google znamenitosti i drugi, brončani in Recco izazov, treće mjesto u Changellenge>>Cup i prvo mjesto (opet u novcu) u natjecanju strojnog učenja na prvenstvo u programiranju iz Yandexa.

Što kažu sudionici treninga

Mihail Karčevski
“Jako mi je drago što se takve aktivnosti provode ovdje u Sibiru, jer vjerujem da je sudjelovanje na natjecanjima najbrži način da se savlada ML. Za takva natjecanja hardver je prilično skup da ga sami kupite, ali ovdje možete isprobati ideje besplatno.”

Kirill Brodt
“Prije pojave ML treninga nisam posebno sudjelovao u natjecanjima s izuzetkom treninga i hinduističkih natjecanja: nisam vidio smisao u tome, budući da sam radio u području ML-a i bio sam s njim upoznat. Prvi semestar koji sam pohađao kao student. I počevši od drugog semestra, čim su računalni resursi postali dostupni, pomislio sam, zašto ne sudjelovati. I to me navuklo. Zadatak, podaci i metrika izmišljeni su i pripremljeni za vas, samo naprijed i koristite punu snagu MO-a, provjerite najsuvremenije modele i tehnike. Da nije bilo obuke i, što je jednako važno, računalnih resursa, ne bih uskoro počeo sudjelovati.”

Andrej Ševeljev
“Osobna ML obuka mi je pomogla pronaći istomišljenike s kojima sam mogao produbiti svoje znanje u području strojnog učenja i analize podataka. Ovo je također odlična opcija za one koji nemaju puno slobodnog vremena za samostalnu analizu i udubljivanje u temu natjecanja, ali ipak žele biti u temi.”

Pridruži nam se

Natjecanja na Kaggleu i drugim platformama usavršavaju praktične vještine i brzo se pretvaraju u zanimljiv rad u području podatkovne znanosti. Ljudi koji su zajedno sudjelovali u teškom natjecanju često postaju kolege i nastavljaju uspješno rješavati probleme vezane uz posao. To se dogodilo i nama: Mikhail Karchevsky je zajedno s prijateljem iz tima otišao raditi u istu tvrtku na sustav preporuke.

S vremenom ovu aktivnost planiramo proširiti znanstvenim publikacijama i sudjelovanjem na konferencijama strojnog učenja. Pridružite nam se kao sudionici ili stručnjaci u Novosibirsku - pišite mene ili Kiril. Organizirajte sličnu obuku u svojim gradovima i sveučilištima.

Evo male varalice koja će vam pomoći da napravite svoje prve korake:

  1. Razmislite o prikladnom mjestu i vremenu za redovnu nastavu. Optimalno - 1-2 puta tjedno.
  2. Pišite potencijalno zainteresiranim sudionicima o prvom susretu. Prije svega, to su studenti tehničkih sveučilišta, sudionici ODS-a.
  3. Započnite chat kako biste razgovarali o trenutnim stvarima: Telegram, VK, WhatsApp ili bilo koji drugi messenger prikladan za većinu.
  4. Održavajte javno dostupan plan nastave, popis natjecanja i sudionika te pratite rezultate.
  5. Pronađite besplatnu računalnu snagu ili potpore za nju na obližnjim sveučilištima, istraživačkim institutima ili tvrtkama.
  6. DOBIT!

Izvor: www.habr.com

Dodajte komentar