Kako sem organiziral usposabljanje strojnega učenja na NSU

Moje ime je Sasha in rad imam strojno učenje ter poučevanje ljudi. Zdaj nadzorujem izobraževalne programe v Centru za računalništvo in usmerjam dodiplomski program analize podatkov na Državni univerzi v Sankt Peterburgu. Pred tem je delal kot analitik pri Yandexu, še prej pa kot znanstvenik: ukvarjal se je z matematičnim modeliranjem na Inštitutu za računalništvo SB RAS.

V tem prispevku vam želim povedati, kaj je nastala na podlagi ideje o uvedbi usposabljanja za strojno učenje za študente, diplomante Novosibirske državne univerze in vse ostale.

Kako sem organiziral usposabljanje strojnega učenja na NSU

Že dolgo sem si želel organizirati poseben tečaj o pripravi na tekmovanja v analizi podatkov na Kaggle in drugih platformah. To se je zdela odlična ideja:

  • Študenti in vsi zainteresirani bodo teoretično znanje uporabili v praksi in pridobili izkušnje pri reševanju problemov na javnih natečajih.
  • Študenti, ki se na tovrstnih tekmovanjih uvrstijo v vrh, dobro vplivajo na privlačnost NSU za kandidate, študente in diplomante. Enako se zgodi pri treningu športnega programiranja.
  • Ta specialni tečaj odlično dopolnjuje in širi temeljno znanje: udeleženci samostojno izvajajo modele strojnega učenja in pogosto tvorijo ekipe, ki tekmujejo na globalni ravni.
  • Druge univerze so že izvajale takšno usposabljanje, zato sem upal na uspeh posebnega predmeta na NSU.

Izstrelite

Akademgorodok v Novosibirsku ima zelo plodna tla za takšna prizadevanja: študentje, diplomanti in učitelji Centra za računalništvo in močne tehnične fakultete, na primer FIT, MMF, FF, močno podporo uprave NSU, aktivno skupnost ODS, izkušene inženirje in analitiki iz različnih IT podjetij. Približno v istem času smo izvedeli za program nepovratnih sredstev od Botan Investments — sklad podpira ekipe, ki pokažejo dobre rezultate na športnih tekmovanjih ML.

Na NSU smo našli občinstvo za tedenska srečanja, ustvarili klepet na Telegramu in začeli 1. oktobra skupaj s študenti in diplomanti centra CS. Na prvo uro je prišlo 19 ljudi. Šest jih je postalo rednih udeležencev usposabljanja. Skupno je bilo v študijskem letu vsaj enkrat na srečanje 31 ljudi.

Prvi rezultati

S fanti smo se srečali, izmenjali izkušnje, se pogovorili o tekmovanjih in okvirnem načrtu za prihodnost. Kar hitro smo spoznali, da je boj za mesta na tekmovanjih v analizi podatkov običajno, naporno delo, podobno neplačanemu delu s polnim delovnim časom, a zelo zanimivo in vznemirljivo 🙂 Eden od udeležencev, Kaggle-master Maxim, nam je svetoval, da najprej napredujemo na tekmovanjih posamično. , le nekaj tednov kasneje pa se združijo v ekipe ob upoštevanju javnega rezultata. To smo storili! Med usposabljanjem iz oči v oči smo razpravljali o modelih, znanstvenih člankih in zapletenosti knjižnic Python ter skupaj reševali probleme.

Rezultati jesenskega semestra so bile tri srebrne medalje na dveh tekmovanjih na Kagglu: TGS Identifikacija soli и Astronomska klasifikacija PLASTICC. Pa eno tretje mesto na tekmovanju CFT za popravljanje tipkarskih napak s prvim osvojenim denarjem (in the money, kot pravijo izkušeni keglerji).

Drug zelo pomemben posreden rezultat specialnega tečaja je bil zagon in konfiguracija gruče NSU VKI. Njegova računalniška moč je bistveno izboljšala naše tekmovalno življenje: 40 CPU-jev, 755 Gb RAM-a, 8 GPE-jev NVIDIA Tesla V100.

Kako sem organiziral usposabljanje strojnega učenja na NSU

Pred tem smo preživeli po najboljših močeh: računali smo na osebnih prenosnikih in namiznih računalnikih, v Google Colabu in v jedrih Kaggle. Ena ekipa je imela celo samonapisani skript, ki je samodejno shranil model in znova zagnal izračun, ki se je ustavil zaradi časovne omejitve.

V spomladanskem semestru smo nadaljevali z druženjem, izmenjavo uspešnih ugotovitev in pogovori o naših rešitvah konkurence. K nam so začeli prihajati novi zainteresirani udeleženci. V spomladanskem semestru smo v osmih tekmovanjih na Kaggleju uspeli osvojiti eno zlato, tri srebrne in devet bronastih: PetFinder, Santander, Ločljivost glede na spol, Identifikacija kitov, Quora, Googlove znamenitosti in drugi, bronasti v Recco izziv, tretje mesto v Changellenge>>Cup in prvo mesto (spet denarno) v tekmovanju strojnega učenja na prvenstvo v programiranju iz Yandex.

Kaj pravijo udeleženci usposabljanja

Mihail Karčevski
»Zelo sem vesel, da se takšne dejavnosti izvajajo tukaj v Sibiriji, saj menim, da je sodelovanje na tekmovanjih najhitrejši način za obvladovanje ML. Za takšna tekmovanja je strojna oprema precej draga, da jo kupite sami, tukaj pa lahko ideje preizkusite brezplačno.«

Kiril Brodt
»Pred pojavom ML usposabljanja se nisem posebej udeleževal tekmovanj z izjemo treningov in hindujskih tekmovanj: v tem nisem videl smisla, saj sem imel delo na področju ML in sem bil seznanjen s tem. Prvi semester sem obiskoval kot študent. In od drugega semestra, takoj ko so bili na voljo računalniški viri, sem pomislil, zakaj ne bi sodeloval. In to me je zasvojilo. Naloga, podatki in metrike so bili izmišljeni in pripravljeni za vas, nadaljujte in uporabite vso moč MO, preverite najsodobnejše modele in tehnike. Če ne bi bilo usposabljanja in, kar je prav tako pomembno, računalniških virov, ne bi kmalu začel sodelovati.«

Andrej Ševelev
»Osebno usposabljanje ML mi je pomagalo najti somišljenike, s katerimi sem lahko poglobil svoje znanje na področju strojnega učenja in analize podatkov. To je odlična možnost tudi za tiste, ki nimajo veliko prostega časa za samostojno analiziranje in poglobitev v temo tekmovanj, a si vseeno želijo biti v temi.”

Pridruži se nam

Tekmovanja na Kaggle in drugih platformah izpilijo praktične veščine in se hitro spremenijo v zanimivo delo na področju podatkovne znanosti. Ljudje, ki so se skupaj udeležili težkega tekmovanja, pogosto postanejo sodelavci in še naprej uspešno rešujejo službene probleme. To se je zgodilo tudi nam: Mikhail Karchevsky je skupaj s prijateljem iz ekipe šel delat v isto podjetje po sistemu priporočil.

Sčasoma nameravamo to dejavnost razširiti z znanstvenimi objavami in udeležbo na konferencah strojnega učenja. Pridružite se nam kot udeleženci ali strokovnjaki v Novosibirsku - pišite me ali Kiril. Organizirajte podobna izobraževanja v svojih mestih in na univerzah.

Tu je kratek goljuf, ki vam bo v pomoč pri prvih korakih:

  1. Razmislite o primernem kraju in času za redne razrede. Optimalno - 1-2 krat na teden.
  2. Pišite morebitnim zainteresiranim udeležencem o prvem srečanju. Najprej so to študenti tehničnih univerz, udeleženci ODS.
  3. Začnite klepet, da bi razpravljali o aktualnih zadevah: Telegram, VK, WhatsApp ali kateri koli drug messenger, primeren za večino.
  4. Vodite javno dostopen učni načrt, seznam tekmovanj in udeležencev ter spremljajte rezultate.
  5. Poiščite brezplačno računalniško moč ali nepovratna sredstva zanjo na bližnjih univerzah, raziskovalnih inštitutih ali podjetjih.
  6. DOBIČEK!

Vir: www.habr.com

Dodaj komentar