Kuidas ma NSU-s masinõppe koolitust korraldasin

Minu nimi on Sasha ja mulle meeldib nii masinõpe kui ka inimeste õpetamine. Nüüd juhendan arvutiteaduse keskuse haridusprogramme ja juhendan andmeanalüüsi bakalaureusekraadi Peterburi Riiklikus Ülikoolis. Enne seda töötas ta Yandexis analüütikuna ja veel varem teadlasena: tegeles SB RAS-i arvutiteaduse instituudis matemaatilise modelleerimisega.

Selles postituses tahan teile rääkida, mis sai ideest käivitada masinõppe koolitus üliõpilastele, Novosibirski Riikliku Ülikooli lõpetanutele ja kõigile teistele.

Kuidas ma NSU-s masinõppe koolitust korraldasin

Olen ammu tahtnud korraldada Kaggle ja teistel platvormidel andmeanalüüsi võistlusteks valmistumise erikursuse. See tundus suurepärane idee:

  • Õpilased ja kõik huvilised rakendavad teoreetilisi teadmisi praktikas ja saavad kogemusi probleemide lahendamisel avalikel konkurssidel.
  • Üliõpilased, kes saavutavad sellistel võistlustel esikoha, mõjutavad hästi NSU atraktiivsust taotlejate, üliõpilaste ja lõpetajate jaoks. Sama juhtub ka spordi programmeerimise koolitusega.
  • See erikursus täiendab ja laiendab suurepäraselt põhiteadmisi: osalejad rakendavad iseseisvalt masinõppe mudeleid ja moodustavad sageli meeskondi, mis võistlevad globaalsel tasandil.
  • Teised ülikoolid olid selliseid koolitusi juba läbi viinud, nii et lootsin NSU erikursuse edule.

Käivita

Novosibirski Akademgorodokil on sellisteks ettevõtmisteks väga viljakas pinnas: arvutiteaduste keskuse üliõpilased, lõpetajad ja õpetajad ning tugevad tehnilised teaduskonnad, näiteks FIT, MMF, FF, NSU administratsiooni tugev toetus, aktiivne ODS-kogukond, kogenud insenerid. ja erinevate IT-ettevõtete analüütikud. Umbes samal ajal saime toetusprogrammist teada Botaani investeeringud — fond toetab ML-spordivõistlustel häid tulemusi näidanud võistkondi.

Leidsime NSU-s publiku iganädalasteks koosolekuteks, lõime Telegramis vestluse ja alustasime 1. oktoobril koos CS-i keskuse üliõpilaste ja lõpetajatega. Esimesse tundi tuli 19 inimest. Neist kuuest said regulaarsed koolitusel osalejad. Kokku tuli õppeaasta jooksul koosolekule vähemalt korra 31 inimest.

Esimesed tulemused

Saime poistega kokku, vahetasime kogemusi, arutasime võistlusi ja umbkaudset tulevikuplaani. Üsna kiiresti saime aru, et andmeanalüüsi võistlustel kohtade eest võitlemine on tavaline, kurnav töö, mis sarnaneb tasustamata täistööajaga, kuid väga huvitav ja põnev 🙂 Üks osalejatest, Kaggle-meister Maxim, soovitas meil esmalt individuaalselt võistlustel edasi saada. , ja alles paar nädalat hiljem ühinege meeskondadeks, võttes arvesse avalikku skoori. Seda me tegimegi! Näost näkku koolitusel arutasime mudeleid, teadusartikleid ja Pythoni raamatukogude nõtkusi ning lahendasime koos probleeme.

Sügissemestri tulemused olid Kaggle kahel võistlusel kolm hõbemedalit: TGS-i soola identifitseerimine и PLAsTiCC astronoomiline klassifikatsioon. Ja kirjavigade parandamise CFT konkursil kolmas koht esimese võidetud rahaga (rahas, nagu kogenud keglerid ütlevad).

Teine väga oluline erikursuse kaudne tulemus oli NSU VKI klastri käivitamine ja seadistamine. Selle arvutusvõimsus on oluliselt parandanud meie konkurentsivõimelist eluiga: 40 protsessorit, 755 Gb muutmälu, 8 NVIDIA Tesla V100 GPU-d.

Kuidas ma NSU-s masinõppe koolitust korraldasin

Enne seda elasime ellu nii hästi kui suutsime: arvutasime isiklike sülearvutite ja lauaarvutite, Google Colabi ja Kaggle tuumade pealt. Ühel meeskonnal oli isegi enda kirjutatud skript, mis mudeli automaatselt salvestas ja ajalimiidi tõttu seiskunud arvutuse taaskäivitas.

Kevadsemestril jätkasime kogunemist, edukate leidude vahetamist ja oma konkursilahenduste rääkimist. Meie juurde hakkas tulema uusi huvilisi. Kevadsemestril õnnestus Kaggle kaheksal võistlusel võtta üks kuld, kolm hõbedat ja üheksa pronksi: Lemmikloomade leidja, Santander, Sooline eraldusvõime, Vaalade identifitseerimine, Quora, Google'i maamärgid ja teised, pronks sisse Recco väljakutse, kolmas koht Changellenge>>Cup ja esikoht (taas rahas) masinõppe võistlusel kl. programmeerimise meistrivõistlused Yandexist.

Mida koolitusel osalejad räägivad

Mihhail Kartševski
“Mul on väga hea meel, et selliseid tegevusi siin Siberis tehakse, sest usun, et võistlustel osalemine on kiireim viis ML-i valdamiseks. Sellisteks võistlusteks on riistvara ise ostmine üsna kallis, aga siin saab ideid proovida tasuta.»

Kirill Brodt
“Enne ML-treeningu tulekut ma eriti võistlustel ei osalenud, välja arvatud treening- ja hinduvõistlused: ma ei näinud sellel mõtet, kuna mul oli ML-i alal töö ja see oli mulle tuttav. Esimesel semestril osalesin üliõpilasena. Ja alates teisest semestrist, niipea kui arvutiressursid vabanesid, mõtlesin, et miks mitte osaleda. Ja see köitis mind. Ülesanne, andmed ja mõõdikud leiutati ja valmistati teie jaoks ette, olge ja kasutage MO täit võimsust, kontrollige nüüdisaegseid mudeleid ja tehnikaid. Kui poleks olnud koolitust ja, mis sama oluline, arvutusressursse, poleks ma niipea osalema hakanud.

Andrei Ševelev
“Isiklik ML koolitus aitas mul leida mõttekaaslasi, kellega koos sain süvendada oma teadmisi masinõppe ja andmeanalüüsi vallas. See on suurepärane võimalus ka neile, kel pole palju vaba aega iseseisvaks analüüsimiseks ja võistluste teemasse süvenemiseks, kuid soovivad siiski teemas olla.

Liitu meiega

Kaggle ja teistel platvormidel toimuvad võistlused lihvivad praktilisi oskusi ja muutuvad kiiresti huvitavaks tööks andmeteaduse vallas. Üheskoos raskel võistlusel osalenud inimestest saavad sageli kolleegid ja jätkavad tööga seotud probleemide edukat lahendamist. Nii juhtus ka meiega: Mihhail Karchevsky läks koos sõbraga meeskonnast samasse firmasse tööle soovitussüsteemi alusel.

Aja jooksul plaanime seda tegevust laiendada teaduspublikatsioonide ja masinõppekonverentsidel osalemisega. Liituge meiega Novosibirskis osalejate või ekspertidena – kirjutage mind või Kirill. Korraldage samalaadset koolitust oma linnades ja ülikoolides.

Siin on väike petuleht, mis aitab teil esimesi samme astuda:

  1. Kaaluge tavaliste tundide jaoks sobivat kohta ja aega. Optimaalselt - 1-2 korda nädalas.
  2. Kirjutage potentsiaalsetele osalejatele esimesest kohtumisest. Esiteks on need tehnikaülikoolide üliõpilased, ODS-i osalejad.
  3. Alustage vestlust, et arutada päevakajalisi asju: Telegram, VK, WhatsApp või mõni muu enamiku jaoks mugav messenger.
  4. Säilitage avalikult juurdepääsetav tunniplaan, võistluste ja osalejate nimekiri ning jälgige tulemusi.
  5. Otsige tasuta arvutusvõimsust või selle jaoks toetusi lähedalasuvatest ülikoolidest, uurimisinstituutidest või ettevõtetest.
  6. KASUM!

Allikas: www.habr.com

Lisa kommentaar