Hvordan jeg organiserede maskinlæringstræning på NSU

Mit navn er Sasha, og jeg elsker maskinlæring såvel som at undervise folk. Nu vejleder jeg uddannelser på Computer Science Center og leder bacheloruddannelsen i dataanalyse ved St. Petersburg State University. Før det arbejdede han som analytiker hos Yandex og endnu tidligere som videnskabsmand: han var engageret i matematisk modellering ved Institute of Computer Science i SB RAS.

I dette indlæg vil jeg fortælle dig, hvad der kom af ideen om at lancere maskinlæringstræning for studerende, kandidater fra Novosibirsk State University og alle andre.

Hvordan jeg organiserede maskinlæringstræning på NSU

Jeg har længe ønsket at arrangere et særligt kursus om forberedelse til dataanalysekonkurrencer på Kaggle og andre platforme. Dette virkede som en god idé:

  • Studerende og alle interesserede vil anvende teoretisk viden i praksis og få erfaring med at løse problemer i offentlige konkurrencer.
  • Studerende, der placerer sig i toppen i sådanne konkurrencer, har en god effekt på NSU's tiltrækningskraft for ansøgere, studerende og kandidater. Det samme sker med træning i sportsprogrammering.
  • Dette særlige kursus supplerer og udvider grundlæggende viden perfekt: Deltagerne implementerer selvstændigt maskinlæringsmodeller og danner ofte hold, der konkurrerer på globalt plan.
  • Andre universiteter havde allerede gennemført en sådan træning, så jeg håbede på succesen med det særlige kursus på NSU.

Запуск

Akademgorodok i Novosibirsk har meget grobund for sådanne bestræbelser: studerende, kandidater og lærere fra Computer Science Center og stærke tekniske fakulteter, for eksempel FIT, MMF, FF, stærk støtte fra NSU-administrationen, et aktivt ODS-fællesskab, erfarne ingeniører og analytikere fra forskellige it-virksomheder. Omtrent samtidig lærte vi om bevillingsprogrammet fra Botan-investeringer — Fonden støtter hold, der viser gode resultater i ML-sportskonkurrencer.

Vi fandt et publikum på NSU til ugentlige møder, oprettede en chat på Telegram og lancerede den 1. oktober sammen med studerende og dimittender fra CS-centret. 19 personer kom til den første lektion. Seks af dem blev faste deltagere i træning. I alt kom 31 personer til mødet mindst én gang i løbet af studieåret.

Første resultater

Fyrene og jeg mødtes, udvekslede erfaringer, diskuterede konkurrencer og en grov plan for fremtiden. Ret hurtigt indså vi, at kamp om pladser i dataanalysekonkurrencer er regelmæssigt, opslidende arbejde, der ligner ulønnet fuldtidsarbejde, men meget interessant og spændende 🙂 En af deltagerne, Kaggle-master Maxim, rådede os til først at gå videre i konkurrencer individuelt. , og kun et par uger senere forenes i hold, under hensyntagen til den offentlige score. Det var det, vi gjorde! Under træning ansigt-til-ansigt diskuterede vi modeller, videnskabelige artikler og forviklingerne ved Python-biblioteker og løste problemer sammen.

Resultaterne af efterårssemesteret blev tre sølvmedaljer i to konkurrencer på Kaggle: TGS Salt Identifikation и PLAsTiCC Astronomisk Klassifikation. Og en tredjeplads i CFT-konkurrencen for at rette stavefejl med de første penge, der blev vundet (i pengene, som erfarne keglere siger).

Et andet meget vigtigt indirekte resultat af det særlige kursus var lanceringen og konfigurationen af ​​NSU VKI-klyngen. Dens computerkraft har forbedret vores konkurrenceliv betydeligt: ​​40 CPU'er, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU'er.

Hvordan jeg organiserede maskinlæringstræning på NSU

Inden da overlevede vi så godt vi kunne: Vi regnede på personlige bærbare og stationære computere, i Google Colab og i Kaggle-kerner. Et hold havde endda et selvskrevet script, der automatisk gemte modellen og genstartede den beregning, der var stoppet på grund af en tidsbegrænsning.

I forårssemesteret fortsatte vi med at samles, udveksle succesfulde resultater og snakke om vores løsninger til konkurrencen. Nye interesserede deltagere begyndte at komme til os. I løbet af forårssemesteret lykkedes det os at tage et guld, tre sølv og ni bronze i otte konkurrencer på Kaggle: PetFinder, Santander, Kønsbestemt opløsning, Hvalidentifikation, Quora, Google Landmarks og andre, bronze i Recco udfordring, tredjeplads i Changellenge>>Cup og førsteplads (igen i pengene) i maskinlæringskonkurrencen kl. programmeringsmesterskab fra Yandex.

Hvad træningsdeltagere siger

Mikhail Karchevsky
”Jeg er meget glad for, at sådanne aktiviteter udføres her i Sibirien, for jeg mener, at deltagelse i konkurrencer er den hurtigste måde at mestre ML på. Til sådanne konkurrencer er hardwaren ret dyr at købe selv, men her kan du prøve ideer gratis.”

Kirill Brodt
”Før ML-træningens fremkomst deltog jeg ikke specielt i konkurrencer med undtagelse af træning og hindu-konkurrencer: Jeg så ikke meningen med dette, da jeg havde arbejde inden for ML, og jeg var bekendt med det. Det første semester deltog jeg som studerende. Og fra andet semester, så snart computerressourcer blev tilgængelige, tænkte jeg, hvorfor ikke deltage. Og det fik mig hooked. Opgaven, dataene og metrikken blev opfundet og forberedt til dig, gå videre og brug MO's fulde kraft, tjek de avancerede modeller og teknikker. Hvis det ikke var for træningen og, lige så vigtigt, computerressourcerne, ville jeg ikke være begyndt at deltage snart."

Andrey Shevelev
“In-person ML-træning hjalp mig med at finde ligesindede, med hvem jeg var i stand til at uddybe min viden inden for maskinlæring og dataanalyse. Dette er også en glimrende mulighed for dem, der ikke har meget fritid til selvstændigt at analysere og fordybe sig i emnet for konkurrencer, men stadig ønsker at være i emnet."

kom med os

Konkurrencer på Kaggle og andre platforme skærper praktiske færdigheder og konverteres hurtigt til interessant arbejde inden for datavidenskab. Folk, der har deltaget i en svær konkurrence sammen, bliver ofte kolleger og fortsætter med at løse arbejdsrelaterede problemer med succes. Dette skete også for os: Mikhail Karchevsky gik sammen med en ven fra holdet på arbejde for det samme firma på et anbefalingssystem.

Med tiden planlægger vi at udvide denne aktivitet med videnskabelige publikationer og deltagelse i maskinlæringskonferencer. Slut dig til os som deltagere eller eksperter i Novosibirsk - skriv mig eller Kirill. Organiser lignende træning i dine byer og universiteter.

Her er et lille snydeark til at hjælpe dig med at tage dine første skridt:

  1. Overvej et passende sted og tidspunkt for almindelige klasser. Optimalt - 1-2 gange om ugen.
  2. Skriv til potentielt interesserede deltagere om det første møde. Først og fremmest er disse studerende fra tekniske universiteter, ODS-deltagere.
  3. Start en chat for at diskutere aktuelle anliggender: Telegram, VK, WhatsApp eller enhver anden messenger, der er praktisk for de fleste.
  4. Vedligehold en offentligt tilgængelig lektionsplan, en liste over konkurrencer og deltagere, og overvåg resultaterne.
  5. Find gratis computerkraft eller tilskud til det på nærliggende universiteter, forskningsinstitutter eller virksomheder.
  6. PROFIT!

Kilde: www.habr.com

Tilføj en kommentar