Hvordan jeg organiserte maskinlæringstrening ved NSU

Mitt navn er Sasha og jeg elsker maskinlæring i tillegg til å undervise folk. Nå veileder jeg utdanningsprogrammer ved Computer Science Center og leder bachelorstudiet i dataanalyse ved St. Petersburg State University. Før det jobbet han som analytiker ved Yandex, og enda tidligere som vitenskapsmann: han var engasjert i matematisk modellering ved Institute of Computer Science ved SB RAS.

I dette innlegget vil jeg fortelle deg hva som kom av ideen om å lansere maskinlæringstrening for studenter, nyutdannede ved Novosibirsk State University og alle andre.

Hvordan jeg organiserte maskinlæringstrening ved NSU

Jeg har lenge ønsket å organisere et spesialkurs om forberedelse til dataanalysekonkurranser på Kaggle og andre plattformer. Dette virket som en god idé:

  • Studenter og alle interesserte vil anvende teoretisk kunnskap i praksis og få erfaring med å løse problemer i offentlige konkurranser.
  • Studenter som plasserer seg på topp i slike konkurranser har god effekt på attraktiviteten til NSU for søkere, studenter og nyutdannede. Det samme skjer med trening i sportsprogrammering.
  • Dette spesialkurset kompletterer og utvider grunnleggende kunnskap perfekt: deltakerne implementerer selvstendig maskinlæringsmodeller og danner ofte team som konkurrerer på globalt nivå.
  • Andre universiteter hadde allerede gjennomført slik opplæring, så jeg håpet på suksess med spesialkurset ved NSU.

lanseringen

Akademgorodok i Novosibirsk har veldig grobunn for slike bestrebelser: studenter, nyutdannede og lærere ved Computer Science Center og sterke tekniske fakulteter, for eksempel FIT, MMF, FF, sterk støtte fra NSU-administrasjonen, et aktivt ODS-samfunn, erfarne ingeniører og analytikere fra ulike IT-selskaper. Omtrent samtidig fikk vi vite om stipendprogrammet fra Botan-investeringer — fondet støtter lag som viser gode resultater i ML idrettskonkurranser.

Vi fant et publikum på NSU for ukentlige møter, opprettet en chat på Telegram, og lanserte 1. oktober sammen med studenter og nyutdannede ved CS-senteret. 19 personer kom til den første timen. Seks av dem ble faste deltakere på trening. Totalt kom 31 personer på møtet minst én gang i løpet av studieåret.

Første resultater

Gutta og jeg møttes, utvekslet erfaringer, diskuterte konkurranser og en grov plan for fremtiden. Ganske raskt skjønte vi at å kjempe om plassene i dataanalysekonkurranser er vanlig, utmattende arbeid, likt ulønnet fulltidsarbeid, men veldig interessant og spennende 🙂 En av deltakerne, Kaggle-master Maxim, rådet oss til først å gå videre i konkurranser individuelt. , og bare noen få uker senere forenes i lag, tatt i betraktning den offentlige poengsummen. Det var det vi gjorde! Under trening ansikt til ansikt diskuterte vi modeller, vitenskapelige artikler og forviklingene ved Python-biblioteker, og løste problemer sammen.

Resultatene av høstsemesteret ble tre sølvmedaljer i to konkurranser på Kaggle: TGS-saltidentifikasjon и PLAsTiCC astronomisk klassifisering. Og en tredjeplass i CFT-konkurransen for å rette skrivefeil med de første pengene som ble vunnet (i pengene, som erfarne keglere sier).

Et annet svært viktig indirekte resultat av spesialkurset var lanseringen og konfigurasjonen av NSU VKI-klyngen. Datakraften har forbedret konkurranselivet vårt betydelig: 40 CPUer, 755 Gb RAM, 8 NVIDIA Tesla V100 GPUer.

Hvordan jeg organiserte maskinlæringstrening ved NSU

Før det overlevde vi så godt vi kunne: vi regnet på personlige bærbare og stasjonære datamaskiner, i Google Colab og i Kaggle-kjerner. Ett team hadde til og med et selvskrevet skript som automatisk lagret modellen og startet på nytt regnestykket som hadde stoppet på grunn av en tidsbegrensning.

I vårsemesteret fortsatte vi å samles, utveksle vellykkede funn og snakke om våre løsninger på konkurransen. Nye interesserte deltakere begynte å komme til oss. I løpet av vårsemesteret klarte vi å ta ett gull, tre sølv og ni bronse i åtte konkurranser på Kaggle: PetFinder, Santander, Kjønnsdelt oppløsning, Hvalidentifikasjon, Quora, Google landemerker og andre, bronse i Recco utfordring, tredjeplass i Changellenge>>Cup og førsteplass (igjen i pengene) i maskinlæringskonkurransen kl. programmeringsmesterskap fra Yandex.

Hva treningsdeltakerne sier

Mikhail Karchevsky
«Jeg er veldig glad for at slike aktiviteter gjennomføres her i Sibir, fordi jeg tror at deltakelse i konkurranser er den raskeste måten å mestre ML på. For slike konkurranser er maskinvaren ganske dyr å kjøpe selv, men her kan du prøve ideer gratis.»

Kirill Brodt
«Før inntoget av ML-trening deltok jeg ikke spesielt i konkurranser med unntak av trening og hindu-konkurranser: Jeg så ikke poenget med dette, siden jeg hadde arbeid innen ML, og jeg var kjent med det. Det første semesteret gikk jeg som student. Og fra andre semester, så snart dataressurser ble tilgjengelige, tenkte jeg, hvorfor ikke delta. Og det gjorde meg hekta. Oppgaven, dataene og beregningene ble oppfunnet og forberedt for deg, fortsett og bruk den fulle kraften til MO, sjekk de toppmoderne modellene og teknikkene. Hvis det ikke var for opplæringen og, like viktig, dataressursene, ville jeg ikke ha begynt å delta snart.»

Andrey Shevelev
«Personlig ML-opplæring hjalp meg med å finne likesinnede, som jeg var i stand til å utdype kunnskapen min innen maskinlæring og dataanalyse med. Dette er også et utmerket alternativ for de som ikke har mye fritid til selvstendig å analysere og fordype seg i konkurranseemnet, men som fortsatt ønsker å være i emnet.»

bli med oss

Konkurranser på Kaggle og andre plattformer finpner praktiske ferdigheter og konverteres raskt til interessant arbeid innen datavitenskap. Folk som har deltatt i en vanskelig konkurranse sammen, blir ofte kolleger og fortsetter å lykkes med å løse arbeidsrelaterte problemer. Dette skjedde med oss ​​også: Mikhail Karchevsky, sammen med en venn fra teamet, dro på jobb for det samme selskapet etter et anbefalingssystem.

Over tid planlegger vi å utvide denne aktiviteten med vitenskapelige publikasjoner og deltakelse på maskinlæringskonferanser. Bli med oss ​​som deltakere eller eksperter i Novosibirsk - skriv meg eller Kirill. Organiser lignende opplæring i byene og universitetene dine.

Her er et lite jukseark for å hjelpe deg med å ta de første skrittene dine:

  1. Vurder et passende sted og tidspunkt for vanlige klasser. Optimalt - 1-2 ganger i uken.
  2. Skriv til potensielt interesserte deltakere om det første møtet. Først av alt er dette studenter ved tekniske universiteter, ODS-deltakere.
  3. Start en chat for å diskutere aktuelle saker: Telegram, VK, WhatsApp eller en annen messenger som er praktisk for de fleste.
  4. Oppretthold en offentlig tilgjengelig leksjonsplan, en liste over konkurranser og deltakere, og overvåk resultatene.
  5. Finn gratis datakraft eller tilskudd for det i nærliggende universiteter, forskningsinstitutter eller selskaper.
  6. PROFITT!

Kilde: www.habr.com

Legg til en kommentar