Hoe ik machine learning-trainingen organiseerde bij NSU

Mijn naam is Sasha en ik hou van machine learning en van lesgeven aan mensen. Nu begeleid ik onderwijsprogramma's bij het Computer Science Center en leid ik de bacheloropleiding data-analyse aan de St. Petersburg State University. Daarvoor werkte hij als analist bij Yandex, en zelfs eerder als wetenschapper: hij hield zich bezig met wiskundige modellen aan het Institute of Computer Science van de SB RAS.

In dit bericht wil ik je vertellen wat er voortkwam uit het idee om machine learning-trainingen te lanceren voor studenten, afgestudeerden van de Novosibirsk State University en alle anderen.

Hoe ik machine learning-trainingen organiseerde bij NSU

Ik wilde al lang een speciale cursus organiseren over het voorbereiden van data-analysewedstrijden op Kaggle en andere platforms. Dit leek mij een goed idee:

  • Studenten en geïnteresseerden passen theoretische kennis toe in de praktijk en doen ervaring op met het oplossen van problemen in openbare competities.
  • Studenten die in dergelijke competities aan de top eindigen, hebben een goed effect op de aantrekkelijkheid van NSU voor sollicitanten, studenten en afgestudeerden. Hetzelfde gebeurt met training in sportprogrammering.
  • Deze speciale cursus is een perfecte aanvulling en uitbreiding van fundamentele kennis: deelnemers implementeren zelfstandig machine learning-modellen en vormen vaak teams die op mondiaal niveau concurreren.
  • Andere universiteiten hadden een dergelijke training al gegeven, dus ik hoopte op het succes van de speciale cursus bij NSU.

lancering

De Akademgorodok van Novosibirsk heeft een zeer vruchtbare voedingsbodem voor dergelijke inspanningen: studenten, afgestudeerden en docenten van het Computer Science Center en sterke technische faculteiten, bijvoorbeeld FIT, MMF, FF, sterke steun van de NSU-administratie, een actieve ODS-gemeenschap, ervaren ingenieurs en analisten van verschillende IT-bedrijven. Rond dezelfde tijd leerden we over het subsidieprogramma van Botanische investeringen — het fonds ondersteunt teams die goede resultaten laten zien in ML-sportcompetities.

We vonden publiek bij NSU voor wekelijkse bijeenkomsten, creëerden een chat op Telegram en lanceerden op 1 oktober samen met studenten en afgestudeerden van het CS-centrum. Er kwamen 19 mensen naar de eerste les. Zes van hen werden vaste deelnemers aan de training. In totaal kwamen er gedurende het studiejaar minimaal één keer 31 mensen naar de bijeenkomst.

Eerste resultaten

De jongens en ik ontmoetten elkaar, wisselden ervaringen uit, bespraken wedstrijden en een ruw plan voor de toekomst. Al snel beseften we dat vechten voor plaatsen in data-analysewedstrijden regulier, afmattend werk is, vergelijkbaar met onbetaald fulltime werk, maar erg interessant en spannend 🙂 Een van de deelnemers, Kaggle-meester Maxim, adviseerde ons om eerst individueel door te gaan in wedstrijden , en slechts een paar weken later verenigen ze zich in teams, rekening houdend met de publieke score. Dat is wat wij deden! Tijdens de persoonlijke training bespraken we modellen, wetenschappelijke artikelen en de fijne kneepjes van Python-bibliotheken, en losten we samen problemen op.

De resultaten van het herfstsemester waren drie zilveren medailles in twee competities op Kaggle: TGS-zoutidentificatie и PLAsTiCC Astronomische classificatie. En een derde plaats in de CFT-competitie voor het corrigeren van typefouten met het eerste gewonnen geld (in het geld, zoals ervaren keglers zeggen).

Een ander zeer belangrijk indirect resultaat van de speciale cursus was de lancering en configuratie van het NSU VKI-cluster. De rekenkracht heeft ons competitieve leven aanzienlijk verbeterd: 40 CPU's, 755 GB RAM, 8 NVIDIA Tesla V100 GPU's.

Hoe ik machine learning-trainingen organiseerde bij NSU

Voordien overleefden we zo goed als we konden: we rekenden op persoonlijke laptops en desktops, in Google Colab en in Kaggle-kernels. Eén team had zelfs een zelfgeschreven script dat het model automatisch opsloeg en de door een tijdslimiet gestopte berekening opnieuw opstartte.

In het voorjaarssemester bleven we bijeenkomen, succesvolle bevindingen uitwisselen en praten over onze oplossingen voor de concurrentie. Nieuwe geïnteresseerde deelnemers kwamen naar ons toe. Tijdens het voorjaarssemester zijn we erin geslaagd om één keer goud, drie keer zilver en negen keer brons te pakken in acht wedstrijden op Kaggle: Dierenzoeker, Santander, Geslachtsresolutie, Walvisidentificatie, Quora, Google-oriëntatiepunten en anderen, brons in Recco-uitdaging, derde plaats in Changellenge>>Cup en eerste plaats (opnieuw in het geld) in de machine learning-competitie op kampioenschap programmeren van Yandex.

Wat deelnemers aan de training zeggen

Michail Karchevski
“Ik ben erg blij dat dergelijke activiteiten hier in Siberië worden uitgevoerd, omdat ik geloof dat deelname aan wedstrijden de snelste manier is om ML onder de knie te krijgen. Bij zulke wedstrijden is de hardware vrij duur om zelf aan te schaffen, maar hier kun je gratis ideeën uitproberen.”

Kirill Brodt
“Vóór de komst van ML-training nam ik niet bepaald deel aan wedstrijden, met uitzondering van trainingen en hindoeïstische wedstrijden: ik zag daar het nut niet van in, aangezien ik werk had op het gebied van ML, en ik was er bekend mee. Het eerste semester heb ik als student gevolgd. En vanaf het tweede semester, zodra computerbronnen beschikbaar kwamen, dacht ik: waarom niet meedoen. En het heeft mij verslaafd gemaakt. De taak, gegevens en statistieken zijn voor u bedacht en voorbereid, ga uw gang en gebruik de volledige kracht van MO, bekijk de state-of-the-art modellen en technieken. Zonder de training en, net zo belangrijk, de computermiddelen, zou ik niet snel zijn begonnen met meedoen.”

Andrej Shevelev
“Persoonlijke ML-training heeft mij geholpen gelijkgestemde mensen te vinden, met wie ik mijn kennis op het gebied van machine learning en data-analyse heb kunnen verdiepen. Dit is ook een uitstekende optie voor degenen die niet veel vrije tijd hebben om zelfstandig te analyseren en zich te verdiepen in het onderwerp competities, maar toch in het onderwerp willen geïnteresseerd zijn.”

doe met ons mee

Competities op Kaggle en andere platforms scherpen praktische vaardigheden aan en worden snel omgezet in interessant werk op het gebied van data science. Mensen die samen aan een moeilijke competitie hebben deelgenomen, worden vaak collega's en blijven werkgerelateerde problemen met succes oplossen. Dit overkwam ons ook: Mikhail Karchevsky ging samen met een vriend uit het team voor hetzelfde bedrijf aan de slag met een aanbevelingssysteem.

In de loop van de tijd zijn we van plan deze activiteit uit te breiden met wetenschappelijke publicaties en deelname aan machine learning-conferenties. Sluit je aan bij ons als deelnemers of experts in Novosibirsk - schrijf me of Kirill. Organiseer soortgelijke trainingen in uw steden en universiteiten.

Hier is een klein spiekbriefje om u te helpen uw eerste stappen te zetten:

  1. Overweeg een geschikte plaats en tijd voor reguliere lessen. Optimaal - 1-2 keer per week.
  2. Schrijf naar potentieel geïnteresseerde deelnemers over de eerste bijeenkomst. In de eerste plaats zijn dit studenten van technische universiteiten, ODS-deelnemers.
  3. Start een chat om actuele zaken te bespreken: Telegram, VK, WhatsApp of een andere messenger die voor de meesten handig is.
  4. Houd een openbaar toegankelijk lesplan bij, een lijst met wedstrijden en deelnemers, en monitor de resultaten.
  5. Vind gratis rekenkracht of subsidies ervoor bij nabijgelegen universiteiten, onderzoeksinstituten of bedrijven.
  6. WINST!

Bron: www.habr.com

Voeg een reactie