Hur jag organiserade maskininlärningsutbildning på NSU

Jag heter Sasha och jag älskar maskininlärning och att lära människor. Nu handleder jag utbildningsprogram på Computer Science Center och leder kandidatprogrammet i dataanalys vid St. Petersburg State University. Dessförinnan arbetade han som analytiker på Yandex, och ännu tidigare som vetenskapsman: han var engagerad i matematisk modellering vid Institute of Computer Science vid SB RAS.

I det här inlägget vill jag berätta vad som kom av idén om att lansera utbildning för maskininlärning för studenter, utexaminerade från Novosibirsk State University och alla andra.

Hur jag organiserade maskininlärningsutbildning på NSU

Jag har länge velat anordna en specialkurs om att förbereda för dataanalystävlingar på Kaggle och andra plattformar. Detta verkade vara en bra idé:

  • Studenter och alla intresserade kommer att tillämpa teoretisk kunskap i praktiken och få erfarenhet av att lösa problem i offentliga tävlingar.
  • Studenter som placerar sig i toppen i sådana tävlingar har en god effekt på NSU:s attraktionskraft för sökande, studenter och akademiker. Samma sak händer med träning i sportprogrammering.
  • Den här specialkursen kompletterar och utökar grundläggande kunskaper perfekt: deltagare implementerar självständigt maskininlärningsmodeller och bildar ofta team som tävlar på global nivå.
  • Andra universitet hade redan genomfört sådan utbildning, så jag hoppades på framgången för specialkursen vid NSU.

Запуск

Akademgorodok i Novosibirsk har mycket grogrund för sådana ansträngningar: studenter, akademiker och lärare vid Computer Science Center och starka tekniska fakulteter, till exempel FIT, MMF, FF, starkt stöd från NSU-administrationen, en aktiv ODS-gemenskap, erfarna ingenjörer och analytiker från olika IT-företag. Ungefär samtidigt fick vi veta om bidragsprogrammet från Botan investeringar — fonden stödjer lag som visar goda resultat i ML-idrottstävlingar.

Vi hittade en publik på NSU för veckomöten, skapade en chatt på Telegram och lanserade den 1 oktober tillsammans med studenter och utexaminerade från CS-centret. 19 personer kom till första lektionen. Sex av dem blev regelbundna deltagare i träning. Totalt kom 31 personer till mötet minst en gång under läsåret.

Första resultaten

Jag och killarna träffades, utbytte erfarenheter, diskuterade tävlingar och en grov plan för framtiden. Ganska snabbt insåg vi att att slåss om platserna i dataanalystävlingar är ett vanligt, ansträngande arbete, liknande obetalt heltidsarbete, men väldigt intressant och spännande 🙂 En av deltagarna, Kaggle-master Maxim, tipsade oss om att först avancera i tävlingar individuellt , och bara några veckor senare förenas i lag, med hänsyn till publikens poäng. Det var vad vi gjorde! Under träning ansikte mot ansikte diskuterade vi modeller, vetenskapliga artiklar och invecklade Python-bibliotek och löste problem tillsammans.

Resultatet av höstterminen blev tre silvermedaljer i två tävlingar på Kaggle: TGS Salt Identifiering и PLAsTiCC astronomisk klassificering. Och en tredje plats i CFT-tävlingen för att korrigera stavfel med de första pengarna som vann (i pengarna, som erfarna kegler säger).

Ett annat mycket viktigt indirekt resultat av specialkursen var lanseringen och konfigureringen av NSU VKI-klustret. Dess datorkraft har avsevärt förbättrat vårt konkurrenskraftiga liv: 40 processorer, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU:er.

Hur jag organiserade maskininlärningsutbildning på NSU

Innan dess överlevde vi så gott vi kunde: vi räknade på personliga bärbara och stationära datorer, i Google Colab och i Kaggle-kärnor. Ett team hade till och med ett självskrivet skript som automatiskt sparade modellen och startade om beräkningen som hade stoppat på grund av en tidsbegränsning.

Under vårterminen fortsatte vi att samlas, utbyta framgångsrika rön och prata om våra lösningar på tävlingen. Nya intresserade deltagare började komma till oss. Under vårterminen lyckades vi ta ett guld, tre silver och nio brons i åtta tävlingar på Kaggle: PetFinder, santander, Könsupplösning, Validentifiering, Quora, Google Landmärken och andra, brons in Recco utmaning, tredje plats i Changellenge>>Cup och första plats (igen i pengarna) i maskininlärningstävlingen kl. mästerskap i programmering från Yandex.

Vad träningsdeltagarna säger

Mikhail Karchevsky
”Jag är väldigt glad att sådana aktiviteter genomförs här i Sibirien, eftersom jag tror att deltagande i tävlingar är det snabbaste sättet att bemästra ML. För sådana tävlingar är hårdvaran ganska dyr att köpa själv, men här kan du prova idéer gratis.”

Kirill Brodt
"Innan ML-träningen kom, deltog jag inte särskilt i tävlingar med undantag för träning och hinduiska tävlingar: jag såg inte poängen med detta, eftersom jag hade arbete inom ML-området och jag var bekant med det. Första terminen gick jag som student. Och från och med andra terminen, så fort datorresurser blev tillgängliga, tänkte jag, varför inte delta. Och det gjorde mig fast. Uppgiften, data och mätvärden uppfanns och förbereddes för dig, fortsätt och använd MO:s fulla kraft, kontrollera de senaste modellerna och teknikerna. Om det inte vore för utbildningen och, lika viktigt, datorresurserna, skulle jag inte ha börjat delta snart."

Andrey Shevelev
"Personlig ML-utbildning hjälpte mig att hitta likasinnade, med vilka jag kunde fördjupa mina kunskaper inom området maskininlärning och dataanalys. Detta är också ett utmärkt alternativ för dem som inte har mycket fritid att självständigt analysera och fördjupa sig i tävlingsämnet, men ändå vill vara i ämnet."

gå med oss

Tävlingar på Kaggle och andra plattformar finslipar praktiska färdigheter och omvandlas snabbt till intressant arbete inom datavetenskap. Människor som har deltagit i en svår tävling tillsammans blir ofta kollegor och fortsätter att framgångsrikt lösa arbetsrelaterade problem. Detta hände oss också: Mikhail Karchevsky, tillsammans med en vän från teamet, gick till jobbet för samma företag på ett rekommendationssystem.

Med tiden planerar vi att utöka denna aktivitet med vetenskapliga publikationer och deltagande i maskininlärningskonferenser. Följ med oss ​​som deltagare eller experter i Novosibirsk - skriv mig eller Kirill. Organisera liknande utbildningar i dina städer och universitet.

Här är ett litet fuskblad som hjälper dig att ta dina första steg:

  1. Tänk på en lämplig plats och tid för vanliga lektioner. Optimalt - 1-2 gånger i veckan.
  2. Skriv till potentiellt intresserade deltagare om det första mötet. Först och främst är dessa studenter vid tekniska universitet, ODS-deltagare.
  3. Starta en chatt för att diskutera aktuella frågor: Telegram, VK, WhatsApp eller någon annan budbärare som är bekväm för de flesta.
  4. Upprätthålla en allmänt tillgänglig lektionsplan, en lista över tävlingar och deltagare och övervaka resultaten.
  5. Hitta gratis datorkraft eller anslag för det i närliggande universitet, forskningsinstitut eller företag.
  6. VINST!

Källa: www.habr.com

Lägg en kommentar