Wéi ech Maschinn Léieren Training bei NSU organiséiert hunn

Mäin Numm ass Sasha an ech Léift Maschinn Léieren souwéi Léieren Leit. Elo iwwerwaachen ech pädagogesch Programmer am Computer Science Center an dirigéieren de Bachelorstudium an der Datenanalyse op der St. Virun deem huet hien als Analyst bei Yandex geschafft, an och fréier als Wëssenschaftler: hie war an der mathematesch Modeller am Institut fir Informatik vun der SB RAS engagéiert.

An dësem Post wëll ech Iech soen wat vun der Iddi koum fir Maschinn Léieren Training fir Studenten, Graduéierter vun der Novosibirsk State University an all déi aner ze lancéieren.

Wéi ech Maschinn Léieren Training bei NSU organiséiert hunn

Ech wollt laang e spezielle Cours organiséieren iwwer d'Virbereedung fir Datenanalyse-Concoursen op Kaggle an aner Plattformen. Dëst schéngt wéi eng super Iddi:

  • Studenten a jiddereen interesséiert wäerten theoretescht Wëssen an der Praxis applizéieren an Erfahrung kréien fir Probleemer an ëffentleche Concoursen ze léisen.
  • Schüler, déi un der Spëtzt an esou Concoursen Plaz hunn e gudden Effekt op d'Attraktivitéit vun NSU fir Bewerberinnen, Studenten a Graduéierter. Datselwecht geschitt mat Sportprogramméierungstraining.
  • Dëse spezielle Cours perfekt ergänzt an erweidert d'fundamental Wëssen: d'Participanten implementéieren onofhängeg Maschinnléiermodeller an bilden dacks Teams déi um globalen Niveau konkurréiere.
  • Aner Universitéiten hu schonn esou Formatiounen duerchgefouert, also ech gehofft op den Erfolleg vun der speziell Cours op NSU.

Lancéiere

D'Akademgorodok vun Novosibirsk huet ganz fruchtbare Buedem fir esou Bestriewen: Studenten, Graduéierter an Enseignanten vum Computer Science Center a staark technesch Fakultéiten, zum Beispill, FIT, MMF, FF, staark Ënnerstëtzung vun der NSU Administratioun, eng aktiv ODS Communautéit, erfuerene Ingenieuren an Analysten aus verschiddenen IT Firmen. Ëm déiselwecht Zäit hu mir iwwer de Subventiounsprogramm geléiert Botan Investitiounen - de Fonds ënnerstëtzt Équipë déi gutt Resultater am ML Sport Concoursen weisen.

Mir hunn e Publikum bei der NSU fir wëchentlech Reuniounen fonnt, en Chat op Telegram erstallt, an den 1. Oktober zesumme mat Studenten a Graduéierter vum CS-Center lancéiert. 19 Leit koumen op déi éischt Stonn. Sechs vun hinnen goufen regelméisseg Participanten am Training. Am ganzen sinn am Laf vum akademescht Joer op d'mannst 31 Leit op d'Versammlung komm.

Éischt Resultater

D'Jongen an ech hu sech begéint, Erfahrungen austauscht, Concoursen diskutéiert an e graff Plang fir d'Zukunft. Zimlech séier hu mir gemierkt datt de Kampf fir Plazen an Datenanalyse-Concoursen regelméisseg, ustrengend Aarbecht ass, ähnlech wéi onbezuelten Vollzäitaarbecht, awer ganz interessant a spannend 🙂 Ee vun de Participanten, Kaggle-Master Maxim, huet eis ugeroden fir d'éischt an de Concoursen individuell virzegoen. , an nëmmen e puer Woche méi spéit an Équipen vereenegen, andeems de ëffentleche Score berücksichtegt gëtt. Dat hu mir gemaach! Wärend dem Gesiicht-zu-Gesiicht Training hu mir Modeller, wëssenschaftlech Artikelen an d'Intricacies vu Python-Bibliothéiken diskutéiert, a Problemer zesumme geléist.

D'Resultater vum Hierschtsemester waren dräi Sëlwermedailen an zwee Concoursen op Kaggle: TGS Salz Identifikatioun и PLAsTiCC Astronomesch Klassifikatioun. An eng drëtt Plaz am CFT Concours fir d'Korrigéiere vun Tippfehler mat den éischte Suen gewonnen (an de Suen, wéi erfuerene Kegler soen).

En anert ganz wichtegt indirekt Resultat vum spezielle Cours war de Start an d'Konfiguratioun vum NSU VKI Cluster. Seng Rechenkraaft huet eist kompetitiv Liewen wesentlech verbessert: 40 CPUs, 755Gb RAM, 8 NVIDIA Tesla V100 GPUs.

Wéi ech Maschinn Léieren Training bei NSU organiséiert hunn

Virun deem hu mir sou gutt wéi méiglech iwwerlieft: mir hunn op perséinlechen Laptops an Desktops, a Google Colab an a Kaggle-Kernelen berechent. Eng Equipe hat souguer e selbstgeschriwwene Skript, deen de Modell automatesch gespäichert huet an d'Berechnung nei gestart huet, déi wéinst enger Zäitlimit gestoppt gouf.

Am Fréijoerssemester hu mir weider gesammelt, erfollegräich Erkenntnisser austauscht an iwwer eis Léisunge fir de Concours geschwat. Nei interesséiert Participanten hunn ugefaang bei eis ze kommen. Am Fréijoerssemester hu mir et fäerdeg bruecht ee Gold, dräi Sëlwer an néng Bronze an aacht Concoursen op Kaggle ze huelen: PetFinder, Santander, Geschlecht Resolutioun, Wale Identifikatioun, an deer hie, Google Landmarken an anerer, Bronze an Recco Challenge, 3. Plaz Changellenge >> Coupe an 1. Plaz (erëm am Geld) am Machine Learning Concours um programméiere Championnat vum Yandex.

Wat Training Participanten soen

Mikhail Karchevsky
"Ech si ganz frou datt esou Aktivitéiten hei a Sibirien duerchgefouert ginn, well ech gleewen datt d'Participatioun u Concoursen de schnellste Wee ass fir ML ze beherrschen. Fir esou Concoursen ass d'Hardware zimlech deier fir Iech selwer ze kafen, awer hei kënnt Dir Iddie gratis probéieren.

Kirill Brodt
"Virun der Entstoe vun der ML-Formatioun hunn ech net besonnesch u Concoursen deelgeholl, mat Ausnam vun de pädagogeschen an hinduistesche Concoursen: Ech hunn de Sënn dovun net gesinn, well ech am ML-Beräich geschafft hunn, an ech vertraut war. Dat éischt Semester war ech als Student. A vum zweete Semester un, soubal Rechenressourcen zur Verfügung stoungen, hunn ech geduecht, firwat net matmaachen. An et huet mech ugeschloss. D'Aufgab, d'Donnéeën an d'Metriken goufen erfonnt a virbereet fir Iech, gitt vir a benotzt déi voll Kraaft vum MO, kontrolléiert déi modernst Modeller an Techniken. Wann et net fir d'Formatioun an, grad sou wichteg, d'Rechenressourcen wier, hätt ech net geschwënn ugefaang matzemaachen.

Andrey Shevelev
"Perséinlech ML Training huet mir gehollef wéi-minded Leit ze fannen, mat deenen ech konnt mäi Wëssen am Beräich vun Maschinn Léieren an Daten Analyse ze verdéiwen. Dëst ass och eng exzellent Optioun fir déi, déi net vill Fräizäit hunn fir onofhängeg an d'Thema vun de Concoursen ze analyséieren an z'entdecken, awer nach ëmmer am Thema wëlle sinn.

maach bei eis mat

Concoursen op Kaggle an aner Plattformen honn praktesch Fäegkeeten a konvertéieren séier an interessant Aarbecht am Beräich vun der Datewëssenschaft. Leit, déi zesummen un enger schwiereger Konkurrenz deelgeholl hunn, ginn dacks Kollegen a léisen weider Aarbechtsproblemer erfollegräich. Dëst ass och fir eis geschitt: Mikhail Karchevsky, zesumme mat engem Frënd aus der Equipe, gaangen fir déi selwecht Firma op engem Empfehlung System ze schaffen.

Mat der Zäit plangen mir dës Aktivitéit mat wëssenschaftleche Publikatiounen a Participatioun un Maschinnléierekonferenzen auszebauen. Mat eis als Participanten oder Experten an Novosibirsk - schreiwen mech oder Kirill. Organiséiert ähnlech Ausbildung an Äre Stied an Universitéiten.

Hei ass e klenge Cheatsheet fir Iech ze hëllefen Är éischt Schrëtt ze huelen:

  1. Betruecht eng praktesch Plaz an Zäit fir regelméisseg Klassen. Optimal - 1-2 Mol pro Woch.
  2. Schreift potenziell interesséiert Participanten iwwer déi éischt Versammlung. Éischt vun all, dës sinn Schüler vun technesch Universitéiten, ODS Participanten.
  3. Fänkt e Chat un fir aktuell Affären ze diskutéieren: Telegram, VK, WhatsApp oder all aner Messenger praktesch fir déi meescht.
  4. Erhalen en ëffentlech zougänglechen Stonneplang, eng Lëscht vun Concoursen a Participanten, a Monitor d'Resultater.
  5. Fannt gratis Rechenkraaft oder Stipendien dofir an der Emgéigend Universitéiten, Fuerschungsinstituter oder Firmen.
  6. PROFIT!

Source: www.habr.com

Setzt e Commentaire