Com vaig organitzar la formació d'aprenentatge automàtic a NSU

Em dic Sasha i m'encanta l'aprenentatge automàtic i ensenyar a la gent. Ara superviso programes educatius al Centre de Ciències de la Computació i dirigeixo el grau en anàlisi de dades a la Universitat Estatal de Sant Petersburg. Abans d'això, va treballar com a analista a Yandex, i fins i tot abans com a científic: es va dedicar a la modelització matemàtica a l'Institut de Ciències de la Computació de la SB RAS.

En aquesta publicació vull explicar-vos què va sorgir de la idea de llançar formació en aprenentatge automàtic per a estudiants, graduats de la Universitat Estatal de Novosibirsk i tothom.

Com vaig organitzar la formació d'aprenentatge automàtic a NSU

Feia temps que volia organitzar un curs especial sobre la preparació per a concursos d'anàlisi de dades a Kaggle i altres plataformes. Aquesta va semblar una gran idea:

  • Els estudiants i qualsevol persona interessada aplicaran els coneixements teòrics a la pràctica i adquiriran experiència en la resolució de problemes en concursos públics.
  • Els estudiants que es situen al capdavant en aquestes competicions tenen un bon efecte en l'atractiu de NSU per als sol·licitants, estudiants i graduats. El mateix passa amb els entrenaments de programació esportiva.
  • Aquest curs especial complementa i amplia perfectament els coneixements fonamentals: els participants implementen de manera independent models d'aprenentatge automàtic i sovint formen equips que competeixen a nivell global.
  • Altres universitats ja havien realitzat aquesta formació, així que esperava l'èxit del curs especial a la NSU.

Запуск

L'Akademgorodok de Novosibirsk té un terreny molt fèrtil per a aquests esforços: estudiants, graduats i professors del Centre d'Informàtica i facultats tècniques sòlides, per exemple, FIT, MMF, FF, un fort suport de l'administració de la NSU, una comunitat activa d'ODS, enginyers experimentats. i analistes de diverses empreses de TI. Al mateix temps, vam conèixer el programa de subvencions Inversions Botàniques — el fons dóna suport als equips que mostren bons resultats en competicions esportives de ML.

Vam trobar una audiència a NSU per a reunions setmanals, vam crear un xat a Telegram i vam llançar l'1 d'octubre juntament amb estudiants i graduats del centre de CS. 19 persones van venir a la primera lliçó. Sis d'ells es van convertir en participants habituals de la formació. En total, 31 persones van venir a la trobada almenys una vegada durant el curs acadèmic.

Primers resultats

Els nois i jo ens vam conèixer, vam intercanviar experiències, vam discutir competicions i un pla aproximat per al futur. Molt ràpidament ens vam adonar que lluitar per llocs en competicions d'anàlisi de dades és un treball habitual i esgotador, semblant al treball a temps complet no remunerat, però molt interessant i emocionant 🙂 Un dels participants, Kaggle-master Maxim, ens va aconsellar primer avançar a les competicions individualment. , i només unes setmanes més tard unir-se en equips, tenint en compte la puntuació del públic. Això és el que vam fer! Durant la formació presencial, vam parlar de models, articles científics i les complexitats de les biblioteques de Python i vam resoldre problemes junts.

Els resultats del semestre de tardor van ser tres medalles de plata en dues competicions a Kaggle: Identificació de la sal TGS и Classificació Astronòmica PLAsTiCC. I un tercer lloc a la competició CFT per corregir errors ortogràfics amb els primers diners guanyats (en els diners, com diuen els keglers experimentats).

Un altre resultat indirecte molt important del curs especial va ser el llançament i la configuració del clúster NSU VKI. La seva potència de càlcul ha millorat significativament la nostra vida competitiva: 40 CPU, 755 Gb de RAM, 8 GPU NVIDIA Tesla V100.

Com vaig organitzar la formació d'aprenentatge automàtic a NSU

Abans d'això, vam sobreviure com vam poder: vam calcular en ordinadors portàtils i ordinadors de sobretaula personals, a Google Colab i a Kaggle-kernels. Un equip fins i tot tenia un guió escrit per si mateix que desava automàticament el model i reiniciava el càlcul que s'havia aturat a causa d'un límit de temps.

Al semestre de primavera, vam continuar reunint-nos, intercanviant troballes reeixides i parlant de les nostres solucions a la competència. Nous participants interessats van començar a venir a nosaltres. Durant el semestre de primavera, vam aconseguir treure un or, tres de plata i nou de bronze en vuit competicions a Kaggle: PetFinder, Santander, Resolució de gènere, Identificació de balenes, Quora, Punts de referència de Google i altres, de bronze Repte Recco, tercer lloc a Changellenge>>Copa i primer lloc (de nou en diners) a la competició d'aprenentatge automàtic a campionat de programació de Yandex.

Què diuen els participants de la formació

Mikhail Karchevsky
"Estic molt content que aquestes activitats es portin a terme aquí a Sibèria, perquè crec que la participació en competicions és la manera més ràpida de dominar l'ML. Per a aquestes competicions, el maquinari és bastant car per comprar-se, però aquí podeu provar idees de manera gratuïta.

Kirill Brodt
"Abans de l'arribada de l'entrenament d'ML, no participava especialment en competicions, a excepció de les competicions d'entrenament i hindús: no hi veia el sentit, ja que tenia feina en el camp de l'ML i n'estava familiaritzat. El primer semestre vaig assistir com a estudiant. I a partir del segon semestre, tan bon punt es disposaven dels recursos informàtics, vaig pensar, per què no participar-hi. I em va enganxar. La tasca, les dades i les mètriques s'han inventat i preparat per a vosaltres, feu servir tot el poder de MO, comproveu els models i tècniques d'última generació. Si no fos per la formació i, el més important, pels recursos informàtics, no hauria començat a participar aviat”.

Andrei Xevelev
“La formació presencial d'ML em va ajudar a trobar persones amb idees afins, amb qui vaig poder aprofundir en els meus coneixements en l'àmbit de l'aprenentatge automàtic i l'anàlisi de dades. Aquesta també és una opció excel·lent per a aquells que no disposen de molt temps lliure per analitzar i submergir-se de manera independent en el tema de les competicions, però encara volen estar en el tema".

uneix-te a nosaltres

Les competicions a Kaggle i altres plataformes perfeccionen les habilitats pràctiques i es converteixen ràpidament en treballs interessants en el camp de la ciència de dades. Les persones que han participat junts en una competició difícil sovint es converteixen en companys i continuen resolent amb èxit problemes relacionats amb la feina. Això també ens va passar: Mikhail Karchevsky, juntament amb un amic de l'equip, va anar a treballar per a la mateixa empresa amb un sistema de recomanacions.

Amb el temps, tenim previst ampliar aquesta activitat amb publicacions científiques i la participació en conferències d'aprenentatge automàtic. Uneix-te a nosaltres com a participants o experts a Novosibirsk: escriu em o Kirill. Organitzeu formació similar a les vostres ciutats i universitats.

Aquí teniu un petit full de trucs per ajudar-vos a fer els vostres primers passos:

  1. Considereu un lloc i una hora convenients per a les classes regulars. De manera òptima: 1-2 vegades per setmana.
  2. Escriu als participants potencialment interessats sobre la primera reunió. En primer lloc, es tracta d'estudiants d'universitats tècniques, participants de l'ODS.
  3. Inicieu un xat per parlar d'actualitat: Telegram, VK, WhatsApp o qualsevol altre missatger convenient per a la majoria.
  4. Mantenir un pla de lliçons accessible al públic, una llista de competicions i participants, i supervisar els resultats.
  5. Trobeu potència informàtica gratuïta o subvencions a les universitats, instituts de recerca o empreses properes.
  6. BENEFICI!

Font: www.habr.com

Afegeix comentari