Como organizei a formación de aprendizaxe automática na NSU

Chámome Sasha e encántame a aprendizaxe automática e ensinar á xente. Agora superviso programas educativos no Centro de Ciencias da Computación e dirixo o programa de licenciatura en análise de datos na Universidade Estatal de San Petersburgo. Antes diso, traballou como analista en Yandex, e mesmo antes como científico: dedicouse á modelización matemática no Instituto de Ciencias da Computación da SB RAS.

Neste post quero contarvos o que xurdiu da idea de lanzar formación de aprendizaxe automática para estudantes, graduados da Universidade Estatal de Novosibirsk e todos os demais.

Como organizei a formación de aprendizaxe automática na NSU

Hai tempo que quería organizar un curso especial sobre a preparación para concursos de análise de datos en Kaggle e outras plataformas. Esta pareceume unha gran idea:

  • Os estudantes e calquera persoa interesada aplicarán os coñecementos teóricos na práctica e adquirirán experiencia na resolución de problemas en concursos públicos.
  • Os estudantes que se sitúan no primeiro lugar en tales competicións teñen un bo efecto sobre o atractivo de NSU para os candidatos, estudantes e graduados. O mesmo ocorre cos adestramentos de programación deportiva.
  • Este curso especial complementa e amplía perfectamente os coñecementos fundamentais: os participantes implementan de forma independente modelos de aprendizaxe automática e adoitan formar equipos que compiten a nivel global.
  • Outras universidades xa realizaran tal formación, polo que esperaba o éxito do curso especial na NSU.

Lanzamento

O Akademgorodok de Novosibirsk ten un terreo moi fértil para tales esforzos: estudantes, graduados e profesores do Centro de Ciencias da Computación e fortes facultades técnicas, por exemplo, FIT, MMF, FF, un forte apoio da administración NSU, unha comunidade activa de ODS, enxeñeiros experimentados. e analistas de varias empresas de TI. Ao mesmo tempo, coñecemos o programa de subvencións Investimentos Botánicos — o fondo apoia aos equipos que amosan bos resultados nas competicións deportivas de ML.

Atopamos unha audiencia na NSU para reunións semanais, creamos un chat en Telegram e lanzámonos o 1 de outubro xunto con estudantes e titulados do centro de CS. 19 persoas acudiron á primeira lección. Seis deles convertéronse en participantes habituais da formación. En total, 31 persoas acudiron ao encontro polo menos unha vez durante o curso académico.

Primeiros resultados

Os rapaces e eu coñecémonos, intercambiamos experiencias, discutimos competicións e un plan aproximado para o futuro. Axiña decatámonos de que loitar por prazas nos concursos de análise de datos é un traballo regular e esgotador, semellante ao traballo a tempo completo non remunerado, pero moi interesante e emocionante 🙂 Un dos participantes, Kaggle-master Maxim, aconsellounos que primeiro avanzamos nas competicións individualmente. , e só unhas semanas despois únense en equipos, tendo en conta a puntuación do público. Iso foi o que fixemos! Durante a formación presencial, discutimos modelos, artigos científicos e as complejidades das bibliotecas de Python e resolvemos problemas xuntos.

Os resultados do semestre de outono foron tres medallas de prata en dúas competicións en Kaggle: Identificación de sal TGS и Clasificación Astronómica PLAsTiCC. E un terceiro lugar no concurso CFT para corrixir erros tipográficos co primeiro diñeiro gañado (no diñeiro, como din os keglers experimentados).

Outro resultado indirecto moi importante do curso especial foi o lanzamento e configuración do clúster NSU VKI. A súa potencia de cómputo mellorou significativamente a nosa vida competitiva: 40 CPUs, 755 Gb de RAM, 8 GPU NVIDIA Tesla V100.

Como organizei a formación de aprendizaxe automática na NSU

Antes diso, sobrevivimos o mellor que puidemos: calculamos en portátiles e escritorios persoais, en Google Colab e en Kaggle-kernels. Un equipo mesmo tiña un guión escrito por si mesmo que gardaba automaticamente o modelo e reiniciaba o cálculo que se detivo debido a un límite de tempo.

No semestre de primavera, seguimos reuníndonos, intercambiando resultados exitosos e falando das nosas solucións para a competencia. Comezaron a chegar a nós novos participantes interesados. Durante o semestre de primavera, conseguimos levar un ouro, tres pratas e nove bronces en oito competicións en Kaggle: Buscador de mascotas, Santander, Resolución de xénero, Identificación de baleas, Quora, Google Landmarks e outros, bronce en Desafío Recco, terceiro lugar en Changellenge>>Copa e primeiro posto (de novo en diñeiro) na competición de aprendizaxe automática en campeonato de programación de Yandex.

O que din os participantes na formación

Mikhail Karchevsky
"Estou moi contento de que este tipo de actividades se realicen aquí en Siberia, porque creo que a participación en competicións é a forma máis rápida de dominar ML. Para este tipo de competicións, o hardware é bastante caro compralo, pero aquí podes probar ideas de balde".

Kirill Brodt
"Antes da chegada do adestramento de ML, non participaba especialmente en competicións con excepción dos adestramentos e das competicións hindús: non lle vía o sentido, xa que tiña traballo no campo do ML e estaba familiarizado con el. O primeiro cuadrimestre asistín como estudante. E a partir do segundo cuadrimestre, en canto os recursos informáticos estaban dispoñibles, pensei, por que non participar. E enganchoume. A tarefa, os datos e as métricas foron inventados e preparados para ti, segue adiante e utiliza todo o poder de MO, consulta os modelos e técnicas de última xeración. Se non fose pola formación e, o máis importante, polos recursos informáticos, non comezaría a participar pronto”.

Andrei Shevelev
“A formación presencial de ML axudoume a atopar persoas con ideas afines, coas que puiden afondar nos meus coñecementos no campo da aprendizaxe automática e da análise de datos. Tamén é unha excelente opción para aqueles que non teñen moito tempo libre para analizar e mergullarse de forma independente no tema das competicións, pero aínda así queren estar no tema”.

Únete a nós

As competicións en Kaggle e outras plataformas perfeccionan as habilidades prácticas e convértense rapidamente en traballos interesantes no campo da ciencia de datos. As persoas que participaron xuntos nunha competición difícil adoitan converterse en colegas e seguen resolvendo con éxito problemas relacionados co traballo. Isto tamén nos pasou a nós: Mikhail Karchevsky, xunto cun amigo do equipo, foi traballar para a mesma empresa nun sistema de recomendación.

Co paso do tempo, pensamos ampliar esta actividade con publicacións científicas e participación en xornadas de aprendizaxe automática. Únete a nós como participantes ou expertos en Novosibirsk: escribe me ou Kirill. Organiza formación similar nas túas cidades e universidades.

Aquí tes unha pequena folla de trucos para axudarche a dar os teus primeiros pasos:

  1. Considere un lugar e unha hora convenientes para as clases regulares. Óptimo - 1-2 veces por semana.
  2. Escribe aos participantes potencialmente interesados ​​sobre a primeira reunión. En primeiro lugar, son estudantes de universidades técnicas, participantes en ODS.
  3. Inicia un chat para discutir temas de actualidade: Telegram, VK, WhatsApp ou calquera outro mensaxeiro que resulte conveniente para a maioría.
  4. Manter un plan de clases accesible ao público, unha lista de competicións e participantes, e supervisar os resultados.
  5. Atopa potencia informática gratuíta ou subvencións para iso en universidades, institutos de investigación ou empresas próximas.
  6. BENEFICIO!

Fonte: www.habr.com

Engadir un comentario