Chámome Sasha e encántame a aprendizaxe automática e ensinar á xente. Agora superviso programas educativos no Centro de Ciencias da Computación e dirixo o programa de licenciatura en análise de datos na Universidade Estatal de San Petersburgo. Antes diso, traballou como analista en Yandex, e mesmo antes como científico: dedicouse á modelización matemática no Instituto de Ciencias da Computación da SB RAS.
Neste post quero contarvos o que xurdiu da idea de lanzar formación de aprendizaxe automática para estudantes, graduados da Universidade Estatal de Novosibirsk e todos os demais.
Hai tempo que quería organizar un curso especial sobre a preparación para concursos de análise de datos en Kaggle e outras plataformas. Esta pareceume unha gran idea:
- Os estudantes e calquera persoa interesada aplicarán os coñecementos teóricos na práctica e adquirirán experiencia na resolución de problemas en concursos públicos.
- Os estudantes que se sitúan no primeiro lugar en tales competicións teñen un bo efecto sobre o atractivo de NSU para os candidatos, estudantes e graduados. O mesmo ocorre cos adestramentos de programación deportiva.
- Este curso especial complementa e amplía perfectamente os coñecementos fundamentais: os participantes implementan de forma independente modelos de aprendizaxe automática e adoitan formar equipos que compiten a nivel global.
- Outras universidades xa realizaran tal formación, polo que esperaba o éxito do curso especial na NSU.
Lanzamento
O Akademgorodok de Novosibirsk ten un terreo moi fértil para tales esforzos: estudantes, graduados e profesores do Centro de Ciencias da Computación e fortes facultades técnicas, por exemplo, FIT, MMF, FF, un forte apoio da administración NSU, unha comunidade activa de ODS, enxeñeiros experimentados. e analistas de varias empresas de TI. Ao mesmo tempo, coñecemos o programa de subvencións
Atopamos unha audiencia na NSU para reunións semanais, creamos un chat en Telegram e lanzámonos o 1 de outubro xunto con estudantes e titulados do centro de CS. 19 persoas acudiron á primeira lección. Seis deles convertéronse en participantes habituais da formación. En total, 31 persoas acudiron ao encontro polo menos unha vez durante o curso académico.
Primeiros resultados
Os rapaces e eu coñecémonos, intercambiamos experiencias, discutimos competicións e un plan aproximado para o futuro. Axiña decatámonos de que loitar por prazas nos concursos de análise de datos é un traballo regular e esgotador, semellante ao traballo a tempo completo non remunerado, pero moi interesante e emocionante 🙂 Un dos participantes, Kaggle-master Maxim, aconsellounos que primeiro avanzamos nas competicións individualmente. , e só unhas semanas despois únense en equipos, tendo en conta a puntuación do público. Iso foi o que fixemos! Durante a formación presencial, discutimos modelos, artigos científicos e as complejidades das bibliotecas de Python e resolvemos problemas xuntos.
Os resultados do semestre de outono foron tres medallas de prata en dúas competicións en Kaggle:
Outro resultado indirecto moi importante do curso especial foi o lanzamento e configuración do clúster NSU VKI. A súa potencia de cómputo mellorou significativamente a nosa vida competitiva: 40 CPUs, 755 Gb de RAM, 8 GPU NVIDIA Tesla V100.
Antes diso, sobrevivimos o mellor que puidemos: calculamos en portátiles e escritorios persoais, en Google Colab e en Kaggle-kernels. Un equipo mesmo tiña un guión escrito por si mesmo que gardaba automaticamente o modelo e reiniciaba o cálculo que se detivo debido a un límite de tempo.
No semestre de primavera, seguimos reuníndonos, intercambiando resultados exitosos e falando das nosas solucións para a competencia. Comezaron a chegar a nós novos participantes interesados. Durante o semestre de primavera, conseguimos levar un ouro, tres pratas e nove bronces en oito competicións en Kaggle:
O que din os participantes na formación
"Estou moi contento de que este tipo de actividades se realicen aquí en Siberia, porque creo que a participación en competicións é a forma máis rápida de dominar ML. Para este tipo de competicións, o hardware é bastante caro compralo, pero aquí podes probar ideas de balde".
"Antes da chegada do adestramento de ML, non participaba especialmente en competicións con excepción dos adestramentos e das competicións hindús: non lle vía o sentido, xa que tiña traballo no campo do ML e estaba familiarizado con el. O primeiro cuadrimestre asistín como estudante. E a partir do segundo cuadrimestre, en canto os recursos informáticos estaban dispoñibles, pensei, por que non participar. E enganchoume. A tarefa, os datos e as métricas foron inventados e preparados para ti, segue adiante e utiliza todo o poder de MO, consulta os modelos e técnicas de última xeración. Se non fose pola formación e, o máis importante, polos recursos informáticos, non comezaría a participar pronto”.
“A formación presencial de ML axudoume a atopar persoas con ideas afines, coas que puiden afondar nos meus coñecementos no campo da aprendizaxe automática e da análise de datos. Tamén é unha excelente opción para aqueles que non teñen moito tempo libre para analizar e mergullarse de forma independente no tema das competicións, pero aínda así queren estar no tema”.
Únete a nós
As competicións en Kaggle e outras plataformas perfeccionan as habilidades prácticas e convértense rapidamente en traballos interesantes no campo da ciencia de datos. As persoas que participaron xuntos nunha competición difícil adoitan converterse en colegas e seguen resolvendo con éxito problemas relacionados co traballo. Isto tamén nos pasou a nós: Mikhail Karchevsky, xunto cun amigo do equipo, foi traballar para a mesma empresa nun sistema de recomendación.
Co paso do tempo, pensamos ampliar esta actividade con publicacións científicas e participación en xornadas de aprendizaxe automática. Únete a nós como participantes ou expertos en Novosibirsk: escribe
Aquí tes unha pequena folla de trucos para axudarche a dar os teus primeiros pasos:
- Considere un lugar e unha hora convenientes para as clases regulares. Óptimo - 1-2 veces por semana.
- Escribe aos participantes potencialmente interesados sobre a primeira reunión. En primeiro lugar, son estudantes de universidades técnicas, participantes en ODS.
- Inicia un chat para discutir temas de actualidade: Telegram, VK, WhatsApp ou calquera outro mensaxeiro que resulte conveniente para a maioría.
- Manter un plan de clases accesible ao público, unha lista de competicións e participantes, e supervisar os resultados.
- Atopa potencia informática gratuíta ou subvencións para iso en universidades, institutos de investigación ou empresas próximas.
- BENEFICIO!
Fonte: www.habr.com