Cómo organicé la capacitación en aprendizaje automático en NSU

Mi nombre es Sasha y me encanta el aprendizaje automático, además de enseñar a las personas. Ahora superviso programas educativos en el Centro de Ciencias de la Computación y dirijo el programa de licenciatura en análisis de datos en la Universidad Estatal de San Petersburgo. Antes de eso, trabajó como analista en Yandex, e incluso antes como científico: se dedicó al modelado matemático en el Instituto de Ciencias de la Computación de la SB RAS.

En esta publicación quiero contarles qué surgió de la idea de lanzar capacitación en aprendizaje automático para estudiantes, graduados de la Universidad Estatal de Novosibirsk y todos los demás.

Cómo organicé la capacitación en aprendizaje automático en NSU

Hace tiempo que quería organizar un curso especial sobre preparación para competiciones de análisis de datos en Kaggle y otras plataformas. Esto me pareció una gran idea:

  • Los estudiantes y cualquier persona interesada aplicarán los conocimientos teóricos en la práctica y adquirirán experiencia en la resolución de problemas en concursos públicos.
  • Los estudiantes que obtienen los primeros puestos en este tipo de concursos tienen un buen efecto en el atractivo de NSU para los solicitantes, estudiantes y graduados. Lo mismo ocurre con la formación en programación deportiva.
  • Este curso especial complementa y amplía perfectamente los conocimientos fundamentales: los participantes implementan de forma independiente modelos de aprendizaje automático y, a menudo, forman equipos que compiten a nivel global.
  • Otras universidades ya habían impartido este tipo de formación, por lo que esperaba que el curso especial en NSU fuera un éxito.

Lanzar

El Akademgorodok de Novosibirsk tiene un terreno muy fértil para tales esfuerzos: estudiantes, graduados y profesores del Centro de Ciencias de la Computación y sólidas facultades técnicas, por ejemplo, FIT, MMF, FF, un fuerte apoyo de la administración de NSU, una comunidad ODS activa, ingenieros experimentados y analistas de varias empresas de TI. Casi al mismo tiempo, nos enteramos del programa de subvenciones gracias a Inversiones botánicas — el fondo apoya a los equipos que muestran buenos resultados en las competiciones deportivas de ML.

Encontramos una audiencia en NSU para reuniones semanales, creamos un chat en Telegram y lo lanzamos el 1 de octubre junto con estudiantes y graduados del centro de informática. A la primera lección asistieron 19 personas. Seis de ellos se convirtieron en participantes habituales de la formación. En total, 31 personas asistieron al menos una vez durante el curso académico.

Primeros resultados

Los chicos y yo nos reunimos, intercambiamos experiencias, discutimos competiciones y un plan aproximado para el futuro. Rápidamente nos dimos cuenta de que luchar por lugares en las competiciones de análisis de datos es un trabajo regular y agotador, similar al trabajo no remunerado a tiempo completo, pero muy interesante y emocionante 🙂 Uno de los participantes, Kaggle-master Maxim, nos aconsejó que primero avancemos en las competiciones de forma individual. , y solo unas semanas después se unen en equipos, teniendo en cuenta la puntuación del público. ¡Eso es lo que hicimos! Durante la capacitación presencial, discutimos modelos, artículos científicos y las complejidades de las bibliotecas de Python, y resolvimos problemas juntos.

Los resultados del semestre de otoño fueron tres medallas de plata en dos competiciones en Kaggle: Identificación de sal TGS и Clasificación astronómica PLAsTiCC. Y un tercer lugar en el concurso CFT para corregir errores tipográficos con el primer dinero ganado (en el dinero, como dicen los Keglers experimentados).

Otro resultado indirecto muy importante del curso especial fue el lanzamiento y configuración del cluster NSU VKI. Su potencia informática ha mejorado significativamente nuestra vida competitiva: 40 CPU, 755 Gb de RAM, 8 GPU NVIDIA Tesla V100.

Cómo organicé la capacitación en aprendizaje automático en NSU

Antes de eso, sobrevivimos lo mejor que pudimos: calculamos en computadoras portátiles y de escritorio personales, en Google Colab y en Kaggle-kernels. Un equipo incluso tenía un script escrito por él mismo que guardaba automáticamente el modelo y reiniciaba el cálculo que se había detenido debido a un límite de tiempo.

En el semestre de primavera seguimos reuniéndonos, intercambiando resultados exitosos y hablando sobre nuestras soluciones a la competencia. Empezaron a llegar nuevos participantes interesados. Durante el semestre de primavera, logramos llevarnos un oro, tres platas y nueve bronces en ocho competencias en Kaggle: buscador de mascotas, Santander, Resolución de género, Identificación de ballenas, Quora, Puntos de referencia de Google y otros, bronce en Desafío Recco, tercer lugar en la Copa Changellenge>> y primer lugar (de nuevo en premios) en la competencia de aprendizaje automático en campeonato de programación de Yandex.

Lo que dicen los participantes de la capacitación

Mijaíl Kárchevski
“Estoy muy contento de que este tipo de actividades se lleven a cabo aquí en Siberia, porque creo que la participación en competiciones es la forma más rápida de dominar el ML. Para este tipo de competiciones, el hardware es bastante caro si lo compras tú mismo, pero aquí puedes probar ideas gratis”.

Kirill Brodt
“Antes de la llegada del entrenamiento de ML, no participaba particularmente en competiciones, a excepción de los entrenamientos y las competiciones hindúes: no le veía sentido a esto, ya que tenía trabajo en el campo de ML y estaba familiarizado con ello. El primer semestre asistí como estudiante. Y a partir del segundo semestre, tan pronto como estuvieron disponibles los recursos informáticos, pensé, ¿por qué no participar? Y me enganchó. La tarea, los datos y las métricas fueron inventados y preparados para usted, continúe y utilice todo el poder de MO, verifique los modelos y técnicas de última generación. Si no fuera por la formación y, lo que es igualmente importante, los recursos informáticos, no habría empezado a participar pronto”.

Andrei Shevelev
“La formación presencial en ML me ayudó a encontrar personas con ideas afines, con las que pude profundizar mis conocimientos en el campo del aprendizaje automático y el análisis de datos. Esta también es una excelente opción para aquellos que no tienen mucho tiempo libre para analizar y sumergirse de forma independiente en el tema de las competiciones, pero aún así quieren estar en el tema”.

Join Us

Los concursos en Kaggle y otras plataformas perfeccionan las habilidades prácticas y se convierten rápidamente en trabajos interesantes en el campo de la ciencia de datos. Las personas que han participado juntas en una competencia difícil a menudo se convierten en colegas y continúan resolviendo con éxito problemas relacionados con el trabajo. Esto también nos pasó a nosotros: Mikhail Karchevsky, junto con un amigo del equipo, se pusieron a trabajar en la misma empresa mediante un sistema de recomendación.

Con el tiempo, planeamos ampliar esta actividad con publicaciones científicas y participación en conferencias sobre aprendizaje automático. Únase a nosotros como participantes o expertos en Novosibirsk - escriba me o Cirilo. Organice formaciones similares en sus ciudades y universidades.

Aquí tienes una pequeña hoja de trucos que te ayudará a dar tus primeros pasos:

  1. Considere un lugar y horario convenientes para las clases regulares. De manera óptima, 1-2 veces por semana.
  2. Escriba a los participantes potencialmente interesados ​​sobre la primera reunión. En primer lugar, se trata de estudiantes de universidades técnicas, participantes de ODS.
  3. Inicie un chat para discutir temas de actualidad: Telegram, VK, WhatsApp o cualquier otro mensajero que sea conveniente para la mayoría.
  4. Mantenga un plan de lecciones de acceso público, una lista de competencias y participantes, y monitoree los resultados.
  5. Encuentre potencia informática gratuita o subvenciones para ello en universidades, institutos de investigación o empresas cercanas.
  6. ¡GANANCIA!

Fuente: www.habr.com

Añadir un comentario