Comment j'ai organisé une formation en machine learning à NSU

Je m'appelle Sasha et j'aime l'apprentissage automatique ainsi que l'enseignement aux gens. Aujourd'hui, je supervise des programmes éducatifs au Centre d'informatique et je dirige le programme de licence en analyse de données à l'Université d'État de Saint-Pétersbourg. Avant cela, il a travaillé comme analyste chez Yandex, et encore plus tôt comme scientifique : il était engagé dans la modélisation mathématique à l'Institut d'informatique de la SB RAS.

Dans cet article, je veux vous raconter ce qui est né de l'idée de lancer une formation en apprentissage automatique pour les étudiants, les diplômés de l'Université d'État de Novossibirsk et tout le monde.

Comment j'ai organisé une formation en machine learning à NSU

Je souhaitais depuis longtemps organiser un cours spécial sur la préparation aux concours d'analyse de données sur Kaggle et d'autres plateformes. Cela semblait être une excellente idée :

  • Les étudiants et toute personne intéressée appliqueront leurs connaissances théoriques dans la pratique et acquerront de l'expérience dans la résolution de problèmes lors de concours publics.
  • Les étudiants qui se classent en tête de ces concours ont un effet positif sur l'attractivité de la NSU pour les candidats, les étudiants et les diplômés. La même chose se produit avec la formation en programmation sportive.
  • Ce cours spécial complète et élargit parfaitement les connaissances fondamentales : les participants mettent en œuvre de manière indépendante des modèles d'apprentissage automatique et forment souvent des équipes qui rivalisent au niveau mondial.
  • D'autres universités avaient déjà organisé une telle formation, j'espérais donc le succès du cours spécial à la NSU.

Запуск

L'Akademgorodok de Novossibirsk dispose d'un terrain très fertile pour de tels efforts : étudiants, diplômés et enseignants du Centre d'informatique et de solides facultés techniques, par exemple FIT, MMF, FF, un fort soutien de l'administration de la NSU, une communauté ODS active, des ingénieurs expérimentés. et des analystes de diverses sociétés informatiques. À peu près au même moment, nous avons entendu parler du programme de subventions Investissements botaniques — le fonds soutient les équipes qui affichent de bons résultats dans les compétitions sportives ML.

Nous avons trouvé un public à NSU pour des réunions hebdomadaires, créé un chat sur Telegram et lancé le 1er octobre avec les étudiants et les diplômés du CS Center. 19 personnes sont venues au premier cours. Six d’entre eux sont devenus des participants réguliers à la formation. Au total, 31 personnes sont venues à la réunion au moins une fois au cours de l'année universitaire.

Premiers résultats

Les gars et moi nous sommes rencontrés, avons échangé nos expériences, discuté de compétitions et d'un plan approximatif pour l'avenir. Assez vite, nous avons réalisé que se battre pour des places dans les concours d'analyse de données est un travail régulier et épuisant, semblable à un travail à temps plein non rémunéré, mais très intéressant et passionnant 🙂 L'un des participants, Kaggle-master Maxim, nous a conseillé de progresser d'abord individuellement dans les compétitions. , et seulement quelques semaines plus tard, se regroupent en équipes, en tenant compte du score du public. C'est ce que nous avons fait ! Au cours de la formation en présentiel, nous avons discuté de modèles, d'articles scientifiques et des subtilités des bibliothèques Python, et avons résolu des problèmes ensemble.

Les résultats du semestre d'automne ont été trois médailles d'argent dans deux compétitions sur Kaggle : Identification du sel TGS и Classification astronomique PLAsTiCC. Et une troisième place au concours CFT pour la correction des fautes de frappe avec le premier argent gagné (dans l'argent, comme disent les keglers expérimentés).

Un autre résultat indirect très important du cours spécial a été le lancement et la configuration du cluster NSU VKI. Sa puissance de calcul a considérablement amélioré notre durée de vie compétitive : 40 CPU, 755 Go de RAM, 8 GPU NVIDIA Tesla V100.

Comment j'ai organisé une formation en machine learning à NSU

Avant cela, nous survivions du mieux que nous pouvions : nous calculions sur des ordinateurs portables et de bureau personnels, dans Google Colab et dans les noyaux Kaggle. Une équipe disposait même d'un script auto-écrit qui enregistrait automatiquement le modèle et reprenait le calcul qui s'était arrêté en raison d'une limite de temps.

Au semestre de printemps, nous avons continué à nous réunir, à échanger des résultats positifs et à discuter de nos solutions avec la concurrence. De nouveaux participants intéressés ont commencé à nous rejoindre. Au cours du semestre de printemps, nous avons réussi à remporter une médaille d'or, trois d'argent et neuf de bronze dans huit compétitions sur Kaggle : Recherche d'animaux, Santander, Résolution sexospécifique, Identification des baleines, Quora, Points de repère Google et d'autres, du bronze en Défi Recco, troisième place à la Changellenge>>Cup et première place (toujours dans l'argent) au concours d'apprentissage automatique à championnat de programmation de Yandex.

Ce que disent les participants à la formation

Mikhaïl Karchevski
«Je suis très heureux que de telles activités soient menées ici en Sibérie, car je pense que la participation à des compétitions est le moyen le plus rapide de maîtriser le ML. Pour de telles compétitions, le matériel est assez cher à acheter soi-même, mais ici, vous pouvez essayer des idées gratuitement.

Kirill Brodt
« Avant l'avènement de la formation ML, je ne participais pas particulièrement aux compétitions à l'exception des entraînements et des compétitions hindoues : je n'en voyais pas l'intérêt, puisque j'avais du travail dans le domaine du ML, et je le connaissais. J'ai suivi le premier semestre en tant qu'étudiant. Et à partir du deuxième semestre, dès que les ressources informatiques sont devenues disponibles, je me suis demandé pourquoi ne pas participer. Et ça m'a rendu accro. La tâche, les données et les métriques ont été inventées et préparées pour vous, allez-y et utilisez toute la puissance de MO, vérifiez les modèles et techniques de pointe. Sans la formation et, tout aussi important, les ressources informatiques, je n’aurais pas commencé à y participer de si tôt.

Andreï Chevelev
« La formation ML en personne m'a aidé à trouver des personnes partageant les mêmes idées, avec qui j'ai pu approfondir mes connaissances dans le domaine de l'apprentissage automatique et de l'analyse de données. C'est également une excellente option pour ceux qui n'ont pas beaucoup de temps libre pour analyser de manière indépendante et s'immerger dans le sujet des concours, mais qui souhaitent quand même être dans le sujet.

Rejoignez-nous

Les concours sur Kaggle et d'autres plateformes perfectionnent les compétences pratiques et se transforment rapidement en travail intéressant dans le domaine de la science des données. Les personnes qui ont participé ensemble à une compétition difficile deviennent souvent des collègues et continuent de résoudre avec succès des problèmes liés au travail. Cela nous est également arrivé : Mikhail Karchevsky, avec un ami de l'équipe, est allé travailler pour la même entreprise sur un système de recommandation.

Au fil du temps, nous prévoyons d'étendre cette activité avec des publications scientifiques et la participation à des conférences sur l'apprentissage automatique. Rejoignez-nous en tant que participants ou experts à Novossibirsk - écrivez moi ou Kirill. Organisez des formations similaires dans vos villes et universités.

Voici un petit aide-mémoire pour vous aider à faire vos premiers pas :

  1. Pensez à un lieu et à une heure pratiques pour les cours réguliers. Idéalement - 1 à 2 fois par semaine.
  2. Écrivez aux participants potentiellement intéressés à propos de la première réunion. Il s’agit tout d’abord d’étudiants d’universités techniques, participants à l’ODS.
  3. Démarrez un chat pour discuter de l'actualité : Telegram, VK, WhatsApp ou tout autre messager pratique pour la plupart.
  4. Tenir à jour un plan de cours accessible au public, une liste des compétitions et des participants, et surveiller les résultats.
  5. Trouvez de la puissance de calcul gratuite ou des subventions dans les universités, instituts de recherche ou entreprises à proximité.
  6. PROFIT!

Source : www.habr.com

Ajouter un commentaire