Wie ich die Schulung zum maschinellen Lernen bei NSU organisiert habe

Mein Name ist Sasha und ich liebe maschinelles Lernen sowie das Unterrichten von Menschen. Jetzt betreue ich Bildungsprogramme am Informatikzentrum und leite den Bachelorstudiengang Datenanalyse an der Staatlichen Universität St. Petersburg. Zuvor arbeitete er als Analyst bei Yandex und noch früher als Wissenschaftler: Er beschäftigte sich mit mathematischer Modellierung am Institut für Informatik der SB RAS.

In diesem Beitrag möchte ich Ihnen erzählen, wie die Idee entstanden ist, eine Schulung zum maschinellen Lernen für Studenten, Absolventen der Staatlichen Universität Nowosibirsk und alle anderen zu starten.

Wie ich die Schulung zum maschinellen Lernen bei NSU organisiert habe

Ich wollte schon lange einen speziellen Kurs zur Vorbereitung auf Datenanalysewettbewerbe auf Kaggle und anderen Plattformen organisieren. Das schien mir eine tolle Idee zu sein:

  • Studierende und Interessierte wenden theoretisches Wissen in der Praxis an und sammeln Erfahrungen bei der Lösung von Problemen in öffentlichen Wettbewerben.
  • Studierende, die bei solchen Wettbewerben Spitzenplätze belegen, wirken sich positiv auf die Attraktivität der NSU für Bewerber, Studierende und Absolventen aus. Das Gleiche passiert mit dem Sportprogrammierungstraining.
  • Dieser Spezialkurs ergänzt und erweitert das Grundlagenwissen perfekt: Die Teilnehmer implementieren selbständig Machine-Learning-Modelle und bilden häufig Teams, die auf globaler Ebene konkurrieren.
  • Andere Universitäten hatten eine solche Ausbildung bereits durchgeführt, daher hoffte ich auf den Erfolg des Spezialkurses an der NSU.

Starten

Die Akademgorodok von Nowosibirsk verfügt über einen sehr fruchtbaren Boden für solche Unternehmungen: Studenten, Absolventen und Lehrer des Informatikzentrums und starke technische Fakultäten, zum Beispiel FIT, MMF, FF, starke Unterstützung der NSU-Verwaltung, eine aktive ODS-Community, erfahrene Ingenieure und Analysten verschiedener IT-Unternehmen. Etwa zur gleichen Zeit erfuhren wir von dem Stipendienprogramm Botanische Investitionen — Der Fonds unterstützt Teams, die bei ML-Sportwettkämpfen gute Ergebnisse erzielen.

Wir fanden bei NSU ein Publikum für wöchentliche Treffen, erstellten einen Chat auf Telegram und starteten am 1. Oktober zusammen mit Studenten und Absolventen des CS-Zentrums. Zur ersten Unterrichtsstunde kamen 19 Personen. Sechs von ihnen nahmen regelmäßig an der Schulung teil. Insgesamt kamen im Laufe des Studienjahres mindestens einmal 31 Personen zum Treffen.

Erste Ergebnisse

Die Jungs und ich trafen uns, tauschten Erfahrungen aus, besprachen Wettbewerbe und einen groben Plan für die Zukunft. Ziemlich schnell wurde uns klar, dass der Kampf um Plätze in Datenanalyse-Wettbewerben eine regelmäßige, anstrengende Arbeit ist, ähnlich einer unbezahlten Vollzeitarbeit, aber sehr interessant und aufregend. 🙂 Einer der Teilnehmer, Kaggle-Meister Maxim, riet uns, zunächst einzeln in Wettbewerben aufzusteigen und schließen sich nur wenige Wochen später unter Berücksichtigung der öffentlichen Punktzahl zu Teams zusammen. Das haben wir getan! Im Präsenztraining haben wir Modelle, wissenschaftliche Artikel und die Feinheiten von Python-Bibliotheken besprochen und gemeinsam Probleme gelöst.

Das Ergebnis des Herbstsemesters waren drei Silbermedaillen in zwei Wettbewerben auf Kaggle: TGS-Salzidentifizierung и PLAsTiCC Astronomische Klassifikation. Und ein dritter Platz im CFT-Wettbewerb zur Korrektur von Tippfehlern mit dem ersten gewonnenen Geld (im Geld, wie erfahrene Kegler sagen).

Ein weiteres sehr wichtiges indirektes Ergebnis des Spezialkurses war die Einführung und Konfiguration des NSU VKI-Clusters. Seine Rechenleistung hat unser Wettbewerbsleben erheblich verbessert: 40 CPUs, 755 GB RAM, 8 NVIDIA Tesla V100 GPUs.

Wie ich die Schulung zum maschinellen Lernen bei NSU organisiert habe

Davor haben wir überlebt, so gut wir konnten: Wir haben auf persönlichen Laptops und Desktops, in Google Colab und in Kaggle-Kerneln gerechnet. Ein Team verfügte sogar über ein selbstgeschriebenes Skript, das das Modell automatisch speicherte und die aufgrund eines Zeitlimits unterbrochene Berechnung erneut startete.

Auch im Frühjahrssemester haben wir uns weiter getroffen, erfolgreiche Erkenntnisse ausgetauscht und über unsere Lösungen zum Wettbewerb gesprochen. Es begannen neue interessierte Teilnehmer zu uns zu kommen. Im Frühjahrssemester gelang es uns, in acht Wettbewerben auf Kaggle einmal Gold, dreimal Silber und neunmal Bronze zu holen: PetFinder, santa~~POS=TRUNC, Geschlechtsspezifische Auflösung, Walidentifizierung, Quora, Google-Sehenswürdigkeiten und andere, Bronze in Recco-Herausforderung, dritter Platz im Changellenge>>Cup und erster Platz (erneut im Geld) im maschinellen Lernwettbewerb bei Programmiermeisterschaft von Yandex.

Was Schulungsteilnehmer sagen

Michail Karchevsky
„Ich freue mich sehr, dass solche Aktivitäten hier in Sibirien durchgeführt werden, denn ich glaube, dass die Teilnahme an Wettbewerben der schnellste Weg ist, ML zu meistern. Für solche Wettbewerbe ist die Hardware in der Selbstanschaffung recht teuer, aber hier kann man Ideen kostenlos ausprobieren.“

Kirill Brodt
„Vor dem Aufkommen des ML-Trainings habe ich mit Ausnahme von Trainings- und Hindu-Wettbewerben nicht besonders an Wettbewerben teilgenommen: Ich sah darin keinen Sinn, da ich im Bereich ML gearbeitet hatte und damit vertraut war. Das erste Semester habe ich als Student besucht. Und ab dem zweiten Semester, als die Rechenressourcen frei wurden, dachte ich, warum nicht mitmachen? Und es hat mich süchtig gemacht. Die Aufgabe, Daten und Metriken wurden für Sie erfunden und vorbereitet. Nutzen Sie die volle Leistungsfähigkeit von MO und prüfen Sie die neuesten Modelle und Techniken. Ohne die Schulung und, was ebenso wichtig ist, die Rechenressourcen, hätte ich nicht so schnell mit der Teilnahme begonnen.“

Andrej Schewelew
„Das persönliche ML-Training hat mir geholfen, Gleichgesinnte zu finden, mit denen ich mein Wissen im Bereich maschinelles Lernen und Datenanalyse vertiefen konnte. Dies ist auch eine hervorragende Option für diejenigen, die nicht viel freie Zeit haben, sich selbstständig mit dem Thema Wettbewerbe auseinanderzusetzen und sich damit auseinanderzusetzen, sich aber dennoch mit dem Thema beschäftigen möchten.“

Verbinden Sie uns

Wettbewerbe auf Kaggle und anderen Plattformen verbessern praktische Fähigkeiten und verwandeln sich schnell in interessante Arbeiten im Bereich Data Science. Menschen, die gemeinsam an einem schwierigen Wettbewerb teilgenommen haben, werden oft zu Kollegen und lösen weiterhin erfolgreich arbeitsbedingte Probleme. Das ist uns auch passiert: Mikhail Karchevsky hat zusammen mit einem Freund aus dem Team für dasselbe Unternehmen an einem Empfehlungssystem gearbeitet.

Im Laufe der Zeit planen wir, diese Aktivität durch wissenschaftliche Veröffentlichungen und die Teilnahme an Konferenzen zum Thema maschinelles Lernen zu erweitern. Begleiten Sie uns als Teilnehmer oder Experten in Nowosibirsk – schreiben Sie me oder Kirill. Organisieren Sie ähnliche Schulungen in Ihren Städten und Universitäten.

Hier ist ein kleiner Spickzettel, der Ihnen bei Ihren ersten Schritten helfen soll:

  1. Überlegen Sie sich einen geeigneten Ort und eine geeignete Zeit für den regulären Unterricht. Optimal - 1-2 mal pro Woche.
  2. Schreiben Sie potenziell interessierten Teilnehmern über das erste Treffen. Dies sind in erster Linie Studierende technischer Universitäten, ODS-Teilnehmer.
  3. Starten Sie einen Chat, um aktuelle Themen zu besprechen: Telegram, VK, WhatsApp oder jeder andere Messenger, der für die meisten geeignet ist.
  4. Führen Sie einen öffentlich zugänglichen Unterrichtsplan, eine Liste der Wettbewerbe und Teilnehmer und überwachen Sie die Ergebnisse.
  5. Finden Sie kostenlose Rechenleistung oder Zuschüsse dafür bei nahegelegenen Universitäten, Forschungsinstituten oder Unternehmen.
  6. Gewinn!

Quelle: www.habr.com

Kommentar hinzufügen