Jak zorganizowałem szkolenie z zakresu uczenia maszynowego w NSU

Nazywam się Sasha i uwielbiam uczenie maszynowe oraz uczenie ludzi. Obecnie nadzoruję programy edukacyjne w Centrum Informatyki i kieruję programem studiów licencjackich z analizy danych na Uniwersytecie Państwowym w Petersburgu. Wcześniej pracował jako analityk w Yandex, a jeszcze wcześniej jako naukowiec: zajmował się modelowaniem matematycznym w Instytucie Informatyki SB RAS.

W tym poście chcę opowiedzieć, skąd wziął się pomysł uruchomienia szkoleń z zakresu uczenia maszynowego dla studentów, absolwentów Nowosybirskiego Uniwersytetu Państwowego i wszystkich innych.

Jak zorganizowałem szkolenie z zakresu uczenia maszynowego w NSU

Od dawna chciałem zorganizować specjalny kurs z przygotowania do zawodów w zakresie analizy danych na Kaggle i innych platformach. To wydawało się świetnym pomysłem:

  • Studenci i wszyscy zainteresowani wykorzystają wiedzę teoretyczną w praktyce i zdobędą doświadczenie w rozwiązywaniu problemów w konkursach publicznych.
  • Studenci, którzy zajmują czołowe miejsca w tego typu konkursach, dobrze wpływają na atrakcyjność NSU dla kandydatów, studentów i absolwentów. To samo dzieje się z treningiem programowania sportowego.
  • Ten specjalny kurs doskonale uzupełnia i poszerza wiedzę podstawową: uczestnicy samodzielnie wdrażają modele uczenia maszynowego i często tworzą zespoły, które konkurują na światowym poziomie.
  • Inne uczelnie prowadziły już takie szkolenia, więc liczyłem na sukces specjalnego kursu na NSU.

szalupa

Akademik Nowosybirski ma bardzo podatny grunt dla takich przedsięwzięć: studenci, absolwenci i nauczyciele Centrum Informatyki oraz silne wydziały techniczne, np. FIT, MMF, FF, silne wsparcie administracji NSU, aktywna społeczność ODS, doświadczeni inżynierowie i analitycy z różnych firm informatycznych. Mniej więcej w tym samym czasie dowiedzieliśmy się o programie dotacyjnym od Inwestycje Botan — fundusz wspiera drużyny osiągające dobre wyniki w zawodach sportowych ML.

Znaleźliśmy publiczność na NSU na cotygodniowe spotkania, stworzyliśmy czat na Telegramie i uruchomiliśmy 1 października razem ze studentami i absolwentami centrum CS. Na pierwszą lekcję przyszło 19 osób. Sześciu z nich zostało stałymi uczestnikami szkoleń. Łącznie na spotkanie przynajmniej raz w ciągu roku akademickiego przybyło 31 osób.

Pierwsze wyniki

Spotkaliśmy się z chłopakami, wymieniliśmy doświadczeniami, omówiliśmy konkursy i przybliżony plan na przyszłość. Dość szybko zdaliśmy sobie sprawę, że walka o miejsca w konkursach analizy danych to regularna, wyczerpująca praca, podobna do bezpłatnej pracy na pełen etat, ale bardzo ciekawa i emocjonująca 🙂 Jeden z uczestników, Kaggle-master Maxim, doradził nam, abyśmy w pierwszej kolejności awansowali w konkursach indywidualnie i zaledwie kilka tygodni później łączą się w zespoły, biorąc pod uwagę wynik publiczny. To właśnie zrobiliśmy! Podczas szkoleń bezpośrednich omawialiśmy modele, artykuły naukowe i zawiłości bibliotek Pythona oraz wspólnie rozwiązywaliśmy problemy.

Efektami semestru jesiennego były trzy srebrne medale w dwóch konkursach na Kaggle: Identyfikacja soli TGS и Klasyfikacja astronomiczna PLASTiCC. I jedno trzecie miejsce w konkursie CFT za poprawienie literówek za pierwsze wygrane pieniądze (w pieniądzu, jak mówią doświadczeni keglerzy).

Kolejnym bardzo ważnym pośrednim rezultatem specjalnego kursu było uruchomienie i konfiguracja klastra NSU VKI. Jego moc obliczeniowa znacznie poprawiła nasze życie konkurencyjne: 40 procesorów, 755 GB pamięci RAM, 8 procesorów graficznych NVIDIA Tesla V100.

Jak zorganizowałem szkolenie z zakresu uczenia maszynowego w NSU

Wcześniej radziliśmy sobie najlepiej, jak mogliśmy: kalkulowaliśmy na osobistych laptopach i komputerach stacjonarnych, w Google Colab i jądrach Kaggle. Jeden zespół miał nawet samodzielnie napisany skrypt, który automatycznie zapisywał model i rozpoczynał od nowa obliczenia, które zostały zatrzymane ze względu na limit czasu.

W semestrze wiosennym nadal się spotykaliśmy, wymienialiśmy pozytywne wnioski i rozmawialiśmy o naszych rozwiązaniach dla konkurencji. Zaczęli zgłaszać się do nas nowi zainteresowani uczestnicy. W semestrze wiosennym udało nam się zdobyć jedno złoto, trzy srebrne i dziewięć brązowych medali w ośmiu konkursach na Kaggle: Wyszukiwarka zwierząt, Santander, Rozdzielczość płci, Identyfikacja wieloryba, Quora, Punkty orientacyjne Google i inne, brąz w Wyzwanie Recco, trzecie miejsce w Changellenge>>Cup i pierwsze miejsce (znowu w pieniądzu) w konkursie uczenia maszynowego o godz. mistrzostwa programowania od Yandexa.

Co mówią uczestnicy szkolenia

Michaił Karczewski
„Bardzo się cieszę, że takie zajęcia są prowadzone tutaj, na Syberii, bo uważam, że udział w zawodach to najszybsza droga do opanowania ML. Na takie zawody sprzęt jest dość drogi, ale tutaj możesz wypróbować pomysły za darmo.”

Cyryl Brodt
„Przed pojawieniem się treningu ML nie brałem szczególnie udziału w zawodach, z wyjątkiem treningów i zawodów hinduskich: nie widziałem w tym sensu, ponieważ pracowałem w dziedzinie ML i byłem z tym zaznajomiony. W pierwszym semestrze uczestniczyłem jako student. I począwszy od drugiego semestru, gdy tylko zasoby komputerowe stały się dostępne, pomyślałem, dlaczego nie wziąć w tym udziału. I to mnie wciągnęło. Zadanie, dane i metryki zostały wymyślone i przygotowane dla Ciebie, śmiało wykorzystaj pełną moc MO, sprawdź najnowocześniejsze modele i techniki. Gdyby nie szkolenie i, co równie ważne, zasoby komputerowe, nie zacząłbym szybko uczestniczyć w zajęciach”.

Andriej Szewelew
„Stacjonarne szkolenie ML pomogło mi znaleźć osoby o podobnych poglądach, z którymi mogłem pogłębić swoją wiedzę z zakresu uczenia maszynowego i analizy danych. To także doskonała opcja dla tych, którzy nie mają zbyt wiele wolnego czasu na samodzielną analizę i zagłębienie się w tematykę konkursów, a mimo to chcą być w temacie.”

Dołącz do nas

Konkursy na Kaggle i innych platformach doskonalą umiejętności praktyczne i szybko przekształcają się w ciekawą pracę z zakresu data science. Osoby, które wspólnie brały udział w trudnych zawodach, często zostają współpracownikami i nadal skutecznie rozwiązują problemy związane z pracą. Nam też się to przydarzyło: Michaił Karczewski wraz z przyjacielem z zespołu rozpoczął pracę w tej samej firmie w ramach systemu rekomendacji.

Z czasem planujemy rozszerzyć tę działalność o publikacje naukowe i udział w konferencjach poświęconych uczeniu maszynowemu. Dołącz do nas jako uczestnicy lub eksperci w Nowosybirsku - napisz mnie lub Cyryl. Organizujcie podobne szkolenia w swoich miastach i na uczelniach.

Oto mała ściągawka, która pomoże Ci postawić pierwsze kroki:

  1. Zastanów się nad dogodnym miejscem i czasem regularnych zajęć. Optymalnie – 1-2 razy w tygodniu.
  2. Napisz do potencjalnie zainteresowanych uczestników w sprawie pierwszego spotkania. Są to przede wszystkim studenci uczelni technicznych, uczestnicy ODS.
  3. Rozpocznij czat, aby omówić bieżące sprawy: Telegram, VK, WhatsApp lub inny wygodny dla większości komunikator.
  4. Prowadź publicznie dostępny plan lekcji, listę konkursów i uczestników oraz monitoruj wyniki.
  5. Znajdź darmową moc obliczeniową lub granty na nią w pobliskich uczelniach, instytutach badawczych lub firmach.
  6. ZYSK!

Źródło: www.habr.com

Dodaj komentarz