Nazywam się Sasha i uwielbiam uczenie maszynowe oraz uczenie ludzi. Obecnie nadzoruję programy edukacyjne w Centrum Informatyki i kieruję programem studiów licencjackich z analizy danych na Uniwersytecie Państwowym w Petersburgu. Wcześniej pracował jako analityk w Yandex, a jeszcze wcześniej jako naukowiec: zajmował się modelowaniem matematycznym w Instytucie Informatyki SB RAS.
W tym poście chcę opowiedzieć, skąd wziął się pomysł uruchomienia szkoleń z zakresu uczenia maszynowego dla studentów, absolwentów Nowosybirskiego Uniwersytetu Państwowego i wszystkich innych.
Od dawna chciałem zorganizować specjalny kurs z przygotowania do zawodów w zakresie analizy danych na Kaggle i innych platformach. To wydawało się świetnym pomysłem:
- Studenci i wszyscy zainteresowani wykorzystają wiedzę teoretyczną w praktyce i zdobędą doświadczenie w rozwiązywaniu problemów w konkursach publicznych.
- Studenci, którzy zajmują czołowe miejsca w tego typu konkursach, dobrze wpływają na atrakcyjność NSU dla kandydatów, studentów i absolwentów. To samo dzieje się z treningiem programowania sportowego.
- Ten specjalny kurs doskonale uzupełnia i poszerza wiedzę podstawową: uczestnicy samodzielnie wdrażają modele uczenia maszynowego i często tworzą zespoły, które konkurują na światowym poziomie.
- Inne uczelnie prowadziły już takie szkolenia, więc liczyłem na sukces specjalnego kursu na NSU.
szalupa
Akademik Nowosybirski ma bardzo podatny grunt dla takich przedsięwzięć: studenci, absolwenci i nauczyciele Centrum Informatyki oraz silne wydziały techniczne, np. FIT, MMF, FF, silne wsparcie administracji NSU, aktywna społeczność ODS, doświadczeni inżynierowie i analitycy z różnych firm informatycznych. Mniej więcej w tym samym czasie dowiedzieliśmy się o programie dotacyjnym od
Znaleźliśmy publiczność na NSU na cotygodniowe spotkania, stworzyliśmy czat na Telegramie i uruchomiliśmy 1 października razem ze studentami i absolwentami centrum CS. Na pierwszą lekcję przyszło 19 osób. Sześciu z nich zostało stałymi uczestnikami szkoleń. Łącznie na spotkanie przynajmniej raz w ciągu roku akademickiego przybyło 31 osób.
Pierwsze wyniki
Spotkaliśmy się z chłopakami, wymieniliśmy doświadczeniami, omówiliśmy konkursy i przybliżony plan na przyszłość. Dość szybko zdaliśmy sobie sprawę, że walka o miejsca w konkursach analizy danych to regularna, wyczerpująca praca, podobna do bezpłatnej pracy na pełen etat, ale bardzo ciekawa i emocjonująca 🙂 Jeden z uczestników, Kaggle-master Maxim, doradził nam, abyśmy w pierwszej kolejności awansowali w konkursach indywidualnie i zaledwie kilka tygodni później łączą się w zespoły, biorąc pod uwagę wynik publiczny. To właśnie zrobiliśmy! Podczas szkoleń bezpośrednich omawialiśmy modele, artykuły naukowe i zawiłości bibliotek Pythona oraz wspólnie rozwiązywaliśmy problemy.
Efektami semestru jesiennego były trzy srebrne medale w dwóch konkursach na Kaggle:
Kolejnym bardzo ważnym pośrednim rezultatem specjalnego kursu było uruchomienie i konfiguracja klastra NSU VKI. Jego moc obliczeniowa znacznie poprawiła nasze życie konkurencyjne: 40 procesorów, 755 GB pamięci RAM, 8 procesorów graficznych NVIDIA Tesla V100.
Wcześniej radziliśmy sobie najlepiej, jak mogliśmy: kalkulowaliśmy na osobistych laptopach i komputerach stacjonarnych, w Google Colab i jądrach Kaggle. Jeden zespół miał nawet samodzielnie napisany skrypt, który automatycznie zapisywał model i rozpoczynał od nowa obliczenia, które zostały zatrzymane ze względu na limit czasu.
W semestrze wiosennym nadal się spotykaliśmy, wymienialiśmy pozytywne wnioski i rozmawialiśmy o naszych rozwiązaniach dla konkurencji. Zaczęli zgłaszać się do nas nowi zainteresowani uczestnicy. W semestrze wiosennym udało nam się zdobyć jedno złoto, trzy srebrne i dziewięć brązowych medali w ośmiu konkursach na Kaggle:
Co mówią uczestnicy szkolenia
„Bardzo się cieszę, że takie zajęcia są prowadzone tutaj, na Syberii, bo uważam, że udział w zawodach to najszybsza droga do opanowania ML. Na takie zawody sprzęt jest dość drogi, ale tutaj możesz wypróbować pomysły za darmo.”
„Przed pojawieniem się treningu ML nie brałem szczególnie udziału w zawodach, z wyjątkiem treningów i zawodów hinduskich: nie widziałem w tym sensu, ponieważ pracowałem w dziedzinie ML i byłem z tym zaznajomiony. W pierwszym semestrze uczestniczyłem jako student. I począwszy od drugiego semestru, gdy tylko zasoby komputerowe stały się dostępne, pomyślałem, dlaczego nie wziąć w tym udziału. I to mnie wciągnęło. Zadanie, dane i metryki zostały wymyślone i przygotowane dla Ciebie, śmiało wykorzystaj pełną moc MO, sprawdź najnowocześniejsze modele i techniki. Gdyby nie szkolenie i, co równie ważne, zasoby komputerowe, nie zacząłbym szybko uczestniczyć w zajęciach”.
„Stacjonarne szkolenie ML pomogło mi znaleźć osoby o podobnych poglądach, z którymi mogłem pogłębić swoją wiedzę z zakresu uczenia maszynowego i analizy danych. To także doskonała opcja dla tych, którzy nie mają zbyt wiele wolnego czasu na samodzielną analizę i zagłębienie się w tematykę konkursów, a mimo to chcą być w temacie.”
Dołącz do nas
Konkursy na Kaggle i innych platformach doskonalą umiejętności praktyczne i szybko przekształcają się w ciekawą pracę z zakresu data science. Osoby, które wspólnie brały udział w trudnych zawodach, często zostają współpracownikami i nadal skutecznie rozwiązują problemy związane z pracą. Nam też się to przydarzyło: Michaił Karczewski wraz z przyjacielem z zespołu rozpoczął pracę w tej samej firmie w ramach systemu rekomendacji.
Z czasem planujemy rozszerzyć tę działalność o publikacje naukowe i udział w konferencjach poświęconych uczeniu maszynowemu. Dołącz do nas jako uczestnicy lub eksperci w Nowosybirsku - napisz
Oto mała ściągawka, która pomoże Ci postawić pierwsze kroki:
- Zastanów się nad dogodnym miejscem i czasem regularnych zajęć. Optymalnie – 1-2 razy w tygodniu.
- Napisz do potencjalnie zainteresowanych uczestników w sprawie pierwszego spotkania. Są to przede wszystkim studenci uczelni technicznych, uczestnicy ODS.
- Rozpocznij czat, aby omówić bieżące sprawy: Telegram, VK, WhatsApp lub inny wygodny dla większości komunikator.
- Prowadź publicznie dostępny plan lekcji, listę konkursów i uczestników oraz monitoruj wyniki.
- Znajdź darmową moc obliczeniową lub granty na nią w pobliskich uczelniach, instytutach badawczych lub firmach.
- ZYSK!
Źródło: www.habr.com