Kuinka järjestin koneoppimiskoulutuksen NSU:ssa

Nimeni on Sasha ja rakastan koneoppimista sekä ihmisten opettamista. Nyt ohjaan koulutusohjelmia Computer Science Centerissä ja ohjaan data-analyysin kandidaatin tutkintoa Pietarin osavaltion yliopistossa. Sitä ennen hän työskenteli analyytikkona Yandexissa ja vielä aiemmin tiedemiehenä: hän harjoitti matemaattista mallintamista SB RAS:n tietojenkäsittelytieteen instituutissa.

Tässä postauksessa haluan kertoa, mitä syntyi ajatuksesta käynnistää koneoppimiskoulutus opiskelijoille, Novosibirskin valtionyliopiston valmistuneille ja kaikille muille.

Kuinka järjestin koneoppimiskoulutuksen NSU:ssa

Olen pitkään halunnut järjestää erikoiskurssin data-analyysikilpailuihin valmistautumisesta Kagglelle ja muille alustoille. Tämä tuntui loistavalta idealta:

  • Opiskelijat ja kaikki kiinnostuneet soveltavat teoreettista tietoa käytännössä ja saavat kokemusta ongelmien ratkaisemisesta julkisissa kilpailuissa.
  • Tällaisissa kilpailuissa kärkisijoilla olevat opiskelijat vaikuttavat hyvin NSU:n houkuttelevuuteen hakijoiden, opiskelijoiden ja valmistuneiden silmissä. Sama tapahtuu urheilun ohjelmointiharjoittelussa.
  • Tämä erikoiskurssi täydentää ja laajentaa täydellisesti perustietoa: osallistujat toteuttavat itsenäisesti koneoppimismalleja ja muodostavat usein tiimejä, jotka kilpailevat globaalilla tasolla.
  • Muut yliopistot olivat jo järjestäneet tällaista koulutusta, joten toivoin NSU:n erikoiskurssin onnistumista.

Запуск

Novosibirskin Akademgorodokilla on erittäin hedelmällinen maaperä tällaisille pyrkimyksille: Tietojenkäsittelytieteen keskuksen opiskelijat, valmistuneet ja opettajat sekä vahvat tekniset tiedekunnat, esimerkiksi FIT, MMF, FF, NSU:n hallinnon vahva tuki, aktiivinen ODS-yhteisö, kokeneita insinöörejä ja analyytikot eri IT-yrityksistä. Samaan aikaan saimme tietää apurahaohjelmasta Kasvitieteelliset sijoitukset — Rahasto tukee ML-urheilukilpailuissa hyviä tuloksia osoittavia joukkueita.

Löysimme NSU:sta yleisön viikoittaisiin kokouksiin, loimme chatin Telegramiin ja aloitimme 1. lokakuuta yhdessä CS-keskuksen opiskelijoiden ja valmistuneiden kanssa. Ensimmäiselle tunnille tuli 19 henkilöä. Heistä kuusi osallistui säännöllisesti koulutukseen. Yhteensä kokoukseen saapui vähintään kerran lukuvuoden aikana 31 henkilöä.

Ensimmäiset tulokset

Kaverit ja minä tapasimme, vaihdoimme kokemuksia, keskustelimme kilpailuista ja karkeasta tulevaisuuden suunnitelmasta. Melko nopeasti ymmärsimme, että data-analyysikilpailujen paikoista taisteleminen on säännöllistä, uuvuttavaa työtä, palkattoman kokopäivätyön kaltaista, mutta erittäin mielenkiintoista ja jännittävää 🙂 Yksi osallistujista, Kaggle-mestari Maxim, neuvoi meitä etenemään kilpailuissa ensin henkilökohtaisesti. , ja vain muutamaa viikkoa myöhemmin yhdistyä joukkueiksi ottaen huomioon julkiset pisteet. Näin me teimme! Kasvokkain tapahtuvan koulutuksen aikana keskustelimme malleista, tieteellisistä artikkeleista ja Python-kirjastojen hienouksista ja ratkaisimme ongelmia yhdessä.

Syyslukukauden tulokset olivat kolme hopeamitalia kahdessa Kagglen kilpailussa: TGS-suolan tunnistus и PLAsTiCC tähtitieteellinen luokitus. Ja kolmas sija CFT-kilpailussa kirjoitusvirheiden korjaamisesta ensimmäisellä voitetulla rahalla (rahassa, kuten kokeneet keglerit sanovat).

Toinen erittäin tärkeä erikoiskurssin välillinen tulos oli NSU VKI -klusterin käynnistäminen ja konfigurointi. Sen laskentateho on merkittävästi parantanut kilpailukykyistä käyttöikäämme: 40 CPU:ta, 755 Gt RAM, 8 NVIDIA Tesla V100 GPU:ta.

Kuinka järjestin koneoppimiskoulutuksen NSU:ssa

Sitä ennen selvisimme parhaamme mukaan: laskimme henkilökohtaisilla kannettavilla ja pöytäkoneilla, Google Colabissa ja Kaggle-ytimissä. Yhdellä tiimillä oli jopa itse kirjoitettu käsikirjoitus, joka tallensi mallin automaattisesti ja käynnisti aikarajan vuoksi pysähtyneen laskennan uudelleen.

Kevätlukukaudella jatkoimme kokoontumista, onnistuneiden löydösten vaihtoa ja ratkaisuistamme keskustelua kilpailuun. Uusia kiinnostuneita osallistujia alkoi tulla meille. Kagglella onnistuimme kevätlukukauden aikana voittamaan yhden kullan, kolme hopeaa ja yhdeksän pronssia kahdeksassa kilpailussa: PetFinder, Santander, Sukupuolieroteltu resoluutio, Valaan tunnistus, Quora, Google-maamerkit ja muut, pronssia sisään Recco haaste, kolmas sija Changellenge>>Cupissa ja ensimmäinen sija (jälleen rahassa) koneoppimiskilpailussa klo. ohjelmoinnin mestaruus Yandexistä.

Mitä koulutukseen osallistujat sanovat

Mihail Karchevsky
”Olen erittäin iloinen, että tällaista toimintaa täällä Siperiassa tehdään, koska uskon, että kilpailuihin osallistuminen on nopein tapa hallita ML. Tällaisiin kilpailuihin laitteisto on melko kallista ostaa itse, mutta täällä voit kokeilla ideoita ilmaiseksi.

Kirill Brodt
”Ennen ML-harjoittelun tuloa en erityisesti osallistunut kilpailuihin harjoittelua ja hindukilpailuja lukuun ottamatta: en nähnyt tässä mitään järkeä, koska minulla oli työtä ML-alalla ja se oli minulle tuttu. Ensimmäisen lukukauden osallistuin opiskelijana. Ja toisesta lukukaudesta lähtien, heti kun laskentaresurssit tulivat saataville, ajattelin, miksi ei osallistuisi. Ja se sai minut koukkuun. Tehtävä, data ja mittarit keksittiin ja valmisteltiin sinua varten, mene eteenpäin ja käytä MO:n koko tehoa, tarkista huippuluokan mallit ja tekniikat. Ilman koulutusta ja, mikä tärkeintä, laskentaresursseja, en olisi aloittanut osallistumista pian."

Andrei Shevelev
”Henkilökohtainen ML-koulutus auttoi löytämään samanhenkisiä ihmisiä, joiden kanssa pääsin syventämään tietämystäni koneoppimisen ja data-analyysin saralla. Tämä on myös erinomainen vaihtoehto niille, joilla ei ole paljoa vapaa-aikaa itsenäiseen analysointiin ja kilpailuaiheeseen uppoutumiseen, mutta haluavat silti olla aiheen parissa.”

liity meihin

Kagglen ja muiden alustojen kilpailut hiovat käytännön taitoja ja muuttuvat nopeasti mielenkiintoiseksi tietotieteen alan työksi. Yhdessä vaikeaan kilpailuun osallistuneista ihmisistä tulee usein työtovereita ja jatkavat menestyksekkäästi työhön liittyvien ongelmien ratkaisemista. Näin kävi myös meille: Mikhail Karchevsky meni yhdessä tiimin ystävän kanssa töihin samaan yritykseen suositusjärjestelmässä.

Ajan myötä aiomme laajentaa tätä toimintaa tieteellisillä julkaisuilla ja osallistumalla koneoppimiskonferensseihin. Liity meihin osallistujiksi tai asiantuntijoiksi Novosibirskiin - kirjoita minua tai Kirill. Järjestä vastaava koulutus kaupungeissasi ja yliopistoissasi.

Tässä on pieni huijauslehti, joka auttaa sinua ottamaan ensimmäiset askeleet:

  1. Harkitse sopivaa paikkaa ja aikaa tavallisille tunneille. Optimaalinen - 1-2 kertaa viikossa.
  2. Kirjoita mahdollisille kiinnostuneille osallistujille ensimmäisestä tapaamisesta. Ensinnäkin nämä ovat teknisten yliopistojen opiskelijoita, ODS-osallistujia.
  3. Aloita chat keskustellaksesi ajankohtaisista asioista: Telegram, VK, WhatsApp tai mikä tahansa muu useimmille sopiva messenger.
  4. Ylläpidä julkisesti saatavilla olevaa tuntisuunnitelmaa, luetteloa kilpailuista ja osallistujista ja seuraa tuloksia.
  5. Löydä ilmaista laskentatehoa tai apurahoja siihen läheisistä yliopistoista, tutkimuslaitoksista tai yrityksistä.
  6. VOITTO!

Lähde: www.habr.com

Lisää kommentti