Moje ime je Sasha in rad imam strojno učenje ter poučevanje ljudi. Zdaj nadzorujem izobraževalne programe v Centru za računalništvo in usmerjam dodiplomski program analize podatkov na Državni univerzi v Sankt Peterburgu. Pred tem je delal kot analitik pri Yandexu, še prej pa kot znanstvenik: ukvarjal se je z matematičnim modeliranjem na Inštitutu za računalništvo SB RAS.
V tem prispevku vam želim povedati, kaj je nastala na podlagi ideje o uvedbi usposabljanja za strojno učenje za študente, diplomante Novosibirske državne univerze in vse ostale.
Že dolgo sem si želel organizirati poseben tečaj o pripravi na tekmovanja v analizi podatkov na Kaggle in drugih platformah. To se je zdela odlična ideja:
- Študenti in vsi zainteresirani bodo teoretično znanje uporabili v praksi in pridobili izkušnje pri reševanju problemov na javnih natečajih.
- Študenti, ki se na tovrstnih tekmovanjih uvrstijo v vrh, dobro vplivajo na privlačnost NSU za kandidate, študente in diplomante. Enako se zgodi pri treningu športnega programiranja.
- Ta specialni tečaj odlično dopolnjuje in širi temeljno znanje: udeleženci samostojno izvajajo modele strojnega učenja in pogosto tvorijo ekipe, ki tekmujejo na globalni ravni.
- Druge univerze so že izvajale takšno usposabljanje, zato sem upal na uspeh posebnega predmeta na NSU.
Izstrelite
Akademgorodok v Novosibirsku ima zelo plodna tla za takšna prizadevanja: študentje, diplomanti in učitelji Centra za računalništvo in močne tehnične fakultete, na primer FIT, MMF, FF, močno podporo uprave NSU, aktivno skupnost ODS, izkušene inženirje in analitiki iz različnih IT podjetij. Približno v istem času smo izvedeli za program nepovratnih sredstev od
Na NSU smo našli občinstvo za tedenska srečanja, ustvarili klepet na Telegramu in začeli 1. oktobra skupaj s študenti in diplomanti centra CS. Na prvo uro je prišlo 19 ljudi. Šest jih je postalo rednih udeležencev usposabljanja. Skupno je bilo v študijskem letu vsaj enkrat na srečanje 31 ljudi.
Prvi rezultati
S fanti smo se srečali, izmenjali izkušnje, se pogovorili o tekmovanjih in okvirnem načrtu za prihodnost. Kar hitro smo spoznali, da je boj za mesta na tekmovanjih v analizi podatkov običajno, naporno delo, podobno neplačanemu delu s polnim delovnim časom, a zelo zanimivo in vznemirljivo 🙂 Eden od udeležencev, Kaggle-master Maxim, nam je svetoval, da najprej napredujemo na tekmovanjih posamično. , le nekaj tednov kasneje pa se združijo v ekipe ob upoštevanju javnega rezultata. To smo storili! Med usposabljanjem iz oči v oči smo razpravljali o modelih, znanstvenih člankih in zapletenosti knjižnic Python ter skupaj reševali probleme.
Rezultati jesenskega semestra so bile tri srebrne medalje na dveh tekmovanjih na Kagglu:
Drug zelo pomemben posreden rezultat specialnega tečaja je bil zagon in konfiguracija gruče NSU VKI. Njegova računalniška moč je bistveno izboljšala naše tekmovalno življenje: 40 CPU-jev, 755 Gb RAM-a, 8 GPE-jev NVIDIA Tesla V100.
Pred tem smo preživeli po najboljših močeh: računali smo na osebnih prenosnikih in namiznih računalnikih, v Google Colabu in v jedrih Kaggle. Ena ekipa je imela celo samonapisani skript, ki je samodejno shranil model in znova zagnal izračun, ki se je ustavil zaradi časovne omejitve.
V spomladanskem semestru smo nadaljevali z druženjem, izmenjavo uspešnih ugotovitev in pogovori o naših rešitvah konkurence. K nam so začeli prihajati novi zainteresirani udeleženci. V spomladanskem semestru smo v osmih tekmovanjih na Kaggleju uspeli osvojiti eno zlato, tri srebrne in devet bronastih:
Kaj pravijo udeleženci usposabljanja
»Zelo sem vesel, da se takšne dejavnosti izvajajo tukaj v Sibiriji, saj menim, da je sodelovanje na tekmovanjih najhitrejši način za obvladovanje ML. Za takšna tekmovanja je strojna oprema precej draga, da jo kupite sami, tukaj pa lahko ideje preizkusite brezplačno.«
»Pred pojavom ML usposabljanja se nisem posebej udeleževal tekmovanj z izjemo treningov in hindujskih tekmovanj: v tem nisem videl smisla, saj sem imel delo na področju ML in sem bil seznanjen s tem. Prvi semester sem obiskoval kot študent. In od drugega semestra, takoj ko so bili na voljo računalniški viri, sem pomislil, zakaj ne bi sodeloval. In to me je zasvojilo. Naloga, podatki in metrike so bili izmišljeni in pripravljeni za vas, nadaljujte in uporabite vso moč MO, preverite najsodobnejše modele in tehnike. Če ne bi bilo usposabljanja in, kar je prav tako pomembno, računalniških virov, ne bi kmalu začel sodelovati.«
»Osebno usposabljanje ML mi je pomagalo najti somišljenike, s katerimi sem lahko poglobil svoje znanje na področju strojnega učenja in analize podatkov. To je odlična možnost tudi za tiste, ki nimajo veliko prostega časa za samostojno analiziranje in poglobitev v temo tekmovanj, a si vseeno želijo biti v temi.”
Pridruži se nam
Tekmovanja na Kaggle in drugih platformah izpilijo praktične veščine in se hitro spremenijo v zanimivo delo na področju podatkovne znanosti. Ljudje, ki so se skupaj udeležili težkega tekmovanja, pogosto postanejo sodelavci in še naprej uspešno rešujejo službene probleme. To se je zgodilo tudi nam: Mikhail Karchevsky je skupaj s prijateljem iz ekipe šel delat v isto podjetje po sistemu priporočil.
Sčasoma nameravamo to dejavnost razširiti z znanstvenimi objavami in udeležbo na konferencah strojnega učenja. Pridružite se nam kot udeleženci ali strokovnjaki v Novosibirsku - pišite
Tu je kratek goljuf, ki vam bo v pomoč pri prvih korakih:
- Razmislite o primernem kraju in času za redne razrede. Optimalno - 1-2 krat na teden.
- Pišite morebitnim zainteresiranim udeležencem o prvem srečanju. Najprej so to študenti tehničnih univerz, udeleženci ODS.
- Začnite klepet, da bi razpravljali o aktualnih zadevah: Telegram, VK, WhatsApp ali kateri koli drug messenger, primeren za večino.
- Vodite javno dostopen učni načrt, seznam tekmovanj in udeležencev ter spremljajte rezultate.
- Poiščite brezplačno računalniško moč ali nepovratna sredstva zanjo na bližnjih univerzah, raziskovalnih inštitutih ali podjetjih.
- DOBIČEK!
Vir: www.habr.com