Ako som organizoval školenie strojového učenia na NSU

Volám sa Sasha a milujem strojové učenie, ako aj učenie ľudí. Teraz vediem vzdelávacie programy v Centre počítačovej vedy a vediem bakalársky program v oblasti analýzy údajov na Štátnej univerzite v Petrohrade. Predtým pracoval ako analytik v spoločnosti Yandex a ešte skôr ako vedec: zaoberal sa matematickým modelovaním na Inštitúte počítačovej vedy SB RAS.

V tomto príspevku vám chcem povedať, čo vzišlo z myšlienky spustenia školenia strojového učenia pre študentov, absolventov Štátnej univerzity v Novosibirsku a všetkých ostatných.

Ako som organizoval školenie strojového učenia na NSU

Už dlho som chcel zorganizovať špeciálny kurz o príprave na súťaže v oblasti analýzy dát na Kaggle a iných platformách. Toto sa mi zdalo ako skvelý nápad:

  • Študenti a každý záujemca uplatní teoretické poznatky v praxi a získa skúsenosti s riešením problémov vo verejných súťažiach.
  • Študenti, ktorí sa v takýchto súťažiach umiestnia na popredných miestach, majú dobrý vplyv na atraktivitu NŠU pre uchádzačov, študentov a absolventov. To isté sa deje s tréningom športového programovania.
  • Tento špeciálny kurz dokonale dopĺňa a rozširuje základné znalosti: účastníci samostatne implementujú modely strojového učenia a často tvoria tímy, ktoré súťažia na globálnej úrovni.
  • Iné univerzity už takéto školenia absolvovali, takže som dúfal v úspech špeciálneho kurzu na NSU.

Запуск

Akademgorodok v Novosibirsku má pre takéto snahy veľmi úrodnú pôdu: študenti, absolventi a učitelia Centra výpočtovej techniky a silné technické fakulty, napríklad FIT, MMF, FF, silná podpora administratívy NSU, aktívna komunita ODS, skúsení inžinieri a analytici z rôznych IT spoločností. Približne v rovnakom čase sme sa dozvedeli o grantovom programe od r Botan Investments — fond podporuje tímy, ktoré vykazujú dobré výsledky v športových súťažiach ML.

Našli sme publikum na NSU na týždenné stretnutia, vytvorili chat na Telegrame a spustili sme 1. októbra spolu so študentmi a absolventmi CS centra. Na prvú hodinu prišlo 19 ľudí. Šiesti z nich sa stali pravidelnými účastníkmi školenia. Celkovo prišlo na stretnutie aspoň raz počas akademického roka 31 ľudí.

Prvé výsledky

S chalanmi sme sa stretli, vymenili si skúsenosti, prediskutovali súťaže a hrubý plán do budúcnosti. Pomerne rýchlo sme si uvedomili, že bojovať o miesta v súťažiach analýzy dát je pravidelná, vyčerpávajúca práca, podobná neplatenej práci na plný úväzok, ale veľmi zaujímavá a vzrušujúca 🙂 Jeden z účastníkov, Kaggle-master Maxim, nám poradil, aby sme v súťažiach postupovali najskôr individuálne , a len o niekoľko týždňov neskôr sa spojiť do tímov, berúc do úvahy verejné skóre. To sme urobili! Počas osobného školenia sme diskutovali o modeloch, vedeckých článkoch a zložitosti Pythonových knižníc a spoločne riešili problémy.

Výsledkom jesenného semestra boli tri strieborné medaily v dvoch súťažiach na Kaggle: Identifikácia soli TGS и Astronomická klasifikácia PLAsTiCC. A jedno tretie miesto v CFT súťaži za opravu preklepov s prvými vyhranými peniazmi (v peniazoch, ako hovoria skúsení kegleri).

Ďalším veľmi dôležitým nepriamym výsledkom špeciálneho kurzu bolo spustenie a konfigurácia klastra NSU VKI. Jeho výpočtový výkon výrazne zlepšil náš konkurenčný život: 40 CPU, 755 Gb RAM, 8 GPU NVIDIA Tesla V100.

Ako som organizoval školenie strojového učenia na NSU

Predtým sme prežili, ako sa len dalo: počítali sme na osobných prenosných počítačoch a stolných počítačoch, v Google Colab a v jadrách Kaggle. Jeden tím mal dokonca vlastnoručne napísaný skript, ktorý automaticky uložil model a znova spustil výpočet, ktorý sa zastavil z dôvodu časového limitu.

V jarnom semestri sme pokračovali v zhromažďovaní, výmene úspešných poznatkov a rozprávaní o našich riešeniach súťaže. Začali k nám prichádzať noví záujemcovia. Počas jarného semestra sa nám v ôsmich súťažiach na Kaggle podarilo získať jedno zlato, tri strieborné a deväť bronzov: PetFinder, Santander, Rodové rozlíšenie, Identifikácia veľrýb, Quora, Google Landmarks a iné, bronzové v Recco výzva, tretie miesto v Changellenge>>Cup a prvé miesto (opäť v peniazoch) v súťaži strojového učenia na majstrovstvo v programovaní od spoločnosti Yandex.

Čo hovoria účastníci školenia

Michail Karčevskij
„Som veľmi rád, že sa takéto aktivity realizujú aj u nás na Sibíri, pretože verím, že účasť na súťažiach je najrýchlejšia cesta k ovládnutiu ML. Na takéto súťaže je hardvér dosť drahý, aby ste si ho kúpili sami, ale tu si môžete nápady vyskúšať zadarmo.“

Kirill Brodt
„Pred príchodom ML tréningu som sa nijak zvlášť nezúčastňoval súťaží s výnimkou tréningov a hinduistických súťaží: nevidel som v tom zmysel, keďže som mal prácu v oblasti ML a poznal som to. Prvý semester som navštevoval ako študent. A od druhého semestra, hneď ako boli dostupné výpočtové zdroje, som si povedal, prečo sa nezúčastniť. A chytilo ma to. Úloha, údaje a metriky boli vymyslené a pripravené pre vás, pokračujte a využite plnú silu MO, overte si najmodernejšie modely a techniky. Nebyť školenia a, čo je rovnako dôležité, výpočtových zdrojov, nezačal by som sa čoskoro zúčastňovať."

Andrej Ševelev
“Osobné školenie ML mi pomohlo nájsť podobne zmýšľajúcich ľudí, s ktorými som si mohol prehĺbiť svoje znalosti v oblasti strojového učenia a analýzy dát. Je to tiež vynikajúca možnosť pre tých, ktorí nemajú veľa voľného času na samostatné analyzovanie a ponorenie sa do témy súťaží, no napriek tomu chcú byť v tejto téme.“

pripoj sa k nám

Súťaže na Kaggle a iných platformách zdokonaľujú praktické zručnosti a rýchlo sa menia na zaujímavú prácu v oblasti dátovej vedy. Ľudia, ktorí sa spolu zúčastnili ťažkej súťaže, sa často stávajú kolegami a naďalej úspešne riešia pracovné problémy. Stalo sa to aj nám: Michail Karčevskij spolu s kamarátom z tímu išli pracovať do tej istej spoločnosti na odporúčací systém.

Postupom času plánujeme túto aktivitu rozširovať o vedecké publikácie a účasť na konferenciách strojového učenia. Pridajte sa k nám ako účastníci alebo odborníci v Novosibirsku - napíšte ma alebo Kirill. Zorganizujte podobné školenia vo svojich mestách a univerzitách.

Tu je malý cheat, ktorý vám pomôže urobiť prvé kroky:

  1. Zvážte vhodné miesto a čas pre pravidelné hodiny. Optimálne - 1-2 krát týždenne.
  2. Napíšte potenciálnym záujemcom o prvom stretnutí. V prvom rade ide o študentov technických univerzít, účastníkov ODS.
  3. Začnite rozhovor a diskutujte o aktuálnych udalostiach: Telegram, VK, WhatsApp alebo akýkoľvek iný messenger vhodný pre väčšinu.
  4. Udržujte verejne prístupný plán lekcií, zoznam súťaží a účastníkov a sledujte výsledky.
  5. Nájdite si bezplatný výpočtový výkon alebo granty na okolité univerzity, výskumné ústavy alebo spoločnosti.
  6. ZISK!

Zdroj: www.habr.com

Pridať komentár