Hogyan szerveztem gépi tanulási képzést az NSU-ban

A nevem Sasha, és szeretem a gépi tanulást, valamint az emberek tanítását. Jelenleg a Számítógép-tudományi Központ oktatási programjait irányítom, és a Szentpétervári Állami Egyetem adatelemzési alapképzését irányítom. Előtte a Yandex elemzőjeként, még korábban tudósként dolgozott: az SB RAS Számítástechnikai Intézetében matematikai modellezéssel foglalkozott.

Ebben a bejegyzésben szeretném elmondani, hogy mi jött ki az ötletből, hogy gépi tanulási képzést indítsunk hallgatók, a Novoszibirszki Állami Egyetemen végzettek és mindenki más számára.

Hogyan szerveztem gépi tanulási képzést az NSU-ban

Régóta szerettem volna egy speciális tanfolyamot szervezni az adatelemző versenyekre való felkészülésről a Kaggle és más platformokon. Ez remek ötletnek tűnt:

  • A hallgatók és minden érdeklődő az elméleti ismereteket a gyakorlatban kamatoztatják, és nyilvános versenyeken szereznek tapasztalatokat problémamegoldásban.
  • Az ilyen versenyeken az élen álló hallgatók jó hatással vannak az NSU vonzerejére a jelentkezők, hallgatók és végzettek számára. Ugyanez történik a sportprogramozási edzéssel is.
  • Ez a speciális kurzus tökéletesen kiegészíti és bővíti az alapvető ismereteket: a résztvevők önállóan valósítanak meg gépi tanulási modelleket, és gyakran alkotnak csapatokat, amelyek globális szinten versenyeznek.
  • Más egyetemeken már volt ilyen képzés, így reménykedtem az NSU speciális kurzusának sikerében.

dob

A novoszibirszki Akademgorodok nagyon termékeny talajjal rendelkezik az ilyen törekvésekhez: a Számítástechnikai Központ diákjai, diplomásai és tanárai, valamint erős műszaki karok, például FIT, MMF, FF, az NSU adminisztrációjának erős támogatása, aktív ODS közösség, tapasztalt mérnökök és különféle informatikai cégek elemzői. Körülbelül ugyanebben az időben értesültünk a pályázati programról Botan Investments — az alap az ML sportversenyeken jó eredményeket felmutató csapatokat támogatja.

Találtunk közönséget az NSU-ban a heti találkozókra, létrehoztunk egy chat-et a Telegramon, és október 1-jén elindítottuk a CS-központ hallgatóival és végzett hallgatóival. Az első órára 19 fő jött el. Közülük hatan rendszeres résztvevői lettek a képzésnek. Összesen 31-en jöttek el a találkozóra a tanév során legalább egyszer.

Első eredmények

A srácokkal találkoztunk, tapasztalatokat cseréltünk, megbeszéltük a versenyeket és egy durva jövőtervet. Elég hamar rájöttünk, hogy az adatelemző versenyeken a helyekért való harc rendszeres, megerőltető munka, hasonló a fizetés nélküli teljes munkaidőhöz, de nagyon érdekes és izgalmas 🙂 Az egyik résztvevő, Maxim Kaggle-mester azt tanácsolta, hogy először egyéniben lépjünk tovább a versenyeken. , és csak néhány héttel később egyesüljenek csapatokká, figyelembe véve a nyilvános pontszámot. Ezt csináltuk! A személyes tréning során modelleket, tudományos cikkeket és a Python könyvtárak fortélyait vitattuk meg, és közösen oldottuk meg a problémákat.

Az őszi félév eredménye három ezüstérem volt két versenyen a Kaggle-n: TGS só azonosítás и PLAsTiCC csillagászati ​​osztályozás. És egy harmadik hely a CFT-versenyen a gépelési hibák kijavításáért az első nyert pénzből (a pénzben, ahogy tapasztalt keglerek mondják).

A speciális tanfolyam másik nagyon fontos közvetett eredménye az NSU VKI klaszter elindítása és konfigurálása volt. Számítási teljesítménye jelentősen megnövelte versenyképes élettartamunkat: 40 CPU, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU.

Hogyan szerveztem gépi tanulási képzést az NSU-ban

Előtte a lehető legjobban túléltük: személyes laptopokon és asztali gépeken, Google Colabban és Kaggle-kernelekben számoltunk. Az egyik csapatnak még volt egy saját maga által írt szkriptje is, amely automatikusan elmentette a modellt, és újraindította az időkorlát miatt leállt számítást.

A tavaszi félévben is folytattuk a gyülekezést, a sikeres leletek cseréjét és a pályázati megoldásainkról való beszélgetést. Új érdeklődők kezdtek érkezni hozzánk. A tavaszi félév során nyolc versenyen egy aranyat, három ezüstöt és kilenc bronzot sikerült szereznünk a Kaggle-n: PetFinder, Santander, Nemek szerinti felbontás, Bálnaazonosítás, Quora, Google tereptárgyak és mások, bronz Recco kihívás, a Changellenge>>Cup harmadik helyezése és az első hely (ismét pénzben) a gépi tanulási versenyen programozó bajnokság a Yandextől.

Amit a tréning résztvevői mondanak

Mihail Karcsevszkij
„Nagyon örülök, hogy itt Szibériában végeznek ilyen tevékenységeket, mert úgy gondolom, hogy a versenyeken való részvétel a leggyorsabb módja az ML elsajátításának. Az ilyen versenyekhez elég drága a hardver, amit magadnak kell beszerezni, de itt ingyen kipróbálhatsz ötleteket.”

Kirill Brodt
„Az ML-edzés megjelenése előtt az edzések és a hindu versenyek kivételével nem vettem különösebben részt versenyeken: ennek nem láttam értelmét, hiszen volt munkám az ML területén, ismerkedtem vele. Az első félévben diákként jártam. És a második félévtől kezdve, amint rendelkezésre álltak a számítástechnikai erőforrások, arra gondoltam, miért ne vennék részt. És ez megragadta. A feladatot, az adatokat és a mérőszámokat Önnek találták ki és készítették el, használd ki a MO teljes erejét, nézd meg a legmodernebb modelleket és technikákat. Ha nem lettek volna a képzés, és ami ugyanilyen fontos, a számítástechnikai erőforrások, nem kezdtem volna el egyhamar részt venni.”

Andrej Sevelev
„A személyes ML tréning segítségével hasonló gondolkodású embereket találtam, akikkel a gépi tanulás és adatelemzés területén mélyíthettem el tudásomat. Ez egy kiváló lehetőség azoknak is, akiknek nincs sok szabadidejük az önálló elemzésre és a versenyek témájában való elmélyülésre, de mégis szeretnének benne lenni a témában.”

Csatlakozz hozzánk

A Kaggle és más platformokon folyó versenyek a gyakorlati készségeket csiszolják, és gyorsan érdekes munkává alakulnak át az adattudomány területén. Azok, akik együtt vettek részt egy nehéz versenyen, gyakran kollégákká válnak, és továbbra is sikeresen oldják meg a munkával kapcsolatos problémákat. Ez velünk is megtörtént: Mihail Karcsevszkij a csapat egyik barátjával együtt ugyanahhoz a céghez ment el dolgozni egy ajánlási rendszer alapján.

Ezt a tevékenységet idővel tudományos publikációkkal és gépi tanulási konferenciákon való részvétellel tervezzük bővíteni. Csatlakozzon hozzánk résztvevőként vagy szakértőként Novoszibirszkben - írjon nekem vagy Kirill. Szervezzen hasonló képzést városaiban és egyetemein.

Íme egy kis csalólap, amely segít megtenni az első lépéseket:

  1. Fontolja meg a megfelelő helyet és időpontot a rendszeres órákhoz. Optimálisan - heti 1-2 alkalommal.
  2. Írjon a potenciálisan érdeklődő résztvevőknek az első találkozóról. Először is, ezek műszaki egyetemek hallgatói, ODS résztvevők.
  3. Indítson csevegést az aktuális ügyek megvitatásához: Telegram, VK, WhatsApp vagy bármely más, a legtöbb számára kényelmes üzenetküldő.
  4. Vezessen nyilvánosan elérhető óratervet, a versenyek és a résztvevők listáját, és kövesse nyomon az eredményeket.
  5. Keressen ingyenes számítási teljesítményt vagy támogatást a közeli egyetemeken, kutatóintézetekben vagy cégeknél.
  6. PROFIT!

Forrás: www.habr.com

Hozzászólás