Nola antolatu nuen ikaskuntza automatikoko prestakuntza NSUn

Nire izena Sasha da eta ikaskuntza automatikoa maite dut, baita jendeari irakastea ere. Orain hezkuntza-programak gainbegiratzen ditut Informatika Zentroan eta San Petersburgoko Estatuko Unibertsitatean datuen analisiko lizentziatura zuzentzen dut. Aurretik, Yandex-en analista gisa lan egin zuen, eta lehenago ere zientzialari gisa: SB RASeko Informatika Institutuan modelizazio matematikoan aritu zen.

Argitalpen honetan kontatu nahi dizut zer sortu zen ikaskuntza automatikoko prestakuntza abiarazteko ideiak ikasleentzat, Novosibirsk Estatuko Unibertsitateko lizentziatuentzat eta gainerakoentzat.

Nola antolatu nuen ikaskuntza automatikoko prestakuntza NSUn

Aspalditik nahi nuen Kaggle eta beste plataformetan datuen analisiko lehiaketak prestatzeko ikastaro berezi bat antolatu. Ideia bikaina iruditu zitzaidan:

  • Ikasleek eta interesa duen edonork ezagutza teorikoak praktikan aplikatuko dituzte eta lehiaketa publikoetan arazoak konpontzen esperientzia lortuko dute.
  • Horrelako lehiaketetan goiko postuetan kokatzen diren ikasleek NSUren erakargarritasunean eragin ona dute eskatzaile, ikasle eta lizentziadunentzat. Gauza bera gertatzen da kirol programazio prestakuntzarekin.
  • Ikastaro berezi honek ezin hobeto osatu eta zabaltzen ditu oinarrizko ezagutzak: parte-hartzaileek modu independentean ezartzen dituzte ikaskuntza automatikoko ereduak eta, askotan, maila globalean lehiatzen diren taldeak osatzen dituzte.
  • Beste unibertsitate batzuek dagoeneko egin zuten prestakuntza hori, beraz, NSUko ikastaro bereziaren arrakasta espero nuen.

aireratzea

Novosibirsk-eko Akademgorodok-ek lur emankorra du horrelako ahaleginetarako: Informatika Zentroko ikasleak, lizentziatuak eta irakasleak eta fakultate tekniko sendoak, adibidez, FIT, MMF, FF, NSU administrazioaren laguntza sendoa, ODS komunitate aktiboa, esperientziadun ingeniariak. eta hainbat informatikako enpresatako analistak. Garai berean, beken programaren berri izan genuen Botan Inbertsioak β€” fondoak ML kirol lehiaketetan emaitza onak erakusten dituzten taldeei laguntzen die.

NSUn asteko bileretarako entzule bat aurkitu genuen, Telegramen txat bat sortu genuen eta urriaren 1ean jarri genuen martxan CS zentroko ikasle eta graduatuekin batera. 19 lagun hurbildu ziren lehen ikasgaira. Horietatik sei ohiko partaide bihurtu ziren prestakuntzan. Guztira, 31 pertsona hurbildu ziren bilerara gutxienez behin ikasturtean.

Lehen emaitzak

Mutilak eta biok elkartu, esperientziak trukatu, lehiaketei buruz eztabaidatu eta etorkizunerako plan labur bat egin genuen. Azkar konturatu ginen datuen analisiko lehiaketetan plazak lortzeko borroka erregularra eta neketsua dela, lanaldi osoko ordaindu gabeko lanaren antzekoa, baina oso interesgarria eta zirraragarria πŸ™‚ Parte-hartzaileetako batek, Kaggle-master Maxim, lehiaketetan lehenik eta behin aurrera egiteko gomendatu zigun. , eta aste batzuk beranduago taldeetan batu, puntuazio publikoa kontuan hartuta. Horixe egin genuen! Prestakuntza presentzialean, ereduak, artikulu zientifikoak eta Python liburutegien korapilatsuak eztabaidatu eta elkarrekin arazoak konpondu genituen.

Udazkeneko seihilekoan hiru zilarrezko domina izan ziren Kaggle-ko bi lehiaketetan: TGS Gatzaren Identifikazioa ΠΈ PLAsTiCC Sailkapen Astronomikoa. Eta hirugarren postu bat irabazitako lehen diruarekin akatsak zuzentzeko CFT lehiaketan (diruan, kegler esperientziadunek diotenez).

Ikastaro bereziaren zeharkako beste emaitza oso garrantzitsu bat NSU VKI klusterraren abiarazte eta konfigurazioa izan zen. Bere konputazio-ahalmenak gure bizitza lehiakorra nabarmen hobetu du: 40 CPU, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU.

Nola antolatu nuen ikaskuntza automatikoko prestakuntza NSUn

Aurretik, ahal genuen moduan bizirik irauten genuen: ordenagailu eramangarri eta mahaigain pertsonaletan kalkulatzen genuen, Google Colab-en eta Kaggle-kerneletan. Talde batek norberak idatzitako gidoi bat ere izan zuen, eredua automatikoki gorde eta denbora muga baten ondorioz gelditutako kalkulua berrabiarazi zuen.

Udaberriko seihilekoan, elkartzen jarraitu genuen, aurkikuntza arrakastatsuak trukatzen eta lehiaketaren irtenbideei buruz hitz egiten. Interesa duten partaide berriak etortzen hasi ziren gurera. Udaberriko seihilekoan, Kaggleko zortzi lehiaketetan urre bat, hiru zilar eta bederatzi brontzez hartzea lortu genuen: PetFinder, Santander, Generoaren ebazpena, Baleen identifikazioa, Quora, Google mugarriak eta beste batzuk, brontzea Recco erronka, hirugarren postua Changellenge>>Kopa eta lehen postua (berriz ere diruan) machine learning lehiaketan programazio txapelketa Yandex-etik.

Prestakuntzako partaideek diotena

Mikhail Karchevsky
β€œOso pozik nago horrelako jarduerak hemen Siberian egiten direlako, lehiaketetan parte hartzea dela uste baitut ML menperatzeko modurik azkarrena. Horrelako lehiaketetarako, hardwarea nahiko garestia da zeure burua erostea, baina hemen ideiak doan probatu ditzakezuΒ».

Kirill Brodt
β€œML prestakuntza iritsi baino lehen, ez nuen bereziki parte hartzen txapelketetan entrenamenduetan eta hindu lehiaketetan izan ezik: ez nion zentzurik ikusten, ML arloan lana banuen eta ezagutzen nuen. Lehen seihilekoan ikasle bezala joan nintzen. Eta bigarren seihilekotik hasita, informatika baliabideak eskuragarri egon bezain laster, zergatik ez parte hartu pentsatu nuen. Eta engantxatu egin nau. Zereginak, datuak eta neurketak zuretzat asmatu eta prestatu ziren, aurrera egin eta erabili MO-ren ahalmen osoa, egiaztatu punta-puntako ereduak eta teknikak. Prestakuntzagatik eta, bezain garrantzitsua dena, baliabide informatikoengatik ez balitz, ez nintzatekeen laster parte hartzen hasikoΒ».

Andrey Shevelev
β€œPertsonalki ML trebakuntzak ideia berdineko jendea aurkitzen lagundu zidan, eta haiekin ikaskuntza automatikoaren eta datuen analisiaren arloan nire ezagutzak sakondu ahal izan nituen. Aukera bikaina da, halaber, denbora libre handirik ez dutenentzat modu independentean aztertzeko eta lehiaketen gaian murgiltzeko, baina hala ere gaian egon nahi dutenentzatΒ».

Erregistratu gurekin

Kaggle eta beste plataformetako lehiaketek trebetasun praktikoak hobetzen dituzte eta datu-zientzien arloan lan interesgarri bihurtzen dira azkar. Lehiaketa zail batean elkarrekin parte hartu duten pertsonak askotan lankide bihurtzen dira eta laneko arazoak arrakastaz konpontzen jarraitzen dute. Guri ere gertatu zitzaigun: Mikhail Karchevsky, taldeko lagun batekin batera, enpresa berean gomendio sistema batean lan egitera joan zen.

Denborarekin, jarduera hau zabaltzeko asmoa dugu argitalpen zientifikoekin eta ikaskuntza automatikoko jardunaldietan parte hartzearekin. Etorri gurekin Novosibirskeko parte-hartzaile edo aditu gisa - idatzi me edo Kirill. Antolatu antzeko prestakuntza zure hiri eta unibertsitateetan.

Hona hemen iruzur orri txiki bat zure lehen urratsak ematen laguntzeko:

  1. Kontuan hartu ohiko klaseetarako leku eta ordu erosoa. Egokiena - astean 1-2 aldiz.
  2. Idatzi interesa izan dezaketen parte-hartzaileei lehen bilerari buruz. Lehenik eta behin, unibertsitate teknikoetako ikasleak dira, ODSko partaideak.
  3. Hasi txat bat aktualitateari buruz eztabaidatzeko: Telegram, VK, WhatsApp edo gehienentzat komeni den beste edozein mezulari.
  4. Mantendu publikoki irisgarria den ikasgai-plana, lehiaketen eta parte-hartzaileen zerrenda eta emaitzen jarraipena egitea.
  5. Bilatu doako konputazio ahalmena edo horretarako diru-laguntzak inguruko unibertsitateetan, ikerketa-institutuetan edo enpresetan.
  6. IRABAZIA!

Iturria: www.habr.com

Gehitu iruzkin berria