Kiel mi organizis maŝinlernan trejnadon ĉe NSU

Mi nomiĝas Sasha kaj mi amas maŝinlernadon kaj ankaŭ instrui homojn. Nun mi kontrolas edukajn programojn ĉe la Komputika Centro kaj direktas la bakalaŭron pri datuma analizo ĉe la Ŝtata Universitato de Sankt-Peterburgo. Antaŭ tio, li laboris kiel analizisto ĉe Yandex, kaj eĉ pli frue kiel sciencisto: li okupiĝis pri matematika modelado ĉe la Instituto pri Komputado de la SB RAS.

En ĉi tiu afiŝo mi volas diri al vi, kio venis el la ideo lanĉi trejnadon pri maŝinlernado por studentoj, diplomiĝintoj de Novosibirsk State University kaj ĉiuj aliaj.

Kiel mi organizis maŝinlernan trejnadon ĉe NSU

Mi delonge volas organizi specialan kurson pri preparado por konkursoj pri datuma analizo sur Kaggle kaj aliaj platformoj. Ĉi tio ŝajnis bonega ideo:

  • Studentoj kaj iu ajn interesita aplikos teoriajn sciojn en praktiko kaj akiros sperton pri solvado de problemoj en publikaj konkursoj.
  • Studentoj, kiuj lokiĝas ĉe la supro en tiaj konkursoj, havas bonan efikon sur la allogeco de NSU por kandidatoj, studentoj kaj diplomiĝintoj. La sama afero okazas kun sporta programa trejnado.
  • Ĉi tiu speciala kurso perfekte kompletigas kaj vastigas fundamentajn sciojn: partoprenantoj sendepende efektivigas maŝinlernajn modelojn kaj ofte formas teamojn kiuj konkuras sur la tutmonda nivelo.
  • Aliaj universitatoj jam faris tian trejnadon, do mi esperis la sukceson de la speciala kurso ĉe NSU.

Lanĉu

La Akademgorodok de Novosibirsk havas tre fekundan grundon por tiaj klopodoj: studentoj, diplomiĝintoj kaj instruistoj de la Komputika Centro kaj fortaj teknikaj fakultatoj, ekzemple, FIT, MMF, FF, forta subteno de la NSU-administrado, aktiva ODS-komunumo, spertaj inĝenieroj. kaj analizistoj de diversaj IT-kompanioj. Ĉirkaŭ la sama tempo, ni eksciis pri la subvencioprogramo de Botan Investments — la fonduso subtenas teamojn kiuj montras bonajn rezultojn en ML-sportaj konkursoj.

Ni trovis spektantaron ĉe NSU por semajnaj renkontiĝoj, kreis babilejon ĉe Telegramo, kaj lanĉis la 1-an de oktobro kune kun studentoj kaj diplomiĝintoj de la CS-centro. 19 homoj venis al la unua leciono. Ses el ili fariĝis regulaj partoprenantoj en trejnado. Entute 31 homoj venis al la kunveno almenaŭ unufoje dum la akademia jaro.

Unuaj rezultoj

La uloj kaj mi renkontis, interŝanĝis spertojn, diskutis konkursojn kaj malglatan planon por la estonteco. Sufiĉe rapide ni rimarkis, ke batali por lokoj en konkursoj pri datuma analizo estas regula, streĉa laboro, simila al senpaga plentempa laboro, sed tre interesa kaj ekscita 🙂 Unu el la partoprenantoj, Kaggle-majstro Maxim, konsilis al ni unue progresi en konkursoj individue. , kaj nur kelkajn semajnojn poste kuniĝas en teamojn, konsiderante la publikan poentaron. Tion ni faris! Dum vizaĝ-al-vizaĝa trejnado, ni diskutis modelojn, sciencajn artikolojn, kaj la komplikaĵojn de Python-bibliotekoj, kaj solvis problemojn kune.

La rezultoj de la aŭtunsemestro estis tri arĝentaj medaloj en du konkuradoj pri Kaggle: TGS Salo-Identigo и PLAsTiCC Astronomia Klasifiko. Kaj unu tria loko en la CFT-konkurado por korektado de tajperaroj per la unua mono gajnita (en la mono, kiel diras spertaj keglers).

Alia tre grava nerekta rezulto de la speciala kurso estis la lanĉo kaj agordo de la NSU VKI-areto. Ĝia komputika potenco signife plibonigis nian konkurencivan vivon: 40 CPUoj, 755Gb RAM, 8 GPU-oj NVIDIA Tesla V100.

Kiel mi organizis maŝinlernan trejnadon ĉe NSU

Antaŭ tio, ni pluvivis kiel eble plej bone: ni kalkulis sur personaj tekkomputiloj kaj labortabloj, en Google Colab kaj en Kaggle-kernoj. Unu teamo eĉ havis memskribitan skripton, kiu aŭtomate savis la modelon kaj rekomencis la kalkulon, kiu ĉesis pro tempolimo.

En la printempa semestro, ni daŭre kolektiĝis, interŝanĝis sukcesajn rezultojn kaj parolis pri niaj solvoj al la konkurado. Novaj interesataj partoprenantoj komencis veni al ni. Dum la printempa semestro, ni sukcesis preni unu oron, tri arĝentajn kaj naŭ bronzojn en ok konkursoj pri Kaggle: PetFinder, Santander, Seksa rezolucio, Baleno-Identigo, Kora, Google Landmarks kaj aliaj, bronzo en Recco-defio, tria loko en Changellenge>>Pokalo kaj unua loko (denove en la mono) en la maŝinlernada konkurso ĉe programa ĉampioneco de Yandex.

Kion diras trejnaj partoprenantoj

Miĥail Karĉevskij
"Mi tre ĝojas, ke tiaj agadoj estas aranĝitaj ĉi tie en Siberio, ĉar mi kredas, ke partopreno en konkursoj estas la plej rapida maniero por regi ML. Por tiaj konkursoj, la aparataro estas sufiĉe multekosta aĉeti vin mem, sed ĉi tie vi povas provi ideojn senpage."

Kirill Brodt
"Antaŭ la apero de ML-trejnado, mi ne precipe partoprenis konkursojn escepte de trejnado kaj hinduaj konkursoj: mi ne vidis la signifon en tio, ĉar mi havis laboron en la kampo de ML, kaj mi konis ĝin. La unuan semestron mi ĉeestis kiel studento. Kaj ekde la dua semestro, tuj kiam komputikaj rimedoj fariĝis disponeblaj, mi pensis, kial ne partopreni. Kaj ĝi kaptis min. La tasko, datumoj kaj metrikoj estis inventitaj kaj preparitaj por vi, daŭrigu kaj uzu la plenan potencon de MO, kontrolu la plej altnivelajn modelojn kaj teknikojn. Se ne estus la trejnado kaj, same grave, la komputikaj rimedoj, mi ne estus komencinta partopreni baldaŭ."

Andrej Ŝevelev
"Persona ML-trejnado helpis min trovi samideanojn, kun kiuj mi povis profundigi miajn sciojn en la kampo de maŝinlernado kaj analizo de datumoj. Ĉi tio ankaŭ estas bonega elekto por tiuj, kiuj ne havas multe da libera tempo por sendepende analizi kaj mergi sin en la temo de konkursoj, sed ankoraŭ volas esti en la temo."

aliĝu al ni

Konkursoj pri Kaggle kaj aliaj platformoj perfektigas praktikajn kapablojn kaj rapide konvertiĝas en interesan laboron en la kampo de datumscienco. Homoj, kiuj kune partoprenis malfacilan konkurson, ofte fariĝas kolegoj kaj daŭre sukcese solvas laborrilatajn problemojn. Ĉi tio okazis ankaŭ al ni: Miĥail Karĉevskij kune kun amiko de la teamo iris labori por la sama kompanio laŭ rekomendsistemo.

Kun la tempo, ni planas vastigi ĉi tiun agadon per sciencaj publikaĵoj kaj partopreno en maŝinlernado-konferencoj. Aliĝu al ni kiel partoprenantoj aŭ spertuloj en Novosibirsk - skribu miKirill. Organizu similan trejnadon en viaj urboj kaj universitatoj.

Jen malgranda trompfolio por helpi vin fari viajn unuajn paŝojn:

  1. Konsideru oportunan lokon kaj tempon por regulaj klasoj. Optimume - 1-2 fojojn semajne.
  2. Skribu al eble interesitaj partoprenantoj pri la unua renkontiĝo. Antaŭ ĉio, ĉi tiuj estas studentoj de teknikaj universitatoj, partoprenantoj de ODS.
  3. Komencu babiladon por diskuti aktualajn aferojn: Telegramo, VK, WhatsApp aŭ ajna alia mesaĝisto konvena por la plimulto.
  4. Konservu publike alireblan lecionplanon, liston de konkursoj kaj partoprenantoj, kaj monitoru la rezultojn.
  5. Trovu senpagan komputikan potencon aŭ subvenciojn por ĝi en proksimaj universitatoj, esplorinstitutoj aŭ kompanioj.
  6. PROFITO!

Fonto: www.habr.com

Aldoni komenton