Hoe't ik training foar masine-learen organisearre by NSU

Myn namme is Sasha en ik hâld fan masine learen en ek learje minsken. No begelied ik edukative programma's by it Computer Science Center en rjochtsje ik it bachelorprogramma yn gegevensanalyse oan 'e St. Petersburg State University. Dêrfoar wurke er as analist by Yandex, en noch earder as wittenskipper: hy wie dwaande mei wiskundige modellewurk by it Ynstitút foar Computer Science fan de SB RAS.

Yn dizze post wol ik jo fertelle wat der kaam fan it idee om training foar masine-learen te starten foar studinten, ôfstudearden fan Novosibirsk State University en elkenien oars.

Hoe't ik training foar masine-learen organisearre by NSU

Ik woe al lang in spesjale kursus organisearje oer it tarieden fan kompetysjes foar gegevensanalyse op Kaggle en oare platfoarms. Dit like in geweldich idee:

  • Studinten en elkenien dy't ynteressearre binne, sille teoretyske kennis yn 'e praktyk tapasse en ûnderfining krije yn it oplossen fan problemen yn iepenbiere kompetysjes.
  • Studinten dy't yn sokke kompetysjes boppe-oan pleatse hawwe in goed effekt op de oantreklikheid fan NSU foar oanfregers, studinten en ôfstudearden. Itselde bart mei training foar sportprogrammearring.
  • Dizze spesjale kursus komplementeart en wreidet de fûnemintele kennis perfekt oan: dielnimmers ymplementearje selsstannich masine-learmodellen en foarmje faak teams dy't konkurrearje op wrâldwide nivo.
  • Oare universiteiten hiene sa'n oplieding al dien, dus ik hope op it sukses fan 'e spesjale kursus by NSU.

Te rinnen

De Akademgorodok fan Novosibirsk hat heul fruchtbere grûn foar sokke ynspanningen: studinten, ôfstudearden en leararen fan it Computer Science Center en sterke technyske fakulteiten, bygelyks FIT, MMF, FF, sterke stipe fan 'e NSU-administraasje, in aktive ODS-mienskip, betûfte yngenieurs en analisten fan ferskate IT bedriuwen. Om deselde tiid hawwe wy leard oer it subsydzjeprogramma fan Botan Investments - it fûns stipet teams dy't goede resultaten sjen litte yn ML-sportkompetysjes.

Wy fûnen in publyk by NSU foar wyklikse gearkomsten, makken in petear op Telegram, en lansearre op 1 oktober tegearre mei studinten en ôfstudearden fan it CS-sintrum. 19 minsken kamen nei de earste les. Seis fan harren waarden fêste dielnimmers oan training. Yn totaal kamen yn it akademysk jier op syn minst ien kear 31 minsken nei de gearkomste.

Earste resultaten

De jonges en ik troffen, wikselen ûnderfinings út, bepraten kompetysjes en in rûch plan foar de takomst. Hiel fluch realisearre wy dat it fjochtsjen foar plakken yn data-analyzekompetysjes regelmjittich, saai wurk is, fergelykber mei ûnbetelle fulltime wurk, mar tige nijsgjirrich en spannend 🙂 Ien fan 'e dielnimmers, Kaggle-master Maxim, advisearre ús om earst foarút te gean yn kompetysjes yndividueel , en mar in pear wiken letter ferienigje yn teams, rekken hâldend mei de publike skoare. Dat hawwe wy dien! Tidens face-to-face training, wy besprutsen modellen, wittenskiplike artikels, en de intricacies fan Python bibleteken, en oplost problemen tegearre.

De resultaten fan it hjerstsemester wiene trije sulveren medaljes yn twa kompetysjes op Kaggle: TGS Salt Identifikaasje и PLAsTiCC Astronomyske Klassifikaasje. En ien tredde plak yn 'e CFT-kompetysje foar it korrigearjen fan typfouten mei it earste jild dat wûn is (yn it jild, lykas betûfte keglers sizze).

In oar tige wichtich yndirekt resultaat fan 'e spesjale kursus wie de lansearring en konfiguraasje fan it NSU VKI-kluster. De kompjûterkrêft hat ús kompetitive libben signifikant ferbettere: 40 CPU's, 755Gb RAM, 8 NVIDIA Tesla V100 GPU's.

Hoe't ik training foar masine-learen organisearre by NSU

Dêrfoar hawwe wy it sa goed mooglik oerlibbe: wy rekkenen op persoanlike laptops en buroblêden, yn Google Colab en yn Kaggle-kernels. Ien team hie sels in selsskreaun skript dat it model automatysk bewarre en de berekkening opnij starte dy't troch in tiidlimyt stoppe wie.

Yn 'e maitiidssemester bleaunen wy sammelje, suksesfolle fynsten útwikselje en prate oer ús oplossingen foar de konkurrinsje. Nije ynteressearre dielnimmers begûnen by ús te kommen. Yn it maitiidssemester binne wy ​​der yn slagge om ien goud, trije sulver en njoggen brûnzen te nimmen yn acht kompetysjes op Kaggle: PetFinder, Santander, Gendered resolúsje, Whale Identifikaasje, Quora, Google Landmarks en oaren, brûns yn Recco útdaging, tredde plak yn Changellenge >> Cup en earste plak (opnij yn it jild) yn 'e masine-learkompetysje by programmearring kampioenskip fan Yandex.

Wat training dielnimmers sizze

Mikhail Karchevsky
“Ik bin hiel bliid dat sokke aktiviteiten hjir yn Sibearje útfierd wurde, want ik leau dat dielname oan kompetysjes de fluchste manier is om ML te behearskjen. Foar sokke kompetysjes is de hardware frij djoer om sels te keapjen, mar hjir kinne jo ideeën fergees besykje. ”

Kirill Brodt
"Foar de komst fan ML-oplieding die ik net bysûnder mei oan kompetysjes mei útsûndering fan training en hindoe-kompetysjes: ik seach it punt hjir net yn, om't ik wurk hie op it mêd fan ML, en ik wie bekend mei. It earste semester haw ik bywenne as studint. En fanôf it twadde semester, sa gau't der komputerboarnen beskikber wiene, tocht ik, wêrom net meidwaan. En it hat my ferwûne rekke. De taak, gegevens en metriken binne útfûn en foar jo taret, gean fierder en brûk de folsleine krêft fan MO, kontrolearje de modernste modellen en techniken. As it net wie foar de training en, like wichtich, de kompjûterboarnen, dan soe ik net gau begjinne mei meidwaan."

Andrey Shevelev
"In-person ML training holp my te finen lykas-minded, mei wa't ik koe ferdjipje myn kennis op it mêd fan masine learen en data analyze. Dit is ek in poerbêste opsje foar dyjingen dy't net folle frije tiid hawwe om selsstannich te analysearjen en harsels te ferdjipjen yn it ûnderwerp fan kompetysjes, mar dochs yn it ûnderwerp wolle wêze.

Kom by ûs

Kompetysjes op Kaggle en oare platfoarms hone praktyske feardichheden en gau omsette yn nijsgjirrich wurk op it mêd fan gegevens wittenskip. Minsken dy't tegearre meidien hawwe oan in drege kompetysje wurde faak kollega's en bliuwe wurkrelatearre problemen mei súkses oplosse. Dit barde ek mei ús: Mikhail Karchevsky, tegearre mei in freon fan it team, gie oan it wurk foar itselde bedriuw op in oanbefellingssysteem.

Yn 'e rin fan' e tiid binne wy ​​fan plan dizze aktiviteit út te wreidzjen mei wittenskiplike publikaasjes en dielname oan konferinsjes foar masine-learen. Doch mei ús as dielnimmers of saakkundigen yn Novosibirsk - skriuw me of Kirill. Organisearje ferlykbere training yn jo stêden en universiteiten.

Hjir is in lyts cheat sheet om jo te helpen jo earste stappen te nimmen:

  1. Beskôgje in handich plak en tiid foar reguliere lessen. Optimaal - 1-2 kear yn 'e wike.
  2. Skriuw nei mooglik ynteressearre dielnimmers oer de earste gearkomste. As earste binne dit studinten fan technyske universiteiten, ODS-dielnimmers.
  3. Begjin in petear om aktuele saken te besprekken: Telegram, VK, WhatsApp of elke oare messenger dy't handich is foar de measte.
  4. Hâld in iepenbier tagonklik lesplan, in list mei kompetysjes en dielnimmers, en kontrolearje de resultaten.
  5. Fyn fergese kompjûterkrêft as subsydzjes foar it yn tichtby universiteiten, ûndersyksynstituten of bedriuwen.
  6. WINST!

Boarne: www.habr.com

Add a comment