Hoe ek masjienleer-opleiding by NSU georganiseer het

My naam is Sasha en ek hou van masjienleer sowel as om mense te onderrig. Nou hou ek toesig oor opvoedkundige programme by die Rekenaarwetenskapsentrum en rig ek die baccalaureusprogram in data-analise aan die St. Petersburg State University. Voor dit het hy as 'n ontleder by Yandex gewerk, en selfs vroeër as 'n wetenskaplike: hy was besig met wiskundige modellering by die Instituut vir Rekenaarwetenskap van die SB RAS.

In hierdie pos wil ek jou vertel wat gekom het van die idee om masjienleeropleiding vir studente, gegradueerdes van die Novosibirsk State University en almal anders te begin.

Hoe ek masjienleer-opleiding by NSU georganiseer het

Ek wou al lank 'n spesiale kursus oor voorbereiding vir data-ontledingskompetisies op Kaggle en ander platforms reël. Dit het na 'n goeie idee gelyk:

  • Studente en enigiemand wat belangstel, sal teoretiese kennis in die praktyk toepas en ondervinding opdoen in die oplossing van probleme in openbare kompetisies.
  • Studente wat bo in sulke kompetisies plaas, het 'n goeie uitwerking op die aantreklikheid van NSU vir aansoekers, studente en gegradueerdes. Dieselfde ding gebeur met sportprogrammeringsopleiding.
  • Hierdie spesiale kursus komplementeer en brei fundamentele kennis perfek uit: deelnemers implementeer onafhanklik masjienleermodelle en vorm dikwels spanne wat op wêreldvlak meeding.
  • Ander universiteite het reeds sulke opleiding gedoen, so ek het gehoop op die sukses van die spesiale kursus by NSU.

bekendstelling

Die Akademgorodok van Novosibirsk het baie vrugbare grond vir sulke pogings: studente, gegradueerdes en onderwysers van die Rekenaarwetenskapsentrum en sterk tegniese fakulteite, byvoorbeeld FIT, MMF, VF, sterk ondersteuning van die NSU-administrasie, 'n aktiewe ODS-gemeenskap, ervare ingenieurs en ontleders van verskeie IT-maatskappye. Ongeveer dieselfde tyd het ons van die toekenningsprogram van Botan Beleggings — die fonds ondersteun spanne wat goeie resultate in ML-sportkompetisies toon.

Ons het 'n gehoor by NSU gevind vir weeklikse vergaderings, 'n klets op Telegram geskep en op 1 Oktober saam met studente en gegradueerdes van die CS-sentrum begin. 19 mense het na die eerste les gekom. Ses van hulle het gereelde deelnemers aan opleiding geword. In totaal het 31 mense ten minste een keer gedurende die akademiese jaar na die vergadering gekom.

Eerste resultate

Ek en die ouens het ontmoet, ervarings uitgeruil, kompetisies bespreek en ’n rowwe plan vir die toekoms. Ons het taamlik vinnig besef dat om vir plekke in data-ontledingskompetisies te veg gereelde, uitmergelende werk is, soortgelyk aan onbetaalde voltydse werk, maar baie interessant en opwindend 🙂 Een van die deelnemers, Kaggle-meester Maxim, het ons aangeraai om eers individueel in kompetisies te vorder , en net 'n paar weke later verenig in spanne, met inagneming van die publieke telling. Dis wat ons gedoen het! Tydens opleiding van aangesig tot aangesig het ons modelle, wetenskaplike artikels en die ingewikkeldhede van Python-biblioteke bespreek en probleme saam opgelos.

Die uitslae van die herfssemester was drie silwermedaljes in twee kompetisies op Kaggle: TGS Sout Identifikasie и PLAsTiCC Astronomiese Klassifikasie. En een derde plek in die CFT-kompetisie vir die regstelling van tikfoute met die eerste geld wat gewen is (in die geld, soos ervare keglers sê).

Nog 'n baie belangrike indirekte resultaat van die spesiale kursus was die bekendstelling en konfigurasie van die NSU VKI-groepering. Sy rekenaarkrag het ons mededingende lewe aansienlik verbeter: 40 SVE's, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU's.

Hoe ek masjienleer-opleiding by NSU georganiseer het

Voor dit het ons so goed as moontlik oorleef: ons het op persoonlike skootrekenaars en rekenaars, in Google Colab en in Kaggle-kernels bereken. Een span het selfs 'n selfgeskrewe skrif gehad wat die model outomaties gestoor het en die berekening wat weens 'n tydsbeperking gestop het, weer begin het.

In die lente semester het ons voortgegaan om bymekaar te kom, suksesvolle bevindings uit te ruil en oor ons oplossings vir die kompetisie te praat. Nuwe belangstellende deelnemers het na ons begin kom. Gedurende die lente semester het ons daarin geslaag om een ​​goud, drie silwer en nege brons in agt kompetisies op Kaggle te neem: PetFinder, Santander, Geslagtelike besluit, Walvis identifikasie, Quora, Google Landmerke en ander, brons in Recco uitdaging, derde plek in Changellenge>>beker en eerste plek (weer in die geld) in die masjienleerkompetisie by programmeringskampioenskap van Yandex.

Wat opleiding deelnemers sê

Mikhail Karchevsky
“Ek is baie bly dat sulke aktiwiteite hier in Siberië uitgevoer word, want ek glo dat deelname aan kompetisies die vinnigste manier is om ML te bemeester. Vir sulke kompetisies is die hardeware redelik duur om self te koop, maar hier kan jy idees gratis probeer.”

Kirill Brodt
“Voor die koms van ML-opleiding het ek nie besonder aan kompetisies deelgeneem nie, behalwe vir opleiding en Hindoe-kompetisies: Ek het nie die nut hiervan raakgesien nie, aangesien ek werk in die veld van ML gehad het, en ek daarmee vertroud was. Die eerste semester het ek as student bygewoon. En vanaf die tweede semester, sodra rekenaarhulpbronne beskikbaar geword het, het ek gedink, hoekom nie deelneem nie. En dit het my vasgehaak. Die taak, data en statistieke is vir jou uitgevind en voorberei, gaan voort en gebruik die volle krag van MO, kyk na die nuutste modelle en tegnieke. As dit nie vir die opleiding en, net so belangrik, die rekenaarhulpbronne was nie, sou ek nie binnekort begin deelneem het nie.”

Andrey Shevelev
“In-persoonlike ML-opleiding het my gehelp om eendersdenkende mense te vind, saam met wie ek my kennis op die gebied van masjienleer en data-analise kon verdiep. Dit is ook 'n uitstekende opsie vir diegene wat nie veel vrye tyd het om onafhanklik te ontleed en hulself in die onderwerp van kompetisies te verdiep nie, maar steeds in die onderwerp wil wees."

sluit by ons aan

Kompetisies op Kaggle en ander platforms slyp praktiese vaardighede en verander vinnig in interessante werk in die veld van datawetenskap. Mense wat saam aan 'n moeilike kompetisie deelgeneem het, word dikwels kollegas en gaan voort om werkverwante probleme suksesvol op te los. Dit het ook met ons gebeur: Mikhail Karchevsky het saam met 'n vriend van die span vir dieselfde maatskappy op 'n aanbevelingstelsel gaan werk.

Met verloop van tyd beplan ons om hierdie aktiwiteit uit te brei met wetenskaplike publikasies en deelname aan masjienleerkonferensies. Sluit by ons aan as deelnemers of kundiges in Novosibirsk - skryf vir my of Kirill. Organiseer soortgelyke opleiding in jou stede en universiteite.

Hier is 'n klein cheat sheet om jou te help om jou eerste treë te neem:

  1. Oorweeg 'n gerieflike plek en tyd vir gereelde klasse. Optimaal - 1-2 keer per week.
  2. Skryf aan potensieel belangstellende deelnemers oor die eerste ontmoeting. Eerstens is dit studente van tegniese universiteite, ODS-deelnemers.
  3. Begin 'n klets om aktuele sake te bespreek: Telegram, VK, WhatsApp of enige ander boodskapper wat vir die meeste gerieflik is.
  4. Handhaaf 'n publiek toeganklike lesplan, 'n lys van kompetisies en deelnemers, en monitor die resultate.
  5. Vind gratis rekenaarkrag of toekennings daarvoor by nabygeleë universiteite, navorsingsinstellings of maatskappye.
  6. WINS!

Bron: www.habr.com

Voeg 'n opmerking