Kaip organizavau mašininio mokymosi mokymus NSU

Mano vardas Sasha ir man patinka mašininis mokymasis bei žmonių mokymas. Dabar kuruoju švietimo programas Kompiuterių mokslų centre ir vadovauju duomenų analizės bakalauro studijoms Sankt Peterburgo valstybiniame universitete. Prieš tai jis dirbo „Yandex“ analitiku, o dar anksčiau – mokslininku: SB RAS Kompiuterių mokslų institute užsiėmė matematiniu modeliavimu.

Šiame įraše noriu papasakoti, kas kilo iš idėjos pradėti mašininio mokymosi mokymus studentams, Novosibirsko valstybinio universiteto absolventams ir visiems kitiems.

Kaip organizavau mašininio mokymosi mokymus NSU

Jau seniai norėjau surengti specialų kursą apie pasiruošimą duomenų analizės konkursams Kaggle ir kitose platformose. Tai atrodė puiki idėja:

  • Studentai ir visi norintys teorines žinias pritaikys praktikoje, įgis patirties sprendžiant problemas viešuose konkursuose.
  • Studentai, kurie tokiuose konkursuose užima aukščiausią vietą, turi gerą poveikį NSU patrauklumui stojantiesiems, studentams ir absolventams. Tas pats vyksta ir su sporto programavimo treniruotėmis.
  • Šis specialus kursas puikiai papildo ir praplečia pagrindines žinias: dalyviai savarankiškai diegia mašininio mokymosi modelius ir dažnai formuoja komandas, kurios konkuruoja pasauliniu lygiu.
  • Kiti universitetai jau buvo vedę tokius mokymus, todėl tikėjausi specialaus kurso NSU sėkmės.

Paleidimas

Novosibirsko Akademgorodokas tokioms pastangoms turi labai palankią dirvą: Kompiuterių mokslų centro studentai, absolventai ir dėstytojai bei stiprūs techniniai fakultetai, pavyzdžiui, FIT, MMF, FF, stipri NSU administracijos parama, aktyvi ODS bendruomenė, patyrę inžinieriai. ir analitikai iš įvairių IT įmonių. Maždaug tuo pačiu metu sužinojome apie dotacijų programą Investicijos į botaną — fondas remia ML sporto varžybose gerus rezultatus demonstruojančias komandas.

NSU radome auditoriją savaitiniams susitikimams, sukūrėme pokalbį „Telegram“ ir pradėjome spalio 1 d. kartu su CS centro studentais ir absolventais. Į pirmąją pamoką atėjo 19 žmonių. Šeši iš jų tapo nuolatiniais mokymų dalyviais. Iš viso bent kartą per mokslo metus į susirinkimą atvyko 31 žmogus.

Pirmieji rezultatai

Su vaikinais susitikome, keitėmės patirtimi, aptarėme konkursus ir apytikslį ateities planą. Gana greitai supratome, kad kova dėl vietų duomenų analizės konkursuose yra įprastas, alinantis darbas, panašus į neapmokamą etatinį darbą, tačiau labai įdomus ir jaudinantis 🙂 Vienas iš dalyvių, Kaggle-master Maxim, patarė iš pradžių žengti į priekį individualiai varžybose , ir tik po kelių savaičių susijungti į komandas, atsižvelgiant į viešą rezultatą. Štai ką mes padarėme! Mokymų akis į akį metu aptarėme modelius, mokslinius straipsnius, Python bibliotekų subtilybes, kartu sprendėme problemas.

Rudens semestro rezultatai buvo trys sidabro medaliai dviejose Kaggle varžybose: TGS druskos identifikavimas и PLAsTiCC astronominė klasifikacija. Ir viena trečia vieta CFT konkurse už rašybos klaidų taisymą su pirmaisiais laimėtais pinigais (pinigais, kaip sako patyrę keglininkai).

Kitas labai svarbus netiesioginis specialaus kurso rezultatas buvo NSU VKI klasterio paleidimas ir konfigūravimas. Jo skaičiavimo galia žymiai pagerino mūsų konkurencinį gyvenimą: 40 procesorių, 755 Gb RAM, 8 NVIDIA Tesla V100 GPU.

Kaip organizavau mašininio mokymosi mokymus NSU

Prieš tai išgyvenome kaip galėjome: skaičiavome asmeniniuose nešiojamuosiuose ir staliniuose kompiuteriuose, Google Colab ir Kaggle branduoliuose. Viena komanda netgi turėjo pačios parašytą scenarijų, kuris automatiškai išsaugojo modelį ir iš naujo pradėjo skaičiavimą, kuris buvo sustabdytas dėl laiko limito.

Pavasario semestrą toliau būrėmės, keitėmės sėkmingomis išvadomis ir kalbėjomės apie savo sprendimus konkursui. Pas mus pradėjo lankytis nauji susidomėję dalyviai. Per pavasario semestrą Kaggle aštuoniuose konkursuose pavyko iškovoti vieną auksą, tris sidabro ir devynias bronzas: PetFinder, Santanderas, Lyčių raiška, Banginio identifikavimas, Quora, Google orientyrai ir kiti, bronzos in Recco iššūkis, trečioji vieta Changellenge>>Taurėje ir pirmoji vieta (vėl pinigais) mašininio mokymosi varžybose programavimo čempionatas iš „Yandex.

Ką sako mokymų dalyviai

Michailas Karčevskis
„Labai džiaugiuosi, kad tokia veikla vykdoma čia, Sibire, nes manau, kad dalyvavimas varžybose yra greičiausias būdas įvaldyti ML. Tokiems konkursams aparatūrą gana brangu įsigyti patiems, bet čia galima išbandyti idėjas nemokamai.“

Kirilas Brodtas
„Prieš atsirandant ML treniruotėms, varžybose ypač nedalyvavau, išskyrus treniruotes ir induistų varžybas: nemačiau tame prasmės, nes dirbau ML srityje ir buvau su ja susipažinęs. Pirmąjį semestrą lankiau kaip studentė. Ir nuo antrojo semestro, kai tik atsirado skaičiavimo resursai, pagalvojau, kodėl gi nedalyvauti. Ir tai mane užkabino. Užduotis, duomenys ir metrika buvo sugalvoti ir paruošti jums, pirmyn ir išnaudokite visas MO galias, patikrinkite naujausius modelius ir metodus. Jei ne mokymai ir, kas taip pat svarbu, kompiuteriniai ištekliai, greitai nebūčiau pradėjęs dalyvauti.

Andrejus Ševelevas
„Asmeniniai ML mokymai padėjo susirasti bendraminčių, su kuriais galėjau pagilinti žinias mašininio mokymosi ir duomenų analizės srityje. Tai taip pat puikus pasirinkimas tiems, kurie neturi daug laisvo laiko savarankiškai analizuoti ir pasinerti į konkursų temą, bet vis tiek nori būti temoje.

Prisijunk prie mūsų

Konkursai Kaggle ir kitose platformose tobulina praktinius įgūdžius ir greitai virsta įdomiu darbu duomenų mokslo srityje. Kartu nelengvame konkurse dalyvavę žmonės dažnai tampa kolegomis ir toliau sėkmingai sprendžia su darbu susijusias problemas. Taip nutiko ir mums: Michailas Karčevskis kartu su draugu iš komandos išvyko dirbti į tą pačią įmonę pagal rekomendacijų sistemą.

Laikui bėgant šią veiklą planuojame plėsti mokslinėmis publikacijomis ir dalyvavimu mašininio mokymosi konferencijose. Prisijunkite prie mūsų kaip dalyviai ar ekspertai Novosibirske – rašykite mane arba Kirilas. Organizuokite panašius mokymus savo miestuose ir universitetuose.

Štai nedidelis apgaulės lapas, padėsiantis žengti pirmuosius žingsnius:

  1. Apsvarstykite patogią vietą ir laiką reguliariems užsiėmimams. Optimaliai – 1-2 kartus per savaitę.
  2. Parašykite potencialiems suinteresuotiems dalyviams apie pirmąjį susitikimą. Visų pirma, tai technikos universitetų studentai, ODS dalyviai.
  3. Pradėkite pokalbį ir aptarkite aktualijas: „Telegram“, „VK“, „WhatsApp“ ar bet kurį kitą daugeliui patogų pasiuntinį.
  4. Tvarkykite viešai prieinamą pamokų planą, konkursų ir dalyvių sąrašą, stebėkite rezultatus.
  5. Raskite nemokamos skaičiavimo galios arba subsidijų šalia esančiuose universitetuose, tyrimų institutuose ar įmonėse.
  6. Pelnas!

Šaltinis: www.habr.com

Добавить комментарий