Cum am organizat cursuri de învățare automată la NSU

Numele meu este Sasha și îmi place învățarea automată, precum și să predau oamenii. Acum supervizez programe educaționale la Centrul de Informatică și conduc programul de licență în analiza datelor la Universitatea de Stat din Sankt Petersburg. Înainte de asta, a lucrat ca analist la Yandex și, chiar mai devreme, ca om de știință: a fost angajat în modelare matematică la Institutul de Științe Calculatoare al SB RAS.

În această postare vreau să vă spun ce a venit din ideea lansării de formare de învățare automată pentru studenți, absolvenți ai Universității de Stat din Novosibirsk și toți ceilalți.

Cum am organizat cursuri de învățare automată la NSU

Îmi doream de mult să organizez un curs special de pregătire pentru competiții de analiză a datelor pe Kaggle și alte platforme. Aceasta mi s-a părut o idee grozavă:

  • Studenții și oricine este interesat vor aplica cunoștințele teoretice în practică și vor dobândi experiență în rezolvarea problemelor în cadrul concursurilor publice.
  • Studenții care se plasează în top în astfel de competiții au un efect bun asupra atractivității NSU pentru solicitanți, studenți și absolvenți. Același lucru se întâmplă și cu antrenamentul de programare sportivă.
  • Acest curs special completează și extinde perfect cunoștințele fundamentale: participanții implementează în mod independent modele de învățare automată și formează adesea echipe care concurează la nivel global.
  • Alte universități desfășuraseră deja astfel de pregătire, așa că am sperat la succesul cursului special de la NSU.

lansa

Akademgorodok din Novosibirsk are un teren foarte fertil pentru astfel de eforturi: studenți, absolvenți și profesori ai Centrului de Informatică și facultăți tehnice puternice, de exemplu, FIT, MMF, FF, sprijin puternic al administrației NSU, o comunitate activă ODS, ingineri cu experiență și analiști de la diverse companii IT. Cam în același timp, am aflat despre programul de granturi de la Investiții botanice — fondul sprijină echipele care au rezultate bune în competițiile sportive ML.

Am găsit o audiență la NSU pentru întâlniri săptămânale, am creat un chat pe Telegram și ne-am lansat pe 1 octombrie împreună cu studenții și absolvenții centrului CS. La prima lecție au venit 19 persoane. Șase dintre ei au devenit participanți obișnuiți la formare. În total, 31 de persoane au venit la întâlnire cel puțin o dată pe parcursul anului universitar.

Primele rezultate

Băieții și cu mine ne-am întâlnit, am făcut schimb de experiențe, am discutat despre competiții și un plan brut pentru viitor. Destul de repede ne-am dat seama că lupta pentru locuri în competițiile de analiză a datelor este o muncă obișnuită, obositoare, asemănătoare cu munca cu normă întreagă neremunerată, dar foarte interesantă și incitantă 🙂 Unul dintre participanți, Kaggle-master Maxim, ne-a sfătuit să avansăm mai întâi în competiții individual , iar doar câteva săptămâni mai târziu se unesc în echipe, ținând cont de scorul public. Asta am făcut! În timpul instruirii față în față, am discutat despre modele, articole științifice și complexitățile bibliotecilor Python și am rezolvat probleme împreună.

Rezultatele semestrului de toamnă au fost trei medalii de argint în două competiții pe Kaggle: Identificarea sării TGS и Clasificarea Astronomică PLAsTiCC. Și un al treilea loc în competiția CFT pentru corectarea greșelilor de scriere cu primii bani câștigați (în bani, după cum spun keglerii experimentați).

Un alt rezultat indirect foarte important al cursului special a fost lansarea și configurarea clusterului NSU VKI. Puterea sa de calcul a îmbunătățit semnificativ viața noastră competitivă: 40 de procesoare, 755 Gb RAM, 8 GPU-uri NVIDIA Tesla V100.

Cum am organizat cursuri de învățare automată la NSU

Înainte de asta, am supraviețuit cât de bine am putut: am calculat pe laptopuri și desktop-uri personale, în Google Colab și în Kaggle-kernel-uri. O echipă a avut chiar și un scenariu auto-scris care a salvat automat modelul și a reluat calculul care s-a oprit din cauza unei limită de timp.

În semestrul de primăvară, am continuat să ne adunăm, să facem schimb de descoperiri de succes și să vorbim despre soluțiile noastre la concurență. Noi participanți interesați au început să vină la noi. În timpul semestrului de primăvară, am reușit să luăm un aur, trei argint și nouă bronz în opt competiții pe Kaggle: PetFinder, Santander, Rezoluție bazată pe gen, Identificarea balenei, Quora, Repere Google iar altele, bronz în Provocare Recco, locul trei în Changellenge>>Cup și locul întâi (din nou la bani) în competiția de învățare automată la campionatul de programare de la Yandex.

Ce spun participanții la antrenament

Mihail Karcevski
„Sunt foarte bucuros că astfel de activități se desfășoară aici, în Siberia, pentru că cred că participarea la competiții este cea mai rapidă modalitate de a stăpâni ML. Pentru astfel de competiții, hardware-ul este destul de scump de cumpărat, dar aici poți încerca idei gratuit.”

Kirill Brodt
„Înainte de apariția antrenamentului ML, nu participam în mod deosebit la competiții, cu excepția antrenamentelor și a competițiilor hinduse: nu vedeam rostul în asta, deoarece aveam de lucru în domeniul ML și eram familiarizat cu asta. Primul semestru l-am urmat ca student. Și începând din al doilea semestru, de îndată ce resursele de calcul au devenit disponibile, m-am gândit, de ce să nu particip. Și m-a cucerit. Sarcina, datele și valorile au fost inventate și pregătite pentru dvs., mergeți mai departe și utilizați întreaga putere a MO, verificați modelele și tehnicile de ultimă generație. Dacă nu ar fi fost instruirea și, la fel de important, resursele de calcul, nu aș fi început să particip curând.”

Andrei Shevelev
„Pregătirea personală de ML m-a ajutat să găsesc oameni cu gânduri similare, cu care am putut să-mi aprofundez cunoștințele în domeniul învățării automate și al analizei datelor. Aceasta este, de asemenea, o opțiune excelentă pentru cei care nu au mult timp liber pentru a analiza în mod independent și a se scufunda în tema competițiilor, dar totuși doresc să fie în subiect.”

alăturaţi-ne

Competițiile de pe Kaggle și alte platforme îmbunătățesc abilitățile practice și se transformă rapid în lucrări interesante în domeniul științei datelor. Oamenii care au participat împreună la o competiție dificilă devin adesea colegi și continuă să rezolve cu succes problemele legate de muncă. Acest lucru s-a întâmplat și nouă: Mikhail Karchevsky, împreună cu un prieten din echipă, a plecat să lucreze pentru aceeași companie pe un sistem de recomandare.

În timp, intenționăm să extindem această activitate cu publicații științifice și participarea la conferințe de învățare automată. Alăturați-vă nouă ca participanți sau experți în Novosibirsk - scrieți sau Kirill. Organizați cursuri similare în orașele și universitățile dvs.

Iată o mică foaie de cheat pentru a vă ajuta să faceți primii pași:

  1. Luați în considerare un loc și un timp convenabil pentru cursurile obișnuite. În mod optim - de 1-2 ori pe săptămână.
  2. Scrieți participanților potențial interesați despre prima întâlnire. În primul rând, aceștia sunt studenți ai universităților tehnice, participanți la ODS.
  3. Începeți un chat pentru a discuta despre probleme curente: Telegram, VK, WhatsApp sau orice alt messenger convenabil pentru majoritatea.
  4. Mențineți un plan de lecție accesibil publicului, o listă de competiții și participanți și monitorizați rezultatele.
  5. Găsiți putere de calcul gratuită sau granturi pentru aceasta în universități, institute de cercetare sau companii din apropiere.
  6. PROFIT!

Sursa: www.habr.com

Adauga un comentariu