Come ho organizzato la formazione sul machine learning presso NSU

Mi chiamo Sasha e amo l'apprendimento automatico così come insegnare alle persone. Ora supervisiono i programmi educativi presso il Centro di informatica e dirigo il programma di laurea in analisi dei dati presso l'Università statale di San Pietroburgo. Prima di allora, ha lavorato come analista presso Yandex, e ancor prima come scienziato: era impegnato nella modellazione matematica presso l'Istituto di informatica della SB RAS.

In questo post voglio raccontarti cosa è nata dall'idea di lanciare una formazione sul machine learning per studenti, laureati dell'Università statale di Novosibirsk e tutti gli altri.

Come ho organizzato la formazione sul machine learning presso NSU

Desidero da tempo organizzare un corso speciale sulla preparazione alle gare di analisi dei dati su Kaggle e altre piattaforme. Sembrava un'ottima idea:

  • Gli studenti e chiunque sia interessato applicheranno le conoscenze teoriche nella pratica e acquisiranno esperienza nella risoluzione di problemi nei concorsi pubblici.
  • Gli studenti che si classificano ai primi posti in tali concorsi hanno un buon effetto sull'attrattiva della NSU per candidati, studenti e laureati. La stessa cosa accade con gli allenamenti di programmazione sportiva.
  • Questo corso speciale integra e amplia perfettamente le conoscenze fondamentali: i partecipanti implementano autonomamente modelli di machine learning e spesso formano team che competono a livello globale.
  • Altre università avevano già condotto tale formazione, quindi speravo nel successo del corso speciale alla NSU.

Запуск

L'Akademgorodok di Novosibirsk dispone di un terreno molto fertile per tali iniziative: studenti, laureati e insegnanti del Centro di informatica e forti facoltà tecniche, ad esempio FIT, MMF, FF, un forte sostegno dell'amministrazione NSU, una comunità ODS attiva, ingegneri esperti e analisti di varie società IT. Più o meno nello stesso periodo siamo venuti a conoscenza del programma di sovvenzioni da Investimenti botanici — il fondo sostiene le squadre che ottengono buoni risultati nelle competizioni sportive di ML.

Abbiamo trovato un pubblico alla NSU per riunioni settimanali, creato una chat su Telegram e lanciato il 1 ottobre insieme a studenti e laureati del centro CS. Alla prima lezione sono venute 19 persone. Sei di loro sono diventati partecipanti regolari alla formazione. In totale sono intervenute all'incontro almeno una volta nel corso dell'anno accademico 31 persone.

Primi risultati

Io e i ragazzi ci siamo incontrati, abbiamo scambiato esperienze, discusso di gare e di un piano approssimativo per il futuro. Ben presto ci siamo resi conto che lottare per un posto nelle competizioni di analisi dei dati è un lavoro regolare ed estenuante, simile al lavoro a tempo pieno non retribuito, ma molto interessante ed emozionante 🙂 Uno dei partecipanti, Kaggle-master Maxim, ci ha consigliato di avanzare prima nelle competizioni individualmente , e solo poche settimane dopo si uniscono in squadre, tenendo conto del punteggio pubblico. Questo è quello che abbiamo fatto! Durante la formazione frontale, abbiamo discusso modelli, articoli scientifici e le complessità delle librerie Python e risolto insieme i problemi.

I risultati del semestre autunnale furono tre medaglie d'argento in due competizioni su Kaggle: Identificazione del sale TGS и Classificazione astronomica PLAsTiCC. E un terzo posto nel concorso CFT per la correzione di errori di battitura con il primo denaro vinto (in the money, come dicono gli esperti kegler).

Un altro risultato indiretto molto importante del corso speciale è stato il lancio e la configurazione del cluster NSU VKI. La sua potenza di calcolo ha migliorato significativamente la nostra vita competitiva: 40 CPU, 755Gb di RAM, 8 GPU NVIDIA Tesla V100.

Come ho organizzato la formazione sul machine learning presso NSU

Prima di ciò, sopravvivevamo come meglio potevamo: calcolavamo su laptop e desktop personali, in Google Colab e nei kernel Kaggle. Un team disponeva addirittura di uno script autoprodotto che salvava automaticamente il modello e riavviava il calcolo interrotto a causa di un limite di tempo.

Nel semestre primaverile abbiamo continuato a riunirci, scambiare risultati di successo e parlare delle nostre soluzioni al concorso. Nuovi partecipanti interessati iniziarono a venire da noi. Durante il semestre primaverile, siamo riusciti a conquistare un oro, tre argenti e nove bronzi in otto competizioni su Kaggle: Trova animali domestici, Santander, Risoluzione di genere, Identificazione delle balene, quora, Punti di riferimento di Google e altri, bronzo Sfida di Recco, terzo posto nella Changellenge>>Cup e primo posto (di nuovo in the money) nella competizione di machine learning su campionato di programmazione da Yandex.

Cosa dicono i partecipanti alla formazione

Michail Karcevskij
“Sono molto contento che tali attività vengano svolte qui in Siberia, perché credo che la partecipazione alle competizioni sia il modo più veloce per padroneggiare il ML. Per tali competizioni, l’hardware è piuttosto costoso da acquistare da soli, ma qui puoi provare le idee gratuitamente”.

Kirill Brodt
“Prima dell'avvento dell'allenamento ML, non partecipavo particolarmente alle competizioni ad eccezione degli allenamenti e delle gare indù: non ne vedevo il punto, dato che lavoravo nel campo del ML e lo conoscevo. Il primo semestre l'ho frequentato da studentessa. E a partire dal secondo semestre, non appena le risorse informatiche saranno diventate disponibili, ho pensato, perché non partecipare. E mi ha conquistato. Il compito, i dati e le metriche sono stati inventati e preparati per te, vai avanti e utilizza tutta la potenza del MO, verifica i modelli e le tecniche all'avanguardia. Se non fosse stato per la formazione e, cosa altrettanto importante, per le risorse informatiche, non avrei iniziato a partecipare presto”.

Andrej Shevelev
"La formazione ML in presenza mi ha aiutato a trovare persone con i miei stessi interessi, con le quali ho potuto approfondire le mie conoscenze nel campo dell'apprendimento automatico e dell'analisi dei dati. Questa è anche un’ottima opzione per coloro che non hanno molto tempo libero per analizzare in modo indipendente e immergersi nell’argomento delle competizioni, ma vogliono comunque essere coinvolti nell’argomento.”

Unisciti a noi

I concorsi su Kaggle e altre piattaforme affinano le abilità pratiche e si trasformano rapidamente in lavori interessanti nel campo della scienza dei dati. Le persone che hanno preso parte insieme a una competizione difficile diventano spesso colleghi e continuano a risolvere con successo problemi legati al lavoro. Questo è successo anche a noi: Mikhail Karchevskij, insieme ad un amico del team, è andato a lavorare per la stessa azienda su un sistema di raccomandazione.

Con il tempo prevediamo di ampliare questa attività con pubblicazioni scientifiche e partecipazione a convegni sul machine learning. Unisciti a noi come partecipanti o esperti a Novosibirsk - scrivi me o Kirill. Organizzate corsi di formazione simili nelle vostre città e università.

Ecco un piccolo foglietto illustrativo per aiutarti a muovere i primi passi:

  1. Considera un luogo e un orario convenienti per le lezioni regolari. In modo ottimale - 1-2 volte a settimana.
  2. Scrivi ai partecipanti potenzialmente interessati riguardo al primo incontro. Prima di tutto, si tratta di studenti di università tecniche, partecipanti all'ODS.
  3. Avvia una chat per discutere di attualità: Telegram, VK, WhatsApp o qualsiasi altro messenger conveniente per la maggior parte.
  4. Mantenere un programma di lezioni accessibile al pubblico, un elenco di concorsi e partecipanti e monitorare i risultati.
  5. Trova potenza di calcolo gratuita o sovvenzioni per essa nelle università, istituti di ricerca o aziende vicine.
  6. UTILE!

Fonte: www.habr.com

Aggiungi un commento