Cara saya menganjurkan latihan pembelajaran mesin di NSU

Nama saya Sasha dan saya suka pembelajaran mesin serta mengajar orang. Kini saya menyelia program pendidikan di Pusat Sains Komputer dan mengarahkan ijazah sarjana muda dalam analisis data di St. Petersburg State University. Sebelum itu, dia bekerja sebagai penganalisis di Yandex, dan lebih awal sebagai saintis: dia terlibat dalam pemodelan matematik di Institut Sains Komputer SB RAS.

Dalam siaran ini saya ingin memberitahu anda apa yang terhasil daripada idea melancarkan latihan pembelajaran mesin untuk pelajar, graduan Universiti Negeri Novosibirsk dan orang lain.

Cara saya menganjurkan latihan pembelajaran mesin di NSU

Saya telah lama ingin menganjurkan kursus khas mengenai persediaan untuk pertandingan analisis data di Kaggle dan platform lain. Ini kelihatan seperti idea yang bagus:

  • Pelajar dan sesiapa sahaja yang berminat akan menggunakan pengetahuan teori dalam amalan dan mendapat pengalaman dalam menyelesaikan masalah dalam pertandingan awam.
  • Pelajar yang menduduki tempat teratas dalam pertandingan sebegini memberi kesan yang baik terhadap daya tarikan NSU untuk pemohon, pelajar dan graduan. Perkara yang sama berlaku dengan latihan pengaturcaraan sukan.
  • Kursus khas ini melengkapkan dan mengembangkan pengetahuan asas dengan sempurna: peserta melaksanakan model pembelajaran mesin secara bebas dan sering membentuk pasukan yang bersaing di peringkat global.
  • Universiti lain telah pun menjalankan latihan sebegitu, jadi saya mengharapkan kejayaan kursus khas di NSU.

Pelancaran

Akademgorodok Novosibirsk mempunyai tanah yang sangat subur untuk usaha sedemikian: pelajar, graduan dan guru Pusat Sains Komputer dan fakulti teknikal yang kuat, contohnya, FIT, MMF, FF, sokongan kuat pentadbiran NSU, komuniti ODS yang aktif, jurutera berpengalaman. dan penganalisis daripada pelbagai syarikat IT. Pada masa yang sama, kami belajar tentang program geran daripada Pelaburan Botan β€” dana menyokong pasukan yang menunjukkan keputusan yang baik dalam pertandingan sukan ML.

Kami menemui penonton di NSU untuk mesyuarat mingguan, mencipta sembang di Telegram dan dilancarkan pada 1 Oktober bersama pelajar dan graduan pusat CS. 19 orang datang ke pelajaran pertama. Enam daripada mereka menjadi peserta tetap dalam latihan. Secara keseluruhannya, 31 orang hadir ke mesyuarat sekurang-kurangnya sekali dalam tahun akademik.

Keputusan pertama

Saya dan lelaki bertemu, bertukar pengalaman, membincangkan pertandingan dan rancangan kasar untuk masa depan. Dengan cepat kami menyedari bahawa memperjuangkan tempat dalam pertandingan analisis data adalah kerja yang kerap, melelahkan, sama seperti kerja sepenuh masa tanpa gaji, tetapi sangat menarik dan mengujakan πŸ™‚ Salah seorang peserta, Kaggle-master Maxim, menasihatkan kami untuk terlebih dahulu maju dalam pertandingan secara individu , dan hanya beberapa minggu kemudian bersatu menjadi pasukan, dengan mengambil kira markah awam. Itulah yang kami lakukan! Semasa latihan bersemuka, kami membincangkan model, artikel saintifik, dan selok-belok perpustakaan Python, dan menyelesaikan masalah bersama-sama.

Keputusan semester musim gugur ialah tiga pingat perak dalam dua pertandingan di Kaggle: Pengenalan Garam TGS ΠΈ Klasifikasi Astronomi PLAsTiCC. Dan satu tempat ketiga dalam pertandingan CFT untuk membetulkan kesilapan dengan wang pertama yang dimenangi (dalam wang itu, seperti yang dikatakan oleh orang yang berpengalaman).

Satu lagi keputusan tidak langsung yang sangat penting dari kursus khas ialah pelancaran dan konfigurasi kelompok NSU VKI. Kuasa pengkomputerannya telah meningkatkan hayat daya saing kami dengan ketara: 40 CPU, 755Gb RAM, 8 NVIDIA Tesla V100 GPU.

Cara saya menganjurkan latihan pembelajaran mesin di NSU

Sebelum itu, kami bertahan sebaik mungkin: kami mengira pada komputer riba dan desktop peribadi, dalam Google Colab dan dalam Kaggle-kernels. Malah satu pasukan mempunyai skrip tulisan sendiri yang menyimpan model secara automatik dan memulakan semula pengiraan yang telah berhenti kerana had masa.

Pada semester musim bunga, kami terus berkumpul, bertukar-tukar penemuan yang berjaya dan bercakap tentang penyelesaian kami untuk pertandingan. Peserta baru yang berminat mula datang kepada kami. Semasa semester musim bunga, kami berjaya meraih satu emas, tiga perak dan sembilan gangsa dalam lapan pertandingan di Kaggle: PetFinder, Santander, Resolusi jantina, Pengenalan Paus, Quora, Google Landmarks dan lain-lain, gangsa masuk Cabaran Recco, tempat ketiga dalam Changellenge>>Piala dan tempat pertama (sekali lagi dalam wang) dalam pertandingan pembelajaran mesin di kejohanan pengaturcaraan daripada Yandex.

Apa yang dikatakan oleh peserta latihan

Mikhail Karchevsky
β€œSaya sangat gembira aktiviti sebegini dijalankan di sini di Siberia, kerana saya percaya penyertaan dalam pertandingan adalah cara terpantas untuk menguasai ML. Untuk pertandingan sebegini, perkakasan itu agak mahal untuk dibeli sendiri, tetapi di sini anda boleh mencuba idea secara percuma.”

Kirill Brodt
β€œSebelum kemunculan latihan ML, saya tidak mengambil bahagian dalam pertandingan dengan pengecualian latihan dan pertandingan Hindu: Saya tidak nampak maksudnya, kerana saya mempunyai kerja dalam bidang ML, dan saya sudah biasa dengannya. Semester pertama yang saya hadiri sebagai pelajar. Dan bermula dari semester kedua, sebaik sahaja sumber pengkomputeran tersedia, saya fikir, mengapa tidak menyertai. Dan ia membuatkan saya ketagih. Tugas, data dan metrik telah dicipta dan disediakan untuk anda, teruskan dan gunakan kuasa penuh MO, semak model dan teknik terkini. Jika bukan kerana latihan dan, sama pentingnya, sumber pengkomputeran, saya tidak akan mula mengambil bahagian tidak lama lagi."

Andrey Shevelev
β€œLatihan ML secara peribadi membantu saya mencari orang yang berfikiran sama, yang dengannya saya dapat memperdalam pengetahuan saya dalam bidang pembelajaran mesin dan analisis data. Ini juga merupakan pilihan yang sangat baik untuk mereka yang tidak mempunyai banyak masa lapang untuk menganalisis secara bebas dan melibatkan diri dalam topik pertandingan, tetapi masih mahu berada dalam topik itu."

sertai kami

Pertandingan di Kaggle dan platform lain mengasah kemahiran praktikal dan cepat bertukar menjadi kerja yang menarik dalam bidang sains data. Orang yang telah mengambil bahagian dalam pertandingan yang sukar bersama-sama sering menjadi rakan sekerja dan terus berjaya menyelesaikan masalah berkaitan kerja. Ini juga berlaku kepada kami: Mikhail Karchevsky, bersama rakan dari pasukan, pergi bekerja untuk syarikat yang sama pada sistem pengesyoran.

Dari masa ke masa, kami merancang untuk mengembangkan aktiviti ini dengan penerbitan saintifik dan penyertaan dalam persidangan pembelajaran mesin. Sertai kami sebagai peserta atau pakar di Novosibirsk - tulis saya atau Kirill. Atur latihan serupa di bandar dan universiti anda.

Berikut ialah helaian panduan kecil untuk membantu anda mengambil langkah pertama anda:

  1. Pertimbangkan tempat dan masa yang sesuai untuk kelas biasa. Secara optimum - 1-2 kali seminggu.
  2. Tulis kepada peserta yang berpotensi berminat tentang mesyuarat pertama. Pertama sekali, ini adalah pelajar universiti teknikal, peserta ODS.
  3. Mulakan sembang untuk membincangkan hal ehwal semasa: Telegram, VK, WhatsApp atau mana-mana messenger lain yang sesuai untuk kebanyakan orang.
  4. Kekalkan rancangan pengajaran yang boleh diakses secara umum, senarai pertandingan dan peserta, dan pantau keputusan.
  5. Dapatkan kuasa pengkomputeran percuma atau geran untuknya di universiti, institut penyelidikan atau syarikat berdekatan.
  6. KEUNTUNGAN!

Sumber: www.habr.com

Tambah komen