Bagaimana saya menyelenggarakan pelatihan pembelajaran mesin di NSU

Nama saya Sasha dan saya menyukai pembelajaran mesin serta mengajar orang. Sekarang saya mengawasi program pendidikan di Pusat Ilmu Komputer dan mengarahkan program sarjana analisis data di Universitas Negeri St. Petersburg. Sebelumnya, ia bekerja sebagai analis di Yandex, dan bahkan sebelumnya sebagai ilmuwan: ia terlibat dalam pemodelan matematika di Institut Ilmu Komputer SB RAS.

Dalam postingan kali ini saya ingin memberi tahu Anda apa yang muncul dari ide meluncurkan pelatihan pembelajaran mesin untuk mahasiswa, lulusan Universitas Negeri Novosibirsk, dan semua orang.

Bagaimana saya menyelenggarakan pelatihan pembelajaran mesin di NSU

Saya sudah lama ingin mengadakan kursus khusus tentang persiapan kompetisi analisis data di Kaggle dan platform lainnya. Sepertinya ini ide yang bagus:

  • Siswa dan siapa pun yang tertarik akan menerapkan pengetahuan teoritis dalam praktik dan mendapatkan pengalaman dalam memecahkan masalah dalam kompetisi publik.
  • Mahasiswa yang menjadi juara dalam kompetisi tersebut berpengaruh baik terhadap daya tarik NSU bagi pelamar, pelajar dan lulusan. Hal yang sama terjadi dengan pelatihan pemrograman olahraga.
  • Kursus khusus ini melengkapi dan memperluas pengetahuan dasar dengan sempurna: peserta secara mandiri menerapkan model pembelajaran mesin dan sering kali membentuk tim yang bersaing di tingkat global.
  • Perguruan tinggi lain sudah menyelenggarakan pelatihan serupa, jadi saya berharap suksesnya kursus khusus di NSU.

Luncurkan

Akademgorodok Novosibirsk memiliki lahan yang sangat subur untuk upaya tersebut: mahasiswa, lulusan dan guru Pusat Ilmu Komputer dan fakultas teknik yang kuat, misalnya FIT, MMF, FF, dukungan kuat dari administrasi NSU, komunitas ODS yang aktif, insinyur berpengalaman dan analis dari berbagai perusahaan IT. Sekitar waktu yang sama, kami belajar tentang program hibah dari Investasi Botani β€” dana tersebut mendukung tim yang menunjukkan hasil bagus dalam kompetisi olahraga ML.

Kami menemukan audiens di NSU untuk pertemuan mingguan, membuat obrolan di Telegram, dan meluncurkannya pada tanggal 1 Oktober bersama dengan mahasiswa dan lulusan pusat CS. 19 orang datang ke pelajaran pertama. Enam di antaranya menjadi peserta tetap pelatihan. Secara total, 31 orang datang ke pertemuan tersebut setidaknya satu kali selama tahun ajaran.

Hasil pertama

Saya dan teman-teman bertemu, bertukar pengalaman, mendiskusikan kompetisi dan rencana kasar untuk masa depan. Kami segera menyadari bahwa memperebutkan tempat dalam kompetisi analisis data adalah pekerjaan biasa dan melelahkan, mirip dengan pekerjaan penuh waktu yang tidak dibayar, tetapi sangat menarik dan mengasyikkan πŸ™‚ Salah satu peserta, Kaggle-master Maxim, menyarankan kami untuk terlebih dahulu maju dalam kompetisi secara individu , dan hanya beberapa minggu kemudian bersatu menjadi beberapa tim, dengan mempertimbangkan skor publik. Itulah yang kami lakukan! Selama pelatihan tatap muka, kami mendiskusikan model, artikel ilmiah, dan seluk-beluk perpustakaan Python, dan memecahkan masalah bersama.

Hasil semester musim gugur adalah tiga medali perak dalam dua kompetisi di Kaggle: Identifikasi Garam TGS ΠΈ Klasifikasi Astronomi PLAsTiCC. Dan tempat ketiga dalam kompetisi CFT untuk mengoreksi kesalahan ketik dengan memenangkan uang pertama (dalam bentuk uang, seperti yang dikatakan keglers berpengalaman).

Hasil tidak langsung lain yang sangat penting dari kursus khusus ini adalah peluncuran dan konfigurasi cluster NSU VKI. Kekuatan komputasinya telah meningkatkan kehidupan kompetitif kami secara signifikan: 40 CPU, RAM 755Gb, 8 GPU NVIDIA Tesla V100.

Bagaimana saya menyelenggarakan pelatihan pembelajaran mesin di NSU

Sebelumnya, kami bertahan sebaik mungkin: kami menghitung di laptop dan desktop pribadi, di Google Colab, dan di kernel Kaggle. Satu tim bahkan memiliki skrip yang ditulis sendiri yang secara otomatis menyimpan model dan memulai kembali penghitungan yang terhenti karena batas waktu.

Pada semester musim semi, kami terus berkumpul, bertukar temuan sukses dan membicarakan solusi kami terhadap kompetisi. Peserta baru yang berminat mulai berdatangan kepada kami. Selama semester musim semi, kami berhasil meraih satu emas, tiga perak, dan sembilan perunggu dalam delapan kompetisi di Kaggle: Pencari Hewan Peliharaan, Santander, Resolusi gender, Identifikasi Paus, Quora, Google Tengara dan lainnya, masuk perunggu Tantangan Recco, tempat ketiga di Changellenge>>Piala dan tempat pertama (sekali lagi dalam bentuk uang) dalam kompetisi pembelajaran mesin di kejuaraan pemrograman dari Yandex.

Apa yang dikatakan peserta pelatihan

Mikhail Karchevsky
β€œSaya sangat senang kegiatan seperti ini diadakan di sini di Siberia, karena saya yakin mengikuti kompetisi adalah cara tercepat untuk menguasai ML. Untuk kompetisi seperti itu, perangkat kerasnya cukup mahal untuk dibeli sendiri, tetapi di sini Anda dapat mencoba ide secara gratis.”

Kirill Brodt
β€œSebelum munculnya pelatihan ML, saya tidak terlalu mengikuti kompetisi kecuali pelatihan dan kompetisi Hindu: Saya tidak mengerti maksudnya, karena saya punya pekerjaan di bidang ML, dan saya sudah familiar dengan itu. Semester pertama yang saya ikuti sebagai mahasiswa. Dan mulai semester kedua, begitu sumber daya komputasi tersedia, saya berpikir, kenapa tidak ikut. Dan itu membuat saya ketagihan. Tugas, data, dan metrik diciptakan dan disiapkan untuk Anda, lanjutkan dan gunakan kekuatan penuh MO, periksa model dan teknik tercanggih. Jika bukan karena pelatihan dan, yang juga penting, sumber daya komputasi, saya tidak akan segera berpartisipasi.”

Andrey Shevelev
β€œPelatihan ML tatap muka membantu saya menemukan orang-orang yang berpikiran sama, yang dengannya saya dapat memperdalam pengetahuan saya di bidang pembelajaran mesin dan analisis data. Ini juga merupakan pilihan yang sangat baik bagi mereka yang tidak memiliki banyak waktu luang untuk menganalisis secara mandiri dan membenamkan diri dalam topik kompetisi, namun tetap ingin terlibat dalam topik tersebut.”

Bergabunglah dengan kami

Kompetisi di Kaggle dan platform lainnya mengasah keterampilan praktis dan dengan cepat diubah menjadi pekerjaan menarik di bidang ilmu data. Orang-orang yang pernah mengikuti kompetisi yang sulit bersama-sama sering kali menjadi rekan kerja dan terus berhasil memecahkan masalah terkait pekerjaan. Hal ini juga terjadi pada kami: Mikhail Karchevsky, bersama dengan seorang teman dari tim, bekerja di perusahaan yang sama dengan sistem rekomendasi.

Seiring waktu, kami berencana untuk memperluas kegiatan ini dengan publikasi ilmiah dan partisipasi dalam konferensi pembelajaran mesin. Bergabunglah dengan kami sebagai peserta atau pakar di Novosibirsk - tulis ΠΌΠ½Π΅ ΠΈΠ»ΠΈ Kirill. Selenggarakan pelatihan serupa di kota dan universitas Anda.

Berikut ini sedikit contekan untuk membantu Anda mengambil langkah pertama:

  1. Pertimbangkan tempat dan waktu yang nyaman untuk kelas reguler. Optimalnya - 1-2 kali seminggu.
  2. Tulislah kepada peserta yang berpotensi tertarik tentang pertemuan pertama. Pertama-tama, mereka adalah mahasiswa universitas teknik, peserta ODS.
  3. Mulai obrolan untuk mendiskusikan masalah terkini: Telegram, VK, WhatsApp, atau messenger lain yang nyaman bagi kebanyakan orang.
  4. Simpan rencana pelajaran yang dapat diakses publik, daftar kompetisi dan peserta, dan pantau hasilnya.
  5. Temukan daya komputasi gratis atau hibah di universitas, lembaga penelitian, atau perusahaan terdekat.
  6. LABA!

Sumber: www.habr.com

Tambah komentar