Πώς οργάνωσα την εκπαίδευση μηχανικής μάθησης στο NSU

Το όνομά μου είναι Σάσα και μου αρέσει η μηχανική μάθηση καθώς και η διδασκαλία των ανθρώπων. Τώρα επιβλέπω εκπαιδευτικά προγράμματα στο Κέντρο Επιστήμης Υπολογιστών και διευθύνω το πρόγραμμα πτυχίου στην ανάλυση δεδομένων στο Κρατικό Πανεπιστήμιο της Αγίας Πετρούπολης. Πριν από αυτό, εργάστηκε ως αναλυτής στην Yandex και ακόμη νωρίτερα ως επιστήμονας: ασχολήθηκε με τη μαθηματική μοντελοποίηση στο Ινστιτούτο Επιστήμης Υπολογιστών του SB RAS.

Σε αυτήν την ανάρτηση θέλω να σας πω τι προέκυψε από την ιδέα της έναρξης εκπαίδευσης μηχανικής εκμάθησης για φοιτητές, αποφοίτους του κρατικού πανεπιστημίου του Νοβοσιμπίρσκ και όλους τους άλλους.

Πώς οργάνωσα την εκπαίδευση μηχανικής μάθησης στο NSU

Ήθελα από καιρό να οργανώσω ένα ειδικό μάθημα για την προετοιμασία για διαγωνισμούς ανάλυσης δεδομένων στο Kaggle και σε άλλες πλατφόρμες. Αυτό φαινόταν σαν μια υπέροχη ιδέα:

  • Οι μαθητές και οποιοσδήποτε ενδιαφερόμενος θα εφαρμόσει τις θεωρητικές γνώσεις στην πράξη και θα αποκτήσει εμπειρία στην επίλυση προβλημάτων σε δημόσιους διαγωνισμούς.
  • Οι μαθητές που τοποθετούνται στην κορυφή σε τέτοιους διαγωνισμούς έχουν καλή επίδραση στην ελκυστικότητα του NSU για υποψήφιους, φοιτητές και αποφοίτους. Το ίδιο συμβαίνει και με την προπόνηση αθλητικού προγραμματισμού.
  • Αυτό το ειδικό μάθημα συμπληρώνει και επεκτείνει τέλεια τις θεμελιώδεις γνώσεις: οι συμμετέχοντες εφαρμόζουν ανεξάρτητα μοντέλα μηχανικής μάθησης και συχνά σχηματίζουν ομάδες που ανταγωνίζονται σε παγκόσμιο επίπεδο.
  • Άλλα πανεπιστήμια είχαν ήδη πραγματοποιήσει τέτοια εκπαίδευση, οπότε ήλπιζα στην επιτυχία του ειδικού μαθήματος στο NSU.

Запуск

Το Akademgorodok του Novosibirsk έχει πολύ γόνιμο έδαφος για τέτοιες προσπάθειες: φοιτητές, απόφοιτοι και δάσκαλοι του Computer Science Center και ισχυρές τεχνικές σχολές, για παράδειγμα, FIT, MMF, FF, ισχυρή υποστήριξη της διοίκησης NSU, μια ενεργή κοινότητα ODS, έμπειροι μηχανικοί και αναλυτές από διάφορες εταιρείες πληροφορικής. Περίπου την ίδια περίοδο, μάθαμε για το πρόγραμμα επιχορήγησης από Botan Investments — το ταμείο υποστηρίζει ομάδες που παρουσιάζουν καλά αποτελέσματα σε αθλητικούς αγώνες ML.

Βρήκαμε ένα κοινό στο NSU για εβδομαδιαίες συναντήσεις, δημιουργήσαμε μια συνομιλία στο Telegram και ξεκινήσαμε την 1η Οκτωβρίου μαζί με φοιτητές και αποφοίτους του κέντρου CS. Στο πρώτο μάθημα ήρθαν 19 άτομα. Έξι από αυτούς έγιναν τακτικοί συμμετέχοντες στην εκπαίδευση. Συνολικά, 31 άτομα προσήλθαν στη συνάντηση τουλάχιστον μία φορά κατά τη διάρκεια του ακαδημαϊκού έτους.

Πρώτα αποτελέσματα

Με τα παιδιά συναντηθήκαμε, ανταλλάξαμε εμπειρίες, συζητήσαμε για διαγωνισμούς και ένα πρόχειρο σχέδιο για το μέλλον. Πολύ γρήγορα καταλάβαμε ότι ο αγώνας για θέσεις σε διαγωνισμούς ανάλυσης δεδομένων είναι τακτική, εξαντλητική εργασία, παρόμοια με την απλήρωτη εργασία πλήρους απασχόλησης, αλλά πολύ ενδιαφέρουσα και συναρπαστική 🙂 Ένας από τους συμμετέχοντες, ο Kaggle-master Maxim, μας συμβούλεψε να προχωρήσουμε πρώτα σε διαγωνισμούς ατομικά , και μόνο λίγες εβδομάδες αργότερα ενωθείτε σε ομάδες, λαμβάνοντας υπόψη τη βαθμολογία του κοινού. Αυτό κάναμε! Κατά τη διάρκεια της εκπαίδευσης πρόσωπο με πρόσωπο, συζητήσαμε μοντέλα, επιστημονικά άρθρα και τις περιπλοκές των βιβλιοθηκών Python και λύσαμε προβλήματα μαζί.

Τα αποτελέσματα του φθινοπωρινού εξαμήνου ήταν τρία ασημένια μετάλλια σε δύο αγώνες στο Kaggle: Αναγνώριση αλατιού TGS и Αστρονομική Ταξινόμηση PLAsTiCC. Και μια τρίτη θέση στον διαγωνισμό CFT για διόρθωση τυπογραφικών σφαλμάτων με τα πρώτα χρήματα που κέρδισαν (στα χρήματα, όπως λένε οι έμπειροι keglers).

Ένα άλλο πολύ σημαντικό έμμεσο αποτέλεσμα του ειδικού μαθήματος ήταν η εκτόξευση και η διαμόρφωση του συμπλέγματος NSU VKI. Η υπολογιστική του ισχύς έχει βελτιώσει σημαντικά την ανταγωνιστική μας ζωή: 40 CPU, 755 Gb RAM, 8 GPU NVIDIA Tesla V100.

Πώς οργάνωσα την εκπαίδευση μηχανικής μάθησης στο NSU

Πριν από αυτό, επιβιώσαμε όσο καλύτερα μπορούσαμε: υπολογίζαμε σε προσωπικούς φορητούς υπολογιστές και επιτραπέζιους υπολογιστές, στο Google Colab και στους πυρήνες Kaggle. Μία ομάδα είχε ακόμη και ένα αυτογραφικό σενάριο που αποθήκευε αυτόματα το μοντέλο και επανεκκίνησε τον υπολογισμό που είχε σταματήσει λόγω χρονικού ορίου.

Το εαρινό εξάμηνο συνεχίσαμε να μαζευόμαστε, να ανταλλάσσουμε επιτυχημένα ευρήματα και να συζητάμε για τις λύσεις μας στον διαγωνισμό. Νέοι ενδιαφερόμενοι άρχισαν να έρχονται σε εμάς. Κατά το εαρινό εξάμηνο, καταφέραμε να πάρουμε ένα χρυσό, τρία ασημένια και εννέα χάλκινα σε οκτώ διαγωνισμούς στο Kaggle: PetFinder, Santander, Ανάλυση με βάση το φύλο, Αναγνώριση φάλαινας, Quora, Ορόσημα Google και άλλα, χάλκινο μέσα Πρόκληση Recco, τρίτη θέση στο Changellenge>>Κύπελλο και πρώτη θέση (πάλι στα χρήματα) στον διαγωνισμό μηχανικής μάθησης στο πρωτάθλημα προγραμματισμού από το Yandex.

Τι λένε οι συμμετέχοντες στην εκπαίδευση

Μιχαήλ Καρτσέφσκι
«Χαίρομαι πολύ που τέτοιες δραστηριότητες πραγματοποιούνται εδώ στη Σιβηρία, γιατί πιστεύω ότι η συμμετοχή σε διαγωνισμούς είναι ο πιο γρήγορος τρόπος για να μάθεις το ML. Για τέτοιους διαγωνισμούς, το υλικό είναι αρκετά ακριβό για να το αγοράσετε μόνοι σας, αλλά εδώ μπορείτε να δοκιμάσετε ιδέες δωρεάν."

Κίριλ Μπροντ
«Πριν από την έλευση της εκπαίδευσης ML, δεν συμμετείχα ιδιαίτερα σε διαγωνισμούς με εξαίρεση τους αγώνες προπόνησης και Ινδουιστές: δεν έβλεπα το νόημα σε αυτό, αφού είχα δουλειά στον τομέα του ML και το γνώριζα. Το πρώτο εξάμηνο παρακολούθησα ως φοιτητής. Και ξεκινώντας από το δεύτερο εξάμηνο, μόλις έγιναν διαθέσιμοι πόροι υπολογιστών, σκέφτηκα, γιατί να μην συμμετάσχω. Και με κόλλησε. Η εργασία, τα δεδομένα και οι μετρήσεις επινοήθηκαν και προετοιμάστηκαν για εσάς, προχωρήστε και χρησιμοποιήστε την πλήρη ισχύ του MO, ελέγξτε τα τελευταίας τεχνολογίας μοντέλα και τεχνικές. Αν δεν ήταν η εκπαίδευση και, εξίσου σημαντικό, οι υπολογιστικοί πόροι, δεν θα είχα ξεκινήσει να συμμετέχω σύντομα».

Andrey Shevelev
«Η προσωπική εκπαίδευση ML με βοήθησε να βρω ανθρώπους με το ίδιο σκεπτικό, με τους οποίους μπόρεσα να εμβαθύνω τις γνώσεις μου στον τομέα της μηχανικής μάθησης και της ανάλυσης δεδομένων. Αυτή είναι επίσης μια εξαιρετική επιλογή για όσους δεν έχουν πολύ ελεύθερο χρόνο για να αναλύσουν ανεξάρτητα και να βυθιστούν στο θέμα των διαγωνισμών, αλλά εξακολουθούν να θέλουν να είναι στο θέμα."

έλα μαζί μας

Οι διαγωνισμοί στο Kaggle και σε άλλες πλατφόρμες ακονίζουν τις πρακτικές δεξιότητες και μετατρέπονται γρήγορα σε ενδιαφέρουσες εργασίες στον τομέα της επιστήμης δεδομένων. Οι άνθρωποι που έχουν λάβει μέρος σε έναν δύσκολο διαγωνισμό μαζί συχνά γίνονται συνάδελφοι και συνεχίζουν να επιλύουν με επιτυχία προβλήματα που σχετίζονται με την εργασία. Αυτό συνέβη και σε εμάς: Ο Μιχαήλ Καρτσέφσκι, μαζί με έναν φίλο από την ομάδα, πήγαν να δουλέψουν στην ίδια εταιρεία με σύστημα συστάσεων.

Με την πάροδο του χρόνου, σχεδιάζουμε να επεκτείνουμε αυτή τη δραστηριότητα με επιστημονικές δημοσιεύσεις και συμμετοχή σε συνέδρια μηχανικής μάθησης. Ελάτε μαζί μας ως συμμετέχοντες ή ειδικοί στο Νοβοσιμπίρσκ - γράψτε μου ή Κύριλλος. Οργανώστε παρόμοια εκπαίδευση στις πόλεις και τα πανεπιστήμιά σας.

Ακολουθεί ένα μικρό φύλλο εξαπάτησης που θα σας βοηθήσει να κάνετε τα πρώτα σας βήματα:

  1. Εξετάστε ένα βολικό μέρος και ώρα για τακτικά μαθήματα. Βέλτιστα - 1-2 φορές την εβδομάδα.
  2. Γράψτε στους πιθανούς ενδιαφερόμενους συμμετέχοντες για την πρώτη συνάντηση. Πρώτα απ 'όλα, πρόκειται για φοιτητές τεχνικών πανεπιστημίων, συμμετέχοντες στο ODS.
  3. Ξεκινήστε μια συνομιλία για να συζητήσετε τρέχουσες υποθέσεις: Telegram, VK, WhatsApp ή οποιοδήποτε άλλο messenger είναι κατάλληλο για τους περισσότερους.
  4. Διατηρήστε ένα πρόγραμμα μαθημάτων προσβάσιμο στο κοινό, μια λίστα διαγωνισμών και συμμετεχόντων και παρακολουθήστε τα αποτελέσματα.
  5. Βρείτε δωρεάν υπολογιστική ισχύ ή επιχορηγήσεις σε κοντινά πανεπιστήμια, ερευνητικά ιδρύματα ή εταιρείες.
  6. ΚΕΡΔΟΣ!

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο