Από φυσικούς στην Επιστήμη Δεδομένων (Από τις μηχανές της επιστήμης στο πλαγκτόν γραφείου). Το τρίτο μέρος

Από φυσικούς στην Επιστήμη Δεδομένων (Από τις μηχανές της επιστήμης στο πλαγκτόν γραφείου). Το τρίτο μέρος

Αυτή η φωτογραφία είναι του Arthur Kuzin (n01z3), συνοψίζει με μεγάλη ακρίβεια το περιεχόμενο της ανάρτησης του ιστολογίου. Ως αποτέλεσμα, η ακόλουθη αφήγηση θα πρέπει να εκληφθεί περισσότερο σαν ιστορία της Παρασκευής παρά ως κάτι εξαιρετικά χρήσιμο και τεχνικό. Επιπλέον, αξίζει να σημειωθεί ότι το κείμενο είναι πλούσιο σε αγγλικές λέξεις. Δεν ξέρω πώς να μεταφράσω κάποια από αυτά σωστά και απλά δεν θέλω να μεταφράσω μερικά από αυτά.

Πρώτο μέρος.
Δεύτερο μέρος.

Το πώς έγινε η μετάβαση από το ακαδημαϊκό σε ένα βιομηχανικό περιβάλλον αποκαλύπτεται στα δύο πρώτα επεισόδια. Σε αυτό, η συζήτηση θα είναι για το τι συνέβη στη συνέχεια.

Ήταν Ιανουάριος του 2017. Τότε είχα λίγο περισσότερο από ένα χρόνο εργασιακή εμπειρία και δούλευα στο Σαν Φρανσίσκο στην εταιρεία TrueAccord όπως ο Sr. Επιστήμονας Δεδομένων.

Το TrueAccord είναι μια startup είσπραξης χρεών. Με απλά λόγια - ένα πρακτορείο συλλογής. Οι συλλέκτες συνήθως καλούν πολύ. Στείλαμε πολλά email, αλλά κάναμε λίγες κλήσεις. Κάθε email οδηγούσε στον ιστότοπο της εταιρείας, όπου στον οφειλέτη προσφέρθηκε έκπτωση επί του χρέους και μάλιστα επέτρεπε να πληρώσει σε δόσεις. Αυτή η προσέγγιση οδήγησε σε καλύτερη είσπραξη, επέτρεψε την κλιμάκωση και λιγότερη έκθεση σε αγωγές.

Η παρέα ήταν κανονική. Το προϊόν είναι σαφές. Η διοίκηση είναι λογική. Η τοποθεσία είναι καλή.

Κατά μέσο όρο, οι άνθρωποι στην κοιλάδα εργάζονται σε ένα μέρος για περίπου ενάμιση χρόνο. Δηλαδή, οποιαδήποτε εταιρεία στην οποία εργάζεσαι είναι απλώς ένα μικρό βήμα. Σε αυτό το βήμα θα συγκεντρώσετε κάποια χρήματα, θα αποκτήσετε νέες γνώσεις, δεξιότητες, συνδέσεις και γραμμές στο βιογραφικό σας. Μετά από αυτό υπάρχει μια μετάβαση στο επόμενο βήμα.

Στο ίδιο το TrueAccord, συμμετείχα στην επισύναψη συστημάτων συστάσεων σε ενημερωτικά δελτία ηλεκτρονικού ταχυδρομείου, καθώς και στην ιεράρχηση των τηλεφωνικών κλήσεων. Ο αντίκτυπος είναι κατανοητός και μετρήθηκε αρκετά καλά σε δολάρια μέσω δοκιμών A/B. Δεδομένου ότι δεν υπήρχε μηχανική μάθηση πριν από την άφιξή μου, ο αντίκτυπος της δουλειάς μου δεν ήταν κακός. Και πάλι, είναι πολύ πιο εύκολο να βελτιώσετε κάτι παρά κάτι που έχει ήδη βελτιστοποιηθεί σε μεγάλο βαθμό.

Μετά από έξι μήνες εργασίας σε αυτά τα συστήματα, αύξησαν ακόμη και τη βασική μου αμοιβή από 150 $ σε $163. Στην κοινότητα Ανοιχτή Επιστήμη Δεδομένων (ODS) υπάρχει ένα μιμίδιο περίπου $163. Μεγαλώνει με τα πόδια από εδώ.

Όλα αυτά ήταν υπέροχα, αλλά δεν οδήγησαν πουθενά, ή οδήγησαν, αλλά όχι εκεί.

Τρέφω μεγάλο σεβασμό για την TrueAccord, τόσο την εταιρεία όσο και τα παιδιά με τα οποία συνεργάστηκα εκεί. Έμαθα πολλά από αυτούς, αλλά δεν ήθελα να δουλέψω για μεγάλο χρονικό διάστημα σε συστήματα συστάσεων σε μια εταιρεία συλλογής. Από αυτό το βήμα έπρεπε να προχωρήσεις σε κάποια κατεύθυνση. Αν όχι προς τα εμπρός και προς τα πάνω, τότε τουλάχιστον προς τα πλάγια.

Τι δεν μου άρεσε;

  1. Από τη σκοπιά της μηχανικής μάθησης, τα προβλήματα δεν με ενθουσίασαν. Ήθελα κάτι μοδάτο, νεανικό, δηλαδή Deep Learning, Computer Vision, κάτι μάλλον κοντά στην επιστήμη ή τουλάχιστον στην αλχημεία.
  2. Μια startup, ακόμη και μια εταιρεία συλλογής, αντιμετωπίζει προβλήματα με την πρόσληψη υψηλά ειδικευμένου προσωπικού. Ως startup, δεν μπορεί να πληρώσει πολλά. Αλλά ως πρακτορείο εισπράξεων, χάνει σε θέση. Σε γενικές γραμμές, αν μια κοπέλα σε ένα ραντεβού ρωτήσει πού δουλεύεις; Η απάντησή σας: "Στο Google" ακούγεται καλύτερα από το "πρακτορείο συλλογής". Με ενόχλησε ελαφρώς το γεγονός ότι για τους φίλους μου που εργάζονται στην Google και στο Facebook, σε αντίθεση με εμένα, το όνομα της εταιρείας τους άνοιξε πόρτες όπως: μπορείς να προσκληθείς σε ένα συνέδριο ή συνάντηση ως ομιλητής, ή πιο ενδιαφέροντα άτομα να γράφουν στο LinkedIn με μια προσφορά να συναντηθούμε και να συνομιλήσουμε με ένα ποτήρι τσάι. Μου αρέσει πολύ να επικοινωνώ με ανθρώπους που δεν γνωρίζω προσωπικά. Αν λοιπόν ζείτε στο Σαν Φρανσίσκο, μη διστάσετε να γράψετε - πάμε για καφέ να μιλήσουμε.
  3. Εκτός από εμένα, τρεις Επιστήμονες Δεδομένων εργάστηκαν στην εταιρεία. Εργαζόμουν στη μηχανική εκμάθηση και εκείνοι δούλευαν σε άλλες εργασίες Επιστήμης Δεδομένων, οι οποίες είναι κοινές σε κάθε εκκίνηση από εδώ μέχρι αύριο. Ως αποτέλεσμα, δεν καταλάβαιναν πραγματικά τη μηχανική μάθηση. Αλλά για να μεγαλώσω, πρέπει να επικοινωνήσω με κάποιον, να συζητήσω άρθρα και τις τελευταίες εξελίξεις και να ζητήσω συμβουλές, στο τέλος.

Τι ήταν διαθέσιμο;

  1. Εκπαίδευση: φυσική, όχι επιστήμη των υπολογιστών.
  2. Η μόνη γλώσσα προγραμματισμού που ήξερα ήταν η Python. Υπήρχε η αίσθηση ότι έπρεπε να αλλάξω σε C++, αλλά και πάλι δεν μπορούσα να το προσεγγίσω.
  3. Ενάμιση χρόνο δουλειά στον κλάδο. Επιπλέον, στη δουλειά δεν σπούδασα ούτε Deep Learning ούτε Computer Vision.
  4. Ούτε ένα άρθρο για το Deep Learning / Computer Vision στο βιογραφικό.
  5. Υπήρχε ένα επίτευγμα Kaggle Master.

Τι ηθελες?

  1. Μια θέση όπου θα είναι απαραίτητο να εκπαιδεύσει πολλά δίκτυα, και πιο κοντά στην όραση υπολογιστή.
  2. Είναι καλύτερα αν πρόκειται για μια μεγάλη εταιρεία όπως η Google, η Tesla, το Facebook, η Uber, το LinkedIn κ.λπ. Αν και σε λίγο, μια startup θα έκανε.
  3. Δεν χρειάζεται να είμαι ο μεγαλύτερος ειδικός στη μηχανική μάθηση στην ομάδα. Υπήρχε μεγάλη ανάγκη για ανώτερους συντρόφους, μέντορες και κάθε είδους επικοινωνία, που υποτίθεται ότι θα επιτάχυνε τη μαθησιακή διαδικασία.
  4. Αφού διάβασα αναρτήσεις ιστολογίου σχετικά με το πώς οι απόφοιτοι χωρίς βιομηχανική εμπειρία έχουν συνολική αποζημίωση 300-500 $ ετησίως, ήθελα να πάω στο ίδιο εύρος. Δεν είναι ότι αυτό με ενοχλεί τόσο πολύ, αλλά επειδή λένε ότι αυτό είναι ένα συνηθισμένο φαινόμενο, αλλά έχω λιγότερα, τότε αυτό είναι ένα σήμα.

Το έργο φαινόταν εντελώς επιλύσιμο, αν και όχι με την έννοια ότι μπορείς να μπεις σε οποιαδήποτε εταιρεία, αλλά μάλλον ότι αν πεινάς, όλα θα πάνε καλά. Δηλαδή, δεκάδες ή εκατοντάδες προσπάθειες, και ο πόνος από κάθε αποτυχία και κάθε απόρριψη, θα πρέπει να χρησιμοποιηθούν για να οξυνθεί η εστίαση, να βελτιωθεί η μνήμη και να παραταθεί η ημέρα σε 36 ώρες.

Τροποποίησα το βιογραφικό μου, άρχισα να το στέλνω και να πηγαίνω για συνεντεύξεις. Πέταξα τα περισσότερα από αυτά στο στάδιο της επικοινωνίας με το HR. Πολλοί άνθρωποι χρειάζονταν C++, αλλά εγώ δεν το ήξερα και είχα την έντονη αίσθηση ότι δεν θα με ενδιέφεραν πολύ οι θέσεις που απαιτούσαν C++.

Αξίζει να σημειωθεί ότι περίπου την ίδια περίοδο υπήρξε μια μετάβαση φάσης στο είδος των αγώνων στο Kaggle. Πριν από το 2017 υπήρχαν πολλά δεδομένα σε πίνακα και πολύ σπάνια δεδομένα εικόνας, αλλά από το 2017 υπήρχαν πολλές εργασίες όρασης υπολογιστή.

Η ζωή κυλούσε με τον ακόλουθο τρόπο:

  1. Εργασία κατά τη διάρκεια της ημέρας.
  2. Όταν η οθόνη τεχνολογίας / επιτόπου παίρνετε άδεια.
  3. Βραδιές και Σαββατοκύριακα Kaggle + άρθρα / βιβλία / αναρτήσεις ιστολογίου

Το τέλος του 2016 σημαδεύτηκε από το γεγονός ότι μπήκα στην κοινότητα Ανοιχτή Επιστήμη Δεδομένων (ODS), που απλοποίησε πολλά πράγματα. Υπάρχουν πολλοί τύποι στην κοινότητα με πλούσια βιομηχανική εμπειρία, κάτι που μας επέτρεψε να κάνουμε πολλές ανόητες ερωτήσεις και να λάβουμε πολλές έξυπνες απαντήσεις. Υπάρχουν επίσης πολλοί πολύ ισχυροί ειδικοί μηχανικής εκμάθησης όλων των γραμμών, οι οποίοι, απροσδόκητα, μου επέτρεψαν, μέσω ODS, να κλείσω το θέμα με τακτική σε βάθος επικοινωνία σχετικά με την Επιστήμη των Δεδομένων. Μέχρι τώρα, όσον αφορά το ML, το ODS μου δίνει πολλές φορές περισσότερα από όσα παίρνω στη δουλειά.

Λοιπόν, ως συνήθως, η ODS έχει αρκετούς ειδικούς σε διαγωνισμούς στο Kaggle και σε άλλους ιστότοπους. Η επίλυση προβλημάτων σε μια ομάδα είναι πιο διασκεδαστική και παραγωγική, γι' αυτό με αστεία, βρισιές, μιμίδια και άλλη ανόητη ψυχαγωγία, αρχίσαμε να λύνουμε προβλήματα ένα προς ένα.

Τον Μάρτιο του 2017 - σε ομάδα με τη Serega Mushinsky - τρίτη θέση για Δορυφορική ανίχνευση εικόνων Dstl. Χρυσό μετάλλιο στο Kaggle + $20k για δύο. Σε αυτήν την εργασία, βελτιώθηκε η εργασία με δορυφορικές εικόνες + δυαδική τμηματοποίηση μέσω UNet. Ανάρτηση ιστολογίου στο Habré σχετικά με αυτό το θέμα.

Τον ίδιο Μάρτιο, πήγα για μια συνέντευξη στη NVidia με την ομάδα Self Driving. Πραγματικά δυσκολεύτηκα με ερωτήσεις σχετικά με την ανίχνευση αντικειμένων. Δεν υπήρχε αρκετή γνώση.

Ευτυχώς ταυτόχρονα ξεκίνησε και ο διαγωνισμός Object Detection σε αεροφωτογραφίες από το ίδιο DSTL. Ο ίδιος ο Θεός διέταξε να λυθεί το πρόβλημα και να αναβαθμιστεί. Ένας μήνας με βράδια και σαββατοκύριακα. Πήρα τις γνώσεις και τερμάτισα δεύτερος. Αυτός ο διαγωνισμός είχε μια ενδιαφέρουσα απόχρωση στους κανόνες, που με οδήγησε να εμφανιστώ στη Ρωσία σε ομοσπονδιακά και όχι τόσο ομοσπονδιακά κανάλια. ανέβηκα σπίτι Lenta.ru, και σε ένα σωρό έντυπες και διαδικτυακές εκδόσεις. Ο Όμιλος Mail Ru έλαβε λίγο θετικό PR με δικά του έξοδα και δικά του χρήματα, και η θεμελιώδης επιστήμη στη Ρωσία εμπλουτίστηκε κατά 12000 λίρες. Ως συνήθως, γράφτηκε για αυτό το θέμα ανάρτηση ιστολογίου στο hubr. Πηγαίνετε εκεί για λεπτομέρειες.

Την ίδια στιγμή, ένας υπεύθυνος προσλήψεων της Tesla επικοινώνησε μαζί μου και προσφέρθηκε να μιλήσει για τη θέση του Computer Vision. Συμφωνώ. Έτρεξα στο take home, δύο οθόνες τεχνολογίας, μια συνέντευξη επιτόπου και είχα μια πολύ ευχάριστη συζήτηση με τον Andrei Karpathy, ο οποίος είχε μόλις προσληφθεί στην Tesla ως Διευθυντής AI. Το επόμενο στάδιο είναι ο έλεγχος ιστορικού. Μετά από αυτό, ο Έλον Μασκ έπρεπε να εγκρίνει προσωπικά την αίτησή μου. Η Tesla έχει μια αυστηρή Συμφωνία Μη Αποκάλυψης (NDA).
Δεν πέρασα τον έλεγχο παρασκηνίου. Ο υπεύθυνος προσλήψεων είπε ότι συνομιλώ πολύ στο διαδίκτυο, παραβιάζοντας το NDA. Το μόνο μέρος όπου είπα οτιδήποτε για μια συνέντευξη στην Tesla ήταν το ODS, οπότε η τρέχουσα υπόθεση είναι ότι κάποιος τράβηξε ένα στιγμιότυπο οθόνης και έγραψε στο HR στην Tesla, και απομάκρυνα από τον αγώνα χωρίς κίνδυνο. Ήταν κρίμα τότε. Τώρα χαίρομαι που δεν λειτούργησε. Η τρέχουσα θέση μου είναι πολύ καλύτερη, αν και θα ήταν πολύ ενδιαφέρον να συνεργαστώ με τον Αντρέι.

Αμέσως μετά, μπήκα στον διαγωνισμό δορυφορικών εικόνων στο Kaggle από Planet Labs - Κατανόηση του Αμαζονίου από το Διάστημα. Το πρόβλημα ήταν απλό και εξαιρετικά βαρετό· κανείς δεν ήθελε να το λύσει, αλλά όλοι ήθελαν ένα δωρεάν χρυσό μετάλλιο ή ένα χρηματικό έπαθλο. Επομένως, με μια ομάδα Kaggle Masters 7 ατόμων, συμφωνήσαμε να ρίξουμε σίδερο. Εκπαιδεύσαμε 480 δίκτυα στη λειτουργία 'fit_predict' και φτιάξαμε ένα τριώροφο σύνολο από αυτά. Τερμάτισε έβδομος. Ανάρτηση ιστολογίου που περιγράφει τη λύση από τον Arthur Kuzin. Παρεμπιπτόντως, ο Jeremy Howard, ο οποίος είναι ευρέως γνωστός ως δημιουργός Fast.AI τελείωσε 23.

Μετά το τέλος του διαγωνισμού, μέσω ενός φίλου που δούλευε στο AdRoll, οργάνωσα ένα Meetup στις εγκαταστάσεις τους. Εκπρόσωποι της Planet Labs μίλησαν εκεί για το πώς ήταν η διοργάνωση του διαγωνισμού και η σήμανση δεδομένων από την πλευρά τους. Η Wendy Kwan, η οποία εργάζεται στο Kaggle και επέβλεπε τον διαγωνισμό, μίλησε για το πώς τον είδε. Περιέγραψα τη λύση, τα κόλπα, τις τεχνικές και τις τεχνικές λεπτομέρειες. Τα δύο τρίτα του κοινού έλυσαν αυτό το πρόβλημα, οπότε οι ερωτήσεις έγιναν επί της ουσίας και γενικά όλα ήταν ωραία. Εκεί ήταν και ο Τζέρεμι Χάουαρντ. Αποδείχθηκε ότι τερμάτισε στην 23η θέση επειδή δεν ήξερε πώς να στοιβάζει το μοντέλο και ότι δεν γνώριζε καθόλου αυτή τη μέθοδο κατασκευής συνόλων.

Οι συναντήσεις στην κοιλάδα για τη μηχανική μάθηση είναι πολύ διαφορετικές από τις συναντήσεις στη Μόσχα. Κατά κανόνα, οι συναντήσεις στην κοιλάδα είναι στο κάτω μέρος. Αλλά το δικό μας βγήκε καλό. Δυστυχώς, ο σύντροφος που έπρεπε να πατήσει το κουμπί και να καταγράψει τα πάντα δεν πάτησε το κουμπί :)

Μετά από αυτό, κλήθηκα να μιλήσω με τη θέση του Deep Learning Engineer στο ίδιο Planet Labs, και αμέσως επί τόπου. Δεν το πέρασα. Η διατύπωση της άρνησης είναι ότι δεν υπάρχει αρκετή γνώση στο Deep Learning.

Σχεδίασα κάθε διαγωνισμό ως έργο στο LinkedIn. Για το πρόβλημα DSTL γράψαμε προεκτύπωση και το δημοσίευσε στο arxiv. Όχι ένα άρθρο, αλλά ακόμα ψωμί. Συνιστώ επίσης σε όλους τους άλλους να διογκώσουν το προφίλ τους στο LinkedIn μέσω διαγωνισμών, άρθρων, δεξιοτήτων και ούτω καθεξής. Υπάρχει θετική συσχέτιση μεταξύ του πόσες λέξεις-κλειδιά έχετε στο προφίλ σας στο LinkedIn και πόσο συχνά σας στέλνουν μηνύματα οι άνθρωποι.

Αν τον χειμώνα και την άνοιξη ήμουν πολύ τεχνικός, τότε μέχρι τον Αύγουστο είχα και γνώση και αυτοπεποίθηση.

Στα τέλη Ιουλίου, ένας τύπος που εργαζόταν ως διευθυντής Επιστήμης Δεδομένων στη Lyft επικοινώνησε μαζί μου στο LinkedIn και με κάλεσε να πιούμε καφέ και να συζητήσουμε για τη ζωή, για τη Lyft, για το TrueAccord. Μιλήσαμε. Προσφέρθηκε να πάρει συνέντευξη με την ομάδα του για τη θέση του Επιστήμονα Δεδομένων. Είπα ότι η επιλογή λειτουργεί, με την προϋπόθεση ότι είναι Computer Vision / Deep Learning από το πρωί μέχρι το βράδυ. Διαβεβαίωσε ότι δεν υπήρξαν αντιρρήσεις από την πλευρά του.

Έστειλα το βιογραφικό μου και το ανέβασε στην εσωτερική πύλη της Lyft. Μετά από αυτό, ο υπεύθυνος προσλήψεων με κάλεσε για να ανοίξει το βιογραφικό μου και να μάθει περισσότερα για μένα. Από τις πρώτες κιόλας λέξεις, ήταν ξεκάθαρο ότι γι 'αυτόν αυτό ήταν μια τυπική διαδικασία, αφού ήταν φανερό γι 'αυτόν από το βιογραφικό του ότι "δεν είμαι υλικό για τον Lyft". Υποθέτω ότι μετά από αυτό το βιογραφικό μου πήγε στον κάδο απορριμμάτων.

Όλο αυτό το διάστημα, όσο έπαιρνα συνέντευξη, συζητούσα τις αποτυχίες και τις πτώσεις μου στο ODS και τα παιδιά μου έδιναν σχόλια και με βοήθησαν με κάθε δυνατό τρόπο με συμβουλές, αν και, ως συνήθως, υπήρχε και πολύ φιλικό τρολάρισμα εκεί.

Ένα από τα μέλη της ODS προσφέρθηκε να με συνδέσει με τον φίλο του, ο οποίος είναι Διευθυντής Μηχανικών στη Lyft. Όχι νωρίτερα. Έρχομαι στο Lyft για μεσημεριανό γεύμα, και εκτός από αυτόν τον φίλο υπάρχει επίσης ένας Head of Data Science και ένας Product Manager που είναι μεγάλος θαυμαστής του Deep Learning. Στο μεσημεριανό γεύμα συζητήσαμε με DL. Και δεδομένου ότι εκπαιδεύω δίκτυα 24/7 για μισό χρόνο, διάβαζα κυβικά μέτρα λογοτεχνίας και έτρεξα εργασίες στο Kaggle με λίγο-πολύ ξεκάθαρα αποτελέσματα, θα μπορούσα να μιλήσω για το Deep Learning για ώρες, τόσο από άποψη νέων άρθρων όσο και πρακτικές τεχνικές.

Μετά το μεσημεριανό γεύμα με κοίταξαν και είπαν - είναι αμέσως προφανές ότι είσαι όμορφος, θέλεις να μας μιλήσεις; Επιπλέον, πρόσθεσαν ότι είναι σαφές για μένα ότι η οθόνη take home + tech μπορεί να παραλειφθεί. Και ότι θα με καλέσουν αμέσως στο χώρο. Συμφωνώ.

Μετά από αυτό, αυτός ο υπεύθυνος προσλήψεων με κάλεσε για να προγραμματίσω μια συνέντευξη επί τόπου και ήταν δυσαρεστημένος. Μουρμούρισε κάτι για το ότι δεν πηδήξατε πάνω από το κεφάλι σας.

Ήρθε. Επί τόπου συνέντευξη. Πέντε ώρες επικοινωνίας με διαφορετικούς ανθρώπους. Δεν υπήρχε ούτε μία ερώτηση σχετικά με το Deep Learning ή σχετικά με τη μηχανική μάθηση κατ' αρχήν. Αφού δεν υπάρχει Deep Learning / Computer Vision, τότε δεν με ενδιαφέρει. Έτσι, τα αποτελέσματα της συνέντευξης ήταν ορθογώνια.

Αυτός ο υπεύθυνος προσλήψεων τηλεφωνεί και λέει - συγχαρητήρια, περάσατε στη δεύτερη επιτόπια συνέντευξη. Όλα αυτά είναι εκπληκτικά. Ποιο είναι το δεύτερο επί τόπου; Δεν έχω ακούσει ποτέ για κάτι τέτοιο. Πήγα. Υπάρχουν μερικές ώρες εκεί, αυτή τη φορά όλα για την παραδοσιακή μηχανική εκμάθηση. Αυτό είναι καλύτερο. Αλλά και πάλι όχι ενδιαφέρον.

Ο υπεύθυνος προσλήψεων τηλεφωνεί με συγχαρητήρια που πέρασα την τρίτη επιτόπια συνέντευξη και ορκίζεται ότι αυτή θα είναι η τελευταία. Πήγα να το δω και υπήρχε και DL και βιογραφικό.

Είχα έναν προπορευόμενο για πολλούς μήνες που μου είπε ότι δεν θα υπάρξει προσφορά. Θα προπονηθώ όχι σε τεχνικές δεξιότητες, αλλά σε μαλακές. Όχι στο soft side, αλλά στο γεγονός ότι η θέση θα κλείσει ή ότι η εταιρεία δεν προσλαμβάνει ακόμη, αλλά απλώς δοκιμάζει την αγορά και το επίπεδο των υποψηφίων.

Μέσα Αυγούστου. Έπινα μπύρα εντάξει. Σκοτεινές σκέψεις. Πέρασαν 8 μήνες και ακόμα καμία προσφορά. Είναι καλό να είσαι δημιουργικός κάτω από την μπύρα, ειδικά αν η δημιουργικότητα είναι περίεργη. Μου έρχεται μια ιδέα στο μυαλό. Το μοιράζομαι με τον Alexey Shvets, ο οποίος εκείνη την εποχή ήταν μεταδιδακτορικός στο MIT.

Τι θα συμβεί αν πάρετε το πλησιέστερο συνέδριο DL/CV, παρακολουθήσετε τους διαγωνισμούς που γίνονται στο πλαίσιο του, εκπαιδεύσετε κάτι και υποβάλετε; Δεδομένου ότι όλοι οι ειδικοί εκεί χτίζουν την καριέρα τους πάνω σε αυτό και το κάνουν αυτό για πολλούς μήνες ή και χρόνια, δεν έχουμε καμία πιθανότητα. Αλλά δεν είναι τρομακτικό. Κάνουμε κάποια ουσιαστική υποβολή, πετάμε στην τελευταία θέση και μετά γράφουμε μια προεκτύπωση ή ένα άρθρο για το πώς δεν είμαστε όπως όλοι οι άλλοι και μιλάμε για την απόφασή μας. Και το άρθρο βρίσκεται ήδη στο LinkedIn και στο βιογραφικό σας.

Δηλαδή, φαίνεται να είναι σχετικό και υπάρχουν πιο σωστές λέξεις-κλειδιά στο βιογραφικό, κάτι που θα αυξήσει ελαφρώς τις πιθανότητες να φτάσετε στην οθόνη τεχνολογίας. Κώδικας και υποβολές από εμένα, κείμενα από τον Alexey. Παιχνίδι, φυσικά, αλλά γιατί όχι;

Όχι νωρίτερα. Το πιο κοντινό συνέδριο που ψάξαμε στο google ήταν το MICCAI και στην πραγματικότητα υπήρχαν διαγωνισμοί εκεί. Χτυπάμε το πρώτο. Ήταν Γαστρεντερική ανάλυση εικόνας (GIANA). Η εργασία έχει 3 δευτερεύουσες εργασίες. Έμειναν 8 ημέρες πριν από τη λήξη της προθεσμίας. Ξύπνησα το πρωί, αλλά δεν εγκατέλειψα την ιδέα. Πήρα τους αγωγούς μου από το Kaggle και τους άλλαξα από δορυφορικά δεδομένα σε ιατρικά δεδομένα. 'fit_predict'. Ο Alexey ετοίμασε μια περιγραφή λύσεων δύο σελίδων για κάθε πρόβλημα και τη στείλαμε. Ετοιμος. Θεωρητικά, μπορείτε να εκπνεύσετε. Αλλά αποδείχθηκε ότι υπήρχε μια άλλη εργασία για το ίδιο εργαστήριο (Τμηματοποίηση ρομποτικών οργάνων) με τρεις δευτερεύουσες εργασίες και ότι η προθεσμία της ανέβηκε κατά 4 ημέρες, δηλαδή, μπορούμε να κάνουμε το 'fit_predict' εκεί και να το στείλουμε. Αυτό κάναμε.

Σε αντίθεση με τον Kaggle, αυτοί οι διαγωνισμοί είχαν τις δικές τους ακαδημαϊκές ιδιαιτερότητες:

  1. Χωρίς Leaderboard. Οι υποβολές αποστέλλονται με email.
  2. Θα διαγραφείτε εάν ένας εκπρόσωπος της ομάδας δεν έρθει να παρουσιάσει τη λύση στο συνέδριο στο Εργαστήριο.
  3. Η θέση σας στο leaderboard γίνεται γνωστή μόνο κατά τη διάρκεια του συνεδρίου. Ένα είδος ακαδημαϊκού δράματος.

Το συνέδριο MICCAI 2017 πραγματοποιήθηκε στην πόλη του Κεμπέκ. Για να είμαι ειλικρινής, από τον Σεπτέμβριο άρχισα να κουράζομαι, οπότε η ιδέα να πάρω μια εβδομάδα άδεια από τη δουλειά και να κατευθυνθώ στον Καναδά φαινόταν ενδιαφέρουσα.

Ήρθε στο συνέδριο. Ήρθα σε αυτό το Εργαστήριο, δεν ξέρω κανέναν, κάθομαι στη γωνία. Όλοι γνωρίζονται μεταξύ τους, επικοινωνούν, πετούν έξυπνα ιατρικά λόγια. Ανασκόπηση του πρώτου διαγωνισμού. Οι συμμετέχοντες μιλούν και μιλούν για τις αποφάσεις τους. Είναι δροσερό εκεί, με λάμψη. Σειρά μου. Και με κάποιο τρόπο ντρέπομαι. Έλυσαν το πρόβλημα, εργάστηκαν πάνω σε αυτό, προχώρησαν στην επιστήμη και είμαστε καθαρά «fit_predict» από προηγούμενες εξελίξεις, όχι για την επιστήμη, αλλά για να ενισχύσουμε το βιογραφικό μας.

Βγήκε και είπε ότι δεν είμαι ούτε ειδικός στην ιατρική, ζήτησε συγγνώμη που έχασα τον χρόνο τους και μου έδειξε μια διαφάνεια με τη λύση. Κατέβηκα στο χολ.

Ανακοινώνουν την πρώτη υποεργασία - είμαστε πρώτοι και με διαφορά.
Ανακοινώνονται το δεύτερο και το τρίτο.
Ανακοινώνουν το τρίτο - ξανά πρώτο και ξανά με προβάδισμα.
Ο στρατηγός είναι ο πρώτος.

Από φυσικούς στην Επιστήμη Δεδομένων (Από τις μηχανές της επιστήμης στο πλαγκτόν γραφείου). Το τρίτο μέρος

Επίσημο δελτίο τύπου.

Κάποιοι από το κοινό χαμογελούν και με κοιτούν με σεβασμό. Άλλοι, εκείνοι που προφανώς θεωρούνταν ειδικοί στον τομέα, είχαν κερδίσει μια επιχορήγηση για αυτό το έργο και το έκαναν για πολλά χρόνια, είχαν μια ελαφρώς παραμορφωμένη έκφραση στα πρόσωπά τους.

Ακολουθεί η δεύτερη εργασία, αυτή με τρεις δευτερεύουσες εργασίες και η οποία έχει προχωρήσει τέσσερις ημέρες.

Εδώ ζήτησα επίσης συγγνώμη και έδειξα ξανά τη δική μας διαφάνεια.
Η ίδια ιστορία. Δύο πρώτα, ένα δεύτερο, κοινό πρώτο.

Νομίζω ότι αυτή είναι ίσως η πρώτη φορά στην ιστορία που μια εταιρεία συλλογής κερδίζει διαγωνισμό ιατρικής απεικόνισης.

Και τώρα στέκομαι στη σκηνή, μου δίνουν κάποιο είδος διπλώματος και βομβαρδίζομαι. Πώς στο διάολο μπορεί να είναι αυτό; Αυτοί οι ακαδημαϊκοί ξοδεύουν τα χρήματα των φορολογουμένων, εργάζονται για να απλοποιήσουν και να βελτιώσουν την ποιότητα της εργασίας για τους γιατρούς, δηλαδή, θεωρητικά, το προσδόκιμο ζωής μου, και κάποιο σώμα έριξε όλο αυτό το ακαδημαϊκό προσωπικό στη βρετανική σημαία σε λίγα βράδια.

Ένα μπόνους σε αυτό είναι ότι σε άλλες ομάδες, οι μεταπτυχιακοί φοιτητές που εργάζονται σε αυτές τις εργασίες για πολλούς μήνες θα έχουν ένα βιογραφικό που είναι ελκυστικό για το HR, δηλαδή θα φτάνουν εύκολα στην οθόνη της τεχνολογίας. Και μπροστά στα μάτια μου υπάρχει ένα πρόσφατα ληφθέν email:

A Googler recently referred you for the Research Scientist, Google Brain (United States) role. We carefully reviewed your background and experience and decided not to proceed with your application at this time.

Γενικά, από τη σκηνή, ρωτάω το κοινό: «Ξέρει κανείς πού δουλεύω;» Ένας από τους διοργανωτές του διαγωνισμού ήξερε - έψαξε στο Google τι ήταν το TrueAccord. Τα υπόλοιπα δεν είναι. Συνεχίζω: «Δουλεύω σε μια εταιρεία συλλογής και στη δουλειά δεν κάνω ούτε Computer Vision ούτε Deep Learning. Και από πολλές απόψεις, αυτό συμβαίνει επειδή τα τμήματα HR του Google Brain και του Deepmind φιλτράρουν το βιογραφικό μου, χωρίς να μου δίνουν την ευκαιρία να δείξω τεχνική κατάρτιση. "

Παρέδωσαν το πιστοποιητικό, διάλειμμα. Μια ομάδα ακαδημαϊκών με τραβάει στην άκρη. Αποδείχθηκε ότι πρόκειται για ομάδα Υγείας με Deepmind. Εντυπωσιάστηκαν τόσο πολύ που θέλησαν αμέσως να μου μιλήσουν για την κενή θέση του Ερευνητή Μηχανικού στην ομάδα τους. (Μιλήσαμε. Αυτή η συζήτηση κράτησε 6 μήνες, πέρασα take home, κουίζ, αλλά κόπηκε απότομα στην οθόνη τεχνολογίας. 6 μήνες από την έναρξη της επικοινωνίας στην οθόνη τεχνολογίας είναι πολύς χρόνος. Η μεγάλη αναμονή δίνει μια γεύση Ερευνητής Μηχανικός στο Deepmind στο Λονδίνο, στο πλαίσιο του TrueAccord υπήρξε ένα ισχυρό βήμα προς τα πάνω, αλλά στο πλαίσιο της τρέχουσας θέσης μου είναι ένα βήμα κάτω. Από απόσταση δύο ετών που έχουν περάσει από τότε, είναι καλό ότι δεν το έκανε.)

Συμπέρασμα

Την ίδια περίπου περίοδο, έλαβα μια πρόταση από τη Lyft, την οποία αποδέχτηκα.
Με βάση τα αποτελέσματα αυτών των δύο διαγωνισμών με το MICCAI, δημοσιεύθηκαν τα ακόλουθα:

  1. Αυτόματη τμηματοποίηση οργάνων στη χειρουργική με τη βοήθεια ρομπότ χρησιμοποιώντας βαθιά μάθηση
  2. Ανίχνευση και εντοπισμός αγγειοδυσπλασίας χρησιμοποιώντας βαθιά συνελικτικά νευρωνικά δίκτυα
  3. Πρόκληση τμηματοποίησης ρομποτικών οργάνων 2017

Δηλαδή, παρά την αγριότητα της ιδέας, η προσθήκη σταδιακών άρθρων και προεκτυπώσεων μέσω διαγωνισμών λειτουργεί καλά. Και τα επόμενα χρόνια το κάναμε ακόμα χειρότερο.

Από φυσικούς στην Επιστήμη Δεδομένων (Από τις μηχανές της επιστήμης στο πλαγκτόν γραφείου). Το τρίτο μέρος

Εργάζομαι στη Lyft τα τελευταία δύο χρόνια κάνοντας Computer Vision/Deep Learning for Self Driving cars. Δηλαδή, πήρα αυτό που ήθελα. Και καθήκοντα, και μια εταιρεία υψηλού επιπέδου, και δυνατοί συνάδελφοι, και όλα τα άλλα καλούδια.

Κατά τη διάρκεια αυτών των μηνών, είχα επικοινωνία τόσο με τις μεγάλες εταιρείες Google, Facebook, Uber, LinkedIn, όσο και με μια θάλασσα από startups διαφόρων μεγεθών.

Πονούσε όλους αυτούς τους μήνες. Το σύμπαν σου λέει κάτι όχι πολύ ευχάριστο κάθε μέρα. Τακτική απόρριψη, τακτικά λάθη και όλα αυτά αρωματίζονται με ένα επίμονο αίσθημα απελπισίας. Δεν υπάρχουν εγγυήσεις ότι θα πετύχεις, αλλά υπάρχει η αίσθηση ότι είσαι ανόητος. Θυμίζει πολύ το πώς προσπάθησα να βρω δουλειά αμέσως μετά το πανεπιστήμιο.

Νομίζω ότι πολλοί έψαχναν για δουλειά στην κοιλάδα και όλα ήταν πολύ πιο εύκολα για αυτούς. Το κόλπο, κατά τη γνώμη μου, είναι αυτό. Αν ψάχνετε για δουλειά σε έναν τομέα στον οποίο καταλαβαίνετε, έχετε αρκετή εμπειρία και το βιογραφικό σας λέει το ίδιο, δεν υπάρχουν προβλήματα. Το πήρα και το βρήκα. Υπάρχουν πολλές κενές θέσεις.

Αν όμως ψάχνετε για δουλειά σε έναν τομέα που είναι νέος για εσάς, όταν δηλαδή δεν υπάρχουν γνώσεις, δεν υπάρχουν διασυνδέσεις και το βιογραφικό σας λέει κάτι λάθος - αυτή τη στιγμή όλα γίνονται εξαιρετικά ενδιαφέροντα.

Αυτή τη στιγμή, οι υπεύθυνοι προσλήψεων μου γράφουν τακτικά και μου προσφέρουν να κάνουν το ίδιο πράγμα που κάνω τώρα, αλλά σε διαφορετική εταιρεία. Είναι πραγματικά καιρός να αλλάξετε δουλειά. Αλλά δεν έχει νόημα να κάνω αυτό στο οποίο είμαι ήδη καλός. Για τι?

Αλλά για αυτό που θέλω, πάλι δεν έχω ούτε τις γνώσεις ούτε τις γραμμές στο βιογραφικό μου. Ας δούμε πώς θα τελειώσει όλο αυτό. Αν όλα πάνε καλά, θα γράψω το επόμενο μέρος. 🙂

Πηγή: www.habr.com

Προσθέστε ένα σχόλιο