Τι να διαβάσετε ως επιστήμονας δεδομένων το 2020

Τι να διαβάσετε ως επιστήμονας δεδομένων το 2020
Σε αυτήν την ανάρτηση, μοιραζόμαστε μαζί σας μια επιλογή πηγών χρήσιμων πληροφοριών σχετικά με την Επιστήμη των Δεδομένων από τον συνιδρυτή και CTO του DAGsHub, μιας κοινότητας και πλατφόρμας ιστού για τον έλεγχο εκδόσεων δεδομένων και τη συνεργασία μεταξύ επιστημόνων δεδομένων και μηχανικών μηχανικής μάθησης. Η επιλογή περιλαμβάνει μια ποικιλία πηγών, από λογαριασμούς Twitter έως ολοκληρωμένα ιστολόγια μηχανικής, τα οποία απευθύνονται σε όσους γνωρίζουν ακριβώς τι ψάχνουν. Λεπτομέρειες κάτω από το κόψιμο.

Από τον συγγραφέα:
Είστε αυτό που τρώτε και ως εργαζόμενος στη γνώση, χρειάζεστε μια καλή ενημερωτική διατροφή. Θέλω να μοιραστώ πηγές πληροφοριών σχετικά με την Επιστήμη των Δεδομένων, την τεχνητή νοημοσύνη και τις σχετικές τεχνολογίες που θεωρώ πιο χρήσιμες ή ελκυστικές. Ελπίζω να σε βοηθήσει κι αυτό!

Έγγραφα δύο λεπτών

Ένα κανάλι YouTube που είναι κατάλληλο για να ενημερώνεστε για τα τελευταία γεγονότα. Το κανάλι ενημερώνεται συχνά και ο οικοδεσπότης έχει έναν μεταδοτικό ενθουσιασμό και θετικότητα σε όλα τα θέματα που καλύπτονται. Αναμένετε κάλυψη ενδιαφέρουσας εργασίας όχι μόνο για την τεχνητή νοημοσύνη, αλλά και για γραφικά υπολογιστών και άλλα οπτικά ελκυστικά θέματα.

Γιανίκ Κίλτσερ

Στο κανάλι του στο YouTube, ο Yannick εξηγεί τη σημαντική έρευνα στη βαθιά μάθηση με τεχνικές λεπτομέρειες. Αντί να διαβάζετε μόνοι σας μια μελέτη, είναι συχνά πιο γρήγορο και πιο εύκολο να παρακολουθήσετε ένα από τα βίντεό της για να κατανοήσετε καλύτερα σημαντικά άρθρα. Οι εξηγήσεις μεταφέρουν την ουσία των άρθρων χωρίς να παραμελούν τα μαθηματικά ή να χαθούν σε τρία πεύκα. Ο Yannick μοιράζεται επίσης τις απόψεις του σχετικά με το πώς ταιριάζουν οι μελέτες, πόσο σοβαρά πρέπει να λαμβάνονται τα αποτελέσματα, ευρύτερες ερμηνείες κ.λπ. Οι αρχάριοι (ή οι μη ακαδημαϊκοί) δυσκολεύονται περισσότερο να φτάσουν σε αυτές τις ανακαλύψεις μόνοι τους.

απόσταγμα.pub

Με τα δικά τους λόγια:

Η έρευνα μηχανικής μάθησης πρέπει να είναι σαφής, δυναμική και ζωντανή. Και το Distill δημιουργήθηκε για να βοηθήσει στην έρευνα.

Το Distill είναι μια μοναδική ερευνητική δημοσίευση μηχανικής μάθησης. Τα άρθρα προωθούνται με εκπληκτικές απεικονίσεις για να δώσουν στον αναγνώστη μια πιο διαισθητική κατανόηση των θεμάτων. Η χωρική σκέψη και η φαντασία τείνουν να λειτουργούν πολύ καλά βοηθώντας σας να κατανοήσετε τα θέματα της Μηχανικής Μάθησης και της Επιστήμης Δεδομένων. Οι παραδοσιακές μορφές δημοσιεύσεων, από την άλλη πλευρά, τείνουν να είναι άκαμπτες στη δομή τους, στατικές και στεγνές, και μερικές φορές "μαθηματικός". Ο Chris Olah, συνδημιουργός του Distill, διατηρεί επίσης ένα καταπληκτικό προσωπικό blog στο GitHub. Δεν έχει ενημερωθεί για πολύ καιρό, αλλά εξακολουθεί να παραμένει μια συλλογή από τις καλύτερες εξηγήσεις βαθιάς μάθησης που γράφτηκαν ποτέ. Συγκεκριμένα, με βοήθησε πολύ περιγραφή LSTM!

Τι να διαβάσετε ως επιστήμονας δεδομένων το 2020
πηγή

Σεμπάστιαν Ρούντερ

Ο Sebastian Ruder γράφει ένα πολύ κατατοπιστικό ιστολόγιο και ενημερωτικό δελτίο, κυρίως για τη διασταύρωση των νευρωνικών δικτύων και την ανάλυση κειμένου φυσικής γλώσσας. Δίνει επίσης πολλές συμβουλές σε ερευνητές και ομιλητές συνεδρίων, οι οποίες μπορεί να είναι πολύ χρήσιμες αν είστε στον ακαδημαϊκό χώρο. Τα άρθρα του Sebastian τείνουν να λαμβάνουν τη μορφή ανασκοπήσεων, συνοψίζοντας και εξηγώντας την κατάσταση της τέχνης στην έρευνα και τις μεθόδους σε μια δεδομένη περιοχή. Αυτό σημαίνει ότι τα άρθρα είναι εξαιρετικά χρήσιμα για τους επαγγελματίες που θέλουν να αποκτήσουν γρήγορα τον προσανατολισμό τους. Ο Σεμπάστιαν γράφει επίσης Twitter.

Αντρέι Καρπάτι

Ο Αντρέι Καρπάτι δεν χρειάζεται συστάσεις. Εκτός του ότι είναι ένας από τους πιο διάσημους ερευνητές βαθιάς μάθησης στη γη, δημιουργεί εργαλεία που χρησιμοποιούνται ευρέως όπως π.χ αρχειοφύλακας λογικής ως παράπλευρα έργα. Αμέτρητοι άνθρωποι μπήκαν σε αυτό το βασίλειο μέσω της πορείας του στο Στάνφορντ. cs231n, και θα είναι χρήσιμο να το γνωρίζετε συνταγή εκπαίδευση νευρωνικών δικτύων. Προτείνω επίσης να το παρακολουθήσετε ομιλία σχετικά με τα πραγματικά προβλήματα που πρέπει να ξεπεράσει η Tesla όταν προσπαθεί να εφαρμόσει τη μηχανική μάθηση σε μαζική κλίμακα στον πραγματικό κόσμο. Ο λόγος είναι κατατοπιστικός, εντυπωσιακός και νηφάλιος. Εκτός από άρθρα για την ίδια την ML, ο Andrey Karpaty δίνει καλές συμβουλές ζωής για φιλόδοξους επιστήμονες. Διαβάστε τον Andrew στο Twitter και Github.

Μηχανική Uber

Το blog engineering Uber είναι πραγματικά εντυπωσιακό όσον αφορά την κλίμακα και το εύρος κάλυψης, καλύπτοντας πολλά θέματα, ιδίως Τεχνητή νοημοσύνη. Αυτό που μου αρέσει ιδιαίτερα στη μηχανολογική κουλτούρα της Uber είναι η τάση τους να κυκλοφορούν πολύ ενδιαφέρουσες και πολύτιμες Έργα ανοιχτού κώδικα με ιλιγγιώδεις ρυθμούς. Να μερικά παραδείγματα:

Ιστολόγιο OpenAI

Πέρα από τη διαμάχη, το ιστολόγιο OpenAI είναι αναμφισβήτητα εξαιρετικό. Κατά καιρούς, το ιστολόγιο δημοσιεύει περιεχόμενο και γνώσεις σχετικά με τη βαθιά μάθηση που μπορεί να φτάσει μόνο στην κλίμακα του OpenAI: υποθετικό φαινόμενο βαθιά διπλή κατάβαση. Η ομάδα του OpenAI τείνει να δημοσιεύει σπάνια, αλλά πρόκειται για σημαντικό περιεχόμενο.

Τι να διαβάσετε ως επιστήμονας δεδομένων το 2020
πηγή

Ιστολόγιο Taboola

Το ιστολόγιο Taboola δεν είναι τόσο γνωστό όσο μερικές από τις άλλες πηγές σε αυτήν την ανάρτηση, αλλά νομίζω ότι είναι μοναδικό - οι συγγραφείς γράφουν για πολύ εγκόσμια, πραγματικά προβλήματα όταν προσπαθούν να εφαρμόσουν ML στην παραγωγή για μια "κανονική" επιχείρηση: λιγότερο για αυτοοδηγούμενα αυτοκίνητα και πράκτορες RL που κερδίζουν παγκόσμιους πρωταθλητές, περισσότερα για το "πώς μπορώ να ξέρω αν το μοντέλο μου τώρα προβλέπει τα πράγματα με ψεύτικη σιγουριά;". Αυτά τα ζητήματα σχετίζονται σχεδόν με όλους όσους εργάζονται στον τομέα και λαμβάνουν λιγότερη κάλυψη από τον Τύπο από ό,τι πιο συνηθισμένα θέματα τεχνητής νοημοσύνης, αλλά εξακολουθεί να χρειάζεται ταλέντα παγκόσμιας κλάσης για να αντιμετωπιστούν σωστά αυτά τα ζητήματα. Ευτυχώς, η Taboola έχει τόσο αυτό το ταλέντο όσο και την προθυμία και την ικανότητα να γράψει γι 'αυτό, ώστε να μπορούν να μάθουν και άλλοι άνθρωποι.

Reddit

Μαζί με το Twitter, δεν υπάρχει τίποτα καλύτερο στο Reddit από το να κολλάτε στην έρευνα, τα εργαλεία ή τη σοφία του πλήθους.

Κατάσταση της AI

Οι αναρτήσεις δημοσιεύονται μόνο ετησίως, αλλά είναι γεμάτες με πολύ πυκνές πληροφορίες. Σε σύγκριση με άλλες πηγές σε αυτήν τη λίστα, αυτή είναι πιο προσιτή σε επιχειρηματίες που δεν ασχολούνται με την τεχνολογία. Αυτό που μου αρέσει στις συνομιλίες είναι ότι προσπαθούν να δώσουν μια πιο ολιστική άποψη για το πού κατευθύνεται η βιομηχανία και η έρευνα, συνδυάζοντας τις προόδους στο υλικό, την έρευνα, τις επιχειρήσεις και ακόμη και τη γεωπολιτική από την οπτική γωνία. Φροντίστε να ξεκινήσετε από το τέλος για να διαβάσετε για τις συγκρούσεις συμφερόντων.

Podcasts

Ειλικρινά, νομίζω ότι τα podcast δεν είναι κατάλληλα για την εκμάθηση τεχνικών θεμάτων. Εξάλλου, χρησιμοποιούν μόνο ήχο για να εξηγήσουν θέματα και η επιστήμη των δεδομένων είναι ένα πολύ οπτικό πεδίο. Τα podcast τείνουν να σας δίνουν μια δικαιολογία για να εξερευνήσετε σε μεγαλύτερο βάθος αργότερα ή για να εμπλακείτε σε φιλοσοφικές συζητήσεις. Ωστόσο, εδώ είναι μερικές συστάσεις:

  • lex friedman podcastόταν συνομιλεί με εξέχοντες ερευνητές στον τομέα της τεχνητής νοημοσύνης. Τα επεισόδια με τον Francois Chollet είναι ιδιαίτερα καλά!
  • podcast Μηχανικής Δεδομένων. Χαίρομαι που μαθαίνω για νέα εργαλεία υποδομής δεδομένων.

Φοβερές λίστες

Υπάρχουν λιγότερα πράγματα που πρέπει να παρακολουθείτε εδώ, αλλά περισσότεροι πόροι που είναι χρήσιμοι μόλις μάθετε τι ψάχνετε:

Twitter

  • Μάτι Μαριάνσκι
    Ο Matty βρίσκει όμορφους, δημιουργικούς τρόπους να χρησιμοποιεί τα νευρωνικά δίκτυα και είναι απλά διασκεδαστικό να βλέπεις τα αποτελέσματά του στη ροή σου στο Twitter. Ρίξτε μια ματιά τουλάχιστον αυτό δημοσιεύσετε.
  • Όρι Κοέν
    Το Ori είναι απλώς μια μηχανή οδήγησης ιστολόγια. Γράφει εκτενώς για προβλήματα και λύσεις για τους επιστήμονες δεδομένων. Φροντίστε να εγγραφείτε για να ενημερώνεστε όταν δημοσιεύεται ένα άρθρο. Του συλλογήιδιαίτερα είναι πραγματικά εντυπωσιακό.
  • Τζέρεμι Χάουαρντ
    Συνιδρυτής του fast.ai, μιας ολοκληρωμένης πηγής δημιουργικότητας και παραγωγικότητας.
  • Χαμέλ Χουσεΐν
    Ένας μηχανικός ML προσωπικού στο Github, ο Hamel Hussain είναι απασχολημένος με τη δημιουργία και την αναφορά πολλών εργαλείων για κωδικοποιητές στον τομέα δεδομένων.
  • Φρανσουά Σολέ
    Δημιουργός του Keras, τώρα προσπαθεί ενημερώσουμε την κατανόησή μας για το τι είναι η νοημοσύνη και πώς να τη δοκιμάσουμε.
  • hardmaru
    Ερευνητής στο Google Brain.

Συμπέρασμα

Η αρχική ανάρτηση μπορεί να ενημερωθεί καθώς ο συγγραφέας βρίσκει εξαιρετικές πηγές περιεχομένου που θα ήταν κρίμα να μην συμπεριληφθούν στη λίστα. Μη διστάσετε να επικοινωνήσετε μαζί του Twitterαν θέλετε να προτείνετε κάποια νέα πηγή! Και επίσης το DAGsHub προσλαμβάνει Δικηγόρος [περ. μετάφρ. Public Practitioner] στο Data Science, οπότε αν δημιουργήσετε το δικό σας περιεχόμενο Data Science, μη διστάσετε να γράψετε στον συγγραφέα της ανάρτησης.

Τι να διαβάσετε ως επιστήμονας δεδομένων το 2020
Αναπτύξτε διαβάζοντας τις προτεινόμενες πηγές και τον κωδικό προσφοράς HABR, μπορείτε να λάβετε επιπλέον 10% στην έκπτωση που αναγράφεται στο banner.

Περισσότερα μαθήματα

Επιλεγμένα άρθρα

Πηγή: www.habr.com