Cosa leggere come data scientist nel 2020

Cosa leggere come data scientist nel 2020
In questo post, condividiamo con te una selezione di fonti di informazioni utili su Data Science dal co-fondatore e CTO di DAGsHub, una community e piattaforma web per il controllo della versione dei dati e la collaborazione tra data scientist e ingegneri di machine learning. La selezione include una varietà di fonti, dagli account Twitter ai blog di ingegneria a tutti gli effetti, rivolti a coloro che sanno esattamente cosa stanno cercando. Dettagli sotto il taglio.

Da parte dell'autore:
Sei quello che mangi e, come lavoratore della conoscenza, hai bisogno di una buona dieta informativa. Voglio condividere fonti di informazioni su Data Science, intelligenza artificiale e tecnologie correlate che trovo più utili o attraenti. Spero che questo aiuti anche te!

Documenti da due minuti

Un canale YouTube che ben si presta per tenersi aggiornati sugli ultimi eventi. Il canale viene aggiornato frequentemente e l'host ha un entusiasmo e una positività contagiosi in tutti gli argomenti trattati. Aspettatevi una copertura di lavori interessanti non solo sull'intelligenza artificiale, ma anche sulla computer grafica e altri argomenti visivamente accattivanti.

Yannick Kilcher

Sul suo canale YouTube, Yannick spiega nei dettagli tecnici importanti ricerche nel deep learning. Invece di leggere uno studio da soli, spesso è più facile e veloce guardare uno dei suoi video per acquisire una comprensione più approfondita di articoli importanti. Le spiegazioni trasmettono l'essenza degli articoli senza trascurare la matematica o perdersi in tre pini. Yannick condivide anche le sue opinioni su come gli studi si incastrano, quanto seriamente dovrebbero essere presi i risultati, interpretazioni più ampie e così via. I principianti (o i praticanti non accademici) trovano più difficile arrivare a queste scoperte da soli.

distill.pub

Con le loro stesse parole:

La ricerca sull'apprendimento automatico deve essere chiara, dinamica e vibrante. E Distill è stato creato per aiutare nella ricerca.

Distill è una pubblicazione di ricerca sull'apprendimento automatico unica. Gli articoli sono promossi con straordinarie visualizzazioni per offrire al lettore una comprensione più intuitiva degli argomenti. Il pensiero spaziale e l'immaginazione tendono a funzionare molto bene per aiutarti a comprendere gli argomenti di Machine Learning e Data Science. I formati tradizionali delle pubblicazioni, invece, tendono ad essere rigidi nella loro struttura, statici e asciutti, a volte "matematico". Chris Olah, co-creatore di Distill, mantiene anche un fantastico blog personale su GitHub. Non è stato aggiornato per molto tempo, ma rimane comunque una raccolta delle migliori spiegazioni di deep learning mai scritte. In particolare, mi ha aiutato molto descrizione LST!

Cosa leggere come data scientist nel 2020
fonte

Sebastian Ruder

Sebastian Ruder scrive un blog e una newsletter molto istruttivi, principalmente sull'intersezione di reti neurali e analisi del testo in linguaggio naturale. Dà anche molti consigli a ricercatori e relatori di conferenze, che possono essere molto utili se sei nel mondo accademico. Gli articoli di Sebastian tendono ad assumere la forma di recensioni, riassumendo e spiegando lo stato dell'arte della ricerca e dei metodi in una data area. Ciò significa che gli articoli sono estremamente utili per i professionisti che vogliono orientarsi rapidamente. Anche Sebastian scrive Twitter.

Andrej Karpaty

Andrei Karpaty non ha bisogno di presentazioni. Oltre ad essere uno dei più famosi ricercatori di deep learning sulla terra, crea strumenti ampiamente utilizzati come archivio conservatore di sanità mentale come progetti collaterali. Innumerevoli persone sono entrate in questo regno attraverso il suo corso di Stanford. cs231n, e ti sarà utile conoscerlo ricetta addestramento della rete neurale. Consiglio anche di guardarlo речь sui problemi reali che Tesla deve superare quando cerca di applicare l'apprendimento automatico su vasta scala nel mondo reale. Il discorso è informativo, impressionante e che fa riflettere. Oltre agli articoli sullo stesso ML, Andrey Karpaty dà buon consiglio di vita per scienziati ambiziosi. Leggi Andrea a Twitter e Github.

Ingegneria Uber

Il blog di ingegneria di Uber è davvero impressionante in termini di scala e ampiezza di copertura, coprendo molti argomenti, in particolare intelligenza artificiale. Quello che mi piace particolarmente della cultura ingegneristica di Uber è la loro tendenza a rilasciare contenuti molto interessanti e di valore Progetti open source a un ritmo vertiginoso. Ecco alcuni esempi:

Blog OpenAI

Polemiche a parte, il blog OpenAI è innegabilmente fantastico. Di tanto in tanto, il blog pubblica contenuti e approfondimenti sul deep learning che possono arrivare solo alla scala di OpenAI: ipotetico un fenomeno profonda doppia discesa. Il team di OpenAI tende a postare raramente, ma si tratta di contenuti importanti.

Cosa leggere come data scientist nel 2020
fonte

Blog Taboola

Il blog Taboola non è così noto come alcune delle altre fonti in questo post, ma penso che sia unico: gli autori scrivono di problemi molto banali e reali quando provano ad applicare ML in produzione per un'attività "normale": meno su auto a guida autonoma e agenti RL che vincono campioni del mondo, altro su "come faccio a sapere se il mio modello ora prevede le cose con falsa sicurezza?". Questi problemi sono rilevanti per quasi tutti coloro che lavorano sul campo e ricevono meno copertura da parte della stampa rispetto ad argomenti di intelligenza artificiale più comuni, ma ci vogliono comunque talenti di livello mondiale per affrontare correttamente questi problemi. Fortunatamente, Taboola ha sia questo talento che la volontà e la capacità di scriverne in modo che anche altre persone possano imparare.

Reddit

Insieme a Twitter, non c'è niente di meglio su Reddit che rimanere affascinati dalla ricerca, dagli strumenti o dalla saggezza della folla.

Stato dell'AI

I post vengono pubblicati solo ogni anno, ma sono pieni di informazioni in modo molto denso. Rispetto ad altre fonti in questo elenco, questa è più accessibile agli uomini d'affari non tecnologici. Ciò che amo dei colloqui è che cercano di fornire una visione più olistica di dove si stanno dirigendo l'industria e la ricerca, unendo i progressi nell'hardware, nella ricerca, negli affari e persino nella geopolitica da una prospettiva a volo d'uccello. Assicurati di iniziare dalla fine per leggere i conflitti di interesse.

Podcast

Francamente, penso che i podcast non siano adatti per l'apprendimento di argomenti tecnici. Dopotutto, usano solo il suono per spiegare gli argomenti e la scienza dei dati è un campo molto visivo. I podcast tendono a darti una scusa per esplorare in modo più approfondito in seguito o per coinvolgere discussioni filosofiche. Tuttavia, ecco alcune raccomandazioni:

  • podcast di lex friedmanquando parla con importanti ricercatori nel campo dell'intelligenza artificiale. Gli episodi con Francois Chollet sono particolarmente belli!
  • Podcast Ingegneria dei dati. È bello conoscere i nuovi strumenti per l'infrastruttura dei dati.

Liste fantastiche

C'è meno da tenere d'occhio qui, ma più risorse utili una volta che sai cosa stai cercando:

Twitter

  • Matty Mariansky
    Matty trova modi belli e creativi per utilizzare le reti neurali ed è divertente vedere i suoi risultati sul tuo feed Twitter. Dai almeno un'occhiata questo post.
  • Ori Cohen
    Ori è solo una macchina da guidare blog. Scrive ampiamente di problemi e soluzioni per i data scientist. Assicurati di iscriverti per ricevere una notifica quando viene pubblicato un articolo. Il suo collezionein particolare è davvero impressionante.
  • JeremyHoward
    Co-fondatore di fast.ai, una fonte completa di creatività e produttività.
  • Hamel Hussein
    Hamel Hussain, ingegnere ML dello staff di Github, è impegnato a creare e creare report su molti strumenti per i programmatori nel dominio dei dati.
  • Francois Chollet
    Creatore di Keras, adesso sta provando aggiornare la nostra comprensione di cosa sia l'intelligenza e come testarla.
  • hardmaru
    Ricercatore presso Google Brain.

conclusione

Il post originale potrebbe essere aggiornato poiché l'autore trova ottime fonti di contenuti che sarebbe un peccato non includere nell'elenco. Sentiti libero di contattarlo Twitterse vuoi consigliare qualche nuova fonte! E anche DAGsHub assunzioni Avvocato [ca. trad. Public Practitioner] in Data Science, quindi se crei i tuoi contenuti di Data Science, sentiti libero di scrivere all'autore del post.

Cosa leggere come data scientist nel 2020
Sviluppa leggendo le fonti consigliate e dal codice promozionale CARPENNA, puoi ottenere un ulteriore 10% rispetto allo sconto indicato sul banner.

Più corsi

Articoli consigliati

Fonte: habr.com