In questo post, condividiamo con te una selezione di fonti di informazioni utili su Data Science dal co-fondatore e CTO di DAGsHub, una community e piattaforma web per il controllo della versione dei dati e la collaborazione tra data scientist e ingegneri di machine learning. La selezione include una varietà di fonti, dagli account Twitter ai blog di ingegneria a tutti gli effetti, rivolti a coloro che sanno esattamente cosa stanno cercando. Dettagli sotto il taglio.
Da parte dell'autore:
Sei quello che mangi e, come lavoratore della conoscenza, hai bisogno di una buona dieta informativa. Voglio condividere fonti di informazioni su Data Science, intelligenza artificiale e tecnologie correlate che trovo più utili o attraenti. Spero che questo aiuti anche te!
Un canale YouTube che ben si presta per tenersi aggiornati sugli ultimi eventi. Il canale viene aggiornato frequentemente e l'host ha un entusiasmo e una positività contagiosi in tutti gli argomenti trattati. Aspettatevi una copertura di lavori interessanti non solo sull'intelligenza artificiale, ma anche sulla computer grafica e altri argomenti visivamente accattivanti.
Sul suo canale YouTube, Yannick spiega nei dettagli tecnici importanti ricerche nel deep learning. Invece di leggere uno studio da soli, spesso è più facile e veloce guardare uno dei suoi video per acquisire una comprensione più approfondita di articoli importanti. Le spiegazioni trasmettono l'essenza degli articoli senza trascurare la matematica o perdersi in tre pini. Yannick condivide anche le sue opinioni su come gli studi si incastrano, quanto seriamente dovrebbero essere presi i risultati, interpretazioni più ampie e così via. I principianti (o i praticanti non accademici) trovano più difficile arrivare a queste scoperte da soli.
La ricerca sull'apprendimento automatico deve essere chiara, dinamica e vibrante. E Distill è stato creato per aiutare nella ricerca.
Distill è una pubblicazione di ricerca sull'apprendimento automatico unica. Gli articoli sono promossi con straordinarie visualizzazioni per offrire al lettore una comprensione più intuitiva degli argomenti. Il pensiero spaziale e l'immaginazione tendono a funzionare molto bene per aiutarti a comprendere gli argomenti di Machine Learning e Data Science. I formati tradizionali delle pubblicazioni, invece, tendono ad essere rigidi nella loro struttura, statici e asciutti, a volte "matematico". Chris Olah, co-creatore di Distill, mantiene anche un fantastico blog personale su GitHub. Non è stato aggiornato per molto tempo, ma rimane comunque una raccolta delle migliori spiegazioni di deep learning mai scritte. In particolare, mi ha aiutato molto descrizione LST!
Sebastian Ruder scrive un blog e una newsletter molto istruttivi, principalmente sull'intersezione di reti neurali e analisi del testo in linguaggio naturale. Dà anche molti consigli a ricercatori e relatori di conferenze, che possono essere molto utili se sei nel mondo accademico. Gli articoli di Sebastian tendono ad assumere la forma di recensioni, riassumendo e spiegando lo stato dell'arte della ricerca e dei metodi in una data area. Ciò significa che gli articoli sono estremamente utili per i professionisti che vogliono orientarsi rapidamente. Anche Sebastian scrive Twitter.
Andrei Karpaty non ha bisogno di presentazioni. Oltre ad essere uno dei più famosi ricercatori di deep learning sulla terra, crea strumenti ampiamente utilizzati come archivio conservatore di sanità mentale come progetti collaterali. Innumerevoli persone sono entrate in questo regno attraverso il suo corso di Stanford. cs231n, e ti sarà utile conoscerlo ricetta addestramento della rete neurale. Consiglio anche di guardarlo речь sui problemi reali che Tesla deve superare quando cerca di applicare l'apprendimento automatico su vasta scala nel mondo reale. Il discorso è informativo, impressionante e che fa riflettere. Oltre agli articoli sullo stesso ML, Andrey Karpaty dà buon consiglio di vita per scienziati ambiziosi. Leggi Andrea a Twitter e Github.
Il blog di ingegneria di Uber è davvero impressionante in termini di scala e ampiezza di copertura, coprendo molti argomenti, in particolare intelligenza artificiale. Quello che mi piace particolarmente della cultura ingegneristica di Uber è la loro tendenza a rilasciare contenuti molto interessanti e di valore Progetti open source a un ritmo vertiginoso. Ecco alcuni esempi:
Polemiche a parte, il blog OpenAI è innegabilmente fantastico. Di tanto in tanto, il blog pubblica contenuti e approfondimenti sul deep learning che possono arrivare solo alla scala di OpenAI: ipotetico un fenomeno profonda doppia discesa. Il team di OpenAI tende a postare raramente, ma si tratta di contenuti importanti.
Il blog Taboola non è così noto come alcune delle altre fonti in questo post, ma penso che sia unico: gli autori scrivono di problemi molto banali e reali quando provano ad applicare ML in produzione per un'attività "normale": meno su auto a guida autonoma e agenti RL che vincono campioni del mondo, altro su "come faccio a sapere se il mio modello ora prevede le cose con falsa sicurezza?". Questi problemi sono rilevanti per quasi tutti coloro che lavorano sul campo e ricevono meno copertura da parte della stampa rispetto ad argomenti di intelligenza artificiale più comuni, ma ci vogliono comunque talenti di livello mondiale per affrontare correttamente questi problemi. Fortunatamente, Taboola ha sia questo talento che la volontà e la capacità di scriverne in modo che anche altre persone possano imparare.
Reddit
Insieme a Twitter, non c'è niente di meglio su Reddit che rimanere affascinati dalla ricerca, dagli strumenti o dalla saggezza della folla.
I post vengono pubblicati solo ogni anno, ma sono pieni di informazioni in modo molto denso. Rispetto ad altre fonti in questo elenco, questa è più accessibile agli uomini d'affari non tecnologici. Ciò che amo dei colloqui è che cercano di fornire una visione più olistica di dove si stanno dirigendo l'industria e la ricerca, unendo i progressi nell'hardware, nella ricerca, negli affari e persino nella geopolitica da una prospettiva a volo d'uccello. Assicurati di iniziare dalla fine per leggere i conflitti di interesse.
Podcast
Francamente, penso che i podcast non siano adatti per l'apprendimento di argomenti tecnici. Dopotutto, usano solo il suono per spiegare gli argomenti e la scienza dei dati è un campo molto visivo. I podcast tendono a darti una scusa per esplorare in modo più approfondito in seguito o per coinvolgere discussioni filosofiche. Tuttavia, ecco alcune raccomandazioni:
podcast di lex friedmanquando parla con importanti ricercatori nel campo dell'intelligenza artificiale. Gli episodi con Francois Chollet sono particolarmente belli!
Matty Mariansky
Matty trova modi belli e creativi per utilizzare le reti neurali ed è divertente vedere i suoi risultati sul tuo feed Twitter. Dai almeno un'occhiata questo post.
Ori Cohen
Ori è solo una macchina da guidare blog. Scrive ampiamente di problemi e soluzioni per i data scientist. Assicurati di iscriverti per ricevere una notifica quando viene pubblicato un articolo. Il suo collezionein particolare è davvero impressionante.
JeremyHoward
Co-fondatore di fast.ai, una fonte completa di creatività e produttività.
Hamel Hussein
Hamel Hussain, ingegnere ML dello staff di Github, è impegnato a creare e creare report su molti strumenti per i programmatori nel dominio dei dati.
Francois Chollet
Creatore di Keras, adesso sta provando aggiornare la nostra comprensione di cosa sia l'intelligenza e come testarla.
Il post originale potrebbe essere aggiornato poiché l'autore trova ottime fonti di contenuti che sarebbe un peccato non includere nell'elenco. Sentiti libero di contattarlo Twitterse vuoi consigliare qualche nuova fonte! E anche DAGsHub assunzioni Avvocato [ca. trad. Public Practitioner] in Data Science, quindi se crei i tuoi contenuti di Data Science, sentiti libero di scrivere all'autore del post.
Sviluppa leggendo le fonti consigliate e dal codice promozionale CARPENNA, puoi ottenere un ulteriore 10% rispetto allo sconto indicato sul banner.