In questo post, condividiamo con te una selezione di fonti di informazioni utili su Data Science dal co-fondatore e CTO di DAGsHub, una community e piattaforma web per il controllo della versione dei dati e la collaborazione tra data scientist e ingegneri di machine learning. La selezione include una varietà di fonti, dagli account Twitter ai blog di ingegneria a tutti gli effetti, rivolti a coloro che sanno esattamente cosa stanno cercando. Dettagli sotto il taglio.
Da parte dell'autore:
Sei quello che mangi e, come lavoratore della conoscenza, hai bisogno di una buona dieta informativa. Voglio condividere fonti di informazioni su Data Science, intelligenza artificiale e tecnologie correlate che trovo più utili o attraenti. Spero che questo aiuti anche te!
Un canale YouTube che ben si presta per tenersi aggiornati sugli ultimi eventi. Il canale viene aggiornato frequentemente e l'host ha un entusiasmo e una positività contagiosi in tutti gli argomenti trattati. Aspettatevi una copertura di lavori interessanti non solo sull'intelligenza artificiale, ma anche sulla computer grafica e altri argomenti visivamente accattivanti.
Sul suo canale YouTube, Yannick spiega nei dettagli tecnici importanti ricerche nel deep learning. Invece di leggere uno studio da soli, spesso è più facile e veloce guardare uno dei suoi video per acquisire una comprensione più approfondita di articoli importanti. Le spiegazioni trasmettono l'essenza degli articoli senza trascurare la matematica o perdersi in tre pini. Yannick condivide anche le sue opinioni su come gli studi si incastrano, quanto seriamente dovrebbero essere presi i risultati, interpretazioni più ampie e così via. I principianti (o i praticanti non accademici) trovano più difficile arrivare a queste scoperte da soli.
Con le loro stesse parole:
La ricerca sull'apprendimento automatico deve essere chiara, dinamica e vibrante. E Distill è stato creato per aiutare nella ricerca.
Distill è una pubblicazione di ricerca sull'apprendimento automatico unica. Gli articoli sono promossi con straordinarie visualizzazioni per offrire al lettore una comprensione più intuitiva degli argomenti. Il pensiero spaziale e l'immaginazione tendono a funzionare molto bene per aiutarti a comprendere gli argomenti di Machine Learning e Data Science. I formati tradizionali delle pubblicazioni, invece, tendono ad essere rigidi nella loro struttura, statici e asciutti, a volte . Chris Olah, co-creatore di Distill, mantiene anche un fantastico blog personale su . Non è stato aggiornato per molto tempo, ma rimane comunque una raccolta delle migliori spiegazioni di deep learning mai scritte. In particolare, mi ha aiutato molto LST!

Sebastian Ruder scrive un blog e una newsletter molto istruttivi, principalmente sull'intersezione di reti neurali e analisi del testo in linguaggio naturale. Dà anche molti consigli a ricercatori e relatori di conferenze, che possono essere molto utili se sei nel mondo accademico. Gli articoli di Sebastian tendono ad assumere la forma di recensioni, riassumendo e spiegando lo stato dell'arte della ricerca e dei metodi in una data area. Ciò significa che gli articoli sono estremamente utili per i professionisti che vogliono orientarsi rapidamente. Anche Sebastian scrive .
Andrei Karpaty non ha bisogno di presentazioni. Oltre ad essere uno dei più famosi ricercatori di deep learning sulla terra, crea strumenti ampiamente utilizzati come come progetti collaterali. Innumerevoli persone sono entrate in questo regno attraverso il suo corso di Stanford. , e ti sarà utile conoscerlo addestramento della rete neurale. Consiglio anche di guardarlo sui problemi reali che Tesla deve superare quando cerca di applicare l'apprendimento automatico su vasta scala nel mondo reale. Il discorso è informativo, impressionante e che fa riflettere. Oltre agli articoli sullo stesso ML, Andrey Karpaty dà per . Leggi Andrea a e .
Il blog di ingegneria di Uber è davvero impressionante in termini di scala e ampiezza di copertura, coprendo molti argomenti, in particolare . Quello che mi piace particolarmente della cultura ingegneristica di Uber è la loro tendenza a rilasciare contenuti molto interessanti e di valore open source a un ritmo vertiginoso. Ecco alcuni esempi:
- E l'elenco potrebbe continuare all'infinito... Tanto di cappello, Uber
Polemiche a parte, il blog OpenAI è innegabilmente fantastico. Di tanto in tanto, il blog pubblica contenuti e approfondimenti sul deep learning che possono arrivare solo alla scala di OpenAI: ipotetico profonda doppia discesa. Il team di OpenAI tende a postare raramente, ma si tratta di contenuti importanti.

Il blog Taboola non è così noto come alcune delle altre fonti in questo post, ma penso che sia unico: gli autori scrivono di problemi molto banali e reali quando provano ad applicare ML in produzione per un'attività "normale": meno su auto a guida autonoma e agenti RL che vincono campioni del mondo, altro su "come faccio a sapere se il mio modello ora prevede le cose con falsa sicurezza?". Questi problemi sono rilevanti per quasi tutti coloro che lavorano sul campo e ricevono meno copertura da parte della stampa rispetto ad argomenti di intelligenza artificiale più comuni, ma ci vogliono comunque talenti di livello mondiale per affrontare correttamente questi problemi. Fortunatamente, Taboola ha sia questo talento che la volontà e la capacità di scriverne in modo che anche altre persone possano imparare.
Insieme a Twitter, non c'è niente di meglio su Reddit che rimanere affascinati dalla ricerca, dagli strumenti o dalla saggezza della folla.
I post vengono pubblicati solo ogni anno, ma sono pieni di informazioni in modo molto denso. Rispetto ad altre fonti in questo elenco, questa è più accessibile agli uomini d'affari non tecnologici. Ciò che amo dei colloqui è che cercano di fornire una visione più olistica di dove si stanno dirigendo l'industria e la ricerca, unendo i progressi nell'hardware, nella ricerca, negli affari e persino nella geopolitica da una prospettiva a volo d'uccello. Assicurati di iniziare dalla fine per leggere i conflitti di interesse.
Podcast
Francamente, penso che i podcast non siano adatti per l'apprendimento di argomenti tecnici. Dopotutto, usano solo il suono per spiegare gli argomenti e la scienza dei dati è un campo molto visivo. I podcast tendono a darti una scusa per esplorare in modo più approfondito in seguito o per coinvolgere discussioni filosofiche. Tuttavia, ecco alcune raccomandazioni:
- quando parla con importanti ricercatori nel campo dell'intelligenza artificiale. Gli episodi con Francois Chollet sono particolarmente belli!
- . È bello conoscere i nuovi strumenti per l'infrastruttura dei dati.
Liste fantastiche
C'è meno da tenere d'occhio qui, ma più risorse utili una volta che sai cosa stai cercando:
Matty trova modi belli e creativi per utilizzare le reti neurali ed è divertente vedere i suoi risultati sul tuo feed Twitter. Dai almeno un'occhiata post.
Ori è solo una macchina da guidare . Scrive ampiamente di problemi e soluzioni per i data scientist. Assicurati di iscriverti per ricevere una notifica quando viene pubblicato un articolo. Il suo in particolare è davvero impressionante.
Co-fondatore di fast.ai, una fonte completa di creatività e produttività.
Hamel Hussain, ingegnere ML dello staff di Github, è impegnato a creare e creare report su molti strumenti per i programmatori nel dominio dei dati.
Creatore di Keras, adesso aggiornare la nostra comprensione di cosa sia l'intelligenza e come testarla.
Ricercatore presso Google Brain.
conclusione
Il post originale potrebbe essere aggiornato poiché l'autore trova ottime fonti di contenuti che sarebbe un peccato non includere nell'elenco. Sentiti libero di contattarlo se vuoi consigliare qualche nuova fonte! E anche DAGsHub Avvocato [ca. trad. Public Practitioner] in Data Science, quindi se crei i tuoi contenuti di Data Science, sentiti libero di scrivere all'autore del post.
Sviluppa leggendo le fonti consigliate e dal codice promozionale CARPENNA, puoi ottenere un ulteriore 10% rispetto allo sconto indicato sul banner.
Più corsi
Articoli consigliati
Fonte: habr.com
