Wat om te lees as 'n datawetenskaplike in 2020

Wat om te lees as 'n datawetenskaplike in 2020
In hierdie pos deel ons 'n seleksie van bronne van nuttige inligting oor Data Science van die medestigter en CTO van DAGsHub, 'n gemeenskap en webplatform vir dataweergawebeheer en samewerking tussen datawetenskaplikes en masjienleeringenieurs. Die keuse sluit 'n verskeidenheid bronne in, van Twitter-rekeninge tot volwaardige ingenieursblogs, wat gemik is op diegene wat presies weet waarna hulle soek. Besonderhede onder die snit.

Van die skrywer:
Jy is wat jy eet, en as kenniswerker het jy ’n goeie inligtingdieet nodig. Ek wil bronne van inligting deel oor Datawetenskap, Kunsmatige Intelligensie en verwante tegnologieë wat ek die nuttigste of aantreklikste vind. Ek hoop dit help jou ook!

Twee minute vraestelle

'n YouTube-kanaal wat goed geskik is om tred te hou met die nuutste gebeure. Die kanaal word gereeld opgedateer en die gasheer het 'n aansteeklike entoesiasme en positiwiteit vir al die onderwerpe wat gedek word. Verwag dekking van interessante werk nie net oor KI nie, maar ook oor rekenaargrafika en ander visueel aantreklike onderwerpe.

Yannick Kilcher

Op sy YouTube-kanaal verduidelik Yannick betekenisvolle navorsing oor diep leer in tegniese detail. In plaas daarvan om self die studie te lees, is dit dikwels vinniger en makliker om een ​​van sy video's te kyk om 'n dieper begrip van die belangrike artikels te kry. Die verduidelikings dra die essensie van die artikels oor sonder om wiskunde af te skeep of in drie denne te verdwaal. Yannick deel ook sy siening oor hoe die studies bymekaar pas, hoe ernstig om die resultate op te neem, breër interpretasies, en meer. Dit is moeiliker vir beginners (of nie-akademiese praktisyns) om op hul eie tot hierdie ontdekkings te kom.

distilleer.pub

In hul eie woorde:

Masjienleernavorsing moet duidelik, dinamies en lewendig wees. En Distill is geskep om te help met navorsing.

Distill is 'n unieke publikasie met navorsing op die gebied van masjienleer. Artikels met pragtige visualiserings word bevorder om die leser 'n meer intuïtiewe begrip van die onderwerpe te gee. Ruimtelike denke en verbeelding is geneig om baie goed te werk om masjienleer en datawetenskaponderwerpe te help verstaan. Tradisionele publikasieformate, aan die ander kant, is geneig om rigied in hul struktuur te wees, staties en droog, en soms "wiskundig". Chris Olah, een van die skeppers van Distill, het ook 'n wonderlike persoonlike blog by GitHub. Dit is 'n ruk lank nie bygewerk nie, maar dit bly steeds 'n versameling van die beste verduidelikings oor die onderwerp van diepleer wat ooit geskryf is. Dit het my veral baie gehelp beskrywing LSTM!

Wat om te lees as 'n datawetenskaplike in 2020
bron

Sebastian Ruder

Sebastian Ruder skryf 'n baie insiggewende blog en nuusbrief, hoofsaaklik oor die kruising van neurale netwerke en natuurlike taal-teksontginning. Hy het ook baie raad vir navorsers en konferensiesprekers, wat baie nuttig kan wees as jy in die akademie is. Sebastian se artikels neem tipies die vorm aan van resensies, wat die stand van huidige navorsing en metodes in 'n bepaalde veld opsom en verduidelik. Dit beteken dat die artikels uiters nuttig is vir praktisyns wat vinnig hul ore wil kry. Sebastian skryf ook in Twitter.

Andrey Karpathy

Andrei Karpathy het geen bekendstelling nodig nie. Benewens die feit dat hy een van die bekendste diepleer-navorsers op aarde is, skep hy wyd gebruikte gereedskap, bv. arxiv gesonde verstand bewaarder as byprojekte. Talle mense het hierdie veld betree deur sy Stanford-kursus cs231n, en dit sal nuttig wees vir jou om dit te weet resep neurale netwerk opleiding. Ek beveel ook aan om daarna te kyk toespraak oor die werklike uitdagings wat Tesla moet oorkom wanneer hy probeer om masjienleer op 'n massaskaal in die regte wêreld toe te pas. Die toespraak is insiggewend, indrukwekkend en ontnugterend. Benewens artikels oor ML self, gee Andrei Karpathy goeie lewensadvies vir ambisieuse wetenskaplikes. Lees Andrey in Twitter en GitHub.

Uber Ingenieurswese

Die Uber-ingenieursblog is werklik indrukwekkend in sy omvang en breedte van dekking, wat baie onderwerpe dek, veral Kunsmatige intelligensie. Wat ek veral van Uber se ingenieurskultuur hou, is hul neiging om baie interessant en waardevol te produseer projekte oopbron teen 'n yslike pas. Hier is 'n paar voorbeelde:

OpenAI Blog

Kontroversies ter syde, OpenAI se blog is onteenseglik wonderlik. Van tyd tot tyd plaas die blog inhoud en idees oor diep leer wat net op die skaal van OpenAI: Hipoteties kan kom verskynsel diep dubbele afkoms. Die OpenAI-span is geneig om selde te plaas, maar dit is belangrike dinge.

Wat om te lees as 'n datawetenskaplike in 2020
bron

Taboola Blog

Die Taboola-blog is nie so bekend soos sommige van die ander bronne in hierdie pos nie, maar ek dink dit is uniek - die skrywers skryf oor baie plat-op-die-aarde, werklike probleme wanneer hulle probeer om ML in vervaardiging toe te pas vir "normale" " besighede: minder oor selfbesturende motors en RL-agente wat wêreldkampioene wen, meer oor "hoe weet ek dat my model nou dinge met valse selfvertroue voorspel?" Hierdie probleme is relevant vir byna almal wat in die veld werk, en hulle kry minder persdekking as meer algemene KI-onderwerpe, maar dit verg steeds wêreldklastalent om hierdie probleme korrek op te los. Gelukkig het Taboola beide hierdie talent en die gewilligheid en vermoë om daaroor te skryf sodat ander mense ook kan leer.

reddit

Saam met Twitter is daar niks beter op Reddit as om verslaaf te raak aan navorsing, gereedskap of die wysheid van die skare nie.

Toestand van KI

Poste word slegs jaarliks ​​gepubliseer, maar is gevul met baie digte inligting. In vergelyking met ander bronne op hierdie lys, is hierdie een meer toeganklik vir nie-tegnologie sakelui. Wat ek van die samesprekings hou, is dat dit probeer om 'n meer holistiese siening te gee van waarheen die industrie en navorsing op pad is, deur vooruitgang in hardeware, navorsing, besigheid en selfs geopolitiek vanuit 'n voëlvlug te verbind. Maak seker dat jy aan die einde begin om te lees oor botsende belange.

Podcasts

Eerlik gesê, ek dink podcasts is swak geskik om tegniese onderwerpe te verken. Hulle gebruik immers net oudio om onderwerpe te verduidelik, en datawetenskap is 'n baie visuele veld. Poduitsendings is geneig om jou 'n verskoning te gee om later meer in-diepte navorsing te doen of 'n paar fassinerende filosofiese besprekings te hê. Hier is egter 'n paar aanbevelings:

  • Lex Friedman podcast, terwyl hy met prominente navorsers op die gebied van kunsmatige intelligensie praat. Die episodes met Francois Chollet is veral goed!
  • Data Engineering podcast. Goed om te hoor van nuwe data-infrastruktuurnutsgoed.

Awesome lyste

Hier is minder om tred te hou, maar meer hulpbronne wat nuttig is as jy weet waarna jy soek:

Twitter

  • Matty Marianski
    Matty vind pragtige, kreatiewe maniere om neurale netwerke te gebruik, en dit is net pret om sy resultate op jou Twitter-stroom te sien. Kyk darem na hierdie vinnig.
  • Ori Cohen
    Ori is net 'n bestuursmasjien blogs. Hy skryf breedvoerig oor probleme en oplossings vir datawetenskaplikes. Maak seker dat jy inteken om in kennis gestel te word wanneer 'n artikel gepubliseer word. Syne samestelling, in die besonder, is werklik indrukwekkend.
  • Jeremy Howard
    Medestigter van fast.ai, 'n omvattende bron van kreatiwiteit en produktiwiteit.
  • Hamel Hussein
    Hamel Hussain, 'n personeel-ML-ingenieur by Github, is besig om baie instrumente vir datakodeerders te skep en daaroor verslag te doen.
  • Francois Chollet
    Skepper van Keras, nou probeer om te dateer ons begrip op van wat intelligensie is en hoe om dit te toets.
  • Hardmaru
    Navorsingswetenskaplike by Google Brain.

Gevolgtrekking

Die oorspronklike plasing kan opgedateer word aangesien die skrywer goeie bronne van inhoud vind wat dit jammer sal wees om nie in die lys in te sluit nie. Kontak hom gerus by Twitter, as jy 'n nuwe bron wil aanbeveel! En ook DAGsHub huur Advokaat [ongeveer. vertaling openbare praktisyn] in Data Science, so as jy jou eie Data Science-inhoud skep, skryf gerus aan die skrywer van die plasing.

Wat om te lees as 'n datawetenskaplike in 2020
Ontwikkel jouself deur aanbevole bronne te lees en die promosiekode te gebruik HABR, kan jy 'n bykomende 10% kry tot die afslag wat op die banier aangedui word.

Meer kursusse

Uitgestalde artikels

Bron: will.com