Vad man ska läsa som dataforskare 2020

Vad man ska läsa som dataforskare 2020
I det här inlägget delar vi med dig ett urval av källor till användbar information om Data Science från medgrundaren och CTO för DAGsHub, en community och webbplattform för dataversionskontroll och samarbete mellan datavetare och maskininlärningsingenjörer. Urvalet innehåller en mängd olika källor, från Twitter-konton till fullfjädrade ingenjörsbloggar, som riktar sig till dem som vet exakt vad de letar efter. Detaljer under snittet.

Från författaren:
Du är vad du äter och som kunskapsarbetare behöver du en bra informationskost. Jag vill dela med mig av informationskällor om datavetenskap, artificiell intelligens och relaterade teknologier som jag tycker är mest användbara eller attraktiva. Jag hoppas att detta hjälper dig också!

Två minutspapper

En YouTube-kanal som är väl lämpad för att hänga med i de senaste händelserna. Kanalen uppdateras ofta och värden har en smittande entusiasm och positivitet för alla ämnen som tas upp. Förvänta dig bevakning av intressant arbete inte bara om AI, utan också om datorgrafik och andra visuellt tilltalande ämnen.

Yannick Kilcher

På sin YouTube-kanal förklarar Yannick betydande forskning inom djupinlärning i teknisk detalj. Istället för att läsa en studie på egen hand är det ofta snabbare och lättare att titta på en av dess videor för att få en djupare förståelse för viktiga artiklar. Förklaringarna förmedlar essensen av artiklarna utan att försumma matematiken eller gå vilse i tre tallar. Yannick delar också med sig av sina synpunkter på hur studier hänger ihop, hur seriöst resultat bör tas, bredare tolkningar osv. Nybörjare (eller icke-akademiska utövare) har svårare att komma till dessa upptäckter på egen hand.

Distiller.pub

Med deras egna ord:

Forskning om maskininlärning måste vara tydlig, dynamisk och levande. Och Distill skapades för att hjälpa till med forskning.

Distill är en unik forskningspublikation för maskininlärning. Artiklar marknadsförs med fantastiska visualiseringar för att ge läsaren en mer intuitiv förståelse av ämnena. Rumsligt tänkande och fantasi tenderar att fungera mycket bra för att hjälpa dig förstå maskininlärning och datavetenskap. Traditionella publikationsformat å andra sidan tenderar att vara stela i sin struktur, statiska och torra, och ibland "matematisk". Chris Olah, medskapare av Distill, har också en fantastisk personlig blogg på GitHub. Det har inte uppdaterats på ett tag, men det är fortfarande en samling av de bästa förklaringarna om ämnet djupinlärning som någonsin skrivits. Framför allt hjälpte det mig mycket описание LSTM!

Vad man ska läsa som dataforskare 2020
källa

Sebastian Ruder

Sebastian Ruder skriver en mycket insiktsfull blogg och ett nyhetsbrev, främst om skärningspunkten mellan neurala nätverk och textutvinning av naturligt språk. Han har också många råd till forskare och konferensföreläsare, som kan vara till stor hjälp om du befinner dig i akademin. Sebastians artiklar tar vanligtvis formen av översikter, som sammanfattar och förklarar läget för aktuell forskning och metoder inom ett visst område. Det betyder att artiklarna är oerhört användbara för utövare som snabbt vill få koll. Sebastian skriver också in Twitter.

Andrey Karpathy

Andrei Karpathy behöver ingen presentation. Förutom att vara en av de mest kända djupinlärningsforskarna på jorden skapar han flitigt använda verktyg, t.ex. arxiv förnuftsbevarare som sidoprojekt. Otaliga människor har kommit in på detta område genom hans Stanford-kurs cs231n, och det kommer att vara användbart för dig att veta det receptet utbildning i neurala nätverk. Jag rekommenderar också att se den tal om de verkliga problemen som Tesla måste övervinna när man försöker tillämpa maskininlärning i massiv skala i den verkliga världen. Tal är informativt, imponerande och nykter. Förutom artiklar om ML själv, ger Andrey Karpaty bra livsråd för ambitiösa forskare. Läs Andrew på Twitter och Github.

Uber Engineering

Ubers ingenjörsblogg är verkligen imponerande i sin omfattning och bredd av täckning, som täcker många ämnen, särskilt Artificiell intelligens. Det jag speciellt gillar med Ubers ingenjörskultur är deras tendens att släppa mycket intressant och värdefullt Projekt öppen källkod i en rasande takt. Här är några exempel:

OpenAI-blogg

Bortsett från kontroverser är OpenAI:s blogg onekligen underbar. Då och då publicerar bloggen innehåll och idéer om djupinlärning som bara kan komma i skalan av OpenAI: Hypotetical fenomen djup dubbel nedstigning. OpenAI-teamet brukar göra inlägg sällan, men det här är viktigt innehåll.

Vad man ska läsa som dataforskare 2020
källa

Taboola blogg

Taboola-bloggen är inte lika känd som några av de andra källorna i det här inlägget, men jag tycker att den är unik – författarna skriver om väldigt vardagliga, verkliga problem när de försöker tillämpa ML i produktionen för en "normal" verksamhet: mindre om självkörande bilar och RL-agenter som vinner världsmästare, mer om "hur vet jag om min modell nu förutspår saker med falskt självförtroende?". Dessa frågor är relevanta för nästan alla som arbetar inom fältet och får mindre pressbevakning än vanligare AI-ämnen, men det krävs fortfarande talang i världsklass för att ta itu med dessa frågor på rätt sätt. Som tur är har Taboola både denna talang och viljan och förmågan att skriva om den så att andra människor också kan lära sig.

reddit

Tillsammans med Twitter finns det inget bättre på Reddit än att fastna för forskning, verktyg eller publikens visdom.

Tillstånd av AI

Inlägg publiceras endast årligen, men fyllda med information mycket tätt. Jämfört med andra källor på den här listan är den här mer tillgänglig för icke-tekniska affärsmän. Det jag älskar med samtalen är att de försöker ge en mer holistisk bild av vart industrin och forskningen är på väg, genom att knyta samman framsteg inom hårdvara, forskning, affärer och till och med geopolitik ur ett fågelperspektiv. Se till att börja i slutet för att läsa om intressekonflikter.

Poddsändningar

Ärligt talat tycker jag att poddar är dåligt lämpade för att utforska tekniska ämnen. När allt kommer omkring använder de bara ljud för att förklara ämnen, och datavetenskap är ett väldigt visuellt fält. Podcaster tenderar att ge dig en ursäkt att göra mer djupgående research senare eller ha några fascinerande filosofiska diskussioner. Men här är några rekommendationer:

Fantastiska listor

Det finns mindre att hålla reda på här, men fler resurser som är användbara när du vet vad du letar efter:

Twitter

  • Matty Marianski
    Matty hittar vackra, kreativa sätt att använda neurala nätverk, och det är bara roligt att se hans resultat på ditt Twitter-flöde. Ta åtminstone en titt på detta inlägg.
  • Ori Cohen
    Ori är bara en körmaskin bloggar. Han skriver mycket om problem och lösningar för datavetare. Se till att prenumerera för att bli meddelad när en artikel publiceras. Hans samling, i synnerhet, är verkligen imponerande.
  • Jeremy Howard
    Medgrundare av fast.ai, en omfattande källa till kreativitet och produktivitet.
  • Hamel Hussein
    En ML-ingenjör på Github, Hamel Hussain är upptagen med att skapa och rapportera om många verktyg för datakodare.
  • Francois Chollet
    Skapare av Keras, nu försöker att uppdatera vår förståelse av vad intelligens är och hur man testar den.
  • Hardmaru
    Forskare på Google Brain.

Slutsats

Det ursprungliga inlägget kan komma att uppdateras eftersom författaren hittar bra innehållskällor som det skulle vara synd att inte ta med i listan. Kontakta honom gärna Twitter, om du vill rekommendera en ny källa! Och även DAGsHub anställer Advokat [ca. transl. Public Practitioner] i Data Science, så om du skapar ditt eget Data Science-innehåll, skriv gärna till författaren av inlägget.

Vad man ska läsa som dataforskare 2020
Utveckla dig själv genom att läsa rekommenderade källor och använda kampanjkoden HABR, kan du få ytterligare 10 % till rabatten som anges på bannern.

Fler kurser

Utvalda artiklar

Källa: will.com