Hva du skal lese som dataforsker i 2020

Hva du skal lese som dataforsker i 2020
I dette innlegget deler vi med deg et utvalg kilder til nyttig informasjon om Data Science fra medgründeren og CTOen til DAGsHub, et fellesskap og nettplattform for dataversjonskontroll og samarbeid mellom dataforskere og maskinlæringsingeniører. Utvalget inkluderer en rekke kilder, fra Twitter-kontoer til fullverdige ingeniørblogger, som er rettet mot de som vet nøyaktig hva de leter etter. Detaljer under kuttet.

Fra forfatteren:
Du er det du spiser, og som kunnskapsarbeider trenger du et godt informasjonskosthold. Jeg ønsker å dele informasjonskilder om datavitenskap, kunstig intelligens og relaterte teknologier som jeg finner mest nyttige eller attraktive. Jeg håper dette hjelper deg også!

To minutter papirer

En YouTube-kanal som er godt egnet til å følge med på de siste hendelsene. Kanalen oppdateres ofte og verten har en smittende entusiasme og positivitet for alle temaene som dekkes. Forvent dekning av interessant arbeid ikke bare om AI, men også om datagrafikk og andre visuelt tiltalende emner.

Yannick Kilcher

På sin YouTube-kanal forklarer Yannick betydelig forskning innen dyp læring i teknisk detalj. I stedet for å lese studien selv, er det ofte raskere og enklere å se en av videoene for å få en dypere forståelse av de viktige artiklene. Forklaringene formidler essensen av artiklene uten å neglisjere matematikk eller gå seg vill i tre furuer. Yannick deler også sitt syn på hvordan studiene henger sammen, hvor seriøst man skal ta resultatene, bredere tolkninger og mer. Det er vanskeligere for nybegynnere (eller ikke-akademiske utøvere) å komme til disse oppdagelsene på egenhånd.

Distiller.pub

Med deres egne ord:

Maskinlæringsforskning må være tydelig, dynamisk og levende. Og Distill ble opprettet for å hjelpe med forskning.

Distill er en unik publikasjon med forskning innen maskinlæring. Artikler med fantastiske visualiseringer promoteres for å gi leseren en mer intuitiv forståelse av emnene. Romlig tenkning og fantasi har en tendens til å fungere veldig bra for å hjelpe til med å forstå maskinlæring og datavitenskap. Tradisjonelle publikasjonsformater har derimot en tendens til å være stive i sin struktur, statiske og tørre, og noen ganger "matematisk". Chris Olah, en av skaperne av Distill, har også en fantastisk personlig blogg på GitHub. Den har ikke blitt oppdatert på en stund, men den er fortsatt en samling av de beste forklaringene om dyp læring som noen gang er skrevet. Spesielt hjalp det meg mye описание LSTM!

Hva du skal lese som dataforsker i 2020
kilde

Sebastian Ruder

Sebastian Ruder skriver en svært innsiktsfull blogg og et nyhetsbrev, først og fremst om skjæringspunktet mellom nevrale nettverk og tekstutvinning i naturlig språk. Han har også mange råd til forskere og konferansetalere, som kan være til stor hjelp hvis du er i akademia. Sebastians artikler har typisk form av anmeldelser, oppsummering og forklaring av dagens forskning og metoder innen et bestemt felt. Dette betyr at artiklene er ekstremt nyttige for utøvere som raskt ønsker å orientere seg. Sebastian skriver også inn Twitter.

Andrey Karpathy

Andrei Karpathy trenger ingen introduksjon. I tillegg til å være en av de mest kjente dyplæringsforskerne på jorden, lager han mye brukte verktøy, f.eks. arxiv fornuftsbevarende som sideprosjekter. Utallige mennesker har gått inn på dette feltet gjennom Stanford-kurset hans cs231n, og det vil være nyttig for deg å vite det oppskrift nevrale nettverkstrening. Jeg anbefaler også å se den tale om de virkelige utfordringene Tesla må overvinne når de prøver å bruke maskinlæring i masseskala i den virkelige verden. Talen er informativ, imponerende og nøkternt. I tillegg til artikler om ML selv, gir Andrei Karpathy gode livsråd for ambisiøse forskere. Les Andrey inn Twitter og Github.

Uber Engineering

Ubers ingeniørblogg er virkelig imponerende i sin omfang og bredde av dekning, og dekker mange emner, spesielt Kunstig intelligens. Det jeg liker spesielt godt med Ubers ingeniørkultur er deres tendens til å produsere veldig interessant og verdifullt Prosjekter åpen kildekode i et forrykende tempo. Her er noen eksempler:

OpenAI-blogg

Kontroverser til side, OpenAIs blogg er unektelig fantastisk. Fra tid til annen legger bloggen ut innhold og ideer om dyp læring som bare kan komme på skalaen til OpenAI: Hypotetical fenomen dyp dobbel nedstigning. OpenAI-teamet har en tendens til å poste sjeldne, men dette er viktige ting.

Hva du skal lese som dataforsker i 2020
kilde

Taboola-bloggen

Taboola-bloggen er ikke like kjent som noen av de andre kildene i dette innlegget, men jeg tror den er unik - forfatterne skriver om veldig jordnære, virkelige problemer når de prøver å bruke ML i produksjon for "normale " bedrifter: mindre om selvkjørende biler og RL-agenter som vinner verdensmestere, mer om "hvordan vet jeg at modellen min nå forutsier ting med falsk selvtillit?" Disse problemene er relevante for nesten alle som jobber i feltet, og de får mindre pressedekning enn mer vanlige AI-temaer, men det krever fortsatt talent i verdensklasse for å løse disse problemene riktig. Heldigvis har Taboola både dette talentet og viljen og evnen til å skrive om det slik at andre mennesker også kan lære.

Reddit

Sammen med Twitter er det ingenting som er bedre på Reddit enn å bli hekta på forskning, verktøy eller visdommen til mengden.

Statens AI

Innlegg publiseres kun årlig, men er fylt med svært tett informasjon. Sammenlignet med andre kilder på denne listen, er denne mer tilgjengelig for ikke-teknologiske forretningsfolk. Det jeg liker med samtalene er at de prøver å gi et mer helhetlig syn på hvor industrien og forskningen er på vei, og knytter sammen fremskritt innen maskinvare, forskning, næringsliv og til og med geopolitikk fra et fugleperspektiv. Sørg for å begynne på slutten for å lese om interessekonflikter.

Podcaster

Ærlig talt synes jeg podcaster er dårlig egnet for å utforske tekniske emner. Tross alt bruker de kun lyd for å forklare emner, og datavitenskap er et veldig visuelt felt. Podcaster har en tendens til å gi deg en unnskyldning for å gjøre mer dyptgående research senere eller ha noen fascinerende filosofiske diskusjoner. Men her er noen anbefalinger:

Fantastiske lister

Det er mindre å holde styr på her, men flere ressurser som er nyttige når du vet hva du leter etter:

Twitter

  • Matty Marianski
    Matty finner vakre, kreative måter å bruke nevrale nettverk på, og det er bare gøy å se resultatene hans på Twitter-feeden din. Ta i det minste en titt på dette poste.
  • Ori Cohen
    Ori er bare en kjøremaskin blogger. Han skriver mye om problemer og løsninger for dataforskere. Sørg for å abonnere for å bli varslet når en artikkel publiseres. Hans samling, spesielt, er virkelig imponerende.
  • Jeremy Howard
    Medgründer av fast.ai, en omfattende kilde til kreativitet og produktivitet.
  • Hamel Hussein
    En ansatt ML-ingeniør hos Github, Hamel Hussain er opptatt med å lage og rapportere om mange verktøy for datakodere.
  • Francois Chollet
    Skaperen av Keras, nå prøver å oppdater vår forståelse av hva intelligens er og hvordan man kan teste den.
  • Hardmaru
    Forsker ved Google Brain.

Konklusjon

Det originale innlegget kan bli oppdatert ettersom forfatteren finner gode innholdskilder som det ville være synd å ikke inkludere på listen. Ta gjerne kontakt med ham på Twitter, hvis du vil anbefale en ny kilde! Og også DAGsHub ansetter Advokat [ca. oversettelse offentlig utøver] i Data Science, så hvis du lager ditt eget Data Science-innhold, kan du gjerne skrive til forfatteren av innlegget.

Hva du skal lese som dataforsker i 2020
Utvikle deg selv ved å lese anbefalte kilder og bruke kampanjekoden HORNBEAM, kan du få ytterligere 10 % til rabatten som er angitt på banneret.

Flere kurs

Utvalgte artikler

Kilde: www.habr.com