Hvad skal man læse som dataforsker i 2020

Hvad skal man læse som dataforsker i 2020
I dette indlæg deler vi et udvalg af kilder til nyttig information om Data Science fra medstifteren og CTO'en af ​​DAGsHub, et fællesskab og webplatform til dataversionskontrol og samarbejde mellem datavidenskabsfolk og maskinlæringsingeniører. Udvalget omfatter en række forskellige kilder, fra Twitter-konti til fuldgyldige ingeniørblogs, som er målrettet dem, der ved præcis, hvad de leder efter. Detaljer under snittet.

Fra forfatteren:
Du er, hvad du spiser, og som vidensarbejder har du brug for en god informativ kost. Jeg vil gerne dele informationskilder om Data Science, kunstig intelligens og relaterede teknologier, som jeg finder mest nyttige eller attraktive. Jeg håber, at dette også hjælper dig!

To minutter papirer

En YouTube-kanal, der er velegnet til at holde sig ajour med de seneste begivenheder. Kanalen opdateres hyppigt, og værten har en smittende entusiasme og positivitet i alle emner, der behandles. Forvent dækning af interessant arbejde, ikke kun om AI, men også om computergrafik og andre visuelt tiltalende emner.

Yannick Kilcher

På sin YouTube-kanal forklarer Yannick betydelig forskning i dyb læring i tekniske detaljer. I stedet for at læse en undersøgelse på egen hånd, er det ofte hurtigere og nemmere at se en af ​​dens videoer for at få en dybere forståelse af vigtige artikler. Forklaringerne formidler essensen af ​​artiklerne uden at negligere matematikken eller fare vild i tre fyrretræer. Yannick deler også sine synspunkter om, hvordan undersøgelser hænger sammen, hvor seriøst resultater bør tages, bredere fortolkninger og så videre. Begyndere (eller ikke-akademiske praktikere) finder det sværere at komme til disse opdagelser på egen hånd.

destiller.pub

Med deres egne ord:

Maskinlæringsforskning skal være klar, dynamisk og levende. Og Distill blev skabt for at hjælpe med forskning.

Distill er en unik maskinlæringsforskningspublikation. Artikler promoveres med fantastiske visualiseringer for at give læseren en mere intuitiv forståelse af emnerne. Rumlig tænkning og fantasi har en tendens til at fungere meget godt til at hjælpe dig med at forstå Machine Learning og Data Science-emner. Traditionelle publikationsformater har på den anden side tendens til at være stive i deres struktur, statiske og tørre, og nogle gange "matematisk". Chris Olah, medskaber af Distill, vedligeholder også en fantastisk personlig blog på GitHub. Det er ikke blevet opdateret i lang tid, men er stadig en samling af de bedste deep learning-forklaringer, der nogensinde er skrevet. Især hjalp det mig meget описание LSTM!

Hvad skal man læse som dataforsker i 2020
kilde

Sebastian Ruder

Sebastian Ruder skriver en meget informativ blog og nyhedsbrev, primært om skæringspunktet mellem neurale netværk og naturligt sprogtekstanalyse. Han giver også en masse råd til forskere og konferencetalere, som kan være meget nyttige, hvis du er i den akademiske verden. Sebastians artikler har en tendens til at tage form af anmeldelser, der opsummerer og forklarer det nyeste inden for forskning og metoder inden for et givent område. Det betyder, at artiklerne er yderst brugbare for praktikere, der gerne vil have styr på det hurtigt. Sebastian skriver også ind Twitter.

Andrey Karpaty

Andrei Karpaty behøver ingen introduktion. Udover at være en af ​​de mest kendte deep learning-forskere på jorden, skaber han meget brugte værktøjer som f.eks arkivfornuftsbevarende som sideprojekter. Utallige mennesker kom ind i dette rige gennem hans Stanford-kursus. cs231n, og det vil være nyttigt for dig at vide det opskrift træning i neurale netværk. Jeg anbefaler også at se den tale om de reelle problemer, som Tesla skal overvinde, når de forsøger at anvende maskinlæring i massiv skala i den virkelige verden. Talen er informativ, imponerende og nøgtern. Udover artikler om selve ML giver Andrey Karpaty gode råd til livet for ambitiøse videnskabsmænd. Læs Andrew på Twitter og Github.

Uber Engineering

Uber-ingeniørbloggen er virkelig imponerende med hensyn til skala og bredde af dækning og dækker en masse emner, især Kunstig intelligens. Det, jeg især godt kan lide ved Ubers ingeniørkultur, er deres tendens til at udgive meget interessant og værdifuldt Projekter open source i et hæsblæsende tempo. Her er nogle eksempler:

OpenAI blog

Kontrovers til side er OpenAI-bloggen unægtelig fantastisk. Fra tid til anden poster bloggen indhold og indsigt om dyb læring, der kun kan komme på skalaen af ​​OpenAI: hypotetisk fænomen dyb dobbelt nedstigning. OpenAI-teamet har en tendens til at poste sjældent, men disse er vigtigt indhold.

Hvad skal man læse som dataforsker i 2020
kilde

Taboola blog

Taboola-bloggen er ikke så kendt som nogle af de andre kilder i dette indlæg, men jeg synes, den er unik - forfatterne skriver om meget hverdagsagtige, reelle problemer, når de forsøger at anvende ML i produktionen til en "normal" virksomhed: mindre om selvkørende biler og RL-agenter, der vinder verdensmestre, mere om "hvordan ved jeg, om min model nu forudsiger ting med falsk selvtillid?". Disse spørgsmål er relevante for næsten alle, der arbejder i feltet, og modtager mindre pressedækning end mere almindelige AI-emner, men det kræver stadig verdensklasse talent at løse disse problemer ordentligt. Heldigvis har Taboola både dette talent og viljen og evnen til at skrive om det, så andre mennesker også kan lære.

Reddit

Sammen med Twitter er der intet bedre på Reddit end at blive hooked på mængdens forskning, værktøjer eller visdom.

AI tilstand

Indlæg udgives kun årligt, men fyldt med information meget tæt. Sammenlignet med andre kilder på denne liste er denne mere tilgængelig for ikke-teknologiske forretningsfolk. Det, jeg elsker ved foredragene, er, at de forsøger at give et mere holistisk syn på, hvor industrien og forskningen er på vej hen, ved at binde sammen fremskridt inden for hardware, forskning, forretning og endda geopolitik fra et fugleperspektiv. Sørg for at starte til sidst for at læse om interessekonflikter.

Podcasts

Helt ærligt tror jeg, at podcasts er dårligt egnede til at lære om tekniske emner. De bruger jo kun lyd til at forklare emner, og datavidenskab er et meget visuelt felt. Podcasts plejer at give dig en undskyldning for at udforske mere i dybden senere eller for at engagere filosofiske diskussioner. Men her er nogle anbefalinger:

  • lex friedman podcastnår han taler med fremtrædende forskere inden for kunstig intelligens. Episoder med Francois Chollet er særligt gode!
  • Data Engineering podcast. Dejligt at høre om nye datainfrastrukturværktøjer.

Fantastiske lister

Der er mindre at holde øje med her, men flere ressourcer, der er nyttige, når du ved, hvad du leder efter:

Twitter

  • Matty Mariansky
    Matty finder smukke, kreative måder at bruge neurale netværk på, og det er bare sjovt at se hans resultater på dit Twitter-feed. Tag et kig i det mindste dette sende.
  • Ori Cohen
    Ori er bare en køremaskine blogs. Han skriver meget om problemer og løsninger for data scientists. Sørg for at abonnere for at få besked, når en artikel er publiceret. Hans samlingisær er virkelig imponerende.
  • Jeremy Howard
    Medstifter af fast.ai, en omfattende kilde til kreativitet og produktivitet.
  • Hamel Hussein
    Hamel Hussain, som er ML-ingeniør hos Github, har travlt med at skabe og rapportere om mange værktøjer til kodere i datadomænet.
  • François Chollet
    Skaberen af ​​Keras, nu forsøger at opdatere vores forståelse af, hvad intelligens er, og hvordan man tester det.
  • hardmaru
    Forsker ved Google Brain.

Konklusion

Det originale indlæg kan blive opdateret, da forfatteren finder gode kilder til indhold, som det ville være en skam ikke at inkludere på listen. Kontakt ham gerne Twitterhvis du vil anbefale en ny kilde! Og også DAGsHub ansætter Advokat [ca. overs. Public Practitioner] i Data Science, så hvis du opretter dit eget Data Science-indhold, er du velkommen til at skrive til forfatteren af ​​indlægget.

Hvad skal man læse som dataforsker i 2020
Udvikl ved at læse de anbefalede kilder og ved hjælp af kampagnekoden HABR, kan du få yderligere 10% til rabatten angivet på banneret.

Flere kurser

Udvalgte artikler

Kilde: www.habr.com