Ce să citești ca cercetător de date în 2020

Ce să citești ca cercetător de date în 2020
În această postare, vă împărtășim o selecție de surse de informații utile despre Data Science de la co-fondatorul și CTO al DAGsHub, o comunitate și o platformă web pentru controlul versiunilor de date și colaborarea între oamenii de știință ai datelor și inginerii de învățare automată. Selecția include o varietate de surse, de la conturi Twitter la bloguri de inginerie cu drepturi depline, care sunt adresate celor care știu exact ce caută. Detalii sub croiala.

De la autor:
Ești ceea ce mănânci și, în calitate de lucrător al cunoștințelor, ai nevoie de o dietă informațională bună. Doresc să împărtășesc surse de informații despre Data Science, inteligența artificială și tehnologiile conexe pe care le consider cele mai utile sau atractive. Sper ca asta sa te ajute si pe tine!

Două lucrări de minut

Un canal YouTube care este potrivit pentru a fi la curent cu cele mai recente evenimente. Canalul este actualizat frecvent, iar gazda are un entuziasm și o pozitivitate molipsitoare în toate subiectele abordate. Așteptați-vă acoperirea unor lucrări interesante nu numai despre AI, ci și despre grafica computerizată și alte subiecte atractive din punct de vedere vizual.

Yannick Kilcher

Pe canalul său de YouTube, Yannick explică cercetările semnificative în deep learning în detalii tehnice. În loc să citiți singur un studiu, este adesea mai rapid și mai ușor să vizionați unul dintre videoclipurile acestuia pentru a obține o înțelegere mai profundă a articolelor importante. Explicațiile transmit esența articolelor fără a neglija matematica sau a se pierde în trei pini. De asemenea, Yannick își împărtășește părerile despre modul în care studiile se potrivesc, cât de serios ar trebui luate rezultatele, interpretări mai ample și așa mai departe. Începătorilor (sau practicienilor non-universitari) le este mai greu să ajungă singuri la aceste descoperiri.

distila.pub

Cu propriile lor cuvinte:

Cercetarea învățării automate trebuie să fie clară, dinamică și vibrantă. Iar Distill a fost creat pentru a ajuta la cercetare.

Distill este o publicație unică de cercetare a învățării automate. Articolele sunt promovate cu vizualizări uimitoare pentru a oferi cititorului o înțelegere mai intuitivă a subiectelor. Gândirea spațială și imaginația tind să funcționeze foarte bine pentru a vă ajuta să înțelegeți subiectele de învățare automată și știința datelor. Formatele tradiționale de publicare, pe de altă parte, tind să fie rigide în structura lor, statice și uscate și uneori "matematic". Chris Olah, co-creatorul Distill, menține și un blog personal uimitor la GitHub. Nu a fost actualizat de mult timp, dar rămâne totuși o colecție a celor mai bune explicații de deep learning scrise vreodată. În special, m-a ajutat foarte mult описание LSTM!

Ce să citești ca cercetător de date în 2020
sursă

Sebastian Ruder

Sebastian Ruder scrie un blog și un buletin informativ foarte informativ, în primul rând despre intersecția rețelelor neuronale și analiza textului în limbaj natural. De asemenea, oferă o mulțime de sfaturi cercetătorilor și vorbitorilor de conferințe, ceea ce poate fi de mare ajutor dacă sunteți în mediul academic. Articolele lui Sebastian tind să ia forma unor recenzii, care rezumă și explică stadiul tehnicii în cercetare și metode într-un anumit domeniu. Aceasta înseamnă că articolele sunt extrem de utile pentru practicanții care doresc să se orienteze rapid. Sebastian scrie și în Twitter.

Andrei Karpaty

Andrei Karpaty nu are nevoie de prezentare. Pe lângă faptul că este unul dintre cei mai renumiți cercetători de învățare profundă de pe pământ, el creează instrumente utilizate pe scară largă, cum ar fi arhiva sanity conservator ca proiecte secundare. Nenumărați oameni au intrat în acest tărâm prin cursul său de la Stanford. cs231n, și îți va fi de folos să-l cunoști rețetă antrenamentul rețelei neuronale. Recomand și vizionarea lui vorbire despre problemele reale pe care Tesla trebuie să le depășească atunci când încearcă să aplice învățarea automată la scară masivă în lumea reală. Discursul este informativ, impresionant și reducător. Pe lângă articole despre ML în sine, Andrey Karpaty oferă sfaturi bune de viata pentru oameni de știință ambițioși. Citește Andrew la Twitter și Github.

Uber Engineering

Blogul de inginerie Uber este cu adevărat impresionant în ceea ce privește amploarea și amploarea acoperirii, acoperind o mulțime de subiecte, în special Inteligență artificială. Ceea ce îmi place în special la cultura inginerească a Uber este tendința lor de a lansa produse foarte interesante și valoroase Proiecte sursă deschisă într-un ritm vertiginos. Aici sunt cateva exemple:

Blog OpenAI

Lăsând la o parte controversele, blogul OpenAI este incontestabil grozav. Din când în când, blogul postează conținut și perspective despre învățarea profundă care pot veni doar la scara OpenAI: ipotetice fenomen coborâre dublă adâncă. Echipa OpenAI tinde să posteze rar, dar acestea sunt conținut important.

Ce să citești ca cercetător de date în 2020
sursă

Taboola Blog

Blogul Taboola nu este la fel de cunoscut ca unele dintre celelalte surse din această postare, dar cred că este unic - autorii scriu despre probleme foarte banale, reale atunci când încearcă să aplice ML în producție pentru o afacere „normală”: mai puțin despre mașini cu conducere autonomă și agenți RL câștigând campioni mondiali, mai multe despre „cum știu dacă modelul meu prezice acum lucrurile cu o încredere falsă?”. Aceste probleme sunt relevante pentru aproape toți cei care lucrează în domeniu și primesc mai puțină acoperire de presă decât subiectele AI mai obișnuite, dar este nevoie totuși de talent de talie mondială pentru a aborda în mod corespunzător aceste probleme. Din fericire, Taboola are atât acest talent, cât și dorința și capacitatea de a scrie despre el, astfel încât și alții să poată învăța.

Reddit

Alături de Twitter, nu există nimic mai bun pe Reddit decât să fii cuplat de cercetarea, instrumentele sau înțelepciunea mulțimii.

Starea AI

Postările sunt publicate doar anual, dar pline cu informații foarte dens. În comparație cu alte surse din această listă, aceasta este mai accesibilă oamenilor de afaceri non-tech. Ceea ce îmi place la discuții este că încearcă să ofere o viziune mai holistică asupra direcției în care se îndreaptă industria și cercetarea, legând împreună progresele în hardware, cercetare, afaceri și chiar geopolitică dintr-o perspectivă de ochi. Asigurați-vă că începeți de la sfârșit pentru a citi despre conflictele de interese.

Podcast-uri

Sincer, cred că podcasturile nu sunt potrivite pentru a învăța despre subiecte tehnice. La urma urmei, folosesc doar sunetul pentru a explica subiecte, iar știința datelor este un domeniu foarte vizual. Podcast-urile tind să vă ofere o scuză pentru a explora mai în profunzime mai târziu sau pentru a antrena discuții filozofice. Cu toate acestea, iată câteva recomandări:

  • podcast lex friedmancând vorbește cu cercetători de seamă din domeniul inteligenței artificiale. Episoadele cu Francois Chollet sunt deosebit de bune!
  • Podcast de inginerie a datelor. Mă bucur să aud despre noile instrumente de infrastructură de date.

Liste grozave

Există mai puține lucruri de urmărit aici, dar mai multe resurse care vă sunt utile odată ce știți ce căutați:

Twitter

  • Matty Mariansky
    Matty găsește modalități frumoase și creative de a folosi rețelele neuronale și este doar distractiv să-i vezi rezultatele pe feedul tău Twitter. Aruncă o privire măcar acest posta.
  • Ori Cohen
    Ori este doar o mașină de conducere bloguri. El scrie pe larg despre probleme și soluții pentru oamenii de știință de date. Asigurați-vă că vă abonați pentru a fi anunțat când un articol este publicat. A lui colectareîn special este cu adevărat impresionant.
  • Jeremy Howard
    Co-fondator al fast.ai, o sursă cuprinzătoare de creativitate și productivitate.
  • Hamel Hussein
    Un inginer ML personal la Github, Hamel Hussain este ocupat la muncă creând și raportând multe instrumente pentru programatori din domeniul datelor.
  • François Chollet
    Creatorul Keras, acum incercand sa actualizați înțelegerea noastră despre ce este inteligența și cum să o testăm.
  • hardmaru
    Cercetător la Google Brain.

Concluzie

Postarea originală poate fi actualizată, deoarece autorul găsește surse grozave de conținut pe care ar fi păcat să nu le includă în listă. Simțiți-vă liber să-l contactați Twitterdacă doriți să recomandați o sursă nouă! Și, de asemenea, DAGsHub angajează avocat [aprox. transl. Public Practitioner] în Data Science, așa că dacă vă creați propriul conținut Data Science, nu ezitați să scrieți autorului postării.

Ce să citești ca cercetător de date în 2020
Dezvoltați citind sursele recomandate și după codul promoțional HABR, puteți obține un suplimentar de 10% la reducerea indicată pe banner.

Mai multe cursuri

Articole Promovate

Sursa: www.habr.com