Kaj brati kot podatkovni znanstvenik leta 2020

Kaj brati kot podatkovni znanstvenik leta 2020
V tej objavi z vami delimo izbor virov uporabnih informacij o Data Science od soustanovitelja in tehničnega direktorja DAGsHub, skupnosti in spletne platforme za nadzor različic podatkov in sodelovanje med podatkovnimi znanstveniki in inženirji strojnega učenja. Izbor vključuje različne vire, od računov Twitter do popolnih inženirskih blogov, ki so namenjeni tistim, ki točno vedo, kaj iščejo. Detajli pod krojem.

Od avtorja:
Ste, kar jeste, in kot delavec znanja potrebujete dobro informativno prehrano. Deliti želim vire informacij o podatkovni znanosti, umetni inteligenci in povezanih tehnologijah, ki se mi zdijo najbolj uporabni ali privlačni. Upam, da bo to pomagalo tudi vam!

Dvominutni prispevki

YouTube kanal, ki je zelo primeren za obveščanje o najnovejših dogodkih. Kanal se pogosto posodablja in gostitelj ima nalezljivo navdušenje in pozitivnost v vseh obravnavanih temah. Pričakujte poročanje o zanimivem delu ne le o AI, ampak tudi o računalniški grafiki in drugih vizualno privlačnih temah.

Yannick Kilcher

Yannick na svojem YouTube kanalu podrobno razlaga pomembne raziskave globokega učenja. Namesto da sami berete študijo, si je pogosto hitreje in lažje ogledati enega od njenih videoposnetkov, da bi globlje razumeli pomembne članke. Razlage podajajo bistvo člankov, ne da bi zanemarili matematiko ali se izgubili v treh borovcih. Yannick deli tudi svoje poglede na to, kako se študije ujemajo, kako resno je treba jemati rezultate, širše interpretacije itd. Začetniki (ali neakademski praktiki) do teh odkritij težje pridejo sami.

destilirati.pub

Z lastnimi besedami:

Raziskave strojnega učenja morajo biti jasne, dinamične in živahne. In Distill je bil ustvarjen za pomoč pri raziskavah.

Distill je edinstvena raziskovalna publikacija o strojnem učenju. Članki so promovirani z osupljivimi vizualizacijami, ki bralcu omogočajo bolj intuitivno razumevanje tem. Prostorsko razmišljanje in domišljija ponavadi zelo dobro delujeta pri razumevanju tem strojnega učenja in znanosti o podatkih. Po drugi strani pa so tradicionalni formati publikacij togi v svoji strukturi, statični in suhoparni ter včasih "matematični". Chris Olah, soustvarjalec Distilla, prav tako vodi neverjeten osebni blog na GitHub. Že dolgo ni bil posodobljen, a še vedno ostaja zbirka najboljših razlag globokega učenja, ki so bile kdajkoli napisane. Predvsem meni je zelo pomagalo описание LSTM!

Kaj brati kot podatkovni znanstvenik leta 2020
Vir

Sebastijan Ruder

Sebastian Ruder piše zelo informativen blog in glasilo, predvsem o presečišču nevronskih mrež in analize besedil v naravnem jeziku. Raziskovalcem in govorcem na konferencah daje tudi veliko nasvetov, kar je lahko zelo koristno, če ste v akademskem svetu. Sebastianovi članki so ponavadi v obliki recenzij, ki povzemajo in razlagajo stanje raziskav in metod na določenem področju. To pomeni, da so članki izjemno uporabni za praktike, ki se želijo hitro orientirati. Piše tudi Sebastian Twitter.

Andrej Karpati

Andrej Karpaty ne potrebuje predstavitve. Poleg tega, da je eden najbolj znanih raziskovalcev globokega učenja na svetu, ustvarja široko uporabljena orodja, kot so varovalo zdravja arhiva kot stranski projekti. Nešteto ljudi je vstopilo v to kraljestvo skozi njegov tečaj na Stanfordu. cs231n, in koristno vam bo, da ga poznate recept usposabljanje nevronske mreže. Tudi jaz priporočam ogled govor o resničnih težavah, ki jih mora Tesla premagati, ko poskuša uporabiti strojno učenje v velikem obsegu v resničnem svetu. Govor je informativen, impresiven in streznitev. Poleg člankov o samem ML daje Andrey Karpaty dober življenjski nasvet za ambiciozni znanstveniki. Preberite Andreja na Twitter in GitHub.

Uber inženiring

Inženirski blog Uber je res impresiven v smislu obsega in širine pokritosti, saj pokriva veliko tem, zlasti Umetna inteligenca. Kar mi je pri Uberjevi inženirski kulturi še posebej všeč, je njihova nagnjenost k objavljanju zelo zanimivih in dragocenih vsebin Projekti odprto kodo z vrtoglavo hitrostjo. Tukaj je nekaj primerov:

Blog OpenAI

Ne glede na polemike je blog OpenAI nedvomno odličen. Spletni dnevnik občasno objavi vsebino in vpoglede v globoko učenje, ki so lahko le na ravni OpenAI: hipotetično pojav globok dvojni spust. Ekipa OpenAI redko objavlja, vendar so to pomembne vsebine.

Kaj brati kot podatkovni znanstvenik leta 2020
Vir

Taboola blog

Blog Taboola ni tako znan kot nekateri drugi viri v tej objavi, vendar mislim, da je edinstven – avtorji pišejo o zelo vsakdanjih, resničnih težavah, ko poskušajo uporabiti ML v proizvodnji za »običajno« poslovanje: manj o samovozeči avtomobili in agenti RL, ki osvajajo svetovne prvake, več o tem, "kako naj vem, ali moj model zdaj napoveduje stvari z lažnim zaupanjem?". Ta vprašanja so pomembna za skoraj vse, ki delajo na tem področju, in so deležna manj pokritosti v medijih kot pogostejše teme umetne inteligence, vendar je še vedno potreben talent svetovnega razreda, da se pravilno spopade s temi vprašanji. Na srečo ima Taboola tako ta talent kot pripravljenost in sposobnost, da o tem piše, da se lahko tudi drugi učijo.

Reddit

Poleg Twitterja na Redditu ni nič boljšega od tega, da se zasvojite z raziskavami, orodji ali modrostjo množice.

Stanje AI

Objave so objavljene le enkrat letno, vendar zelo gosto zapolnjene z informacijami. V primerjavi z drugimi viri na tem seznamu je ta bolj dostopen poslovnežem, ki se ne ukvarjajo s tehnologijo. Kar mi je všeč pri pogovorih, je to, da poskušajo dati bolj celosten pogled na to, kam gredo industrija in raziskave, pri čemer povezujejo napredek v strojni opremi, raziskavah, poslovanju in celo geopolitiki iz ptičje perspektive. Ne pozabite začeti na koncu in brati o navzkrižju interesov.

Podcasti

Odkrito povedano, mislim, da podcasti niso primerni za učenje o tehničnih temah. Navsezadnje za razlago tem uporabljajo le zvok, podatkovna znanost pa je zelo vizualno področje. Podcasti so ponavadi izgovor za poglobljeno raziskovanje pozneje ali za zanimive filozofske razprave. Vendar je tukaj nekaj priporočil:

  • lex friedman podcastko se pogovarja z uglednimi raziskovalci na področju umetne inteligence. Epizode s Francoisom Cholletom so še posebej dobre!
  • Podcast Data Engineering. Lepo je slišati o novih orodjih podatkovne infrastrukture.

Čudoviti seznami

Tukaj je manj, na kar bi morali biti pozorni, več pa je virov, ki so v pomoč, ko veste, kaj iščete:

Twitter

  • Matty Mariansky
    Matty najde čudovite, ustvarjalne načine za uporabo nevronskih mrež in prav zabavno je videti njegove rezultate na svojem Twitterju. Poglejte vsaj ta post.
  • Ori Cohen
    Ori je samo pogonski stroj blogi. Obširno piše o problemih in rešitvah za podatkovne znanstvenike. Ne pozabite se naročiti, da boste obveščeni, ko bo članek objavljen. Njegovo kompilacijapredvsem je res impresiven.
  • Jeremy Howard
    Soustanovitelj fast.ai, celovitega vira ustvarjalnosti in produktivnosti.
  • Hamel Husein
    Hamel Hussain, zaposleni inženir ML pri Githubu, je zaposlen pri ustvarjanju in poročanju o številnih orodjih za kodirnike v podatkovni domeni.
  • François Chollet
    Ustvarjalec Kerasa, zdaj poskušati posodobiti naše razumevanje, kaj je inteligenca in kako jo preizkusiti.
  • hardmaru
    Raziskovalec pri Google Brain.

Zaključek

Prvotna objava se lahko posodobi, saj avtor najde odlične vire vsebine, ki bi jih bilo škoda ne vključiti na seznam. Kontaktirajte ga Twitterče želite priporočiti kakšen nov vir! In tudi DAGsHub najame Zagovornik [pribl. prevod Public Practitioner] v podatkovni znanosti, tako da če ustvarite lastno podatkovno znanost, pišite avtorju objave.

Kaj brati kot podatkovni znanstvenik leta 2020
Razvijajte se z branjem priporočenih virov in s promocijsko kodo HABR, lahko dobite dodatnih 10% na popust, ki je naveden na pasici.

Več tečajev

Predstavljeni članki

Vir: www.habr.com