Čo čítať ako dátový vedec v roku 2020

Čo čítať ako dátový vedec v roku 2020
V tomto príspevku s vami zdieľame výber zdrojov užitočných informácií o Data Science od spoluzakladateľa a technického riaditeľa DAGsHub, komunitnej a webovej platformy na kontrolu verzií údajov a spoluprácu medzi vedcami údajov a inžiniermi strojového učenia. Výber zahŕňa rôzne zdroje, od účtov na Twitteri až po plnohodnotné inžinierske blogy, ktoré sú zamerané na tých, ktorí presne vedia, čo hľadajú. Detaily pod strihom.

Od autora:
Ste to, čo jete, a ako vedomostný pracovník potrebujete dobrú informačnú stravu. Chcem sa podeliť o zdroje informácií o Data Science, umelej inteligencii a súvisiacich technológiách, ktoré považujem za najužitočnejšie alebo najatraktívnejšie. Dúfam, že to pomôže aj vám!

Dva minúty

Kanál YouTube, ktorý je vhodný na udržiavanie aktuálnych informácií o najnovších udalostiach. Kanál je často aktualizovaný a hostiteľ má nákazlivé nadšenie a pozitivitu vo všetkých preberaných témach. Očakávajte pokrytie zaujímavej práce nielen o AI, ale aj o počítačovej grafike a iných vizuálne príťažlivých témach.

Yannick Kilcher

Na svojom kanáli YouTube vysvetľuje Yannick významný výskum v oblasti hlbokého učenia v technických detailoch. Namiesto čítania samostatnej štúdie je často rýchlejšie a jednoduchšie pozrieť si jedno z jej videí, aby ste lepšie porozumeli dôležitým článkom. Vysvetlivky vyjadrujú podstatu článkov bez toho, aby zanedbávali matematiku alebo sa stratili v troch boroviciach. Yannick tiež zdieľa svoje názory na to, ako štúdie do seba zapadajú, ako vážne treba brať výsledky, širšie interpretácie atď. Pre začiatočníkov (alebo neakademikov) je ťažšie prísť k týmto objavom sami.

destilovať.pub

Ich vlastnými slovami:

Výskum strojového učenia musí byť jasný, dynamický a živý. A Distill bol vytvorený, aby pomohol vo výskume.

Distill je jedinečná publikácia o výskume strojového učenia. Články sú propagované s úžasnými vizualizáciami, ktoré čitateľovi poskytujú intuitívnejšie pochopenie tém. Priestorové myslenie a predstavivosť majú tendenciu veľmi dobre pomáhať pri pochopení tém strojového učenia a dátovej vedy. Tradičné formáty publikácií majú na druhej strane tendenciu byť vo svojej štruktúre rigidné, statické a suché a niekedy "matematický". Chris Olah, spolutvorca Distillu, má tiež úžasný osobný blog na GitHub. Dlho nebol aktualizovaný, ale stále zostáva zbierkou najlepších vysvetlení hlbokého učenia, aké boli kedy napísané. Najmä mne to veľmi pomohlo описание LSTM!

Čo čítať ako dátový vedec v roku 2020
zdroj

Sebastian Ruder

Sebastian Ruder píše veľmi informatívny blog a newsletter, predovšetkým o priesečníku neurónových sietí a analýzy textu v prirodzenom jazyku. Poskytuje tiež veľa rád výskumníkom a prednášajúcim na konferenciách, čo môže byť veľmi užitočné, ak ste na akademickej pôde. Sebastianove články majú tendenciu mať formu recenzií, zhrňujúcich a vysvetľujúcich súčasný stav výskumu a metód v danej oblasti. To znamená, že články sú mimoriadne užitočné pre praktizujúcich, ktorí sa chcú rýchlo zorientovať. Píše aj Sebastian Twitter.

Andrej Karpaty

Andreja Karpatyho netreba predstavovať. Okrem toho, že je jedným z najznámejších výskumníkov hlbokého učenia na zemi, vytvára široko používané nástroje ako napr konzervátor archívu ako vedľajšie projekty. Cez jeho Stanfordský kurz vstúpilo do tejto sféry nespočetné množstvo ľudí. cs231n, a bude pre vás užitočné to vedieť recept tréning neurónovej siete. Odporúčam aj pozrieť reč o skutočných problémoch, ktoré musí Tesla prekonať, keď sa snaží v masovom meradle aplikovať strojové učenie v reálnom svete. Reč je informatívna, pôsobivá a triezva. Okrem článkov o samotnom ML dáva Andrey Karpaty dobrá rada do života pre ambicióznych vedcov. Prečítajte si Andrew na Twitter a GitHub.

Uber inžinierstvo

Blog o inžinierstve Uber je skutočne pôsobivý z hľadiska rozsahu a šírky pokrytia, najmä pokiaľ ide o množstvo tém Umela inteligencia. Čo sa mi na inžinierskej kultúre Uberu obzvlášť páči, je ich tendencia uvoľňovať veľmi zaujímavé a hodnotné Projekty open source závratným tempom. Tu je niekoľko príkladov:

Blog OpenAI

Odhliadnuc od kontroverzií, blog OpenAI je nepochybne skvelý. Z času na čas blog zverejňuje obsah a postrehy o hlbokom učení, ktoré môže prísť len v rozsahu OpenAI: hypotetické fenomén hlboký dvojitý zostup. Tím OpenAI má tendenciu uverejňovať príspevky zriedka, ale toto je dôležitý obsah.

Čo čítať ako dátový vedec v roku 2020
zdroj

Blog Taboola

Blog Taboola nie je taký známy ako niektoré iné zdroje v tomto príspevku, ale myslím si, že je jedinečný – autori píšu o veľmi všedných, skutočných problémoch pri pokuse aplikovať ML vo výrobe pre „normálny“ biznis: menej o samoriadiace autá a agenti RL vyhrávajúci majstra sveta, viac o tom, „ako zistím, či môj model teraz predpovedá veci s falošnou istotou?“. Tieto problémy sú relevantné pre takmer každého, kto pracuje v tejto oblasti, a dostáva sa im menej pozornosti v tlači ako bežnejším témam AI, no na správne riešenie týchto problémov sú stále potrebné talenty svetovej triedy. Našťastie má Taboola tento talent aj ochotu a schopnosť o tom písať, aby sa aj ostatní ľudia mohli učiť.

facebook

Spolu s Twitterom nie je na Reddite nič lepšie, ako sa pripútať k výskumu, nástrojom alebo múdrosti davu.

Stav AI

Príspevky sú publikované len ročne, no informáciami naplnené veľmi husto. V porovnaní s inými zdrojmi v tomto zozname je tento prístupnejší pre netechnických podnikateľov. Na rozhovoroch sa mi páči, že sa snažia poskytnúť ucelenejší pohľad na to, kam smeruje priemysel a výskum, spájajúc pokroky v hardvéri, výskume, obchode a dokonca aj geopolitike z vtáčej perspektívy. Začnite od konca a prečítajte si o konflikte záujmov.

Podcasty

Úprimne povedané, myslím si, že podcasty nie sú vhodné na učenie sa o technických témach. Koniec koncov, na vysvetlenie tém používajú iba zvuk a veda o údajoch je veľmi vizuálna oblasť. Podcasty majú tendenciu poskytnúť vám zámienku na hlbšie preskúmanie neskôr alebo na zapojenie do filozofických diskusií. Tu je však niekoľko odporúčaní:

  • podcast lex friedmankeď sa rozpráva s významnými výskumníkmi v oblasti umelej inteligencie. Epizódy s Francoisom Cholletom sú obzvlášť dobré!
  • Podcast Data Engineering. Je príjemné počuť o nových nástrojoch dátovej infraštruktúry.

Úžasné zoznamy

Tu je toho menej, čo by ste mali sledovať, ale viac zdrojov, ktoré sú užitočné, keď viete, čo hľadáte:

Twitter

  • Matty Mariánsky
    Matty nachádza krásne, kreatívne spôsoby využitia neurónových sietí a je zábavné vidieť jeho výsledky na vašom kanáli Twitter. Pozrite sa aspoň toto príspevok.
  • Ori Cohen
    Ori je len hnací stroj blogy. Rozsiahlo píše o problémoch a riešeniach pre dátových vedcov. Nezabudnite sa prihlásiť na odber, aby ste boli informovaní o uverejnení článku. Jeho zbierkanajmä je naozaj pôsobivé.
  • Jeremy Howard
    Spoluzakladateľ fast.ai, komplexného zdroja kreativity a produktivity.
  • Hamel Husajn
    Hamel Hussain, zamestnanec ML inžinier v Github, je zaneprázdnený prácou vytváraním a podávaním správ o mnohých nástrojoch pre kóderov v dátovej doméne.
  • François Chollet
    Teraz tvorca Keras snaží sa aktualizovať naše chápanie toho, čo je inteligencia a ako ju testovať.
  • hardmaru
    Výskumný pracovník v Google Brain.

Záver

Pôvodný príspevok môže byť aktualizovaný, pretože autor nájde skvelé zdroje obsahu, ktoré by bola škoda nezaradiť do zoznamu. Neváhajte ho kontaktovať Twitterak chcete odporučiť nejaký nový zdroj! A tiež DAGsHub najíma Advokát [cca. preklad. Public Practitioner] v Data Science, takže ak vytvárate svoj vlastný obsah Data Science, pokojne napíšte autorovi príspevku.

Čo čítať ako dátový vedec v roku 2020
Rozvíjajte čítaním odporúčaných zdrojov a propagačným kódom HABR, môžete získať ďalších 10% k zľave uvedenej na banneri.

Viac kurzov

Odporúčané články

Zdroj: hab.com