Co číst jako datový vědec v roce 2020

Co číst jako datový vědec v roce 2020
V tomto příspěvku s vámi sdílíme výběr zdrojů užitečných informací o Data Science od spoluzakladatele a CTO DAGsHub, komunitní a webové platformy pro kontrolu verzí dat a spolupráci mezi datovými vědci a inženýry strojového učení. Výběr zahrnuje nejrůznější zdroje, od účtů na Twitteru až po plnohodnotné inženýrské blogy, které jsou zaměřeny na ty, kteří přesně vědí, co hledají. Detaily pod střihem.

Od autora:
Jste to, co jíte, a jako znalostní pracovník potřebujete dobrou informační dietu. Chci sdílet zdroje informací o Data Science, umělé inteligenci a souvisejících technologiích, které považuji za nejužitečnější nebo nejatraktivnější. Doufám, že vám to také pomůže!

Dvouminutové dokumenty

Kanál YouTube, který se dobře hodí k tomu, abyste drželi krok s nejnovějšími událostmi. Kanál je často aktualizován a hostitel má nakažlivé nadšení a pozitivitu pro všechna probíraná témata. Očekávejte pokrytí zajímavé práce nejen o AI, ale také o počítačové grafice a dalších vizuálně atraktivních tématech.

Yannick Kilcher

Na svém kanálu YouTube vysvětluje Yannick významný výzkum v oblasti hlubokého učení do technických detailů. Místo abyste si studii sami přečetli, je často rychlejší a snazší podívat se na jedno z jejích videí, abyste hlouběji porozuměli důležitým článkům. Vysvětlivky vyjadřují podstatu článků, aniž by zanedbávaly matematiku nebo se ztrácely ve třech borovicích. Yannick také sdílí své názory na to, jak studie do sebe zapadají, jak vážně brát výsledky, širší interpretace a další. Pro nováčky (nebo neakademické odborníky) je obtížnější k těmto objevům dojít sami.

Destilovat.pub

Jejich vlastními slovy:

Výzkum strojového učení musí být jasný, dynamický a živý. A Distill byl vytvořen, aby pomohl s výzkumem.

Distill je unikátní publikace s výzkumem v oblasti strojového učení. Články s úžasnými vizualizacemi jsou podporovány, aby čtenáři lépe porozuměli tématům. Prostorové myšlení a představivost mají tendenci velmi dobře pomáhat porozumět tématům strojového učení a datové vědy. Tradiční formáty publikací na druhou stranu bývají ve své struktuře rigidní, statické a suché a někdy "matematický". Chris Olah, jeden z tvůrců Destillu, má také úžasný osobní blog GitHub. Už nějakou dobu nebyl aktualizován, ale stále zůstává sbírkou nejlepších vysvětlení na téma hlubokého učení, která byla kdy napsána. Zejména mně to hodně pomohlo описание LSTM!

Co číst jako datový vědec v roce 2020
zdroj

Sebastian Ruder

Sebastian Ruder píše velmi bystrý blog a newsletter, především o průniku neuronových sítí a dolování textu v přirozeném jazyce. Má také mnoho rad pro výzkumníky a přednášející na konferencích, které mohou být velmi užitečné, pokud jste na akademické půdě. Sebastianovy články mají obvykle formu recenzí, shrnujících a vysvětlujících stav současného výzkumu a metod v určité oblasti. To znamená, že články jsou mimořádně užitečné pro praktiky, kteří se chtějí rychle zorientovat. Sebastian také píše X.

Andrej Karpathy

Andrei Karpathy není třeba představovat. Kromě toho, že je jedním z nejznámějších badatelů hlubokého učení na Zemi, vytváří široce používané nástroje, kupř. arxiv ochránce zdravého rozumu jako vedlejší projekty. Bezpočet lidí vstoupilo do tohoto oboru prostřednictvím jeho Stanfordského kurzu cs231n, a bude pro vás užitečné to vědět recept trénink neuronové sítě. Doporučuji také shlédnout řeči o výzvách reálného světa, které musí Tesla překonat, když se pokouší masově aplikovat strojové učení v reálném světě. Řeč je poučná, působivá a vystřízliví. Kromě článků o samotném ML dává Andrei Karpathy dobrá rada do života pro ambiciózní vědci. Přečtěte si Andrey X a GitHub.

Uber Engineering

Blog inženýrství Uber je skutečně působivý svým rozsahem a šířkou pokrytí, zejména pokrývá mnoho témat Umělá inteligence. Na inženýrské kultuře Uberu se mi líbí především jejich tendence vyrábět velmi zajímavé a hodnotné Projekty open source závratným tempem. Zde jsou nějaké příklady:

Blog OpenAI

Kontroverze stranou, blog OpenAI je nepopiratelně úžasný. Čas od času blog zveřejňuje obsah a nápady o hlubokém učení, které může přijít pouze v rozsahu OpenAI: Hypothetical jev hluboký dvojitý sjezd. Tým OpenAI má tendenci zveřejňovat příspěvky zřídka, ale to je důležitá věc.

Co číst jako datový vědec v roce 2020
zdroj

Blog Taboola

Blog Taboola není tak známý jako některé další zdroje v tomto příspěvku, ale myslím si, že je jedinečný – autoři píší o velmi přízemních problémech ze skutečného života, když se snaží aplikovat ML ve výrobě na „normální " podnikání: méně o samořídících autech a RL agentech vyhrávajících mistry světa, více o tom, "jak poznám, že můj model nyní předpovídá věci s falešnou jistotou?" Tyto problémy se týkají téměř každého, kdo v oboru pracuje, a dostává se jim menšího pokrytí v tisku než běžnějších témat AI, ale ke správnému vyřešení těchto problémů je stále zapotřebí talentů světové třídy. Naštěstí má Taboola jak tento talent, tak ochotu a schopnost o tom psát, aby se to mohli učit i ostatní.

reddit

Spolu s Twitterem není na Redditu nic lepšího, než se nechat zapojit do výzkumu, nástrojů nebo moudrosti davu.

Stav AI

Příspěvky jsou publikovány pouze ročně, ale jsou plné velmi hustých informací. Ve srovnání s jinými zdroji na tomto seznamu je tento přístupnější pro netechnické obchodníky. Na rozhovorech se mi líbí, že se snaží poskytnout ucelenější pohled na to, kam průmysl a výzkum směřují, spojující pokroky v hardwaru, výzkumu, obchodu a dokonce i geopolitice z ptačí perspektivy. Začněte od konce a přečtěte si o střetu zájmů.

Podcasty

Upřímně řečeno si myslím, že podcasty nejsou vhodné pro zkoumání technických témat. Koneckonců používají pouze zvuk k vysvětlení témat a datová věda je velmi vizuální pole. Podcasty vám dávají záminku k tomu, abyste později provedli podrobnější výzkum nebo vedli fascinující filozofické diskuse. Zde je však několik doporučení:

Úžasné seznamy

Zde je toho méně ke sledování, ale více zdrojů, které jsou užitečné, když víte, co hledáte:

X

  • Matty Marianski
    Matty nachází krásné, kreativní způsoby, jak používat neuronové sítě, a je prostě zábavné vidět jeho výsledky na vašem Twitteru. Alespoň se podívat tento příspěvek.
  • Ori Cohen
    Ori je jen hnací stroj blogy. Rozsáhle píše o problémech a řešeních pro datové vědce. Nezapomeňte se přihlásit k odběru, abyste byli informováni o vydání článku. Jeho kolekce, je opravdu působivé.
  • Jeremy Howard
    Spoluzakladatel fast.ai, komplexního zdroje kreativity a produktivity.
  • Hamel Husajn
    Hamel Hussain, inženýr ML ve společnosti Github, je zaneprázdněn tvorbou a sestavováním mnoha nástrojů pro datové kodéry.
  • Francois Chollet
    Nyní tvůrce Kerasu se snaží aktualizovat naše chápání toho, co je inteligence a jak ji testovat.
  • Hardmaru
    Research Scientist ve společnosti Google Brain.

Závěr

Původní příspěvek může být aktualizován, protože autor najde skvělé zdroje obsahu, které by byla škoda nezařadit do seznamu. Neváhejte ho kontaktovat na X, pokud chcete doporučit nový zdroj! A také DAGsHub najímá Advokát [cca. překlad veřejný praktik] v Data Science, takže pokud vytváříte svůj vlastní obsah Data Science, neváhejte napsat autorovi příspěvku.

Co číst jako datový vědec v roce 2020
Rozvíjejte se čtením doporučených zdrojů a používáním propagačního kódu HABR, můžete získat dalších 10 % ke slevě uvedené na banneru.

Více kurzů

Doporučené články

Zdroj: www.habr.com