Was Sie als Datenwissenschaftler im Jahr 2020 lesen sollten

Was Sie als Datenwissenschaftler im Jahr 2020 lesen sollten
In diesem Beitrag teilen wir Ihnen eine Auswahl nützlicher Informationsquellen über Data Science vom Mitbegründer und CTO von DAGsHub, einer Community und Webplattform für Datenversionskontrolle und Zusammenarbeit zwischen Datenwissenschaftlern und Ingenieuren für maschinelles Lernen. Die Auswahl umfasst eine Vielzahl von Quellen, von Twitter-Accounts bis hin zu vollwertigen Ingenieurblogs, die sich an diejenigen richten, die genau wissen, wonach sie suchen. Details unter dem Schnitt.

Vom Autor:
Sie sind, was Sie essen, und als Wissensarbeiter benötigen Sie eine gute, informative Ernährung. Ich möchte Informationsquellen über Data Science, künstliche Intelligenz und verwandte Technologien teilen, die ich am nützlichsten oder attraktivsten finde. Ich hoffe, das hilft dir auch!

Zwei Minuten Papiere

Ein YouTube-Kanal, der sich gut eignet, um über die neuesten Ereignisse auf dem Laufenden zu bleiben. Der Kanal wird regelmäßig aktualisiert und der Moderator ist in Bezug auf alle behandelten Themen mit ansteckender Begeisterung und positiver Einstellung vertreten. Erwarten Sie die Berichterstattung über interessante Arbeiten nicht nur zur KI, sondern auch zu Computergrafik und anderen visuell ansprechenden Themen.

Yannick Kilcher

Auf seinem YouTube-Kanal erklärt Yannick wichtige Forschungsergebnisse zum Thema Deep Learning im technischen Detail. Anstatt eine Studie selbst zu lesen, ist es oft schneller und einfacher, sich eines der Videos anzusehen, um ein tieferes Verständnis für wichtige Artikel zu erlangen. Die Erklärungen vermitteln das Wesentliche der Artikel, ohne die Mathematik zu vernachlässigen oder sich in drei Kiefern zu verlieren. Yannick teilt auch seine Ansichten darüber mit, wie Studien zusammenpassen, wie ernst Ergebnisse genommen werden sollten, breitere Interpretationen und so weiter. Für Anfänger (oder nicht-akademische Praktiker) ist es schwieriger, auf eigene Faust zu diesen Entdeckungen zu gelangen.

destill.pub

In ihren eigenen Worten:

Forschung zum maschinellen Lernen muss klar, dynamisch und lebendig sein. Und Distill wurde gegründet, um bei der Forschung zu helfen.

Distill ist eine einzigartige Forschungspublikation zum maschinellen Lernen. Artikel werden mit beeindruckenden Visualisierungen beworben, um dem Leser ein intuitiveres Verständnis der Themen zu vermitteln. Räumliches Denken und Vorstellungskraft helfen Ihnen in der Regel sehr gut, Themen des maschinellen Lernens und der Datenwissenschaft zu verstehen. Herkömmliche Publikationsformate hingegen sind tendenziell starr in ihrer Struktur, statisch und trocken und manchmal „mathematisch“. Chris Olah, Mitbegründer von Distill, unterhält auch einen erstaunlichen persönlichen Blog unter GitHub. Es wurde schon lange nicht mehr aktualisiert, ist aber immer noch eine Sammlung der besten Deep-Learning-Erklärungen, die jemals geschrieben wurden. Insbesondere hat es mir sehr geholfen описание LSTM!

Was Sie als Datenwissenschaftler im Jahr 2020 lesen sollten
Quelle

Sebastian Ruder

Sebastian Ruder schreibt einen sehr informativen Blog und Newsletter, der sich hauptsächlich mit der Schnittstelle zwischen neuronalen Netzen und Textanalyse in natürlicher Sprache befasst. Außerdem gibt er Forschern und Konferenzrednern viele Ratschläge, die im akademischen Bereich sehr hilfreich sein können. Sebastians Artikel haben in der Regel die Form von Rezensionen, in denen der Stand der Forschung und Methoden in einem bestimmten Bereich zusammengefasst und erläutert wird. Damit sind die Artikel für Praktiker, die sich schnell zurechtfinden wollen, äußerst nützlich. Auch Sebastian schreibt mit Twitter.

Andrey Karpaty

Andrei Karpaty bedarf keiner Vorstellung. Er ist nicht nur einer der berühmtesten Deep-Learning-Forscher der Welt, sondern entwickelt auch weit verbreitete Tools wie Archiv zur Bewahrung der geistigen Gesundheit als Nebenprojekte. Unzählige Menschen gelangten durch seinen Stanford-Kurs in dieses Reich. cs231n, und es wird für Sie nützlich sein, es zu wissen Rezept Training neuronaler Netze. Ich empfehle auch, es anzusehen речь über die tatsächlichen Probleme, die Tesla überwinden muss, wenn er versucht, maschinelles Lernen in großem Maßstab in der realen Welt anzuwenden. Die Rede ist informativ, beeindruckend und ernüchternd. Neben Artikeln über ML selbst gibt Andrey Karpaty gute Ratschläge fürs Leben für ambitionierte Wissenschaftler. Lesen Sie Andrew unter Twitter und Github.

Uber-Technik

Der Uber-Engineering-Blog ist hinsichtlich Umfang und Umfang der Berichterstattung wirklich beeindruckend und deckt insbesondere viele Themen ab künstliche Intelligenz. Was mir an der Ingenieurskultur von Uber besonders gefällt, ist ihre Tendenz, sehr interessante und wertvolle Produkte zu veröffentlichen Projekte Open Source in rasendem Tempo. Hier sind einige Beispiele:

OpenAI-Blog

Abgesehen von der Kontroverse ist der OpenAI-Blog unbestreitbar großartig. Von Zeit zu Zeit veröffentlicht der Blog Inhalte und Erkenntnisse über Deep Learning, die nur auf der Ebene von OpenAI möglich sind: hypothetisch ein Phänomen tiefer Doppelabstieg. Das OpenAI-Team postet in der Regel selten, aber das sind wichtige Inhalte.

Was Sie als Datenwissenschaftler im Jahr 2020 lesen sollten
Quelle

Taboola-Blog

Der Taboola-Blog ist nicht so bekannt wie einige der anderen Quellen in diesem Beitrag, aber ich denke, er ist einzigartig – die Autoren schreiben über sehr banale, reale Probleme beim Versuch, ML in der Produktion für ein „normales“ Unternehmen anzuwenden: weniger darüber selbstfahrende Autos und RL-Agenten, die Weltmeister werden, mehr zum Thema „Woher weiß ich, ob mein Modell jetzt Dinge mit falscher Sicherheit vorhersagt?“. Diese Themen sind für fast jeden, der in diesem Bereich arbeitet, relevant und werden in der Presse weniger thematisiert als allgemeinere KI-Themen, aber es bedarf immer noch erstklassiger Talente, um diese Probleme richtig anzugehen. Glücklicherweise verfügt Taboola sowohl über dieses Talent als auch über die Bereitschaft und Fähigkeit, darüber zu schreiben, damit auch andere Menschen davon lernen können.

Reddit

Neben Twitter gibt es auf Reddit nichts Besseres, als sich von den Recherchen, Tools oder der Weisheit der Masse begeistern zu lassen.

Zustand der KI

Beiträge werden nur jährlich veröffentlicht, sind aber sehr dicht mit Informationen gefüllt. Im Vergleich zu anderen Quellen auf dieser Liste ist diese für Geschäftsleute ohne technische Kenntnisse zugänglicher. Was ich an den Vorträgen liebe, ist, dass sie versuchen, einen ganzheitlicheren Blick auf die Richtung der Industrie und der Forschung zu vermitteln und Fortschritte in den Bereichen Hardware, Forschung, Wirtschaft und sogar Geopolitik aus der Vogelperspektive zu verknüpfen. Beginnen Sie unbedingt am Ende, um mehr über Interessenkonflikte zu erfahren.

Podcasts

Ehrlich gesagt denke ich, dass Podcasts nicht dazu geeignet sind, sich über technische Themen zu informieren. Schließlich verwenden sie nur Ton, um Themen zu erklären, und Datenwissenschaft ist ein sehr visuelles Feld. Podcasts bieten Ihnen in der Regel eine Ausrede, sich später eingehender damit zu befassen oder spannende philosophische Diskussionen zu führen. Hier sind jedoch einige Empfehlungen:

  • Lex Friedman-Podcastwenn er mit prominenten Forschern auf dem Gebiet der künstlichen Intelligenz spricht. Besonders gut sind die Folgen mit Francois Chollet!
  • Data Engineering-Podcast. Schön, von neuen Dateninfrastruktur-Tools zu hören.

Tolle Listen

Hier müssen Sie weniger im Auge behalten, aber es gibt mehr Ressourcen, die hilfreich sind, wenn Sie wissen, wonach Sie suchen:

Twitter

  • Matty Mariansky
    Matty findet schöne, kreative Möglichkeiten, neuronale Netze zu nutzen, und es macht einfach Spaß, seine Ergebnisse in Ihrem Twitter-Feed zu sehen. Schauen Sie es sich zumindest an diese schreiben.
  • Ori Cohen
    Ori ist einfach eine Fahrmaschine Bloggen. Er schreibt ausführlich über Probleme und Lösungen für Datenwissenschaftler. Melden Sie sich unbedingt an, um benachrichtigt zu werden, wenn ein Artikel veröffentlicht wird. Sein SammlungInsbesondere ist es wirklich beeindruckend.
  • Jeremy Howard
    Mitbegründer von fast.ai, einer umfassenden Quelle für Kreativität und Produktivität.
  • Hamel Hussein
    Hamel Hussain, ein angestellter ML-Ingenieur bei Github, ist damit beschäftigt, viele Tools für Programmierer im Datenbereich zu erstellen und darüber zu berichten.
  • François Chollet
    Jetzt Schöpfer von Keras versucht es Aktualisieren Sie unser Verständnis darüber, was Intelligenz ist und wie man sie testet.
  • Hardmaru
    Forscher bei Google Brain.

Abschluss

Der ursprüngliche Beitrag kann aktualisiert werden, da der Autor großartige Inhaltsquellen findet, deren Aufnahme in die Liste schade wäre. Kontaktieren Sie ihn gerne Twitterwenn Sie eine neue Quelle empfehlen möchten! Und auch DAGsHub stellt ein Anwalt [ca. übers. Public Practitioner] in Data Science. Wenn Sie also Ihre eigenen Data Science-Inhalte erstellen, können Sie gerne an den Autor des Beitrags schreiben.

Was Sie als Datenwissenschaftler im Jahr 2020 lesen sollten
Entwickeln Sie, indem Sie die empfohlenen Quellen und den Aktionscode lesen Hainbucheerhalten Sie zusätzlich zu dem auf dem Banner angegebenen Rabatt 10 %.

Weitere Kurse

Ausgewählte Artikel

Source: habr.com