Wat te lezen als datawetenschapper anno 2020

Wat te lezen als datawetenschapper anno 2020
In dit bericht delen we een selectie van bronnen met nuttige informatie over Data Science van de mede-oprichter en CTO van DAGsHub, een community en webplatform voor dataversiebeheer en samenwerking tussen datawetenschappers en machine learning-ingenieurs. De selectie omvat een verscheidenheid aan bronnen, van Twitter-accounts tot volwaardige technische blogs, die zijn gericht op degenen die precies weten waarnaar ze op zoek zijn. Details onder de snit.

Van de auteur:
Je bent wat je eet, en als kenniswerker heb je een goed informatief dieet nodig. Ik wil informatiebronnen over Data Science, kunstmatige intelligentie en aanverwante technologieën delen die ik het nuttigst of aantrekkelijkst vind. Ik hoop dat dit jou ook helpt!

Twee minuten papier

Een YouTube-kanaal dat zeer geschikt is om op de hoogte te blijven van de laatste gebeurtenissen. Het kanaal wordt regelmatig bijgewerkt en de gastheer heeft een aanstekelijk enthousiasme en positiviteit in alle behandelde onderwerpen. Verwacht dekking van interessant werk, niet alleen over AI, maar ook over computergraphics en andere visueel aantrekkelijke onderwerpen.

Yannick Kilcher

Op zijn YouTube-kanaal legt Yannick belangrijk onderzoek naar deep learning in technische details uit. In plaats van een studie alleen te lezen, is het vaak sneller en gemakkelijker om een ​​van de video's te bekijken om een ​​beter begrip te krijgen van belangrijke artikelen. De uitleg geeft de essentie van de artikelen weer zonder de wiskunde te verwaarlozen of te verdwalen in drie dennen. Yannick deelt ook zijn visie op hoe studies in elkaar passen, hoe serieus resultaten moeten worden genomen, bredere interpretaties, enzovoort. Beginners (of niet-academische beoefenaars) vinden het moeilijker om zelf tot deze ontdekkingen te komen.

destilleren.pub

In hun eigen woorden:

Onderzoek naar machine learning moet duidelijk, dynamisch en levendig zijn. En Distill is gemaakt om te helpen bij onderzoek.

Distill is een unieke onderzoekspublicatie over machine learning. Artikelen worden gepromoot met verbluffende visualisaties om de lezer een meer intuïtief begrip van de onderwerpen te geven. Ruimtelijk denken en verbeeldingskracht werken over het algemeen heel goed om u te helpen bij het begrijpen van onderwerpen op het gebied van machine learning en datawetenschap. Traditionele publicatieformaten daarentegen hebben de neiging rigide te zijn in hun structuur, soms statisch en droog "wiskundig". Chris Olah, mede-maker van Distill, onderhoudt ook een geweldige persoonlijke blog op GitHub. Het is lange tijd niet bijgewerkt, maar het blijft nog steeds een verzameling van de beste deep learning-uitleg die ooit is geschreven. Het heeft me vooral veel geholpen описание LSTM!

Wat te lezen als datawetenschapper anno 2020
bron

Sebastiaan Ruder

Sebastian Ruder schrijft een zeer informatieve blog en nieuwsbrief, voornamelijk over de kruising van neurale netwerken en tekstanalyse in natuurlijke taal. Hij geeft ook veel advies aan onderzoekers en conferentiesprekers, wat erg handig kan zijn als je in de academische wereld zit. De artikelen van Sebastian hebben de neiging om de vorm aan te nemen van recensies, waarin de stand van het onderzoek en de methoden op een bepaald gebied worden samengevat en toegelicht. Dit betekent dat de artikelen uitermate nuttig zijn voor beoefenaars die snel wegwijs willen worden. Sebastian schrijft ook in Twitter.

Andrej Karpaty

Andrei Karpaty behoeft geen introductie. Behalve dat hij een van de beroemdste deep learning-onderzoekers ter wereld is, maakt hij veelgebruikte tools zoals archief gezond verstand bewaarder als zijprojecten. Talloze mensen kwamen dit rijk binnen via zijn Stanford-cursus. cs231n, en het zal nuttig voor u zijn om het te weten recept neuraal netwerk trainen. Ik raad ook aan om het te bekijken речь over de echte problemen die Tesla moet overwinnen wanneer hij machine learning op grote schaal probeert toe te passen in de echte wereld. Spraak is informatief, indrukwekkend en ontnuchterend. Naast artikelen over ML zelf geeft Andrey Karpaty goed levensadvies voor ambitieuze wetenschappers. Lees Andrew op Twitter en GitHub.

Uber-engineering

De technische blog van Uber is echt indrukwekkend in termen van schaal en reikwijdte, met name over veel onderwerpen kunstmatige intelligentie. Wat ik vooral leuk vind aan de ingenieurscultuur van Uber, is hun neiging om zeer interessant en waardevol vrij te geven Projecten open source in een razend tempo. Hier zijn enkele voorbeelden:

OpenAI-blog

Afgezien van de controverse, is de OpenAI-blog onmiskenbaar geweldig. Van tijd tot tijd plaatst de blog inhoud en inzichten over diep leren die alleen op de schaal van OpenAI kunnen komen: hypothetisch fenomeen diepe dubbele afdaling. Het OpenAI-team post zelden, maar dit is belangrijke inhoud.

Wat te lezen als datawetenschapper anno 2020
bron

Taboola-blog

Het Taboola-blog is niet zo bekend als sommige van de andere bronnen in dit bericht, maar ik denk dat het uniek is - de auteurs schrijven over heel alledaagse, echte problemen bij het toepassen van ML in productie voor een "normaal" bedrijf: minder over zelfrijdende auto's en RL-agenten die wereldkampioenen winnen, meer over "hoe weet ik of mijn model nu dingen met vals vertrouwen voorspelt?". Deze kwesties zijn relevant voor bijna iedereen die in het veld werkt en krijgen minder aandacht in de pers dan meer algemene AI-onderwerpen, maar er is nog steeds talent van wereldklasse voor nodig om deze problemen goed aan te pakken. Gelukkig heeft Taboola zowel dit talent als de bereidheid en het vermogen om erover te schrijven, zodat andere mensen er ook van kunnen leren.

Reddit

Samen met Twitter is er niets beters op Reddit dan verslaafd raken aan het onderzoek, de tools of de wijsheid van de menigte.

Staat van AI

Berichten worden slechts jaarlijks gepubliceerd, maar zijn zeer dicht gevuld met informatie. In vergelijking met andere bronnen op deze lijst is deze beter toegankelijk voor niet-technische zakenmensen. Wat ik zo leuk vind aan de gesprekken, is dat ze een meer holistisch beeld proberen te geven van waar de industrie en het onderzoek naartoe gaan, waarbij ze vooruitgang op het gebied van hardware, onderzoek, zaken en zelfs geopolitiek vanuit vogelperspectief met elkaar verbinden. Begin zeker aan het einde om te lezen over belangenverstrengeling.

Podcasts

Eerlijk gezegd denk ik dat podcasts niet geschikt zijn om over technische onderwerpen te leren. Ze gebruiken immers alleen geluid om onderwerpen uit te leggen, en data science is een heel visueel veld. Podcasts geven je vaak een excuus om later dieper op in te gaan, of voor boeiende filosofische discussies. Hier zijn echter enkele aanbevelingen:

  • Lex Friedman-podcastwanneer hij in gesprek gaat met vooraanstaande onderzoekers op het gebied van kunstmatige intelligentie. Afleveringen met Francois Chollet zijn bijzonder goed!
  • Data Engineering-podcast. Leuk om te horen over nieuwe tools voor data-infrastructuur.

Geweldige lijsten

Er is hier minder om in de gaten te houden, maar meer bronnen die nuttig zijn als u eenmaal weet waarnaar u op zoek bent:

Twitter

  • Matty Marianski
    Matty vindt mooie, creatieve manieren om neurale netwerken te gebruiken, en het is gewoon leuk om zijn resultaten op je Twitter-feed te zien. Neem tenminste een kijkje deze plaatsen.
  • Ori Cohen
    Ori is gewoon een rijdende machine blogs. Hij schrijft uitgebreid over problemen en oplossingen voor datawetenschappers. Zorg ervoor dat u zich abonneert om op de hoogte te worden gehouden wanneer een artikel wordt gepubliceerd. Zijn сборникin het bijzonder is echt indrukwekkend.
  • Jeremy Howard
    Mede-oprichter van fast.ai, een uitgebreide bron van creativiteit en productiviteit.
  • Hamel Hoessein
    Hamel Hussain, staf-ML-engineer bij Github, is druk bezig met het maken en rapporteren van veel tools voor codeerders in het datadomein.
  • François Chollet
    Schepper van Keras, nu proberen update ons begrip van wat intelligentie is en hoe het te testen.
  • hardmaru
    Onderzoeker bij Google Brain.

Conclusie

Het oorspronkelijke bericht kan worden bijgewerkt omdat de auteur geweldige inhoudsbronnen vindt waarvan het zonde zou zijn om ze niet in de lijst op te nemen. Neem gerust contact met hem op Twitterals je een nieuwe bron wilt aanbevelen! En ook DAGsHub huurt Advocaat [ca. vert. Public Practitioner] in Data Science, dus als u uw eigen Data Science-inhoud maakt, schrijf dan gerust naar de auteur van het bericht.

Wat te lezen als datawetenschapper anno 2020
Ontwikkel door de aanbevolen bronnen en de promotiecode te lezen HABR, kunt u 10% extra krijgen bovenop de korting die op de banner staat vermeld.

Meer cursussen

Aanbevolen artikelen

Bron: www.habr.com