Mitä lukea datatieteilijänä vuonna 2020

Mitä lukea datatieteilijänä vuonna 2020
Tässä viestissä jaamme kanssasi valikoiman hyödyllisiä Data Science -tietolähteitä DAGsHubin perustajilta ja teknologiajohtajalta. DAGsHub on yhteisö- ja verkkoalusta dataversioiden hallintaa ja yhteistyötä datatieteilijöiden ja koneoppimisinsinöörien välillä. Valikoima sisältää erilaisia ​​lähteitä Twitter-tileistä täysimittaisiin suunnittelublogeihin, jotka on suunnattu niille, jotka tietävät tarkalleen mitä etsivät. Yksityiskohdat leikkauksen alla.

Kirjailija:
Olet mitä syöt, ja tietotyöntekijänä tarvitset hyvän informatiivisen ruokavalion. Haluan jakaa tietolähteitä datatieteestä, tekoälystä ja niihin liittyvistä teknologioista, joita pidän hyödyllisimpinä tai houkuttelevina. Toivottavasti tämä auttaa sinuakin!

Kaksi minuutin paperit

YouTube-kanava, joka sopii hyvin pysyäksesi ajan tasalla uusimmista tapahtumista. Kanavaa päivitetään usein ja isännöitsijällä on tarttuvaa innostusta ja positiivisuutta kaikissa käsitellyissä aiheissa. Odota mielenkiintoisia töitä paitsi tekoälyn, myös tietokonegrafiikan ja muiden visuaalisesti houkuttelevien aiheiden parissa.

Yannick Kilcher

YouTube-kanavallaan Yannick selittää syvällisen oppimisen merkittävää tutkimusta teknisesti yksityiskohtaisesti. Sen sijaan, että lukisit tutkimuksen itse, on usein nopeampaa ja helpompaa katsoa jokin sen videoista saadaksesi syvemmän käsityksen tärkeistä artikkeleista. Selitykset välittävät artikkelien olemuksen laiminlyömättä matematiikkaa tai eksymättä kolmeen männyyn. Yannick jakaa myös näkemyksensä siitä, kuinka tutkimukset sopivat yhteen, kuinka vakavasti tuloksia tulisi ottaa, laajemmista tulkinnoista ja niin edelleen. Aloittelijoiden (tai ei-akateemisten harjoittajien) on vaikeampi päästä näihin löytöihin yksin.

distill.pub

Heidän omin sanoin:

Koneoppimisen tutkimuksen tulee olla selkeää, dynaamista ja elinvoimaista. Ja Distill luotiin auttamaan tutkimusta.

Distill on ainutlaatuinen koneoppimisen tutkimusjulkaisu. Artikkeleita mainostetaan upeilla visualisoinneilla, jotta lukija ymmärtää aiheet intuitiivisemmin. Tilaajattelu ja mielikuvitus toimivat yleensä erittäin hyvin koneoppimisen ja tietotieteen aiheiden ymmärtämisessä. Perinteiset julkaisumuodot puolestaan ​​ovat rakenteeltaan jäykkiä, staattisia ja kuivia, ja joskus "matemaattinen". Chris Olah, Distillin luoja, ylläpitää myös hämmästyttävää henkilökohtaista blogia osoitteessa GitHub. Sitä ei ole päivitetty pitkään aikaan, mutta se on edelleen kokoelma parhaita koskaan kirjoitettuja syvän oppimisen selityksiä. Erityisesti se auttoi minua paljon описание LSTM!

Mitä lukea datatieteilijänä vuonna 2020
lähde

Sebastian Ruder

Sebastian Ruder kirjoittaa erittäin informatiivista blogia ja uutiskirjettä ensisijaisesti hermoverkkojen ja luonnollisen kielen tekstianalyysin risteyksestä. Hän antaa myös paljon neuvoja tutkijoille ja konferenssien puhujille, mikä voi olla erittäin hyödyllistä, jos olet akateemisessa maailmassa. Sebastianin artikkelit ovat yleensä katsauksia, joissa tiivistetään ja selitetään tietyn alueen tutkimuksen ja menetelmien huippua. Tämä tarkoittaa, että artikkelit ovat erittäin hyödyllisiä harjoittajille, jotka haluavat perehtyä nopeasti. Sebastian kirjoittaa myös Twitter.

Andrei Karpaty

Andrei Karpaty ei esittelyjä kaipaa. Sen lisäksi, että hän on yksi kuuluisimmista syvän oppimisen tutkijoista maan päällä, hän luo laajalti käytettyjä työkaluja, kuten arkiston mielenterveyden säilyttäjä sivuprojekteina. Lukemattomat ihmiset tulivat tälle alueelle hänen Stanford-kurssinsa kautta. cs231n, ja sinun on hyödyllistä tietää se resepti neuroverkkokoulutus. Suosittelen myös katsomaan puhe todellisista ongelmista, jotka Teslan on voitettava, kun se yrittää soveltaa koneoppimista massiivisessa mittakaavassa todellisessa maailmassa. Puhe on informatiivinen, vaikuttava ja raikastavaa. Itse ML:ää koskevien artikkeleiden lisäksi Andrey Karpaty antaa hyviä elämänohjeita varten kunnianhimoisia tiedemiehiä. Lue Andrew osoitteessa Twitter ja edelleen Github.

Uberin suunnittelu

Uber-tekniikkablogi on todella vaikuttava mittakaavaltaan ja kattavuuden laajuudeltaan, ja se kattaa monia aiheita, erityisesti Tekoäly. Erityisesti pidän Uberin insinöörikulttuurissa heidän taipumuksestaan ​​julkaista erittäin mielenkiintoisia ja arvokkaita Hankkeet avoimen lähdekoodin jyrkästi. Tässä on joitain esimerkkejä:

OpenAI-blogi

Kiistaa lukuun ottamatta OpenAI-blogi on kiistatta loistava. Ajoittain blogissa julkaistaan ​​sisältöä ja oivalluksia syväoppimisesta, joka voi tulla vain OpenAI:n mittakaavassa: hypoteettinen ilmiö syvä kaksoislaskeutuminen. OpenAI-tiimi julkaisee viestejä harvoin, mutta nämä ovat tärkeitä sisältöä.

Mitä lukea datatieteilijänä vuonna 2020
lähde

Taboolan blogi

Taboola-blogi ei ole yhtä tunnettu kuin jotkut muut tämän postauksen lähteet, mutta mielestäni se on ainutlaatuinen - kirjoittajat kirjoittavat hyvin arkipäiväisistä, todellisista ongelmista, kun he yrittävät soveltaa ML:ää tuotantoon "normaalissa" yrityksessä: vähemmän siitä itseajavat autot ja RL-agentit, jotka voittivat maailmanmestareita, lisää aiheesta "mistä tiedän, ennustaako mallini nyt asioita väärällä luottamuksella?". Nämä ongelmat ovat tärkeitä melkein kaikille alalla työskenteleville ja saavat vähemmän lehdistöä kuin yleisemmät tekoälyaiheet, mutta silti tarvitaan maailmanluokan kykyjä, jotta nämä ongelmat voidaan käsitellä kunnolla. Onneksi Taboolalla on sekä tämä lahjakkuus että halu ja kyky kirjoittaa siitä, jotta muutkin voivat oppia.

Reddit

Yhdessä Twitterin kanssa Redditissä ei ole mitään parempaa kuin jääminen koukkuun yleisön tutkimukseen, työkaluihin tai viisauteen.

Tekoälyn tila

Viestejä julkaistaan ​​vain vuosittain, mutta ne ovat täynnä tietoa. Verrattuna muihin tämän luettelon lähteisiin, tämä on helpommin muiden kuin tekniikan liikemiesten saatavilla. Pidän keskusteluissa siitä, että ne yrittävät antaa kokonaisvaltaisemman kuvan siitä, mihin teollisuus ja tutkimus ovat menossa, yhdistäen laitteiston, tutkimuksen, liiketoiminnan ja jopa geopolitiikan edistysaskeleita lintuperspektiivistä. Muista aloittaa lopusta lukeaksesi eturistiriidoista.

Podcastit

Suoraan sanottuna mielestäni podcastit sopivat huonosti teknisten aiheiden oppimiseen. Loppujen lopuksi he käyttävät vain ääntä aiheiden selittämiseen, ja datatiede on hyvin visuaalinen kenttä. Podcastit tarjoavat yleensä tekosyyn tutkia asiaa tarkemmin myöhemmin tai syventää filosofisia keskusteluja. Tässä kuitenkin joitain suosituksia:

  • lex friedman podcastkun hän keskustelee tekoälyn alan merkittävien tutkijoiden kanssa. Francois Cholletin jaksot ovat erityisen hyviä!
  • Tietotekniikan podcast. Mukava kuulla uusista tietoinfrastruktuurityökaluista.

Upeita listoja

Täällä on vähemmän tarkkailtavaa, mutta enemmän resursseja, joista on apua, kun tiedät mitä etsit:

Twitter

  • Matty Mariansky
    Matty löytää kauniita, luovia tapoja käyttää hermoverkkoja, ja on vain hauskaa nähdä hänen tuloksiaan Twitter-syötteessäsi. Katso ainakin tämä post.
  • Ori Cohen
    Ori on vain ajokone blogeja. Hän kirjoittaa laajasti datatieteilijöiden ongelmista ja ratkaisuista. Muista tilata, jotta saat ilmoituksen, kun artikkeli julkaistaan. Hänen kokoelmaerityisesti on todella vaikuttava.
  • Jeremy Howard
    Fast.ai:n perustaja, joka on kattava luovuuden ja tuottavuuden lähde.
  • Hamel Hussein
    Githubin ML-insinööri Hamel Hussain on kiireinen työssään luoden ja raportoimalla monia työkaluja data-alueen koodaajille.
  • François Chollet
    Kerasin luoja nyt yrittää päivittää ymmärryksemme siitä, mitä älykkyys on ja miten sitä testataan.
  • hardmaru
    Google Brainin tutkija.

Johtopäätös

Alkuperäistä viestiä saatetaan päivittää, kun kirjoittaja löytää upeita sisältölähteitä, joita olisi sääli olla sisällyttämättä luetteloon. Ota rohkeasti yhteyttä häneen Twitterjos haluat suositella jotain uutta lähdettä! Ja myös DAGsHub palkkaa Asianajaja [n. käännös Public Practitioner] Data Science -alalla, joten jos luot omaa Data Science -sisältöäsi, voit kirjoittaa viestin kirjoittajalle.

Mitä lukea datatieteilijänä vuonna 2020
Kehitä lukemalla suositellut lähteet ja käyttämällä tarjouskoodia sarvisäkki, voit saada 10% lisäalennuksen bannerissa.

Lisää kursseja

Suositellut artikkelit

Lähde: will.com