Hvað á að lesa sem gagnafræðingur árið 2020

Hvað á að lesa sem gagnafræðingur árið 2020
Í þessari færslu deilum við þér úrvali af gagnlegum upplýsingum um Data Science frá meðstofnanda og tæknistjóra DAGsHub, samfélags- og vefvettvangs fyrir gagnaútgáfustýringu og samvinnu milli gagnafræðinga og vélanámsverkfræðinga. Úrvalið inniheldur ýmsar heimildir, allt frá Twitter reikningum til fullgildra verkfræðiblogga, sem miða að þeim sem vita nákvæmlega hvað þeir eru að leita að. Upplýsingar undir klippingu.

Frá höfundi:
Þú ert það sem þú borðar og sem þekkingarstarfsmaður þarftu gott upplýsingafæði. Ég vil deila upplýsingum um Data Science, gervigreind og tengda tækni sem mér finnst gagnlegust eða aðlaðandi. Ég vona að þetta hjálpi þér líka!

Tvö mínútna skjöl

YouTube rás sem er vel til þess fallin að fylgjast með nýjustu viðburðum. Rásin er uppfærð oft og gestgjafinn hefur smitandi eldmóð og jákvæðni í öllum efnum sem fjallað er um. Búast við umfjöllun um áhugavert verk, ekki aðeins um gervigreind, heldur einnig um tölvugrafík og önnur sjónrænt aðlaðandi efni.

Yannick Kilcher

Á YouTube rás sinni útskýrir Yannick mikilvægar rannsóknir í djúpnámi í tæknilegum smáatriðum. Í stað þess að lesa rannsókn á eigin spýtur er oft fljótlegra og auðveldara að horfa á eitt af myndböndum hennar til að öðlast dýpri skilning á mikilvægum greinum. Skýringarnar miðla kjarna greinanna án þess að vanrækja stærðfræðina eða villast í þremur furum. Yannick deilir einnig skoðunum sínum á því hvernig nám passar saman, hversu alvarlega skuli taka niðurstöður, víðtækari túlkanir og svo framvegis. Byrjendur (eða iðkendur sem ekki eru fræðimenn) eiga erfiðara með að komast að þessum uppgötvunum á eigin spýtur.

distill.pub

Með þeirra eigin orðum:

Rannsóknir á vélanámi þurfa að vera skýrar, kraftmiklar og líflegar. Og Distill var stofnað til að hjálpa við rannsóknir.

Distill er einstakt rannsóknarrit um vélanám. Greinar eru kynntar með töfrandi sjónrænum myndum til að gefa lesandanum betri skilning á efninu. Staðbundin hugsun og ímyndunarafl hafa tilhneigingu til að virka mjög vel við að hjálpa þér að skilja efni vélanáms og gagnafræði. Hefðbundin útgáfusnið hafa aftur á móti tilhneigingu til að vera stíf í uppbyggingu, kyrrstæð og þurr og stundum "stærðfræði". Chris Olah, meðhöfundur Distill, heldur einnig ótrúlegu persónulegu bloggi á GitHub. Það hefur ekki verið uppfært í langan tíma, en er samt safn af bestu djúpnámsskýringum sem skrifaðar hafa verið. Sérstaklega hjálpaði það mér mikið описание LSTM!

Hvað á að lesa sem gagnafræðingur árið 2020
uppspretta

Sebastian Ruder

Sebastian Ruder skrifar mjög fróðlegt blogg og fréttabréf, fyrst og fremst um skurðpunkta tauganeta og textagreiningu á náttúrulegu máli. Hann gefur einnig rannsakendum og ráðstefnufyrirlesurum margar ráðleggingar, sem geta verið mjög gagnlegar ef þú ert í akademíunni. Greinar Sebastians hafa tilhneigingu til að vera í formi ritdóma, draga saman og útskýra stöðuna í rannsóknum og aðferðum á tilteknu sviði. Þetta þýðir að greinarnar eru einstaklega gagnlegar fyrir iðkendur sem vilja ná áttum fljótt. Sebastian skrifar líka inn twitter.

Andrey Karpaty

Andrei Karpaty þarf enga kynningu. Auk þess að vera einn frægasti djúpnámsfræðingur á jörðinni býr hann til mikið notuð verkfæri eins og skjalasafn geðheilsu varðveislu sem hliðarverkefni. Ótal margir komust inn á þetta svið í gegnum Stanford námskeiðið sitt. cs231n, og það mun vera gagnlegt fyrir þig að vita það uppskrift tauganetþjálfun. Ég mæli líka með því að horfa á hana ræðu um raunveruleg vandamál sem Tesla verður að sigrast á þegar reynt er að beita vélanámi í stórum stíl í hinum raunverulega heimi. Ræðan er fræðandi, áhrifamikil og edrú. Fyrir utan greinar um ML sjálft, gefur Andrey Karpaty góð lífsráð í metnaðarfullir vísindamenn. Lestu Andrew á twitter og GitHub.

Uber verkfræði

Uber verkfræðibloggið er virkilega áhrifamikið hvað varðar umfang og breidd umfjöllunar og fjallar um mörg efni, sérstaklega Gervigreind. Það sem mér líkar sérstaklega við verkfræðimenningu Uber er tilhneiging þeirra til að gefa út mjög áhugavert og verðmæt Verkefni opinn uppspretta á ógnarhraða. Hér eru nokkur dæmi:

OpenAI blogg

Til hliðar er OpenAI bloggið óneitanlega frábært. Af og til birtir bloggið efni og innsýn um djúpt nám sem getur aðeins komið á mælikvarða OpenAI: ímyndað fyrirbæri djúp tvöföld niðurkoma. OpenAI teymið hefur tilhneigingu til að birta sjaldan, en þetta er mikilvægt efni.

Hvað á að lesa sem gagnafræðingur árið 2020
uppspretta

Taboola blogg

Taboola bloggið er ekki eins þekkt og sumar aðrar heimildir í þessari færslu, en mér finnst það einstakt - höfundarnir skrifa um mjög hversdagsleg, raunveruleg vandamál þegar reynt er að beita ML í framleiðslu fyrir "venjulegt" fyrirtæki: minna um sjálfkeyrandi bílar og RL umboðsmenn vinna heimsmeistara, meira um "hvernig veit ég hvort módelið mitt sé núna að spá fyrir um hlutina með fölsku öryggi?". Þessi mál eiga við næstum alla sem starfa á þessu sviði og fá minni fréttaumfjöllun en algengari gervigreindarefni, en það þarf samt heimsklassa hæfileika til að taka á þessum málum almennilega. Sem betur fer hefur Taboola bæði þennan hæfileika og viljann og hæfileikann til að skrifa um það svo annað fólk geti lært líka.

reddit

Samhliða Twitter er ekkert betra á Reddit en að verða hrifinn af rannsóknum, verkfærum eða visku mannfjöldans.

Ástand gervigreindar

Færslur eru aðeins birtar árlega, en fylltar af upplýsingum mjög þéttar. Í samanburði við aðrar heimildir á þessum lista er þessi aðgengilegri fyrir fólk sem er ekki í tækniviðskiptum. Það sem mér þykir vænt um við viðræðurnar er að þær reyna að gefa heildstæðari sýn á hvert iðnaðurinn og rannsóknirnar eru að stefna, tengja saman framfarir í vélbúnaði, rannsóknum, viðskiptum og jafnvel landstjórnarmálum frá fuglasjónarhorni. Vertu viss um að byrja á endanum til að lesa um hagsmunaárekstra.

Podcast

Satt að segja held ég að podcast henti illa til að læra um tæknileg efni. Þegar öllu er á botninn hvolft nota þeir aðeins hljóð til að útskýra efni og gagnafræði er mjög sjónrænt svið. Podcast hafa tilhneigingu til að gefa þér afsökun til að kanna nánar síðar, eða til að grípa til heimspekilegrar umræðu. Hins vegar eru hér nokkrar tillögur:

Æðislegir listar

Það er minna að fylgjast með hér, en fleiri úrræði sem eru gagnleg þegar þú veist hvað þú ert að leita að:

twitter

  • Matty Mariansky
    Matty finnur fallegar, skapandi leiðir til að nota taugakerfi og það er bara gaman að sjá niðurstöður hans í Twitter-straumnum þínum. Skoðaðu allavega þetta staða.
  • Ori Cohen
    Ori er bara akstursvél blogg. Hann skrifar mikið um vandamál og lausnir fyrir gagnafræðinga. Vertu viss um að gerast áskrifandi til að fá tilkynningu þegar grein er birt. Hans safnsérstaklega er virkilega áhrifamikill.
  • Jeremy Howard
    Meðstofnandi fast.ai, alhliða uppsprettu sköpunar og framleiðni.
  • Hamel Hussein
    Starfsmaður ML verkfræðingur hjá Github, Hamel Hussain er upptekinn við að búa til og gefa skýrslu um mörg verkfæri fyrir kóðara á gagnasviðinu.
  • François Chollet
    Höfundur Keras, núna reyna að uppfærðu skilning okkar á því hvað greind er og hvernig á að prófa hana.
  • harðmaru
    Rannsóknarfræðingur hjá Google Brain.

Ályktun

Upprunalega færslan gæti verið uppfærð þar sem höfundur finnur frábærar uppsprettur efnis sem það væri synd að hafa ekki á listanum. Ekki hika við að hafa samband við hann twitteref þú vilt mæla með einhverri nýrri heimild! Og líka DAGsHub ræður Lögmaður [u.þ.b. þýð. Public Practitioner] í Data Science, þannig að ef þú býrð til þitt eigið Data Science efni skaltu ekki hika við að skrifa til höfundar færslunnar.

Hvað á að lesa sem gagnafræðingur árið 2020
Þróaðu með því að lesa ráðlagðar heimildir og með kynningarkóðanum HABR, þú getur fengið 10% til viðbótar við afsláttinn sem tilgreindur er á borðanum.

Fleiri námskeið

Valdar greinar

Heimild: www.habr.com