Kion legi kiel datuma sciencisto en 2020

Kion legi kiel datuma sciencisto en 2020
En ĉi tiu afiŝo, ni dividas kun vi elekton de fontoj de utilaj informoj pri Data Science de la kunfondinto kaj CTO de DAGsHub, komunumo kaj retejo platformo por datuma versio-kontrolo kaj kunlaboro inter datumsciencistoj kaj maŝinlernado-inĝenieroj. La elekto inkluzivas diversajn fontojn, de Twitter-kontoj ĝis plenrajtaj inĝenieraj blogoj, kiuj celas tiujn, kiuj scias precize kion ili serĉas. Detaloj sub la tranĉo.

De la aŭtoro:
Vi estas tio, kion vi manĝas, kaj kiel scilaboristo, vi bezonas bonan informan dieton. Mi volas kunhavigi fontojn de informoj pri Data Science, artefarita inteligenteco kaj rilataj teknologioj, kiujn mi trovas plej utilaj aŭ allogaj. Mi esperas, ke ĉi tio ankaŭ helpos vin!

Du Minutaj Artikoloj

Jutuba kanalo, kiu taŭgas por resti ĝisdatigita pri la plej novaj eventoj. La kanalo estas ĝisdatigita ofte kaj la gastiganto havas infektan entuziasmon kaj pozitivecon en ĉiuj temoj kovritaj. Atendu priraportadon de interesa laboro ne nur pri AI, sed ankaŭ pri komputila grafiko kaj aliaj vide allogaj temoj.

Yannick Kilcher

Sur sia jutuba kanalo, Yannick klarigas signifan esploradon pri profunda lernado en teknika detalo. Anstataŭ legi studon memstare, ofte estas pli rapide kaj pli facile spekti unu el ĝiaj videoj por akiri pli profundan komprenon de gravaj artikoloj. La klarigoj transdonas la esencon de la artikoloj sen neglekti la matematikon aŭ perdiĝi en tri pinoj. Yannick ankaŭ dividas siajn opiniojn pri kiel studoj kongruas, kiom serioze oni devas preni rezultojn, pli larĝajn interpretojn, ktp. Komencantoj (aŭ ne-akademiaj praktikistoj) trovas pli malfacile veni al ĉi tiuj malkovroj memstare.

distill.pub

En siaj propraj vortoj:

Esplorado pri maŝinlernado devas esti klara, dinamika kaj vigla. Kaj Distill estis kreita por helpi en esplorado.

Distill estas unika maŝinlernada esplorpublikaĵo. Artikoloj estas reklamitaj kun mirindaj bildigoj por doni al la leganto pli intuician komprenon de la temoj. Spaca pensado kaj imago emas funkcii tre bone por helpi vin kompreni Temojn pri Maŝinlernado kaj Datuma Scienco. Tradiciaj publikigformatoj, aliflanke, tendencas esti rigidaj en sia strukturo, senmovaj kaj sekaj, kaj foje "matematika". Chris Olah, kunkreinto de Distill, ankaŭ konservas mirindan personan blogon ĉe GitHub. Ĝi ne estis ĝisdatigita dum longa tempo, sed ankoraŭ restas kolekto de la plej bonaj profundaj lernaj klarigoj iam verkitaj. Precipe ĝi multe helpis min la priskribo LSTM!

Kion legi kiel datuma sciencisto en 2020
fonto

Sebastian Ruder

Sebastian Ruder verkas tre informan blogon kaj bultenon, ĉefe pri la intersekciĝo de neŭralaj retoj kaj naturlingva teksto-analizo. Li ankaŭ donas multajn konsilojn al esploristoj kaj konferencaj parolantoj, kiuj povas esti tre helpemaj se vi estas en akademio. La artikoloj de Sebastian tendencas preni la formon de recenzoj, resumante kaj klarigante la staton de la arto en esplorado kaj metodoj en antaŭfiksita areo. Ĉi tio signifas, ke la artikoloj estas ege utilaj por praktikistoj, kiuj volas rapide ekorientiĝi. Sebastiano ankaŭ skribas en Twitter.

Andrej Karpaty

Andreo Karpaty ne bezonas enkondukon. Krom esti unu el la plej famaj esploristoj pri profunda lernado sur la tero, li kreas vaste uzatajn ilojn kiel ekz arkiva prudento konservilo kiel flankaj projektoj. Sennombraj homoj eniris ĉi tiun regnon per lia Stanforda kurso. cs231n, kaj estos utile por vi koni ĝin recepto trejnado de neŭrala reto. Mi ankaŭ rekomendas spekti ĝin parolado pri la realaj problemoj, kiujn Tesla devas venki kiam ĝi provas apliki maŝinlernadon amase en la reala mondo. Parolado estas informa, impona kaj sobriga. Krom artikoloj pri ML mem, Andrey Karpaty donas bona vivkonsilo por ambiciaj sciencistoj. Legu Andreon ĉe Twitter kaj plu GitHub.

Uber Inĝenieristiko

La Uber-inĝenieristiko-blogo estas vere impresa laŭ skalo kaj amplekso de kovrado, kovrante multajn temojn, precipe Artefarita inteligento. Kion mi precipe ŝatas pri la inĝenieristika kulturo de Uber estas ilia emo liberigi tre interesajn kaj valorajn projektoj malferma fonto je rapida rapideco. Jen kelkaj ekzemploj:

OpenAI Blogo

Konflikto flankenmetite, la OpenAI-blogo estas nekontesteble bonega. De tempo al tempo, la blogo afiŝas enhavon kaj komprenojn pri profunda lernado, kiuj povas veni nur laŭ la skalo de OpenAI: hipoteza fenomeno profunda duobla deveno. La OpenAI-teamo tendencas afiŝi malofte, sed ĉi tiuj estas grava enhavo.

Kion legi kiel datuma sciencisto en 2020
fonto

Taboola Blogo

La Taboola blogo ne estas tiel konata kiel kelkaj el la aliaj fontoj en ĉi tiu afiŝo, sed mi pensas, ke ĝi estas unika - la aŭtoroj skribas pri tre sekularaj, realaj problemoj kiam oni provas apliki ML en produktado por "normala" komerco: malpli pri memveturantaj aŭtoj kaj RL-agentoj gajnantaj mondĉampionojn, pli pri "kiel mi scias ĉu mia modelo nun antaŭdiras aferojn kun falsa fido?". Ĉi tiuj aferoj estas gravaj por preskaŭ ĉiuj laborantaj en la kampo kaj ricevas malpli da gazetara kovrado ol pli oftaj temoj de AI, sed ankoraŭ bezonas mondklasan talenton por ĝuste trakti ĉi tiujn aferojn. Feliĉe, Taboola havas kaj ĉi tiun talenton kaj la volon kaj kapablon skribi pri ĝi por ke aliaj homoj ankaŭ povu lerni.

Reddit

Kune kun Twitter, estas nenio pli bona en Reddit ol enganiĝi al la esplorado, iloj aŭ saĝeco de la homamaso.

Ŝtato de AI

Afiŝoj estas publikigitaj nur ĉiujare, sed plenigitaj kun informoj tre dense. Kompare kun aliaj fontoj en ĉi tiu listo, ĉi tiu estas pli alirebla por ne-teknikaj komercistoj. Kion mi amas pri la babiladoj estas, ke ili provas doni pli holisma vidon de kie la industrio kaj esplorado iras, kunligante progresojn en aparataro, esplorado, komerco, kaj eĉ geopolitiko de birda vido. Nepre komencu ĉe la fino legi pri konfliktoj de intereso.

Podkastoj

Sincere, mi pensas, ke podkastoj estas malbone taŭgaj por lerni pri teknikaj temoj. Post ĉio, ili uzas nur sonon por klarigi temojn, kaj datumscienco estas tre vida kampo. Podkastoj tendencas doni al vi pretekston por esplori pli profunde poste, aŭ por engaĝi filozofiajn diskutojn. Tamen, jen kelkaj rekomendoj:

  • lex friedman podkastokiam li parolas kun elstaraj esploristoj en la kampo de artefarita inteligenteco. Epizodoj kun Francois Chollet estas precipe bonaj!
  • Data Engineering podkasto. Agrabla aŭdi pri novaj iloj pri datuma infrastrukturo.

Mirindaj listoj

Estas malpli por atenti ĉi tie, sed pli da rimedoj, kiuj estas helpemaj post kiam vi scias, kion vi serĉas:

Twitter

  • Matty Mariansky
    Matty trovas belajn, kreivajn manierojn uzi neŭralajn retojn, kaj estas nur amuze vidi liajn rezultojn en via Twitter-fluo. Rigardu almenaŭ ĉi tio rapida.
  • Ori Cohen
    Ori estas nur veturmaŝino blogoj. Li skribas vaste pri problemoj kaj solvoj por datumsciencistoj. Nepre abonu por esti sciigita kiam artikolo estas publikigita. Lia kompiloprecipe estas vere impona.
  • Jeremy Howard
    Kunfondinto de fast.ai, ampleksa fonto de kreivo kaj produktiveco.
  • Hamel Hussein
    Staba ML-inĝeniero ĉe Github, Hamel Hussain estas okupata pri laboro kreante kaj raportante pri multaj iloj por kodistoj en la datuma domajno.
  • François Chollet
    Kreinto de Keras, nun provante ĝisdatigi nian komprenon pri kio estas inteligenteco kaj kiel testi ĝin.
  • hardmaru
    Esploristo ĉe Google Brain.

konkludo

La originala afiŝo povas esti ĝisdatigita ĉar la aŭtoro trovas bonegajn fontojn de enhavo, kiujn estus domaĝe ne inkluzivi en la liston. Bonvolu kontakti lin Twitterse vi volas rekomendi iun novan fonton! Kaj ankaŭ DAGsHub dungas Advokato [ĉ. transl. Public Practitioner] en Datuma Scienco, do se vi kreas vian propran Datuman Sciencan enhavon, bonvolu skribi al la aŭtoro de la afiŝo.

Kion legi kiel datuma sciencisto en 2020
Evoluiĝu legante la rekomenditajn fontojn kaj laŭ la reklama kodo HABR, vi povas ricevi plian 10% al la rabato indikita sur la standardo.

Pli da kursoj

Elstaraj Artikoloj

fonto: www.habr.com