Ką skaityti duomenų mokslininkui 2020 m

Ką skaityti duomenų mokslininkui 2020 m
Šiame įraše dalijamės su jumis naudingos informacijos apie duomenų mokslą šaltiniais, kuriuos pateikė DAGsHub, bendruomenės ir žiniatinklio platforma, skirta duomenų versijų valdymui ir duomenų mokslininkų bei mašininio mokymosi inžinierių bendradarbiavimui, įkūrėjo ir CTO. Pasirinkimas apima įvairius šaltinius – nuo ​​Twitter paskyrų iki pilnaverčių inžinerinių tinklaraščių, skirtų tiems, kurie tiksliai žino, ko ieško. Detalės po pjūviu.

Iš autoriaus:
Jūs esate tai, ką valgote, ir jums, kaip žinių darbuotojui, reikia geros informacinės dietos. Noriu pasidalinti informacijos šaltiniais apie duomenų mokslą, dirbtinį intelektą ir susijusias technologijas, kurios man atrodo naudingiausios ar patraukliausios. Tikiuosi, kad tai padės ir jums!

Dviejų minučių dokumentai

„YouTube“ kanalas, puikiai tinkantis gauti naujausius įvykius. Kanalas dažnai atnaujinamas, o šeimininkas turi užkrečiantį entuziazmą ir pozityvumą visomis nagrinėjamomis temomis. Tikimasi įdomių darbų ne tik AI, bet ir kompiuterinės grafikos bei kitų vizualiai patrauklių temų aprėpties.

Yannickas Kilcheris

Savo „YouTube“ kanale Yannickas išsamiai paaiškina svarbius gilaus mokymosi tyrimus. Užuot skaitę studiją patys, dažnai greičiau ir paprasčiau pažiūrėti vieną iš jo vaizdo įrašų, kad galėtumėte geriau suprasti svarbius straipsnius. Paaiškinimai perteikia straipsnių esmę, neapleidžiant matematikos ar pasiklystant trijose pušyse. Yannickas taip pat dalijasi savo nuomone apie tai, kaip studijos dera tarpusavyje, kaip rimtai reikėtų vertinti rezultatus, platesnes interpretacijas ir pan. Pradedantiesiems (arba neakademiniams specialistams) sunkiau patiems pasiekti šiuos atradimus.

distiliuoti.pub

Jų pačių žodžiais:

Mašininio mokymosi tyrimai turi būti aiškūs, dinamiški ir ryškūs. Ir Distill buvo sukurtas padėti atlikti tyrimus.

Distill yra unikalus mašininio mokymosi tyrimų leidinys. Straipsniai reklamuojami naudojant nuostabias vizualizacijas, kad skaitytojas intuityviau suprastų temas. Erdvinis mąstymas ir vaizduotė paprastai labai gerai padeda suprasti mašininio mokymosi ir duomenų mokslo temas. Kita vertus, tradiciniai leidinių formatai paprastai būna nelanksčios struktūros, statiški ir sausi, o kartais "matematinė". Chrisas Olahas, vienas iš Distill kūrėjų, taip pat palaiko nuostabų asmeninį tinklaraštį adresu GitHub. Jis nebuvo atnaujintas ilgą laiką, bet vis tiek išlieka geriausių kada nors parašytų gilaus mokymosi paaiškinimų rinkiniu. Visų pirma, tai man labai padėjo описание LSTM!

Ką skaityti duomenų mokslininkui 2020 m
šaltinis

Sebastianas Ruderis

Sebastianas Ruderis rašo labai informatyvų tinklaraštį ir informacinį biuletenį, visų pirma apie neuroninių tinklų ir natūralios kalbos teksto analizės sankirtą. Jis taip pat duoda daug patarimų tyrėjams ir konferencijų pranešėjams, kurie gali būti labai naudingi, jei esate akademinėje bendruomenėje. Sebastiano straipsniai dažniausiai pateikiami apžvalgų pavidalu, apibendrina ir paaiškina tam tikros srities tyrimų ir metodų pažangą. Tai reiškia, kad straipsniai yra labai naudingi praktikams, kurie nori greitai susiorientuoti. Sebastianas taip pat rašo Twitter.

Andrejus Karpatas

Andrejaus Karpaty pristatymo nereikia. Be to, kad yra vienas garsiausių giluminio mokymosi tyrinėtojų žemėje, jis kuria plačiai naudojamas priemones, pvz archyvo sveiko proto saugotojas kaip šalutiniai projektai. Daugybė žmonių pateko į šią karalystę per jo Stanfordo kursą. cs231n, ir jums bus naudinga tai žinoti receptas neuroninių tinklų mokymas. Taip pat rekomenduoju pažiūrėti kalba apie tikras problemas, kurias „Tesla“ turi įveikti bandydama masiškai pritaikyti mašininį mokymąsi realiame pasaulyje. Kalba informatyvi, įspūdinga ir blaivi. Be straipsnių apie pačią ML, Andrejus Karpaty pateikia geras gyvenimo patarimasambicingi mokslininkai. Skaitykite Andrew adresu Twitter ir GitHub.

Uber inžinerija

„Uber“ inžinerijos tinklaraštis yra tikrai įspūdingas dėl aprėpties masto ir apimties, apimantis daugybę temų, ypač Dirbtinis intelektas. Kas man ypač patinka Uber inžinerinėje kultūroje, yra jų tendencija išleisti labai įdomius ir vertingus Projektai atvirojo kodo nepaprastai greitai. Štai keletas pavyzdžių:

OpenAI tinklaraštis

Nepaisant ginčų, „OpenAI“ tinklaraštis yra neabejotinai puikus. Kartkartėmis tinklaraštyje skelbiamas turinys ir įžvalgos apie gilų mokymąsi, kuris gali būti tik OpenAI mastu: hipotetinis reiškinys gilus dvigubas nusileidimas. „OpenAI“ komanda linkusi skelbti nedažnai, tačiau tai yra svarbus turinys.

Ką skaityti duomenų mokslininkui 2020 m
šaltinis

Taboola dienoraštis

Tinklaraštis „Taboola“ nėra taip gerai žinomas kaip kai kurie kiti šio įrašo šaltiniai, bet manau, kad jis unikalus – autoriai rašo apie labai žemiškas, tikras problemas bandant ML pritaikyti gamyboje „normaliam“ verslui: mažiau apie savarankiškai važiuojantys automobiliai ir RL agentai, iškovoję pasaulio čempionus, daugiau apie „kaip sužinoti, ar mano modelis dabar prognozuoja dalykus su klaidingu pasitikėjimu?“. Šios problemos aktualios beveik kiekvienam šioje srityje dirbančiam žmogui, jos sulaukia mažiau dėmesio spaudoje nei įprastesnės AI temos, tačiau vis tiek reikia pasaulinio lygio talentų, kad šios problemos būtų tinkamai išspręstos. Laimei, Taboola turi ir šį talentą, ir noro bei gebėjimo apie tai rašyti, kad kiti žmonės taip pat galėtų mokytis.

reddit

Kartu su „Twitter“ „Reddit“ nėra nieko geriau, kaip pasimėgauti minios tyrimais, įrankiais ar išmintimi.

AI būsena

Įrašai skelbiami tik kasmet, tačiau labai tankiai užpildyti informacija. Palyginti su kitais šio sąrašo šaltiniais, šis yra labiau prieinamas ne technologijų verslo žmonėms. Pokalbiuose man patinka tai, kad jie bando pateikti visapusiškesnį vaizdą apie tai, kur eina pramonė ir moksliniai tyrimai, susiejant techninės įrangos, tyrimų, verslo ir net geopolitikos pažangą iš paukščio skrydžio. Būtinai pradėkite nuo pabaigos ir skaitykite apie interesų konfliktus.

Tinklalaidės

Atvirai kalbant, manau, kad podcast'ai netinkami mokytis techninėmis temomis. Galų gale, jie naudoja tik garsą temoms paaiškinti, o duomenų mokslas yra labai vizuali sritis. Podcast'ai paprastai suteikia jums pasiteisinimą, kad vėliau galėtumėte giliau tyrinėti arba įtraukti filosofines diskusijas. Tačiau čia yra keletas rekomendacijų:

Nuostabūs sąrašai

Čia reikia mažiau stebėti, bet daugiau išteklių, kurie bus naudingi, kai žinote, ko ieškote:

Twitter

  • Matty Mariansky
    Matty randa gražių, kūrybiškų būdų, kaip naudoti neuroninius tinklus, ir tiesiog smagu matyti jo rezultatus jūsų „Twitter“ sklaidos kanale. Pažiūrėk bent tai paštu
  • Ori Cohenas
    Ori yra tik vairavimo mašina dienoraščiai. Jis daug rašo apie duomenų mokslininkų problemas ir sprendimus. Būtinai užsiprenumeruokite, kad būtumėte informuoti, kai straipsnis bus paskelbtas. Jo kompiliavimasypač tikrai įspūdinga.
  • Jeremy Howardas
    Fast.ai – visapusiško kūrybiškumo ir produktyvumo šaltinio – įkūrėjas.
  • Hamelis Husseinas
    „Github“ personalo ML inžinierius Hamelas Hussainas yra užsiėmęs kurdamas daugybę duomenų srities koduotojams skirtų įrankių ir teikia ataskaitas apie juos.
  • François Chollet
    „Keras“ kūrėjas, dabar bando atnaujinti savo supratimą apie tai, kas yra intelektas ir kaip jį patikrinti.
  • hardmaru
    „Google Brain“ mokslininkas.

išvada

Originalus įrašas gali būti atnaujintas, nes autorius randa puikių turinio šaltinių, kurių būtų gaila neįtraukti į sąrašą. Nedvejodami susisiekite su juo Twitterjei norite rekomenduoti kokį nors naują šaltinį! Taip pat DAGsHub samdo Advokatas [apytiksliai. vert. Public Practitioner] duomenų moksle, todėl jei kuriate savo duomenų mokslo turinį, drąsiai rašykite įrašo autoriui.

Ką skaityti duomenų mokslininkui 2020 m
Kurkite skaitydami rekomenduojamus šaltinius ir reklamos kredito kodą RAGAŠAS, prie reklamjuostės nurodytos nuolaidos galite gauti papildomus 10%.

Daugiau kursų

Teminiai straipsniai

Šaltinis: www.habr.com