Mida lugeda andmeteadlasena 2020. aastal

Mida lugeda andmeteadlasena 2020. aastal
Selles postituses jagame teiega valikut andmeteaduse kohta kasuliku teabe allikaid, mis pärinevad andmeteadlaste ja masinõppeinseneride vahelise kogukonna ja veebiplatvormi DAGsHubi kaasasutajalt ja tehnoloogiadirektorilt. Valikus on erinevaid allikaid alates Twitteri kontodest kuni täisväärtuslike inseneriblogideni, mis on suunatud neile, kes teavad täpselt, mida nad otsivad. Detailid lõike all.

Autorilt:
Oled see, mida sööd, ja teadmustöötajana vajad head infodieeti. Soovin jagada teabeallikaid andmeteaduse, tehisintellekti ja nendega seotud tehnoloogiate kohta, mis minu arvates on kõige kasulikumad või atraktiivsemad. Loodan, et see aitab ka teid!

Kaks minutilehte

YouTube'i kanal, mis sobib hästi viimaste sündmustega kursis olemiseks. Kanalit uuendatakse sageli ning saatejuhil on nakatav entusiasm ja positiivsus kõigi käsitletavate teemade suhtes. Oodake huvitavaid töid mitte ainult AI, vaid ka arvutigraafika ja muude visuaalselt atraktiivsete teemade kohta.

Yannick Kilcher

Yannick selgitab oma YouTube'i kanalil tehniliste üksikasjadega olulisi süvaõppe uuringuid. Selle asemel, et uuringut ise lugeda, on sageli kiirem ja lihtsam vaadata mõnda selle videot, et saada olulistest artiklitest sügavam arusaam. Selgitused annavad artiklite olemuse edasi, jätmata tähelepanuta matemaatikat või eksimata kolme männi vahele. Yannick jagab ka oma seisukohti selle kohta, kuidas uuringud omavahel kokku sobivad, kui tõsiselt võtta tulemusi, laiemaid tõlgendusi ja palju muud. Algajatel (või mitteakadeemilistel praktikutel) on nende avastusteni iseseisvalt raskem jõuda.

Destill.pub

Nende endi sõnadega:

Masinõppe uurimine peab olema selge, dünaamiline ja elav. Ja Distill loodi uurimistöö abistamiseks.

Distill on ainulaadne masinõppe valdkonna uurimistööga väljaanne. Uimastavate visualiseeringutega artikleid reklaamitakse, et anda lugejale teemadest intuitiivsem arusaam. Ruumiline mõtlemine ja kujutlusvõime töötavad tavaliselt masinõppe ja andmeteaduse teemade mõistmisel väga hästi. Traditsioonilised väljaandevormingud seevastu kipuvad olema oma struktuurilt jäigad, staatilised ja kuivad ning mõnikord "matemaatika". Chris Olah, üks Distilli loojatest, peab ka hämmastavat isiklikku ajaveebi aadressil GitHub. Seda pole mõnda aega värskendatud, kuid see on endiselt kogumik parimatest selgitustest sügava õppimise teemal, mis kunagi kirjutatud. Eelkõige aitas see mind palju описание LSTM!

Mida lugeda andmeteadlasena 2020. aastal
allikas

Sebastian Ruder

Sebastian Ruder kirjutab väga põhjalikku ajaveebi ja uudiskirja, mis käsitleb peamiselt närvivõrkude ja loomuliku keele tekstikaevandamise ristumiskohta. Tal on ka palju nõuandeid teadlastele ja konverentsiesinejatele, millest võib olla palju abi, kui oled akadeemilises ringkonnas. Sebastiani artiklid on tavaliselt ülevaadete vormis, mis võtavad kokku ja selgitavad konkreetse valdkonna praeguste uuringute ja meetodite seisu. See tähendab, et artiklid on äärmiselt kasulikud praktikutele, kes soovivad kiiresti orienteeruda. Sebastian kirjutab ka sisse puperdama.

Andrei Karpathy

Andrei Karpathy ei vaja tutvustamist. Lisaks sellele, et ta on üks kuulsamaid süvaõppe uurijaid Maal, loob ta laialdaselt kasutatavaid tööriistu, nt. arxiv terve mõistuse säilitaja kõrvalprojektidena. Tema Stanfordi kursuse kaudu on sellesse valdkonda sisenenud lugematu arv inimesi cs231n, ja see on teile kasulik teada retsept närvivõrgu koolitus. Soovitan ka vaadata kõne tegelike väljakutsete kohta, mida Tesla peab ületama, kui ta püüab reaalses maailmas massiliselt masinõpet rakendada. Kõne on informatiivne, muljetavaldav ja kainestav. Lisaks ML-i ennast käsitlevatele artiklitele annab Andrei Karpathy head elunõuanded eest ambitsioonikad teadlased. Lugege Andrey sisse puperdama ja Github.

Uberi tehnika

Uberi inseneriblogi on oma ulatuse ja katvuse poolest tõeliselt muljetavaldav, hõlmates paljusid teemasid, eriti Tehisintellekt. Uberi insenerikultuuri juures meeldib mulle eriti nende kalduvus toota väga huvitavaid ja väärtuslikke Projektid avatud lähtekoodiga meeletu kiirusega. siin on mõned näidised:

OpenAI ajaveeb

Kui vaidlused kõrvale jätta, on OpenAI ajaveeb vaieldamatult suurepärane. Aeg-ajalt postitab ajaveebi sisu ja ideid sügava õppimise kohta, mis võib tulla ainult OpenAI: hüpoteetilise skaalal nähtus sügav kahekordne laskumine. OpenAI meeskond kipub harva postitama, kuid see on oluline värk.

Mida lugeda andmeteadlasena 2020. aastal
allikas

Taboola blogi

Taboola ajaveeb ei ole nii tuntud kui mõned teised selle postituse allikad, kuid ma arvan, et see on ainulaadne – autorid kirjutavad väga maapealsetest reaalse elu probleemidest, kui nad üritavad rakendada ML-i tootmises "tavaliste" jaoks. " ettevõtted: vähem isejuhtivatest autodest ja RL agentidest, kes võitsid maailmameistrid, rohkem teemal "kuidas ma tean, et mu modell ennustab nüüd asju valekindlusega?" Need probleemid on aktuaalsed peaaegu kõigile valdkonnas töötavatele ja neid kajastatakse ajakirjanduses vähem kui levinumad tehisintellekti teemad, kuid nende probleemide õigeks lahendamiseks on siiski vaja maailmatasemel talente. Õnneks on Taboolal nii see anne kui ka tahe ja oskus sellest kirjutada, et ka teised inimesed saaksid õppida.

reddit

Lisaks Twitterile pole Redditis midagi paremat kui uuringute, tööriistade või rahvahulga tarkuse haaramine.

AI osariik

Postitusi avaldatakse ainult kord aastas, kuid need on täidetud väga tiheda teabega. Võrreldes teiste selle loendi allikatega, on see mittetehnoloogiliste ärimeeste jaoks kättesaadavam. Mulle meeldib kõneluste juures see, et see püüab anda terviklikuma ülevaate sellest, kuhu tööstus ja teadusuuringud liiguvad, sidudes linnulennult riistvara, teadusuuringute, äritegevuse ja isegi geopoliitika edusammud. Huvide konfliktide kohta lugemist alustage kindlasti lõpust.

Podcastid

Ausalt öeldes arvan, et taskuhäälingusaated sobivad tehniliste teemade uurimiseks halvasti. Lõppude lõpuks kasutavad nad teemade selgitamiseks ainult heli ja andmeteadus on väga visuaalne valdkond. Podcastid annavad teile tavaliselt ettekäände teha hiljem põhjalikumat uurimistööd või pidada põnevaid filosoofilisi arutelusid. Siiski on siin mõned soovitused:

Suurepärased nimekirjad

Siin on vähem, mida jälgida, kuid rohkem ressursse, mis on kasulikud, kui teate, mida otsite.

puperdama

  • Matty Marianski
    Matty leiab ilusaid ja loomingulisi viise närvivõrkude kasutamiseks ning on lihtsalt lõbus näha tema tulemusi oma Twitteri voos. Heida vähemalt pilk peale see Post.
  • Ori Cohen
    Ori on lihtsalt sõidumasin ajaveebid. Ta kirjutab põhjalikult andmeteadlaste probleemidest ja lahendustest. Tellige kindlasti, et teid teavitataks artikli avaldamisest. Tema koostamine, on tõeliselt muljetavaldav.
  • Jeremy Howard
    Fast.ai kaasasutaja, mis on igakülgne loovuse ja tootlikkuse allikas.
  • Hamel Hussein
    Githubi ML-insener Hamel Hussain on hõivatud paljude andmekodeerijate tööriistade loomise ja aruandlusega.
  • Francois Chollet
    Kerase looja, nüüd püüab värskendage oma arusaama sellest, mis on intelligentsus ja kuidas seda testida.
  • Hardmaru
    Google Braini teadur.

Järeldus

Algset postitust võidakse värskendada, kuna autor leiab suurepäraseid sisuallikaid, mida oleks kahju loendisse mitte lisada. Võtke temaga julgelt ühendust aadressil puperdama, kui soovite soovitada uut allikat! Ja ka DAGsHub palkab Advokaat [u. tõlge avalik praktik] Data Science'is, nii et kui loote oma Data Science'i sisu, kirjutage julgelt postituse autorile.

Mida lugeda andmeteadlasena 2020. aastal
Arendage ennast, lugedes soovitatud allikaid ja kasutades sooduskoodi HABR, saate bänneril märgitud allahindlusele lisaks 10%.

Rohkem kursusi

Esiletõstetud artiklid

Allikas: www.habr.com