Zer irakurri datuen zientzialari gisa 2020an

Zer irakurri datuen zientzialari gisa 2020an
Argitalpen honetan, DAGsHub-en sortzailekide eta CTOaren datu-zientziari buruzko informazio baliagarriaren iturri aukeraketa bat partekatzen dugu zurekin, datu-bertsioen kontrolerako eta datu-zientzialarien eta ikaskuntza automatikoko ingeniarien arteko lankidetzarako komunitate eta web plataforma bat. Hautaketak hainbat iturri biltzen ditu, Twitter kontuetatik hasi eta ingeniaritza-blog osoetaraino, zer bilatzen ari diren zehatz-mehatz dakitenei zuzenduta daudenak. Xehetasunak ebaki azpian.

Egilearen eskutik:
Jaten duzuna zara, eta ezagutza-langile gisa, informazio-dieta on bat behar duzu. Erabilgarrien edo erakargarrien iruditzen zaizkidan datuen zientziari, adimen artifizialari eta erlazionatutako teknologiei buruzko informazio iturriak partekatu nahi ditut. Espero dut honek zuri ere laguntzea!

Bi minutuko paperak

Azken gertaeren berri izateko egokia den YouTube kanala. Kanala maiz eguneratzen da eta ostalariak ilusio eta positibo kutsakorra ditu landutako gai guztietan. Espero ezazu lan interesgarrien estaldura ez bakarrik AI-n, baita ordenagailu-grafikoen eta ikusmen erakargarrien beste gai batzuen inguruan ere.

Yannick Kilcher

Bere YouTube-ko kanalean, Yannick-ek deep learning-en ikerketa garrantzitsua azaltzen du xehetasun teknikoetan. Azterketa bat zeure kabuz irakurri beharrean, bizkorrago eta errazagoa izan ohi da bere bideoetako bat ikustea artikulu garrantzitsuen ulermen sakonagoa lortzeko. Azalpenek artikuluen funtsa transmititzen dute matematika alde batera utzi gabe edo hiru pinuetan galdu gabe. Yannickek bere iritzia ere partekatzen du ikasketak nola uztartzen diren, emaitzak zein serio hartu behar diren, interpretazio zabalagoak eta abar. Hasiberriek (edo praktikatzaile ez akademikoek) zailagoa dute aurkikuntza horietara beren kabuz etortzea.

destilatu.pub

Euren hitzetan:

Ikaskuntza automatikoko ikerketak argia, dinamikoa eta bizia izan behar du. Eta Distill ikerketan laguntzeko sortu zen.

Distill ikaskuntza automatikoko ikerketa-argitalpen paregabea da. Artikuluak bistaratze harrigarriekin sustatzen dira irakurleari gaien ulermen intuitiboagoa emateko. Pentsamendu espazialak eta irudimenak oso ondo funtzionatzen du Machine Learning eta Datu Zientzien gaiak ulertzen laguntzeko. Argitalpen formatu tradizionalek, berriz, egituran zurrunak izan ohi dira, estatikoak eta lehorrak, eta batzuetan "matematika". Chris Olah, Distill-en sortzaileak, blog pertsonal harrigarria mantentzen du GitHub. Aspaldi ez da eguneratu, baina oraindik idatzi diren deep learning azalpen onenen bilduma izaten jarraitzen du. Bereziki, asko lagundu zidan описаниС LSTM!

Zer irakurri datuen zientzialari gisa 2020an
iturri

Sebastian Ruder

Sebastian Ruder-ek blog eta buletin oso informatiboak idazten ditu, batez ere neurona-sareen eta hizkuntza naturalen testuen analisiaren arteko elkarguneari buruz. Ikertzaileei eta hitzaldietako hizlariei ere aholku asko ematen dizkie, eta hori oso lagungarria izan daiteke akademian bazaude. Sebastianen artikuluek berrikuspenen forma izan ohi dute, arlo jakin bateko ikerketaren eta metodoen artearen egoera laburbilduz eta azalduz. Horrek esan nahi du artikuluak oso erabilgarriak direla beren errodamenduak azkar lortu nahi dituzten profesionalentzat. Sebastianek ere idazten du Twitter.

Andrei Karpaty

Andrei Karpatyk ez du aurkezpenik behar. Lurrean deep learning ikertzaile ospetsuenetako bat izateaz gain, oso erabiliak diren tresnak sortzen ditu, hala nola artxiboko sanitate kontserbatzailea alboko proiektu gisa. Jende ugari sartu zen erreinu honetan bere Stanford ikastaroaren bidez. cs231n, eta baliagarria izango zaizu hori ezagutzeko errezeta sare neuronalaren prestakuntza. Ikustea ere gomendatzen dut hizkera Teslak mundu errealean eskala masiboan ikaskuntza automatikoa aplikatzen saiatzean gainditu behar dituen benetako arazoei buruz. Hitzaldia informatzailea, ikusgarria eta sobering da. ML berari buruzko artikuluez gain, Andrey Karpatyk ematen du bizitzako aholku onak egiteko asmo handiko zientzialariak. Irakurri Andrew helbidean Twitter eta abar Github.

Uber Ingeniaritza

Uber ingeniaritza bloga benetan ikusgarria da estalduraren eta zabaleraren aldetik, gai asko biltzen dituena, bereziki Inteligentzia artifiziala. Uber-en ingeniaritza-kulturatik bereziki gustatzen zaidana oso interesgarriak eta baliotsuak askatzeko duten joera da proiektuen kode irekia erritmo bizian. Hona hemen adibide batzuk:

OpenAI Bloga

Eztabaida alde batera utzita, OpenAI bloga ezin hobea da. Noizean behin, blogak OpenAIren eskalan bakarrik etor daitezkeen ikaskuntza sakonari buruzko edukiak eta ikuspegiak argitaratzen ditu: hipotetikoak. fenomenoa jaitsiera bikoitz sakona. OpenAI taldeak gutxitan argitaratzen du, baina eduki garrantzitsuak dira.

Zer irakurri datuen zientzialari gisa 2020an
iturri

Taboola Bloga

Taboola bloga ez da argitalpen honetako beste iturri batzuk bezain ezaguna, baina berezia dela uste dut - egileek oso arazo arruntei eta errealei buruz idazten dute negozio "normal" baterako ekoizpenean ML aplikatzen saiatzean: gutxiago. auto gidatzen duten autoak eta RLko agenteak munduko txapeldunak irabazi dituztenak, "nola jakin dezaket orain nire modeloak konfiantza faltsuarekin gauzak iragartzen dituen?". Gai hauek eremuan lan egiten duten ia guztientzat garrantzitsuak dira eta AI ohikoagoak diren gaiek baino prentsa-estaldura gutxiago jasotzen dute, baina hala ere mundu mailako talentua behar da arazo horiek behar bezala jorratzeko. Zorionez, Taboolak baditu talentu hori eta horri buruz idazteko borondatea eta gaitasuna, besteek ere ikas dezaten.

Reddit

Twitterrekin batera, Reddit-en ez dago jendearen ikerketa, tresna edo jakituria konektatzea baino ezer hoberik.

AIren egoera

Argitalpenak urtero bakarrik argitaratzen dira, baina informazioz oso trinko betetzen dira. Zerrenda honetako beste iturri batzuekin alderatuta, hau eskuragarriagoa da teknologia ez duten negozioentzat. Hitzaldiei buruz gustatzen zaidana da industria eta ikerketa norantz doazen ikuspegi holistikoagoa ematen saiatzen direla, hardwarearen, ikerketaren, negozioen eta baita geopolitikaren aurrerapenak txori-ikuspegitik lotuz. Ziurtatu amaieran hasten dela interes-gatazkak irakurtzen.

Podcastak

Egia esan, podcastak gai teknikoei buruz ikasteko ez direla egokiak uste dut. Azken finean, soinua soilik erabiltzen dute gaiak azaltzeko, eta datuen zientzia oso eremu bisuala da. Podcastek gero sakonago aztertzeko edo eztabaida filosofikoetarako aitzakia eman ohi dizute. Hala ere, hona hemen gomendio batzuk:

  • lex friedman podcastadimen artifizialaren alorreko ikertzaile nabarmenekin hitz egiten duenean. Francois Chollet-ekin egindako pasarteak bereziki onak dira!
  • Datuen Ingeniaritza podcasta. Pozten da datu-azpiegiturako tresna berriei buruz entzutea.

Zerrenda ikaragarriak

Begiratu gutxiago dago hemen, baina bilatzen ari zarena jakin ondoren lagungarriak diren baliabide gehiago:

Twitter

  • Matty Mariansky
    Mattyk sare neuronalak erabiltzeko modu ederrak eta sortzaileak aurkitzen ditu, eta dibertigarria da bere emaitzak zure Twitter jarioan ikustea. Begiratu bederen hau post.
  • Ori Cohen
    Ori gidatzeko makina bat besterik ez da blogak. Datu-zientzialarientzako arazoei eta irtenbideei buruz asko idazten du. Ziurtatu harpidetza egiten duzula artikulu bat argitaratzen denean jakinarazteko. Haren collectionbereziki ikusgarria da.
  • Jeremy Howard
    Fast.ai-ren sortzailekidea, sormen eta produktibitate iturri integrala.
  • Hamel Hussein
    Github-eko ML ingeniaria, Hamel Hussain lanpetuta dago datuen domeinuko kodetzaileentzako tresna asko sortzen eta berri ematen.
  • FranΓ§ois Chollet
    Kerasen sortzailea, orain saiatzen eguneratu adimena zer den eta nola probatu dugun ulertzeko.
  • hardmaru
    Google Brain-eko ikerlaria.

Ondorioa

Jatorrizko mezua eguneratu egin daiteke egileak zerrendan ez sartzea pena izango litzatekeen eduki iturri bikainak aurkitzen dituelako. Anima zaitez berarekin harremanetan jartzeko Twitteriturri berriren bat gomendatu nahi baduzu! Eta baita DAGsHub ere kontratatzen Abokatua [gutxi gorabehera. itzul. Public Practitioner] Data Science-n, beraz, zure Data Science edukia sortzen baduzu, lasai idatzi mezuaren egileari.

Zer irakurri datuen zientzialari gisa 2020an
Garatu gomendatutako iturriak irakurriz eta promozio-kodearen arabera HABR, pankartan adierazitako deskontuaren %10 gehigarria lor dezakezu.

Ikastaro gehiago

Artikulu aipagarriak

Iturria: www.habr.com