Што чытаць адмыслоўцу па Data Science у 2020 году

Што чытаць адмыслоўцу па Data Science у 2020 году
У гэтым пасце дзелімся з вамі падборкай крыніц карыснай інфармацыі аб Data Science ад сузаснавальніка і CTO DAGsHub – супольнасці і вэб-платформы для кантролю версій дадзеных і сумеснай працы дата-саенцістаў і інжынераў па машынным навучанні. У падборку патрапілі самыя розныя крыніцы, ад акаўнтаў у твітэры, да паўнавартасных інжынерных блогаў, якія арыентаваны для тых, хто сапраўды ведае, што шукае. Падрабязнасці пад катом.

Ад аўтара:
Вы - гэта тое, што вы ясьце, і вам, як работніку разумовай працы - патрэбна добрая інфармацыйная дыета. Я хачу падзяліцца крыніцамі інфармацыі аб Data Science, штучным інтэлекце і звязаных з ім тэхналогіях, якія знаходжу найбольш карыснымі або прывабнымі. Я спадзяюся, што гэта дапаможа і вам таксама!

Двуххвілінныя артыкулы

YouTube-канал, які добра падыходзіць, каб быць у курсе апошніх падзей. Канал часта абнаўляецца, а вядучы валодае заразлівым энтузіязмам і пазітывам ва ўсіх асвятляных тэмах. Чакайце асвятленні цікавых прац не толькі аб ІІ, але і аб кампутарнай графіцы і іншых візуальна прывабных тэмах.

Янік Кілчар

На сваім YouTube-канале, Янік тэхнічна падрабязна тлумачыць значныя даследаванні ў глыбокім навучанні. Замест таго каб чытаць даследаванне самастойна, часта бывае хутчэй і прасцей паглядзець адно з яго відэа, каб глыбей зразумець важныя артыкулы. Тлумачэнні перадаюць сутнасць артыкулаў, не грэбуючы матэматыкай і не губляючыся ў трох хвоях. Яннік таксама дзеліцца сваімі поглядамі - аб тым, як даследаванні суадносяцца адзін з адным, меркаваннем аб тым, наколькі сур'ёзна трэба ставіцца да вынікаў, больш шырокімі інтэрпрэтацыямі і г.д. Навічкам (ці неакадэмічным практыкам) цяжэй прыйсці да гэтых адкрыццяў самастойна.

Distill.pub

Па іх уласных словах:

Даследаванні ў галіне машыннага навучання павінны быць яснымі, дынамічнымі і яркімі. А Distill створаны, каб дапамагаць у даследаваннях.

Distill - унікальнае выданне з даследаваннямі ў галіне машыннага навучання. Прасоўваюцца артыкулы з узрушаючымі візуалізацыямі, каб даць чытачу больш інтуітыўнае разуменне тэм. Прасторавае мысленне і ўяўленне, як правіла, працуюць вельмі добра, дапамагаючы ў разуменні тэм машыннага навучання і Data Science. Традыцыйныя ж фарматы публікацый, наадварот, маюць тэндэнцыю быць цвёрдымі ў сваёй структуры, статычнымі і сухімі, а часам і «матэматычнымі». Крыс Ола (Chris Olah), адзін са стваральнікаў Distill, таксама вядзе дзіўны асабісты блог на GitHub. Ён даўно не абнаўляўся, але да гэтага часу застаецца калекцыяй лепшых з калі-небудзь напісаных тлумачэнняў па тэме глыбокага навучання. У прыватнасці, мне вельмі дапамагло апісанне LSTM!

Што чытаць адмыслоўцу па Data Science у 2020 году
крыніца

Себасцьян Рудэр

Себасцьян Рудэр піша вельмі змястоўны блог і інфармацыйны бюлетэнь, у першую чаргу аб скрыжаванні нейронавых сетак і аналізу тэкстаў на натуральных мовах. Ён таксама дае шмат парадаў даследчыкам і дакладчыкам на навуковых канферэнцыях, яны могуць быць вельмі карысныя, калі вы знаходзіцеся ў акадэмічных колах. Артыкулы Себасцьяна, як правіла, маюць форму аглядаў, падводзячы вынікі і тлумачачы стан сучасных даследаванняў і метадаў у той ці іншай вобласці. Гэта азначае, што артыкулы вельмі карысныя для практыкаў, якія жадаюць хутка зарыентавацца. Себасцьян таксама піша ў Twitter.

Андрэй Карпаці

Андрэй Карпат не мае патрэбы ў прадстаўленні. Апроч таго, што ён з'яўляецца адным з самых вядомых даследчыкаў глыбокага навучання на Зямлі, ён стварае шырока выкарыстоўваюцца інструменты, напрыклад, arxiv sanity preserver у якасці іншых праектаў. Шмат людзей увайшлі ў гэтую сферу праз яго Стэнфардскі курс cs231n, і вам будзе карысна пазнаць яго рэцэпт навучання нейронавай сеткі. Я таксама рэкамендую паглядзець яго гаворка аб рэальных праблемах, якія Tesla павінна пераадолець, спрабуючы прымяніць машыннае навучанне ў масавым маштабе ў рэальным свеце. Гаворка інфарматыўная, яна ўражвае і выцвярэжвае. Акрамя артыкулаў аб ML непасрэдна, Андрэй Карпаці дае добрыя жыццёвыя парады для амбіцыйных вучоных. Чытайце Андрэя ў Twitter і на Github.

Uber Engineering

Інжынерны блог Uber сапраўды ўражвае маштабам і шырынёй ахопу, асвячаючы масу тэм, у прыватнасці штучны інтэлект. Што мне асабліва падабаецца ў інжынернай культуры Uber, дык гэта іх тэндэнцыя выпускаць вельмі цікавыя і каштоўныя. праекты з адкрытым зыходным кодам у галавакружным тэмпе. Вось некаторыя прыклады:

Блог OpenAI

Калі адкінуць рознагалоссі, блог OpenAI, несумненна, выдатны. Час ад часу ў блогу публікуецца кантэнт і ідэі аб глыбокім навучанні, якія могуць прыйсці толькі ў маштабах OpenAI: гіпатэтычны феномен глыбокага падвойнага спуску. Каманда OpenAI, як правіла, публікуе пасты нячаста, але гэта важныя матэрыялы.

Што чытаць адмыслоўцу па Data Science у 2020 году
крыніца

Taboola Blog

Блог Taboola не так добра вядомы, як некаторыя іншыя крыніцы ў гэтым пасце, але я лічу яго ўнікальным - аўтары пішуць пра вельмі прызямлёных, рэальных праблемах пры спробе ўжываць ML у вытворчасці для нармальнага »бізнэсу: менш аб самакіравальных аўтамабілях і агентах RL, якія перамагаюць чэмпіёнаў свету, больш аб тым, "як мне даведацца, што мая мадэль зараз прадказвае рэчы з фальшывай упэўненасцю?". Гэтыя праблемы актуальныя амаль для ўсіх, хто працуе ў гэтай галіне, і яны менш асвятляюцца ў прэсе, чым больш сыходныя тэмы ІІ, але для правільнага вырашэння гэтых праблем усё яшчэ патрабуецца талент сусветнага класа. На шчасце, Taboola валодае як гэтым талентам, так і гатоўнасцю і здольнасцю пісаць пра яго, каб іншыя людзі таксама маглі вучыцца.

Reddit

Нараўне з Twitter, няма нічога лепш у Reddit, чым учапіцца за даследаванні, інструменты або мудрасць натоўпу.

Дзяржава ІІ

Пасты публікуюцца толькі штогод, але напоўнены інфармацыяй вельмі шчыльна. У параўнанні з іншымі крыніцамі з гэтага спісу, гэты даступней для не звязаных з тэхналогіямі дзелавых людзей. Што мне падабаецца ў дакладах, дык гэта тое, што ён спрабуе даць больш цэласнае ўяўленне аб тым, куды рухаецца галіна і даследаванні, з вышыні птушынага палёту звязваючы разам дасягненні ў галіне апаратнага забеспячэння, даследаванняў, бізнесу і нават геапалітыкі. Абавязкова пачынайце з канца, каб прачытаць аб канфлікце інтарэсаў.

падкасты

Шчыра кажучы, я лічу, што падкасты дрэнна прыстасаваны для вывучэння тэхнічных тэм. Бо для тлумачэння тым яны выкарыстоўваюць толькі гук, а навука аб дадзеных - гэта вельмі візуальная вобласць. Падкасты, як правіла, даюць вам нагода для больш глыбокага даследавання пазней ці ў для займальных філасофскіх дыскусій. Тым не менш, вось некаторыя рэкамендацыі:

  • падкаст Лекса Фрыдмана, Калі ён размаўляе з вядомымі даследчыкамі з вобласці штучнага інтэлекту. Асабліва добрыя эпізоды з Франсуа Шолле!
  • Data Engineering падкаст. Добры, каб пачуць аб новых інструментах інфраструктуры дадзеных.

Узрушаючыя спісы

Тут менш за тое, за чым трэба сачыць, але больш рэсурсаў, якія карысныя, калі вы ведаеце, што шукаеце:

Twitter

  • Мэці Марыянскі
    Мэт знаходзіць прыгожыя, творчыя спосабы выкарыстання нейронавых сетак, і гэта проста пацешна – бачыць яго вынікі ў вашай стужцы Twitter. Зірнуць бы хаця б на гэты пост
  • Оры Коэн
    Оры - проста машына для вядзення блогаў. Ён шмат піша аб праблемах і рашэннях для дата-саенцістаў. Абавязкова падпішыцеся, каб атрымаць апавяшчэнне, калі публікуецца артыкул. Яго зборнік, у прыватнасці, сапраўды ўражвае.
  • Джэрэмі Говард
    Сузаснавальнік кампаніі fast.ai, усебаковая крыніца творчасці і прадуктыўнасці.
  • Хамель Хусэйн
    Штатны інжынер ML ў Github, Хамель Хусэйн заняты на працы стварэннем і справаздачнасцю па многіх інструментах для кодэра ў галіне дадзеных.
  • Франсуа Шолле
    Стваральнік Keras, зараз спрабуе абнавіць нашы ўяўленні аб тым, што такое інтэлект і як яго праверыць.
  • Хардмару
    Навуковец-даследчык у Google Brain.

Заключэнне

Арыгінал паста можа абнаўляцца па меры таго, як аўтар знаходзіць выдатныя крыніцы кантэнту, якія было б сорамна не ўключыць у спіс. Не саромейцеся звяртацца да яго ў Twitter, калі хочаце парэкамендаваць нейкую новую крыніцу! А яшчэ DAGsHub наймае Advocate [заўв. перав. публічнага практыкуючага прыхільніка] у Data Science, так што калі вы ствараеце свой уласны кантэнт па Data Science, не саромейцеся напісаць аўтару паста.

Што чытаць адмыслоўцу па Data Science у 2020 году
Развівайцеся, чытаючы рэкамендаваныя крыніцы, а па промакодзе HABR, вы зможаце атрымаць дадатковыя 10% да скідкі названай на банеры.

Яшчэ курсы

Рэкамендуемыя артыкулы

Крыніца: habr.com