У гэтым пасце дзелімся з вамі падборкай крыніц карыснай інфармацыі аб Data Science ад сузаснавальніка і CTO DAGsHub – супольнасці і вэб-платформы для кантролю версій дадзеных і сумеснай працы дата-саенцістаў і інжынераў па машынным навучанні. У падборку патрапілі самыя розныя крыніцы, ад акаўнтаў у твітэры, да паўнавартасных інжынерных блогаў, якія арыентаваны для тых, хто сапраўды ведае, што шукае. Падрабязнасці пад катом.
Ад аўтара:
Вы - гэта тое, што вы ясьце, і вам, як работніку разумовай працы - патрэбна добрая інфармацыйная дыета. Я хачу падзяліцца крыніцамі інфармацыі аб Data Science, штучным інтэлекце і звязаных з ім тэхналогіях, якія знаходжу найбольш карыснымі або прывабнымі. Я спадзяюся, што гэта дапаможа і вам таксама!
YouTube-канал, які добра падыходзіць, каб быць у курсе апошніх падзей. Канал часта абнаўляецца, а вядучы валодае заразлівым энтузіязмам і пазітывам ва ўсіх асвятляных тэмах. Чакайце асвятленні цікавых прац не толькі аб ІІ, але і аб кампутарнай графіцы і іншых візуальна прывабных тэмах.
На сваім YouTube-канале, Янік тэхнічна падрабязна тлумачыць значныя даследаванні ў глыбокім навучанні. Замест таго каб чытаць даследаванне самастойна, часта бывае хутчэй і прасцей паглядзець адно з яго відэа, каб глыбей зразумець важныя артыкулы. Тлумачэнні перадаюць сутнасць артыкулаў, не грэбуючы матэматыкай і не губляючыся ў трох хвоях. Яннік таксама дзеліцца сваімі поглядамі - аб тым, як даследаванні суадносяцца адзін з адным, меркаваннем аб тым, наколькі сур'ёзна трэба ставіцца да вынікаў, больш шырокімі інтэрпрэтацыямі і г.д. Навічкам (ці неакадэмічным практыкам) цяжэй прыйсці да гэтых адкрыццяў самастойна.
Даследаванні ў галіне машыннага навучання павінны быць яснымі, дынамічнымі і яркімі. А Distill створаны, каб дапамагаць у даследаваннях.
Distill - унікальнае выданне з даследаваннямі ў галіне машыннага навучання. Прасоўваюцца артыкулы з узрушаючымі візуалізацыямі, каб даць чытачу больш інтуітыўнае разуменне тэм. Прасторавае мысленне і ўяўленне, як правіла, працуюць вельмі добра, дапамагаючы ў разуменні тэм машыннага навучання і Data Science. Традыцыйныя ж фарматы публікацый, наадварот, маюць тэндэнцыю быць цвёрдымі ў сваёй структуры, статычнымі і сухімі, а часам і «матэматычнымі». Крыс Ола (Chris Olah), адзін са стваральнікаў Distill, таксама вядзе дзіўны асабісты блог на GitHub. Ён даўно не абнаўляўся, але да гэтага часу застаецца калекцыяй лепшых з калі-небудзь напісаных тлумачэнняў па тэме глыбокага навучання. У прыватнасці, мне вельмі дапамагло апісанне LSTM!
Себасцьян Рудэр піша вельмі змястоўны блог і інфармацыйны бюлетэнь, у першую чаргу аб скрыжаванні нейронавых сетак і аналізу тэкстаў на натуральных мовах. Ён таксама дае шмат парадаў даследчыкам і дакладчыкам на навуковых канферэнцыях, яны могуць быць вельмі карысныя, калі вы знаходзіцеся ў акадэмічных колах. Артыкулы Себасцьяна, як правіла, маюць форму аглядаў, падводзячы вынікі і тлумачачы стан сучасных даследаванняў і метадаў у той ці іншай вобласці. Гэта азначае, што артыкулы вельмі карысныя для практыкаў, якія жадаюць хутка зарыентавацца. Себасцьян таксама піша ў Twitter.
Андрэй Карпат не мае патрэбы ў прадстаўленні. Апроч таго, што ён з'яўляецца адным з самых вядомых даследчыкаў глыбокага навучання на Зямлі, ён стварае шырока выкарыстоўваюцца інструменты, напрыклад, arxiv sanity preserver у якасці іншых праектаў. Шмат людзей увайшлі ў гэтую сферу праз яго Стэнфардскі курс cs231n, і вам будзе карысна пазнаць яго рэцэпт навучання нейронавай сеткі. Я таксама рэкамендую паглядзець яго гаворка аб рэальных праблемах, якія Tesla павінна пераадолець, спрабуючы прымяніць машыннае навучанне ў масавым маштабе ў рэальным свеце. Гаворка інфарматыўная, яна ўражвае і выцвярэжвае. Акрамя артыкулаў аб ML непасрэдна, Андрэй Карпаці дае добрыя жыццёвыя парады для амбіцыйных вучоных. Чытайце Андрэя ў Twitter і на Github.
Інжынерны блог Uber сапраўды ўражвае маштабам і шырынёй ахопу, асвячаючы масу тэм, у прыватнасці штучны інтэлект. Што мне асабліва падабаецца ў інжынернай культуры Uber, дык гэта іх тэндэнцыя выпускаць вельмі цікавыя і каштоўныя. праекты з адкрытым зыходным кодам у галавакружным тэмпе. Вось некаторыя прыклады:
Калі адкінуць рознагалоссі, блог OpenAI, несумненна, выдатны. Час ад часу ў блогу публікуецца кантэнт і ідэі аб глыбокім навучанні, якія могуць прыйсці толькі ў маштабах OpenAI: гіпатэтычны феномен глыбокага падвойнага спуску. Каманда OpenAI, як правіла, публікуе пасты нячаста, але гэта важныя матэрыялы.
Блог Taboola не так добра вядомы, як некаторыя іншыя крыніцы ў гэтым пасце, але я лічу яго ўнікальным - аўтары пішуць пра вельмі прызямлёных, рэальных праблемах пры спробе ўжываць ML у вытворчасці для нармальнага »бізнэсу: менш аб самакіравальных аўтамабілях і агентах RL, якія перамагаюць чэмпіёнаў свету, больш аб тым, "як мне даведацца, што мая мадэль зараз прадказвае рэчы з фальшывай упэўненасцю?". Гэтыя праблемы актуальныя амаль для ўсіх, хто працуе ў гэтай галіне, і яны менш асвятляюцца ў прэсе, чым больш сыходныя тэмы ІІ, але для правільнага вырашэння гэтых праблем усё яшчэ патрабуецца талент сусветнага класа. На шчасце, Taboola валодае як гэтым талентам, так і гатоўнасцю і здольнасцю пісаць пра яго, каб іншыя людзі таксама маглі вучыцца.
Reddit
Нараўне з Twitter, няма нічога лепш у Reddit, чым учапіцца за даследаванні, інструменты або мудрасць натоўпу.
Пасты публікуюцца толькі штогод, але напоўнены інфармацыяй вельмі шчыльна. У параўнанні з іншымі крыніцамі з гэтага спісу, гэты даступней для не звязаных з тэхналогіямі дзелавых людзей. Што мне падабаецца ў дакладах, дык гэта тое, што ён спрабуе даць больш цэласнае ўяўленне аб тым, куды рухаецца галіна і даследаванні, з вышыні птушынага палёту звязваючы разам дасягненні ў галіне апаратнага забеспячэння, даследаванняў, бізнесу і нават геапалітыкі. Абавязкова пачынайце з канца, каб прачытаць аб канфлікце інтарэсаў.
падкасты
Шчыра кажучы, я лічу, што падкасты дрэнна прыстасаваны для вывучэння тэхнічных тэм. Бо для тлумачэння тым яны выкарыстоўваюць толькі гук, а навука аб дадзеных - гэта вельмі візуальная вобласць. Падкасты, як правіла, даюць вам нагода для больш глыбокага даследавання пазней ці ў для займальных філасофскіх дыскусій. Тым не менш, вось некаторыя рэкамендацыі:
падкаст Лекса Фрыдмана, Калі ён размаўляе з вядомымі даследчыкамі з вобласці штучнага інтэлекту. Асабліва добрыя эпізоды з Франсуа Шолле!
Мэці Марыянскі
Мэт знаходзіць прыгожыя, творчыя спосабы выкарыстання нейронавых сетак, і гэта проста пацешна – бачыць яго вынікі ў вашай стужцы Twitter. Зірнуць бы хаця б на гэты пост
Оры Коэн
Оры - проста машына для вядзення блогаў. Ён шмат піша аб праблемах і рашэннях для дата-саенцістаў. Абавязкова падпішыцеся, каб атрымаць апавяшчэнне, калі публікуецца артыкул. Яго зборнік, у прыватнасці, сапраўды ўражвае.
Джэрэмі Говард
Сузаснавальнік кампаніі fast.ai, усебаковая крыніца творчасці і прадуктыўнасці.
Хамель Хусэйн
Штатны інжынер ML ў Github, Хамель Хусэйн заняты на працы стварэннем і справаздачнасцю па многіх інструментах для кодэра ў галіне дадзеных.
Франсуа Шолле
Стваральнік Keras, зараз спрабуе абнавіць нашы ўяўленні аб тым, што такое інтэлект і як яго праверыць.
Арыгінал паста можа абнаўляцца па меры таго, як аўтар знаходзіць выдатныя крыніцы кантэнту, якія было б сорамна не ўключыць у спіс. Не саромейцеся звяртацца да яго ў Twitter, калі хочаце парэкамендаваць нейкую новую крыніцу! А яшчэ DAGsHub наймае Advocate [заўв. перав. публічнага практыкуючага прыхільніка] у Data Science, так што калі вы ствараеце свой уласны кантэнт па Data Science, не саромейцеся напісаць аўтару паста.
Развівайцеся, чытаючы рэкамендаваныя крыніцы, а па промакодзе HABR, вы зможаце атрымаць дадатковыя 10% да скідкі названай на банеры.