Што да читате како научник за податоци во 2020 година

Што да читате како научник за податоци во 2020 година
Во овој пост, споделуваме со вас избор на извори на корисни информации за Data Science од ко-основачот и CTO на DAGsHub, заедница и веб-платформа за контрола на верзии на податоци и соработка помеѓу научниците за податоци и инженерите за машинско учење. Изборот вклучува различни извори, од сметки на Твитер до полноправни инженерски блогови, кои се наменети за оние кои точно знаат што бараат. Детали под сечењето.

Од авторот:
Вие сте тоа што го јадете, а како работник со знаење ви треба добра информативна диета. Сакам да споделам извори на информации за науката за податоци, вештачката интелигенција и поврзаните технологии што ги сметам за најкорисни или привлечни. Се надевам дека ова ви помага и вам!

Две минутни трудови

Канал на YouTube кој е добро прилагоден да биде во тек со најновите настани. Каналот често се ажурира и водителот има заразен ентузијазам и позитивност за сите опфатени теми. Очекувајте покривање на интересна работа не само за вештачка интелигенција, туку и за компјутерска графика и други визуелно привлечни теми.

Јаник Килчер

На неговиот канал на YouTube, Јаник објаснува значајни истражувања за длабоко учење во технички детали. Наместо сами да ја читате студијата, често е побрзо и полесно да гледате едно од неговите видеа за да стекнете подлабоко разбирање за важните написи. Објаснувањата ја пренесуваат суштината на написите без да се занемари математиката или да се изгуби во три борови. Јаник исто така ги споделува своите ставови за тоа како студиите се вклопуваат заедно, колку сериозно да се земат резултатите, пошироки толкувања и многу повеќе. Потешко е за почетниците (или неакадемските практичари) сами да дојдат до овие откритија.

Дестил.паб

Со свои зборови:

Истражувањето за машинско учење треба да биде јасно, динамично и живописно. И Дистил беше создаден за да помогне во истражувањето.

Дистил е единствена публикација со истражување во областа на машинското учење. Написите со зачудувачки визуелизации се промовираат за да му дадат на читателот поинтуитивно разбирање на темите. Просторното размислување и имагинацијата имаат тенденција да работат многу добро во помагањето да се разберат темите за Машинско учење и наука за податоци. Традиционалните формати на објавување, од друга страна, имаат тенденција да бидат крути во нивната структура, статични и суви, а понекогаш „математички“. Крис Олах, еден од креаторите на Дистил, има и неверојатен личен блог во GitHub. Не е ажуриран некое време, но сепак останува збирка од најдобрите објаснувања на темата за длабоко учење некогаш напишани. Конкретно, тоа ми помогна многу описание LSTM!

Што да читате како научник за податоци во 2020 година
извор

Себастијан Рудер

Себастијан Рудер пишува многу прониклив блог и билтен, првенствено за пресекот на невронските мрежи и рударството на текст на природен јазик. Тој, исто така, има многу совети за истражувачи и говорници на конференции, што може да биде многу корисно ако сте во академската заедница. Статиите на Себастијан обично имаат форма на прегледи, сумирање и објаснување на состојбата на тековните истражувања и методи во одредена област. Ова значи дека написите се исклучително корисни за практичарите кои сакаат брзо да ги добијат своите лежишта. Себастијан исто така пишува во Twitter.

Андреј Карпати

На Андреј Карпати не му треба вовед. Покрај тоа што е еден од најпознатите истражувачи за длабоко учење на Земјата, тој создава широко користени алатки, на пр. arxiv чувар на разумот како споредни проекти. Безброј луѓе влегоа на ова поле преку неговиот курс на Стенфорд cs231n, и ќе ви биде корисно да го знаете рецепт обука за невронски мрежи. Ви препорачувам и да го гледате говорот за предизвиците во реалниот свет што Тесла мора да ги надмине кога се обидува масовно да го примени машинското учење во реалниот свет. Говорот е информативен, впечатлив и отрезнувачки. Во прилог на написите за самата ML, Андреј Карпати дава добар животен совет за амбициозни научници. Прочитајте го Андреј Twitter и Github.

Uber Engineering

Блогот за инженерство Uber е навистина импресивен по својот обем и ширина на покриеност, покривајќи многу теми, особено Вештачка интелигенција. Она што особено ми се допаѓа во инженерската култура на Uber е нивната тенденција да произведуваат многу интересни и вредни Проекти отворен код со опасно темпо. Еве неколку примери:

Блог OpenAI

Настрана контроверзите, блогот на OpenAI е несомнено прекрасен. Од време на време, блогот објавува содржини и идеи за длабоко учење што може да дојде само на скалата на OpenAI: хипотетички филм длабоко двојно спуштање. Тимот на OpenAI има тенденција да објавува ретко, но ова е важна работа.

Што да читате како научник за податоци во 2020 година
извор

Блог Табула

Блогот Taboola не е толку познат како некои од другите извори во овој пост, но мислам дека е уникатен - авторите пишуваат за многу приземни, реални проблеми кога се обидуваат да применат ML во производството за „нормални Бизниси: помалку за самоуправувачките автомобили и агентите на RL кои освојуваат светски шампиони, повеќе за „како да знам дека мојот модел сега ги предвидува работите со лажна самодоверба?“ Овие проблеми се релевантни за речиси секој што работи на терен, и тие добиваат помалку покриеност во печатот од повообичаените теми за вештачка интелигенција, но сепак потребни се таленти од светска класа за правилно да се решат овие проблеми. За среќа, Табула го има и овој талент и подготвеноста и способноста да пишува за тоа за да можат и другите луѓе да научат.

reddit

Заедно со Твитер, нема ништо подобро на Редит од тоа да се навлечете на истражување, алатки или мудрост на толпата.

Состојба на вештачка интелигенција

Објавите се објавуваат само годишно, но се полни со многу густи информации. Во споредба со другите извори на оваа листа, овој е попристапен за не-технолошките деловни луѓе. Она што ми се допаѓа во разговорите е тоа што се обидува да обезбеди похолистички поглед на тоа каде се движат индустријата и истражувањето, поврзувајќи ги заедно напредокот во хардверот, истражувањето, бизнисот, па дури и геополитиката од птичја перспектива. Бидете сигурни да започнете на крајот да читате за конфликт на интереси.

Подкасти

Искрено, мислам дека подкастите се слабо прилагодени за истражување на технички теми. На крајот на краиштата, тие користат само аудио за да објаснуваат теми, а науката за податоци е многу визуелно поле. Поткастите имаат тенденција да ви дадат изговор да направите подлабоко истражување подоцна или да имате некои фасцинантни филозофски дискусии. Сепак, еве неколку препораки:

Прекрасни листи

Овде има помалку за следење, но повеќе ресурси кои се корисни кога знаете што барате:

Twitter

  • Мети Мариански
    Мети наоѓа убави, креативни начини за користење на невронски мрежи и едноставно е забавно да се видат неговите резултати на вашиот Twitter feed. Барем погледнете овој пост.
  • Ори Коен
    Ори е само машина за возење блогови. Тој опширно пишува за проблеми и решенија за научниците за податоци. Бидете сигурни да се претплатите за да бидете известени кога ќе се објави статија. Неговиот компилација, особено, е навистина импресивен.
  • Џереми Хауард
    Ко-основач на fast.ai, сеопфатен извор на креативност и продуктивност.
  • Хамел Хусеин
    Вработен инженер за ML во Github, Хамел Хусеин е зафатен со работа создавајќи и известувајќи за многу алатки за кодери на податоци.
  • Франсоа Шоле
    Создател на Керас, сега се обидуваат да ажурирајте го нашето разбирање за тоа што е интелигенција и како да ја тестираме.
  • Хардмару
    Истражувачки научник во Google Brain.

Заклучок

Оригиналната објава може да се ажурира бидејќи авторот наоѓа одлични извори на содржина што би било штета да не ги вклучи во списокот. Слободно контактирајте го на Twitter, ако сакате да препорачате нов извор! И, исто така, DAGsHub вработува Адвокат [приближно. превод public Practitioner] во Data Science, па ако креирате своја содржина на Data Science, слободно пишете му на авторот на објавата.

Што да читате како научник за податоци во 2020 година
Развијте се со читање препорачани извори и користење на промотивниот код HABR, можете да добиете дополнителни 10% на попустот наведен на банерот.

Повеќе курсеви

Избрани статии

Извор: www.habr.com