Шта читати као научник података у 2020

Шта читати као научник података у 2020
У овом посту делимо са вама избор извора корисних информација о науци о подацима од суоснивача и техничког директора ДАГсХуб-а, заједнице и веб платформе за контролу верзија података и сарадњу између научника података и инжењера машинског учења. Избор укључује различите изворе, од Твитер налога до пуноправних инжењерских блогова, који су намењени онима који тачно знају шта траже. Детаљи испод реза.

Од аутора:
Ви сте оно што једете, а као радник знања потребна вам је добра информативна исхрана. Желим да поделим изворе информација о науци о подацима, вештачкој интелигенцији и сродним технологијама које сматрам најкориснијим или најпривлачнијим. Надам се да ће ово помоћи и вама!

Двоминутни радови

ИоуТубе канал који је веома погодан да буде у току са најновијим догађајима. Канал се често ажурира и домаћин има заразни ентузијазам и позитивност у свим обрађеним темама. Очекујте покривање занимљивих радова не само на АИ, већ и на компјутерској графици и другим визуелно привлачним темама.

Ианницк Килцхер

На свом ИоуТубе каналу, Ианницк објашњава значајна истраживања дубоког учења у техничким детаљима. Уместо да сами читате студију, често је брже и лакше погледати неки од њених видео записа да бисте стекли дубље разумевање важних чланака. Објашњења преносе суштину чланака без занемаривања математике или губљења у три бора. Ианницк такође дели своје ставове о томе како се студије уклапају, колико озбиљно треба схватити резултате, шира тумачења и тако даље. Почетницима (или неакадемским практичарима) теже је да сами дођу до ових открића.

дестилирати.пуб

сопственим речима:

Истраживање машинског учења мора да буде јасно, динамично и живописно. А Дистилл је створен да помогне у истраживању.

Дистилл је јединствена истраживачка публикација о машинском учењу. Чланци се промовишу са задивљујућим визуелизацијама како би се читаоцу дало интуитивније разумевање тема. Просторно размишљање и машта имају тенденцију да функционишу веома добро и помажу вам да разумете теме машинског учења и науке о подацима. Традиционални формати публикација, с друге стране, имају тенденцију да буду крути у својој структури, статични и суви, а понекад "математички". Крис Олах, ко-креатор Дистилл-а, такође води невероватан лични блог на ГитХуб. Није ажуриран дуго времена, али и даље остаје збирка најбољих објашњења дубоког учења икада написаних. Посебно ми је много помогло описание ЛСТМ!

Шта читати као научник података у 2020
извор

Себастијан Рудер

Себастијан Рудер пише веома информативан блог и билтен, пре свега о пресеку неуронских мрежа и анализи текста на природном језику. Он такође даје много савета истраживачима и говорницима на конференцијама, што може бити од велике помоћи ако сте у академској заједници. Себастијанови чланци имају тенденцију да буду у облику прегледа, сумирања и објашњења стања уметности у истраживању и методама у датој области. То значи да су чланци изузетно корисни за практичаре који желе брзо да се снађу. Себастијан такође пише Twitter.

Андреи Карпати

Андреју Карпатију није потребно представљање. Поред тога што је један од најпознатијих истраживача дубоког учења на земљи, он ствара широко коришћене алате као што су чувар здраве архиве као споредни пројекти. Безброј људи је ушло у ово царство кроз његов курс на Станфорду. цс231н, и биће вам корисно да то знате рецепт обука неуронске мреже. Такође препоручујем да га погледате говор о стварним проблемима које Тесла мора да превазиђе када покушава да примени машинско учење у масовним размерама у стварном свету. Говор је информативан, упечатљив и отрежњујући. Поред чланака о самом МЛ, Андреи Карпати даје добар животни савет за амбициозни научници. Прочитајте Андрев на Twitter и Гитхуб.

Убер инжењеринг

Уберов инжењерски блог је заиста импресиван у смислу обима и ширине покривености, покривајући много тема, посебно Вештачка интелигенција. Оно што ми се посебно свиђа у Уберовој инжењерској култури је њихова тенденција да објављују веома занимљиве и вредне Пројекти опен соурце вртоглавом брзином. Ево неколико примера:

ОпенАИ блог

На страну контроверзе, ОпенАИ блог је несумњиво сјајан. С времена на време, блог објављује садржај и увиде о дубоком учењу које може доћи само на нивоу ОпенАИ: хипотетички појава дубоко двоструко спуштање. ОпенАИ тим ретко објављује, али ово је важан садржај.

Шта читати као научник података у 2020
извор

Табоола Блог

Блог Табоола није толико познат као неки други извори у овом посту, али мислим да је јединствен – аутори пишу о веома свакодневним, стварним проблемима када покушавају да примене МЛ у производњи за „нормалан“ посао: мање о самовозећи аутомобили и РЛ агенти који освајају светске шампионе, више о томе „како да знам да ли мој модел сада предвиђа ствари са лажним самопоуздањем?“. Ова питања су релевантна за скоро све који раде у овој области и добијају мање извештавања у штампи од уобичајених тема о вештачкој интелигенцији, али је и даље потребан таленат светске класе да би се правилно решили ова питања. Срећом, Табоола има и овај таленат и спремност и способност да пише о томе како би и други људи могли да уче.

реддит

Поред Твитера, нема ничег бољег на Реддиту него да се навучете на истраживање, алате или мудрост гомиле.

Стање АИ

Постови се објављују само једном годишње, али су веома густо испуњени информацијама. У поређењу са другим изворима на овој листи, овај је приступачнији пословним људима који нису технолошки. Оно што ми се свиђа у разговорима је то што покушавају да дају холистичкији поглед на то куда иду индустрија и истраживање, повезујући напредак у хардверу, истраживању, пословању, па чак и геополитици из птичје перспективе. Обавезно почните од краја да бисте прочитали о сукобу интереса.

Подкастови

Искрено, мислим да подкасти нису погодни за учење о техничким темама. На крају крајева, они користе само звук за објашњење тема, а наука о подацима је веома визуелно поље. Подкасти обично дају изговор да касније детаљније истражите или да покренете филозофске расправе. Међутим, ево неколико препорука:

  • лек фриедман подцасткада разговара са истакнутим истраживачима из области вештачке интелигенције. Епизоде ​​са Франсоа Шолеом су посебно добре!
  • Подцаст Дата Енгинееринг. Лепо је чути о новим алатима за инфраструктуру података.

Сјајне листе

Овде је мање потребно да пазите, али више ресурса који су од помоћи када знате шта тражите:

Twitter

  • Матти Мариански
    Мети проналази прелепе, креативне начине за коришћење неуронских мрежа, и једноставно је забавно видети његове резултате на свом Твиттер фееду. Погледајте бар ово пост.
  • Ори Цохен
    Ори је само машина за вожњу блогови. Он опширно пише о проблемима и решењима за научнике података. Обавезно се претплатите да бисте били обавештени када чланак буде објављен. Његово компилацијапосебно је заиста импресиван.
  • Џереми Хауард
    Суоснивач фаст.аи, свеобухватног извора креативности и продуктивности.
  • Хамел Хусеин
    Запослени МЛ инжењер у Гитхуб-у, Хамел Хуссаин је заузет радом на стварању и извештавању о многим алатима за кодере у домену података.
  • Францоис Цхоллет
    Креатор Кераса, сада покушавајући да ажурирамо наше разумевање шта је интелигенција и како да је тестирамо.
  • хардмару
    Научник у Гоогле Браин-у.

Закључак

Оригинални пост се може ажурирати пошто аутор пронађе сјајне изворе садржаја које би било штета не укључити на листу. Слободно га контактирајте Twitterако желите да препоручите неки нови извор! И такође ДАГсХуб унајмљује Адвокат [цца. трансл. Публиц Працтитионер] у науци о подацима, тако да ако креирате сопствени садржај науке о подацима, слободно пишите аутору поста.

Шта читати као научник података у 2020
Развијајте читајући препоручене изворе и промотивни код ХАБР, можете добити додатних 10% на попуст назначен на банеру.

Више курсева

Рекомендуемие статьи

Извор: ввв.хабр.цом