Beth i'w ddarllen fel gwyddonydd data yn 2020

Beth i'w ddarllen fel gwyddonydd data yn 2020
Yn y swydd hon, rydym yn rhannu gyda chi ddetholiad o ffynonellau gwybodaeth ddefnyddiol am Wyddoniaeth Data gan gyd-sylfaenydd a CTO DAGsHub, platfform cymunedol a gwe ar gyfer rheoli fersiynau data a chydweithio rhwng gwyddonwyr data a pheirianwyr dysgu peirianyddol. Mae'r detholiad yn cynnwys amrywiaeth o ffynonellau, o gyfrifon Twitter i flogiau peirianneg llawn, sydd wedi'u hanelu at y rhai sy'n gwybod yn union beth maen nhw'n chwilio amdano. Manylion o dan y toriad.

Gan yr awdur:
Chi yw'r hyn rydych chi'n ei fwyta, ac fel gweithiwr gwybodaeth mae angen diet gwybodaeth da arnoch chi. Rwyf am rannu ffynonellau gwybodaeth am Wyddoniaeth Data, Deallusrwydd Artiffisial a thechnolegau cysylltiedig sydd fwyaf defnyddiol neu ddeniadol i mi. Rwy'n gobeithio bod hyn yn eich helpu chi hefyd!

Dau Bapur Munud

Sianel YouTube sy'n addas iawn i gadw i fyny â'r digwyddiadau diweddaraf. Mae'r sianel yn cael ei diweddaru'n aml ac mae gan y gwesteiwr frwdfrydedd heintus a phositifrwydd ar gyfer yr holl bynciau dan sylw. Disgwyliwch sylw i waith diddorol nid yn unig ar AI, ond hefyd ar graffeg gyfrifiadurol a phynciau eraill sy'n apelio yn weledol.

Yannick Kilcher

Ar ei sianel YouTube, mae Yannick yn esbonio ymchwil sylweddol mewn dysgu dwfn yn fanwl dechnegol. Yn lle darllen yr astudiaeth eich hun, mae'n aml yn gyflymach ac yn haws gwylio un o'i fideos i gael dealltwriaeth ddyfnach o'r erthyglau pwysig. Mae’r esboniadau’n cyfleu hanfod yr erthyglau heb esgeuluso mathemateg na mynd ar goll mewn tair pinwydd. Mae Yannick hefyd yn rhannu ei farn ar sut mae'r astudiaethau'n cyd-fynd â'i gilydd, pa mor ddifrifol i gymryd y canlyniadau, dehongliadau ehangach, a mwy. Mae'n anoddach i ddechreuwyr (neu ymarferwyr anacademaidd) ddod i'r darganfyddiadau hyn ar eu pen eu hunain.

distill.pub

Yn eu geiriau eu hunain:

Mae angen i ymchwil dysgu peiriannau fod yn glir, yn ddeinamig ac yn fywiog. A chrëwyd Distill i helpu gydag ymchwil.

Mae Distill yn gyhoeddiad unigryw gydag ymchwil ym maes dysgu peirianyddol. Hyrwyddir erthyglau gyda delweddiadau syfrdanol i roi dealltwriaeth fwy greddfol i'r darllenydd o'r pynciau. Mae meddwl gofodol a dychymyg yn tueddu i weithio'n dda iawn wrth helpu i ddeall pynciau Dysgu Peiriannau a Gwyddor Data. Mae fformatau cyhoeddi traddodiadol, ar y llaw arall, yn dueddol o fod yn anhyblyg yn eu strwythur, yn sefydlog ac yn sych, ac weithiau "mathemategol". Mae gan Chris Olah, un o grewyr Distill, flog personol anhygoel hefyd yn GitHub. Nid yw wedi'i ddiweddaru ers tro, ond mae'n dal i fod yn gasgliad o'r esboniadau gorau ar bwnc dysgu dwfn a ysgrifennwyd erioed. Yn benodol, fe wnaeth fy helpu llawer y disgrifiad LSTM!

Beth i'w ddarllen fel gwyddonydd data yn 2020
ffynhonnell

Sebastian Ruder

Mae Sebastian Ruder yn ysgrifennu blog a chylchlythyr craff iawn, yn bennaf am groestoriad rhwydweithiau niwral a chloddio testun iaith naturiol. Mae ganddo hefyd lawer o gyngor i ymchwilwyr a siaradwyr cynadledda, a all fod yn ddefnyddiol iawn os ydych yn y byd academaidd. Mae erthyglau Sebastian fel arfer ar ffurf adolygiadau, yn crynhoi ac yn egluro cyflwr ymchwil a dulliau cyfredol mewn maes penodol. Mae hyn yn golygu bod yr erthyglau yn hynod ddefnyddiol ar gyfer ymarferwyr sydd am gael eu cyfeiriannau yn gyflym. Mae Sebastian hefyd yn ysgrifennu yn Twitter.

Andrey Karpathy

Nid oes angen cyflwyniad ar Andrei Karpathy. Yn ogystal â bod yn un o'r ymchwilwyr dysgu dwfn enwocaf ar y Ddaear, mae'n creu offer a ddefnyddir yn eang, e.e. arxiv cadwwr santeiddrwydd fel prosiectau ochr. Mae pobl di-ri wedi mynd i'r maes hwn trwy ei gwrs Stanford cs231n, a bydd yn ddefnyddiol i chi ei wybod rysáit hyfforddiant rhwydwaith niwral. Rwyf hefyd yn argymell ei wylio araith am yr heriau byd go iawn y mae'n rhaid i Tesla eu goresgyn wrth geisio cymhwyso dysgu peirianyddol ar raddfa dorfol yn y byd go iawn. Mae'r araith yn addysgiadol, yn drawiadol ac yn sobreiddiol. Yn ogystal ag erthyglau am ML ei hun, mae Andrei Karpathy yn rhoi cyngor bywyd da gyfer gwyddonwyr uchelgeisiol. Darllenwch Andrey yn Twitter ac ymlaen Github.

Peirianneg Uber

Mae blog peirianneg Uber yn wirioneddol drawiadol o ran maint ac ehangder ei sylw, gan gwmpasu llawer o bynciau, yn arbennig Deallusrwydd Artiffisial. Yr hyn rwy'n ei hoffi'n arbennig am ddiwylliant peirianneg Uber yw eu tueddiad i gynhyrchu'n ddiddorol a gwerthfawr iawn prosiectau ffynhonnell agored ar gyflymder torri. Dyma rai enghreifftiau:

Blog OpenAI

O’r neilltu, mae blog OpenAI yn ddiamau yn fendigedig. O bryd i'w gilydd, mae'r blog yn postio cynnwys a syniadau am ddysgu dwfn na all ond ddod ar raddfa OpenAI: Hypothetical ffenomen disgyniad dwbl dwfn. Mae tîm OpenAI yn tueddu i bostio'n anaml, ond mae hyn yn bethau pwysig.

Beth i'w ddarllen fel gwyddonydd data yn 2020
ffynhonnell

Blog Taboola

Nid yw blog Taboola mor adnabyddus â rhai o'r ffynonellau eraill yn y swydd hon, ond rwy'n credu ei fod yn unigryw - mae'r awduron yn ysgrifennu am broblemau bywyd go iawn, lawr-i-ddaear, wrth geisio cymhwyso ML mewn gweithgynhyrchu ar gyfer "normal" “ busnesau: llai am geir hunan-yrru ac asiantau RL yn ennill pencampwyr y byd, mwy am “sut ydw i'n gwybod bod fy model bellach yn rhagweld pethau'n ffug-hyderus?” Mae'r problemau hyn yn berthnasol i bron pawb sy'n gweithio yn y maes, ac maent yn cael llai o sylw yn y wasg na phynciau AI mwy cyffredin, ond mae'n dal i gymryd talent o safon fyd-eang i ddatrys y problemau hyn yn gywir. Yn ffodus, mae gan Taboola y ddawn hon a'r parodrwydd a'r gallu i ysgrifennu amdano fel y gall pobl eraill ddysgu hefyd.

reddit

Ynghyd â Twitter, does dim byd gwell ar Reddit na gwirioni ar ymchwil, offer, neu ddoethineb y dorf.

Cyflwr AI

Cyhoeddir postiadau yn flynyddol yn unig, ond cânt eu llenwi â gwybodaeth drwchus iawn. O'i gymharu â ffynonellau eraill ar y rhestr hon, mae'r un hon yn fwy hygyrch i bobl fusnes nad yw'n dechnoleg. Yr hyn rwy'n ei hoffi am y sgyrsiau yw ei fod yn ceisio darparu golwg fwy cyfannol o gyfeiriad y diwydiant ac ymchwil, gan glymu datblygiadau mewn caledwedd, ymchwil, busnes, a hyd yn oed geopolitics o olwg aderyn. Byddwch yn siwr i ddechrau ar y diwedd i ddarllen am wrthdaro buddiannau.

Podlediadau

A dweud y gwir, rwy'n meddwl bod podlediadau yn addas iawn ar gyfer archwilio pynciau technegol. Wedi'r cyfan, maen nhw'n defnyddio sain i egluro pynciau yn unig, ac mae gwyddor data yn faes gweledol iawn. Mae podlediadau yn tueddu i roi esgus i chi wneud ymchwil fanylach yn ddiweddarach neu gael rhai trafodaethau athronyddol hynod ddiddorol. Fodd bynnag, dyma rai argymhellion:

Rhestrau Anhygoel

Mae llai i gadw golwg arno yma, ond mwy o adnoddau sy'n ddefnyddiol pan fyddwch chi'n gwybod beth rydych chi'n chwilio amdano:

Twitter

  • Matty Marianski
    Mae Matty yn dod o hyd i ffyrdd hardd, creadigol o ddefnyddio rhwydweithiau niwral, ac mae'n hwyl gweld ei ganlyniadau ar eich ffrwd Twitter. O leiaf cymerwch olwg ar hyn cyflym.
  • Ori Cohen
    Dim ond peiriant gyrru yw Ori blogiau. Mae'n ysgrifennu'n helaeth am broblemau ac atebion i wyddonwyr data. Byddwch yn siwr i danysgrifio i gael gwybod pan fydd erthygl yn cael ei chyhoeddi. Ei casgliad, yn arbennig, yn wirioneddol drawiadol.
  • Jeremy Howard
    Cyd-sylfaenydd fast.ai, ffynhonnell gynhwysfawr o greadigrwydd a chynhyrchiant.
  • Hamel Hussein
    Yn beiriannydd ML staff yn Github, mae Hamel Hussain yn brysur yn y gwaith yn creu ac yn adrodd ar lawer o offer ar gyfer codwyr data.
  • Francois Chollet
    Creawdwr Keras, yn awr ceisio diweddaru ein dealltwriaeth o beth yw deallusrwydd a sut i'w brofi.
  • Hardmaru
    Gwyddonydd Ymchwil yn Google Brain.

Casgliad

Efallai y bydd y postiad gwreiddiol yn cael ei ddiweddaru wrth i'r awdur ddod o hyd i ffynonellau cynnwys gwych y byddai'n drueni peidio â'u cynnwys yn y rhestr. Mae croeso i chi gysylltu ag ef yn Twitter, os ydych chi am argymell ffynhonnell newydd! A hefyd DAGsHub llogi Eiriolwr [tua. cyfieithiad ymarferwr cyhoeddus] mewn Gwyddor Data, felly os ydych chi'n creu eich cynnwys Gwyddor Data eich hun, mae croeso i chi ysgrifennu at awdur y post.

Beth i'w ddarllen fel gwyddonydd data yn 2020
Datblygwch eich hun trwy ddarllen ffynonellau a argymhellir, a defnyddio'r cod hyrwyddo HABR, gallwch gael 10% ychwanegol at y gostyngiad a nodir ar y faner.

Mwy o gyrsiau

Erthyglau dan Sylw

Ffynhonnell: hab.com