Que ler como científico de datos en 2020

Que ler como científico de datos en 2020
Nesta publicación, compartimos contigo unha selección de fontes de información útil sobre Data Science do cofundador e CTO de DAGsHub, unha comunidade e plataforma web para o control de versións de datos e a colaboración entre científicos de datos e enxeñeiros de aprendizaxe automática. A selección inclúe unha variedade de fontes, desde contas de Twitter ata blogs de enxeñería completos, que están dirixidas a aqueles que saben exactamente o que están a buscar. Detalles baixo o corte.

Do autor:
Vostede é o que come e, como traballador do coñecemento, necesita unha boa dieta informativa. Quero compartir fontes de información sobre Data Science, intelixencia artificial e tecnoloxías relacionadas que me parecen máis útiles ou atractivas. Espero que isto tamén che axude!

Papeis de dous minutos

Unha canle de YouTube que se adapta moi ben para estar ao día dos últimos eventos. A canle actualízase con frecuencia e o anfitrión ten un entusiasmo contaxioso e unha positividade en todos os temas tratados. Espere a cobertura de traballos interesantes non só sobre AI, senón tamén sobre gráficos por ordenador e outros temas visualmente atractivos.

Yannick Kilcher

Na súa canle de YouTube, Yannick explica con detalles técnicos importantes investigacións sobre aprendizaxe profunda. En lugar de ler un estudo por conta propia, adoita ser máis rápido e sinxelo ver un dos seus vídeos para comprender máis a fondo os artigos importantes. As explicacións transmiten a esencia dos artigos sen descoidar as matemáticas nin perderse en tres pinos. Yannick tamén comparte as súas opinións sobre como encaixan os estudos, como se deben tomar en serio os resultados, interpretacións máis amplas, etc. Os principiantes (ou os profesionais non académicos) teñen máis dificultades para chegar a estes descubrimentos por si mesmos.

destilar.pub

Nas súas propias palabras:

A investigación de aprendizaxe automática debe ser clara, dinámica e vibrante. E Distill foi creado para axudar na investigación.

Distill é unha publicación única de investigación de aprendizaxe automática. Os artigos promóvense con visualizacións abraiantes para darlle ao lector unha comprensión máis intuitiva dos temas. O pensamento espacial e a imaxinación adoitan funcionar moi ben para axudarche a comprender os temas de Machine Learning e Data Science. Os formatos de publicación tradicionais, pola súa banda, tenden a ser ríxidos na súa estrutura, estáticos e secos, e ás veces "matemático". Chris Olah, co-creador de Distill, tamén mantén un incrible blog persoal en GitHub. Hai moito tempo que non se actualizou, pero segue sendo unha colección das mellores explicacións de aprendizaxe profunda xamais escritas. En particular, axudoume moito описание LSTM!

Que ler como científico de datos en 2020
fonte

Sebastián Ruder

Sebastian Ruder escribe un blog e un boletín informativo, principalmente sobre a intersección de redes neuronais e análise de textos en linguaxe natural. Tamén dá moitos consellos a investigadores e conferenciantes, que poden ser moi útiles se estás no mundo académico. Os artigos de Sebastián tenden a adoptar a forma de recensións, que resumen e explican o estado da arte da investigación e dos métodos nunha determinada área. Isto significa que os artigos son moi útiles para os practicantes que queren orientarse rapidamente. Sebastián tamén escribe en chilro.

Andrei Karpaty

Andrei Karpaty non necesita presentación. Ademais de ser un dos investigadores de aprendizaxe profunda máis famosos da terra, crea ferramentas moi utilizadas como conservador de cordura de arquivo como proxectos paralelos. Infinidade de persoas entraron neste reino a través do seu curso de Stanford. cs231n, e será útil que o coñezas receita adestramento en redes neuronais. Tamén recomendo velo discurso sobre os problemas reais que Tesla debe superar ao intentar aplicar a aprendizaxe automática a gran escala no mundo real. O discurso é informativo, impresionante e aleccionador. Ademais de artigos sobre ML en si, Andrey Karpaty dá bos consellos de vida para científicos ambiciosos. Lea a Andrew en chilro e Github.

Enxeñaría de Uber

O blog de enxeñería de Uber é realmente impresionante en termos de escala e amplitude de cobertura, que abarca moitos temas, en particular Intelixencia artificial. O que me gusta especialmente da cultura de enxeñería de Uber é a súa tendencia a lanzar algo moi interesante e valioso proxectos código aberto a un ritmo vertixinoso. Aquí tes algúns exemplos:

Blog de OpenAI

A parte de polémicas, o blog de OpenAI é innegablemente xenial. De cando en vez, o blog publica contido e ideas sobre a aprendizaxe profunda que só poden chegar á escala de OpenAI: hipotéticos. fenómeno profunda baixada dobre. O equipo de OpenAI adoita publicar con pouca frecuencia, pero estes son contidos importantes.

Que ler como científico de datos en 2020
fonte

Blog de Taboola

O blog de Taboola non é tan coñecido como algunhas das outras fontes desta publicación, pero creo que é único: os autores escriben sobre problemas reais e moi mundanos cando intentan aplicar ML na produción para un negocio "normal": menos sobre coches autónomos e axentes de RL que gañan campións do mundo, máis sobre "como sei se o meu modelo está agora a predicir cousas con falsa confianza?". Estes problemas son relevantes para case todos os que traballan no campo e reciben menos cobertura da prensa que os temas máis comúns de IA, pero aínda fai falta talento de clase mundial para abordar adecuadamente estes problemas. Afortunadamente, Taboola ten tanto este talento como a vontade e a capacidade de escribir sobre el para que outras persoas tamén poidan aprender.

Reddit

Xunto con Twitter, non hai nada mellor en Reddit que engancharse á investigación, ás ferramentas ou á sabedoría da multitude.

Estado da IA

As publicacións publícanse só anualmente, pero están cheas de información moi densamente. En comparación con outras fontes desta lista, esta é máis accesible para os empresarios non tecnolóxicos. O que me encanta das charlas é que tentan dar unha visión máis holística de cara a onde se dirixe a industria e a investigación, vinculando os avances en hardware, investigación, negocios e mesmo xeopolítica desde a vista de paxaro. Asegúrate de comezar polo final para ler sobre conflitos de intereses.

Podcasts

Francamente, creo que os podcasts non son axeitados para aprender sobre temas técnicos. Despois de todo, só usan o son para explicar temas e a ciencia de datos é un campo moi visual. Os podcasts adoitan darche unha escusa para explorar máis en profundidade máis tarde ou para entablar discusións filosóficas. Non obstante, aquí tes algunhas recomendacións:

Listas impresionantes

Aquí hai menos que vixiar, pero hai máis recursos que son útiles unha vez que sabes o que estás buscando:

chilro

  • Matty Mariansky
    Matty atopa formas fermosas e creativas de usar as redes neuronais, e é divertido ver os seus resultados na túa fonte de Twitter. Bótalle un ollo polo menos isto publicación
  • Ori Cohen
    Ori é só unha máquina de condución blogs. Escribe extensamente sobre problemas e solucións para os científicos de datos. Asegúrate de subscribirte para recibir unha notificación cando se publique un artigo. O seu compilaciónen particular é realmente impresionante.
  • Jeremy Howard
    Cofundador de fast.ai, unha fonte integral de creatividade e produtividade.
  • Hamel Hussein
    Hamel Hussain, enxeñeiro de ML do persoal de Github, está ocupado no traballo creando e informando sobre moitas ferramentas para codificadores no dominio de datos.
  • François Chollet
    Creador de Keras, agora tentando actualizar a nosa comprensión do que é a intelixencia e como probala.
  • hardmaru
    Investigador científico en Google Brain.

Conclusión

É posible que a publicación orixinal se actualice xa que o autor atope excelentes fontes de contido que sería unha mágoa non incluír na lista. Non dubide en contactar con el chilrose queres recomendar algunha nova fonte! E tamén DAGsHub contrata Avogado [aprox. transl. Public Practitioner] en Data Science, así que se creas o teu propio contido Data Science, non dubides en escribir ao autor da publicación.

Que ler como científico de datos en 2020
Desenvolver lendo as fontes recomendadas, e polo código promocional HABR, podes obter un 10% adicional ao desconto indicado no banner.

Máis cursos

Artigos destacados

Fonte: www.habr.com