Qué leer como científico de datos en 2020

Qué leer como científico de datos en 2020
En esta publicación, compartimos con usted una selección de fuentes de información útil sobre ciencia de datos del cofundador y CTO de DAGsHub, una comunidad y plataforma web para el control de versiones de datos y la colaboración entre científicos de datos e ingenieros de aprendizaje automático. La selección incluye una variedad de fuentes, desde cuentas de Twitter hasta blogs de ingeniería completos, dirigidos a quienes saben exactamente lo que buscan. Detalles bajo el corte.

Del autor:
Eres lo que comes y, como trabajador del conocimiento, necesitas una buena dieta informativa. Quiero compartir fuentes de información sobre Ciencia de Datos, Inteligencia Artificial y tecnologías relacionadas que me resulten más útiles o atractivas. ¡Espero que esto te ayude a ti también!

Papeles de dos minutos

Un canal de YouTube ideal para mantenerse al día con los últimos acontecimientos. El canal se actualiza con frecuencia y el presentador tiene un entusiasmo contagioso y una positividad por todos los temas tratados. Espere una cobertura de trabajos interesantes no solo sobre IA, sino también sobre gráficos por computadora y otros temas visualmente atractivos.

Yannick Kilcher

En su canal de YouTube, Yannick explica con detalle técnico importantes investigaciones sobre aprendizaje profundo. En lugar de leer el estudio usted mismo, suele ser más rápido y sencillo ver uno de sus vídeos para obtener una comprensión más profunda de los artículos importantes. Las explicaciones transmiten la esencia de los artículos sin descuidar las matemáticas ni perderse entre tres pinos. Yannick también comparte sus puntos de vista sobre cómo encajan los estudios, con qué seriedad se deben tomar los resultados, interpretaciones más amplias y más. Es más difícil para los principiantes (o los profesionales no académicos) llegar a estos descubrimientos por sí solos.

Destilar.pub

En sus propias palabras:

La investigación sobre el aprendizaje automático debe ser clara, dinámica y vibrante. Y Distill fue creado para ayudar con la investigación.

Distill es una publicación única con investigaciones en el campo del aprendizaje automático. Se promocionan artículos con visualizaciones impresionantes para brindar al lector una comprensión más intuitiva de los temas. El pensamiento espacial y la imaginación tienden a funcionar muy bien para ayudar a comprender los temas de aprendizaje automático y ciencia de datos. Los formatos de publicación tradicionales, por otra parte, tienden a ser rígidos en su estructura, estáticos y secos, y en ocasiones "matemático". Chris Olah, uno de los creadores de Distill, también tiene un blog personal increíble en GitHub. No se ha actualizado desde hace tiempo, pero sigue siendo una colección de las mejores explicaciones jamás escritas sobre el tema del aprendizaje profundo. En particular me ayudó mucho descripción ¡LSTM!

Qué leer como científico de datos en 2020
fuente

Sebastián Ruder

Sebastian Ruder escribe un blog y un boletín informativo muy interesantes, principalmente sobre la intersección de las redes neuronales y la minería de textos en lenguaje natural. También tiene muchos consejos para investigadores y conferenciantes, que pueden resultar muy útiles si estás en el mundo académico. Los artículos de Sebastian suelen tomar la forma de reseñas, que resumen y explican el estado de la investigación y los métodos actuales en un campo en particular. Esto significa que los artículos son extremadamente útiles para los profesionales que quieran orientarse rápidamente. Sebastián también escribe en Twitter.

Andrei Karpathy

Andrei Karpathy no necesita presentación. Además de ser uno de los investigadores de aprendizaje profundo más famosos de la Tierra, crea herramientas ampliamente utilizadas, p. preservador de cordura arxiv como proyectos paralelos. Innumerables personas han ingresado a este campo a través de su curso en Stanford. cs231n, y te será útil saberlo receta Entrenamiento de redes neuronales. Tambien recomiendo verlo речь sobre los desafíos del mundo real que Tesla debe superar al intentar aplicar el aprendizaje automático a gran escala en el mundo real. El discurso es informativo, impresionante y aleccionador. Además de los artículos sobre el ML en sí, Andrei Karpathy ofrece buenos consejos de vida para científicos ambiciosos. Leer a Andrey en Twitter y Github.

Uber Ingeniería

El blog de ingeniería de Uber es realmente impresionante por su escala y amplitud de cobertura, ya que cubre muchos temas, en particular inteligencia artificial. Lo que me gusta particularmente de la cultura de ingeniería de Uber es su tendencia a producir productos muy interesantes y valiosos. Proyectos código abierto a un ritmo vertiginoso. Aquí hay unos ejemplos:

Blog de OpenAI

Dejando a un lado las controversias, el blog de OpenAI es innegablemente maravilloso. De vez en cuando, el blog publica contenido e ideas sobre aprendizaje profundo que solo pueden surgir a la escala de OpenAI: Hipotético un fenomeno Doble descenso profundo. El equipo de OpenAI tiende a publicar con poca frecuencia, pero esto es algo importante.

Qué leer como científico de datos en 2020
fuente

Blog Taboola

El blog Taboola no es tan conocido como algunas de las otras fuentes de esta publicación, pero creo que es único: los autores escriben sobre problemas muy prácticos de la vida real al intentar aplicar ML en la fabricación para "normales". " empresas: menos sobre autos sin conductor y agentes de RL que ganan campeones mundiales, más sobre "¿cómo sé que mi modelo ahora predice cosas con falsa confianza?" Estos problemas son relevantes para casi todos los que trabajan en este campo y reciben menos cobertura de prensa que los temas más comunes de IA, pero aún así se necesita talento de clase mundial para resolver estos problemas correctamente. Por suerte, Taboola tiene tanto este talento como la voluntad y capacidad de escribir sobre ello para que otras personas también puedan aprender.

Reddit

Además de Twitter, no hay nada mejor en Reddit que engancharse a la investigación, las herramientas o la sabiduría de la multitud.

Estado de la IA

Las publicaciones se publican sólo anualmente, pero están repletas de información muy densa. En comparación con otras fuentes de esta lista, esta es más accesible para empresarios no especializados en tecnología. Lo que me gusta de las charlas es que intentan brindar una visión más holística de hacia dónde se dirigen la industria y la investigación, vinculando avances en hardware, investigación, negocios e incluso geopolítica a vista de pájaro. Asegúrese de comenzar por el final para leer sobre conflictos de intereses.

Podcasts

Francamente, creo que los podcasts no son adecuados para explorar temas técnicos. Después de todo, solo usan audio para explicar temas y la ciencia de datos es un campo muy visual. Los podcasts tienden a darle una excusa para realizar una investigación más profunda más adelante o tener debates filosóficos fascinantes. Sin embargo, aquí hay algunas recomendaciones:

  • Podcast de Lex Friedman, mientras habla con destacados investigadores en el campo de la inteligencia artificial. ¡Los episodios con Francois Chollet son especialmente buenos!
  • Pódcast de ingeniería de datos. Es bueno saber acerca de nuevas herramientas de infraestructura de datos.

Listas impresionantes

Hay menos cosas que seguir aquí, pero más recursos que son útiles cuando sabes lo que estás buscando:

Twitter

  • Matty Marianski
    Matty encuentra formas hermosas y creativas de utilizar las redes neuronales, y es divertido ver sus resultados en tu cuenta de Twitter. Al menos echa un vistazo a este enviar un mensaje.
  • Ori Cohen
    Ori es sólo una máquina de conducir. blogging. Escribe extensamente sobre problemas y soluciones para científicos de datos. Asegúrese de suscribirse para recibir una notificación cuando se publique un artículo. Su colección, en particular, es realmente impresionante.
  • Jeremy Howard
    Cofundador de fast.ai, una fuente integral de creatividad y productividad.
  • Hamel Hussein
    Hamel Hussain, ingeniero de aprendizaje automático en Github, está ocupado trabajando creando e informando sobre muchas herramientas para codificadores de datos.
  • Francois Chollet
    Creador de Keras, ahora está tratando Actualizar nuestra comprensión de qué es la inteligencia y cómo probarla.
  • Hardmaru
    Científico investigador en Google Brain.

Conclusión

La publicación original puede actualizarse a medida que el autor encuentre excelentes fuentes de contenido que sería una pena no incluir en la lista. No dude en contactarlo en Twitter, si quieres recomendar una nueva fuente! Y también DAGsHub contrata Abogado [aprox. traducción practicante público] en ciencia de datos, por lo que si crea su propio contenido de ciencia de datos, no dude en escribirle al autor de la publicación.

Qué leer como científico de datos en 2020
Desarrollate leyendo fuentes recomendadas y usando el código promocional HABR, podrás obtener un 10% adicional al descuento indicado en el banner.

Más cursos

Artículos recomendados

Fuente: habr.com