O que ler como cientista de dados em 2020

O que ler como cientista de dados em 2020
Neste post, compartilhamos com você uma seleção de fontes de informações úteis sobre Data Science do cofundador e CTO do DAGsHub, uma comunidade e plataforma web para controle de versão de dados e colaboração entre cientistas de dados e engenheiros de aprendizado de máquina. A seleção inclui uma variedade de fontes, desde contas do Twitter até blogs de engenharia completos, direcionados a quem sabe exatamente o que procura. Detalhes sob o corte.

Do autor:
Você é o que você come e, como profissional do conhecimento, precisa de uma boa dieta informativa. Quero compartilhar fontes de informação sobre Ciência de Dados, inteligência artificial e tecnologias relacionadas que considero mais úteis ou atraentes. Espero que isso ajude você também!

Artigos de dois minutos

Um canal no YouTube adequado para se manter atualizado com os últimos acontecimentos. O canal é atualizado com frequência e o apresentador tem um entusiasmo e positividade contagiantes em todos os temas abordados. Espere uma cobertura de trabalhos interessantes não apenas sobre IA, mas também sobre computação gráfica e outros tópicos visualmente atraentes.

Yannick Kilcher

Em seu canal no YouTube, Yannick explica pesquisas significativas em aprendizagem profunda em detalhes técnicos. Em vez de ler um estudo por conta própria, geralmente é mais rápido e fácil assistir a um de seus vídeos para obter uma compreensão mais profunda de artigos importantes. As explicações transmitem a essência dos artigos sem descuidar da matemática ou se perder em três pinheiros. Yannick também compartilha suas opiniões sobre como os estudos se encaixam, quão seriamente os resultados devem ser levados em consideração, interpretações mais amplas e assim por diante. Iniciantes (ou profissionais não acadêmicos) acham mais difícil chegar a essas descobertas por conta própria.

destilar.pub

Em suas próprias palavras:

A pesquisa em aprendizado de máquina precisa ser clara, dinâmica e vibrante. E o Distill foi criado para ajudar na pesquisa.

Distill é uma publicação exclusiva de pesquisa de aprendizado de máquina. Os artigos são promovidos com visualizações impressionantes para dar ao leitor uma compreensão mais intuitiva dos tópicos. O pensamento espacial e a imaginação tendem a funcionar muito bem para ajudá-lo a compreender os tópicos de aprendizado de máquina e ciência de dados. Os formatos de publicação tradicionais, por outro lado, tendem a ser rígidos na sua estrutura, estáticos e secos, e por vezes "matemático". Chris Olah, co-criador do Distill, também mantém um blog pessoal incrível em GitHub. Faz muito tempo que não é atualizado, mas ainda continua sendo uma coleção das melhores explicações de aprendizado profundo já escritas. Em particular, isso me ajudou muito описание LSTM!

O que ler como cientista de dados em 2020
fonte

Sebastião Ruder

Sebastian Ruder escreve um blog e um boletim informativo muito informativo, principalmente sobre a interseção de redes neurais e análise de texto em linguagem natural. Ele também dá muitos conselhos a pesquisadores e palestrantes, o que pode ser muito útil se você estiver na academia. Os artigos de Sebastian tendem a assumir a forma de resenhas, resumindo e explicando o estado da arte em pesquisas e métodos em uma determinada área. Isso significa que os artigos são extremamente úteis para profissionais que desejam se orientar rapidamente. Sebastian também escreve em Twitter.

Andrey Karpaty

Andrei Karpaty dispensa apresentações. Além de ser um dos mais famosos pesquisadores de aprendizagem profunda do planeta, ele cria ferramentas amplamente utilizadas, como preservador de sanidade de arquivo como projetos paralelos. Inúmeras pessoas entraram neste reino através do seu curso em Stanford. cs231n, e será útil para você saber disso receita treinamento de redes neurais. Também recomendo assistir discurso sobre os problemas reais que Tesla deve superar ao tentar aplicar o aprendizado de máquina em grande escala no mundo real. O discurso é informativo, impressionante e sóbrio. Além de artigos sobre o próprio ML, Andrey Karpaty dá bons conselhos de vida para cientistas ambiciosos. Leia André em Twitter e Github.

Engenharia Uber

O blog de engenharia da Uber é realmente impressionante em termos de escala e amplitude de cobertura, cobrindo muitos tópicos, em particular inteligência artificial. O que eu gosto especialmente na cultura de engenharia da Uber é sua tendência de lançar produtos muito interessantes e valiosos Projetos código aberto em um ritmo alucinante. aqui estão alguns exemplos:

Blog OpenAI

Polêmica à parte, o blog OpenAI é inegavelmente ótimo. De tempos em tempos, o blog publica conteúdo e insights sobre aprendizagem profunda que só podem ocorrer na escala do OpenAI: hipotético um fenômeno descida dupla profunda. A equipe OpenAI tende a postar com pouca frequência, mas esses são conteúdos importantes.

O que ler como cientista de dados em 2020
fonte

Blog da Taboola

O blog da Taboola não é tão conhecido como algumas das outras fontes neste post, mas acho que é único - os autores escrevem sobre problemas reais e muito mundanos ao tentar aplicar ML na produção para um negócio "normal": menos sobre carros autônomos e agentes RL ganhando campeões mundiais, mais sobre "como posso saber se meu modelo agora está prevendo coisas com falsa confiança?". Estas questões são relevantes para quase todos os que trabalham na área e recebem menos cobertura da imprensa do que os tópicos mais comuns sobre IA, mas ainda são necessários talentos de classe mundial para abordar adequadamente estas questões. Felizmente, Taboola tem esse talento e a vontade e capacidade de escrever sobre isso para que outras pessoas também possam aprender.

Reddit

Junto com o Twitter, não há nada melhor no Reddit do que ficar viciado em pesquisas, ferramentas ou sabedoria da multidão.

Estado da IA

As postagens são publicadas apenas anualmente, mas são repletas de informações de forma muito densa. Em comparação com outras fontes desta lista, esta é mais acessível para empresários não-tecnológicos. O que adoro nas palestras é que elas tentam dar uma visão mais holística do rumo que a indústria e a pesquisa estão tomando, unindo os avanços em hardware, pesquisa, negócios e até mesmo geopolítica a partir de uma visão panorâmica. Certifique-se de começar pelo final para ler sobre conflitos de interesse.

Podcasts

Francamente, acho que os podcasts não são adequados para aprender sobre tópicos técnicos. Afinal, eles usam apenas sons para explicar tópicos, e a ciência de dados é um campo muito visual. Os podcasts tendem a lhe dar uma desculpa para explorar com mais profundidade posteriormente ou para envolver-se em discussões filosóficas. No entanto, aqui estão algumas recomendações:

  • podcast de Lex Friedmanquando conversa com pesquisadores proeminentes na área de inteligência artificial. Os episódios com François Chollet são especialmente bons!
  • Podcast de engenharia de dados. É bom ouvir sobre novas ferramentas de infraestrutura de dados.

Listas incríveis

Há menos coisas para ficar de olho aqui, mas mais recursos que serão úteis quando você souber o que está procurando:

Twitter

  • Matty Mariansky
    Matty encontra maneiras lindas e criativas de usar redes neurais, e é muito divertido ver os resultados no feed do Twitter. Dê uma olhada pelo menos este postar.
  • Ori Cohen
    Ori é apenas uma máquina motriz blogando. Ele escreve extensivamente sobre problemas e soluções para cientistas de dados. Certifique-se de se inscrever para ser notificado quando um artigo for publicado. Dele coleçãoem particular é realmente impressionante.
  • Jeremy Howard
    Cofundador da fast.ai, uma fonte abrangente de criatividade e produtividade.
  • Hamel Hussein
    Engenheiro de ML da equipe do Github, Hamel Hussain está ocupado criando e gerando relatórios sobre muitas ferramentas para codificadores no domínio de dados.
  • François Chollet
    Criador de Keras, agora está tentando atualizar nossa compreensão do que é inteligência e como testá-la.
  • hardmaru
    Cientista pesquisador do Google Brain.

Conclusão

A postagem original pode ser atualizada à medida que o autor encontrar ótimas fontes de conteúdo que seria uma pena não incluir na lista. Sinta-se à vontade para contatá-lo Twitterse você quiser recomendar alguma nova fonte! E também DAGsHub contrata Advogado [aprox. trad. Public Practitioner] em Data Science, então se você criar seu próprio conteúdo de Data Science, sinta-se à vontade para escrever para o autor da postagem.

O que ler como cientista de dados em 2020
Desenvolva lendo as fontes recomendadas e pelo código promocional HORNBEAM, você poderá obter um adicional de 10% ao desconto indicado no banner.

Mais cursos

artigos em destaque

Fonte: habr.com