2020 年作为数据科学家该读什么

2020 年作为数据科学家该读什么
在这篇文章中,我们与您分享 DAGsHub 联合创始人兼首席技术官提供的一系列关于数据科学的有用信息来源,DAGsHub 是一个用于数据版本控制以及数据科学家和机器学习工程师之间协作的社区和网络平台。 该选择包括各种来源,从 Twitter 帐户到成熟的工程博客,这些来源针对的是那些确切知道自己在寻找什么的人。 细节下切。

作者:
人如其食,作为知识工作者,您需要良好的信息饮食。 我想分享我认为最有用或最有吸引力的数据科学、人工智能和相关技术的信息来源。 我希望这对你也有帮助!

两分钟论文

非常适合了解最新活动的 YouTube 频道。 该频道更新频繁,主持人对所涵盖的所有主题都充满感染力的热情和积极性。 期待不仅涵盖人工智能方面的有趣工作,还涵盖计算机图形学和其他视觉上吸引人的主题。

雅尼克·基尔彻

Yannick 在他的 YouTube 频道上详细解释了深度学习领域的重要研究。 观看其中的视频以更深入地了解重要文章通常更快、更容易,而不是亲自阅读该研究。 这些解释传达了文章的精髓,没有忽视数学或迷失在三棵松树中。 雅尼克还分享了他对这些研究如何整合、如何认真对待结果、更广泛的解释等的看法。 对于新手(或非学术从业者)来说,自己发现这些发现更加困难。

Distill.pub

用他们自己的话说:

机器学习研究需要清晰、动态和充满活力。 Distill 的创建是为了帮助研究。

Distill 是一份关于机器学习领域研究的独特出版物。 具有令人惊叹的可视化效果的文章得到推广,让读者对主题有更直观的理解。 空间思维和想象力往往可以很好地帮助理解机器学习和数据科学主题。 另一方面,传统的出版物格式在结构上往往是僵化的、静态的、枯燥的,有时甚至 “数学”。 Chris Olah,Distill 的创建者之一,也有一个令人惊叹的个人博客: GitHub上。 它已经有一段时间没有更新了,但它仍然是有史以来关于深度学习主题的最佳解释的集合。 特别是对我帮助很大 描述 LSTM!

2020 年作为数据科学家该读什么

塞巴斯蒂安·鲁德

塞巴斯蒂安·鲁德(Sebastian Ruder)撰写了一篇非常有见地的博客和时事通讯,主要是关于神经网络和自然语言文本挖掘的交叉点。 他还为研究人员和会议发言人提供了很多建议,如果您在学术界,这些建议会非常有帮助。 塞巴斯蒂安的文章通常采用评论的形式,总结和解释特定领域当前的研究状况和方法。 这意味着这些文章对于想要快速掌握方向的从业者来说非常有用。 塞巴斯蒂安还写道 Twitter.

安德烈·卡帕蒂

安德烈·卡帕蒂无需介绍。 除了是地球上最著名的深度学习研究人员之一之外,他还创建了广泛使用的工具,例如 arxiv 理智保护者 作为副业项目。 无数人通过他的斯坦福课程进入了这个领域 CS231N,了解它会对你很有用 食谱 神经网络训练。 我也推荐观看 演讲 关于特斯拉在尝试在现实世界中大规模应用机器学习时必须克服的现实挑战。 演讲内容丰富、令人印象深刻且发人深省。 除了有关 ML 本身的文章之外,Andrei Karpathy 还给出了 好的生活建议雄心勃勃的科学家。 读安德烈 TwitterGithub上.

优步工程

Uber 工程博客的规模和覆盖范围确实令人印象深刻,涵盖了很多主题,特别是 人工智能。 我特别喜欢 Uber 的工程文化,因为他们倾向于创造非常有趣和有价值的东西 项目 以极快的速度开源。 这里有些例子:

OpenAI博客

抛开争议不谈,OpenAI 的博客无疑是精彩的。 该博客时不时地发布有关深度学习的内容和想法,这些内容和想法只能达到 OpenAI 的规模:假设 一种现象 深双血统。 OpenAI 团队很少发帖,但这很重要。

2020 年作为数据科学家该读什么

塔博拉博客

Taboola 博客并不像这篇文章中的其他一些来源那样出名,但我认为它是独一无二的 - 作者在尝试将 ML 应用于制造中以实现“正常”时,写了一些非常实际的现实问题。 ” 企业:更少关注自动驾驶汽车和 RL 智能体赢得世界冠军,更多关注“我怎么知道我的模型现在正在以错误的信心预测事物?” 这些问题几乎与该领域的每个人都相关,而且与更常见的人工智能主题相比,它们得到的新闻报道较少,但仍然需要世界一流的人才才能正确解决这些问题。 幸运的是,塔博拉既有这种天赋,也有意愿和能力将其写下来,以便其他人也可以学习。

Reddit

与 Twitter 一样,Reddit 上没有什么比沉迷于研究、工具或大众智慧更好的了。

人工智能的状态

帖子每年只发布一次,但充满了非常密集的信息。 与此列表中的其他来源相比,这个来源更适合非技术业务人员。 我喜欢这些会谈的一点是,它试图提供一个更全面的视角来了解行业和研究的发展方向,从鸟瞰的角度将硬件、研究、商业甚至地缘政治的进步结合在一起。 请务必从最后开始阅读有关利益冲突的内容。

播客

坦率地说,我认为播客不太适合探索技术主题。 毕竟他们只是用音频来解释主题,而数据科学是一个非常视觉化的领域。 播客往往会给你一个借口,让你以后可以进行更深入的研究或进行一些有趣的哲学讨论。 不过,这里有一些建议:

很棒的清单

这里需要跟踪的内容较少,但当您知道自己在寻找什么时,会有更多有用的资源:

Twitter

  • 马蒂·马里安斯基
    Matty 找到了使用神经网络的美丽且富有创意的方法,在 Twitter 上看到他的结果真是太有趣了。 至少看一下 发布。
  • 奥里·科恩
    Ori只是一个驾驶机器 博客。 他撰写了大量有关数据科学家的问题和解决方案的文章。 请务必订阅,以便在文章发布时收到通知。 他的 ,尤其令人印象深刻。
  • 杰里米·霍华德
    fast.ai 的联合创始人,fast.ai 是创造力和生产力的综合来源。
  • 哈梅尔·侯赛因
    Hamel Hussain 是 Github 的一名机器学习工程师,他正忙于为数据编码人员创建和报告许多工具。
  • 弗朗索瓦·肖莱
    现在是 Keras 的创建者 正在努力 更新我们对什么是智力以及如何测试智力的理解。
  • 硬丸
    谷歌大脑的研究科学家。

结论

原始帖子可能会更新,因为作者发现了丰富的内容来源,如果不将其包含在列表中将是一种耻辱。 请随时联系他 Twitter,如果你想推荐一个新的来源! 还有 DAGsHub 雇用 倡导者[约。 翻译数据科学领域的公共从业者],因此,如果您创建自己的数据科学内容,请随时写信给该帖子的作者。

2020 年作为数据科学家该读什么
通过阅读推荐资源并使用促销代码来发展自己 哈勃,您可以获得横幅上所示折扣的额外 10%。

更多课程

推荐文章

来源: habr.com