2020 年數據科學家應該讀些什麼

2020 年數據科學家應該讀些什麼
在這篇文章中,我們與您分享DAGsHub 聯合創始人兼首席技術官提供的一系列有關數據科學的有用信息來源,DAGsHub 是一個用於數據版本控制以及數據科學家和機器學習工程師之間協作的社區和網絡平台。 該選擇包括各種來源,從 Twitter 帳戶到成熟的工程博客,這些來源針對的是那些確切知道自己在尋找什麼的人。 細節下切。

來自作者:
人如其食,作為知識工作者,您需要良好的信息飲食。 我想分享我認為最有用或最有吸引力的數據科學、人工智能和相關技術的信息來源。 我希望這對你也有幫助!

兩分鐘論文

非常適合了解最新活動的 YouTube 頻道。 該頻道更新頻繁,主持人對所涵蓋的所有主題都充滿感染力的熱情和積極性。 期待不僅涵蓋人工智能方面的有趣工作,還涵蓋計算機圖形學和其他視覺上吸引人的主題。

雅尼克·基爾徹

Yannick 在他的 YouTube 頻道上詳細解釋了深度學習領域的重要研究。 觀看其中的視頻以更深入地了解重要文章通常更快、更容易,而不是親自閱讀該研究。 這些解釋傳達了文章的精髓,沒有忽視數學或迷失在三棵松樹中。 雅尼克還分享了他對這些研究如何整合、如何認真對待結果、更廣泛的解釋等的看法。 對於新手(或非學術從業者)來說,自己發現這些發現更加困難。

Distill.pub

用他們自己的話說:

機器學習研究需要清晰、動態和充滿活力。 Distill 的創建是為了幫助研究。

Distill 是一份關於機器學習領域研究的獨特出版物。 具有令人驚嘆的可視化效果的文章得到推廣,讓讀者對主題有更直觀的理解。 空間思維和想像力往往可以很好地幫助理解機器學習和數據科學主題。 另一方面,傳統的出版物格式在結構上往往是僵化的、靜態的、枯燥的,有時甚至 “數學”。 Chris Olah,Distill 的創建者之一,也有一個令人驚嘆的個人博客: GitHub上。 它已經有一段時間沒有更新了,但它仍然是有史以來關於深度學習主題的最佳解釋的集合。 特別是對我幫助很大 описание LSTM!

2020 年數據科學家應該讀些什麼

塞巴斯蒂安·魯德

Sebastian Ruder 撰寫了一篇非常有見地的博客和時事通訊,主要是關於神經網絡和自然語言文本挖掘的交叉點。 他還為研究人員和會議發言人提供了很多建議,如果您在學術界,這些建議會非常有幫助。 塞巴斯蒂安的文章通常採用評論的形式,總結和解釋特定領域當前的研究狀況和方法。 這意味著這些文章對於想要快速掌握方向的從業者來說非常有用。 塞巴斯蒂安還寫道 Twitter.

安德烈·卡帕蒂

安德烈·卡帕蒂無需介紹。 除了是地球上最著名的深度學習研究人員之一之外,他還創建了廣泛使用的工具,例如 arxiv 理智保護者 作為副業項目。 無數人通過他的斯坦福課程進入了這個領域 CS231N,了解它會對你很有用 食譜 神經網絡訓練。 我也推薦觀看 演講 關於特斯拉在嘗試在現實世界中大規模應用機器學習時必須克服的現實挑戰。 演講內容豐富、令人印象深刻且發人深省。 除了有關 ML 本身的文章之外,Andrei Karpathy 還給出了 好的生活建議雄心勃勃的科學家。 讀安德烈 TwitterGithub上.

優步工程

Uber 工程博客的規模和覆蓋範圍確實令人印象深刻,涵蓋了很多主題,特別是 人工智能。 我特別喜歡 Uber 的工程文化,因為他們傾向於創造非常有趣和有價值的東西 項目 以極快的速度開源。 這裡有些例子:

OpenAI 博客

拋開爭議不談,OpenAI 博客無疑是精彩的。 該博客時不時地發布有關深度學習的內容和想法,這些內容和想法只能達到 OpenAI 的規模:假設 現象 深雙血統。 OpenAI 團隊很少發帖,但這很重要。

2020 年數據科學家應該讀些什麼

塔博拉博客

Taboola 博客並不像這篇文章中的其他一些來源那樣出名,但我認為它是獨一無二的 - 作者在嘗試將 ML 應用於製造中以實現“正常”時,寫了一些非常實際的現實問題。 ”企業:更少關注自動駕駛汽車和RL 智能體贏得世界冠軍,更多關注“我怎麼知道我的模型現在正在以錯誤的信心預測事物?” 這些問題幾乎與該領域的每個人都相關,而且與更常見的人工智能主題相比,它們得到的新聞報導較少,但仍然需要世界一流的人才才能正確解決這些問題。 幸運的是,塔博拉既有這種天賦,也有意願和能力將其寫下來,以便其他人也可以學習。

書籤交易

與 Twitter 一樣,Reddit 上沒有什麼比沉迷於研究、工具或大眾智慧更好的了。

人工智能的狀態

帖子每年只發布一次,但充滿了非常密集的信息。 與此列表中的其他來源相比,這個來源更適合非技術業務人員。 我喜歡這些會談的一點是,它試圖提供一個更全面的視角來了解行業和研究的發展方向,從鳥瞰的角度將硬件、研究、商業甚至地緣政治的進步結合在一起。 請務必從最後開始閱讀有關利益衝突的內容。

播客

坦率地說,我認為播客不太適合探索技術主題。 畢竟他們只是用音頻來解釋主題,而數據科學是一個非常視覺化的領域。 播客往往會給你一個藉口,讓你以後可以進行更深入的研究或進行一些有趣的哲學討論。 不過,這裡有一些建議:

很棒的清單

這裡需要跟踪的內容較少,但當您知道自己在尋找什麼時,會有更多有用的資源:

Twitter

  • 馬蒂·馬里安斯基
    Matty 找到了使用神經網絡的美麗且富有創意的方法,在 Twitter 上看到他的結果真是太有趣了。 至少看一下 發布。
  • 奧里·科恩
    Ori只是一個駕駛機器 博客。 他撰寫了大量有關數據科學家的問題和解決方案的文章。 請務必訂閱,以便在文章發佈時收到通知。 他的 ,尤其令人印象深刻。
  • 傑里米·霍華德
    fast.ai 的聯合創始人,fast.ai 是創造力和生產力的綜合來源。
  • 哈梅爾·侯賽因
    Hamel Hussain 是 Github 的一名機器學習工程師,他正忙於為數據編碼人員創建和報告許多工具。
  • 弗朗索瓦·肖萊
    現在是 Keras 的創建者 更新我們對什麼是智力以及如何測試智力的理解。
  • 硬丸
    谷歌大腦的研究科學家。

結論

原始帖子可能會更新,因為作者發現了豐富的內容來源,如果不將其包含在列表中將是一種恥辱。 請隨時聯繫他 Twitter,如果你想推荐一個新的來源! 還有 DAGsHub 僱用 倡導者[約。 翻譯數據科學領域的公共從業者],因此,如果您創建自己的數據科學內容,請隨時寫信給該帖子的作者。

2020 年數據科學家應該讀些什麼
通過閱讀推薦資源並使用促銷代碼來發展自己 哈伯,您可以獲得橫幅上所示折扣的額外 10%。

更多課程

推薦文章

來源: www.habr.com