Perkara yang perlu dibaca sebagai saintis data pada tahun 2020

Perkara yang perlu dibaca sebagai saintis data pada tahun 2020
Dalam siaran ini, kami berkongsi dengan anda pilihan sumber maklumat berguna tentang Sains Data daripada pengasas bersama dan CTO DAGsHub, komuniti dan platform web untuk kawalan versi data dan kerjasama antara saintis data dan jurutera pembelajaran mesin. Pemilihan itu termasuk pelbagai sumber, daripada akaun Twitter kepada blog kejuruteraan lengkap, yang ditujukan kepada mereka yang tahu dengan tepat apa yang mereka cari. Butiran di bawah potongan.

Dari pengarang:
Anda adalah apa yang anda makan, dan sebagai pekerja berpengetahuan anda memerlukan diet maklumat yang baik. Saya ingin berkongsi sumber maklumat tentang Sains Data, Kepintaran Buatan dan teknologi berkaitan yang saya rasa paling berguna atau menarik. Saya harap ini membantu anda juga!

Kertas Dua Minit

Saluran YouTube yang sangat sesuai untuk mengikuti acara terkini. Saluran ini dikemas kini dengan kerap dan hos mempunyai semangat yang menular dan positif untuk semua topik yang diliputi. Jangkakan liputan karya menarik bukan sahaja pada AI, tetapi juga pada grafik komputer dan topik lain yang menarik secara visual.

Yannick Kilcher

Di saluran YouTubenya, Yannick menerangkan penyelidikan penting dalam pembelajaran mendalam secara terperinci teknikal. Daripada membaca kajian sendiri, selalunya lebih cepat dan lebih mudah untuk menonton salah satu videonya untuk mendapatkan pemahaman yang lebih mendalam tentang artikel penting. Penjelasan menyampaikan intipati artikel tanpa mengabaikan matematik atau tersesat dalam tiga pain. Yannick juga berkongsi pandangannya tentang cara kajian itu sesuai, betapa seriusnya untuk mengambil keputusan, tafsiran yang lebih luas dan banyak lagi. Adalah lebih sukar bagi orang baru (atau pengamal bukan akademik) untuk menemui penemuan ini sendiri.

Distill.pub

Dalam kata-kata mereka sendiri:

Penyelidikan pembelajaran mesin perlu jelas, dinamik dan bertenaga. Dan Distill dicipta untuk membantu penyelidikan.

Distill ialah penerbitan unik dengan penyelidikan dalam bidang pembelajaran mesin. Artikel dengan visualisasi yang menakjubkan dipromosikan untuk memberi pembaca pemahaman yang lebih intuitif tentang topik tersebut. Pemikiran dan imaginasi spatial cenderung berfungsi dengan baik dalam membantu memahami topik Pembelajaran Mesin dan Sains Data. Format penerbitan tradisional, sebaliknya, cenderung tegar dalam strukturnya, statik dan kering, dan kadangkala "matematik". Chris Olah, salah seorang pencipta Distill, juga mempunyai blog peribadi yang menakjubkan di GitHub. Ia telah lama tidak dikemas kini, tetapi ia masih kekal sebagai koleksi penjelasan terbaik mengenai topik pembelajaran mendalam yang pernah ditulis. Khususnya, ia banyak membantu saya Penerangan LSTM!

Perkara yang perlu dibaca sebagai saintis data pada tahun 2020
sumber

Sebastian Ruder

Sebastian Ruder menulis blog dan surat berita yang sangat berwawasan, terutamanya mengenai persimpangan rangkaian saraf dan perlombongan teks bahasa semula jadi. Beliau juga mempunyai banyak nasihat untuk penyelidik dan penceramah persidangan, yang boleh sangat membantu jika anda berada dalam bidang akademik. Artikel Sebastian biasanya berbentuk ulasan, meringkaskan dan menerangkan keadaan penyelidikan dan kaedah semasa dalam bidang tertentu. Ini bermakna artikel-artikel tersebut amat berguna untuk pengamal yang ingin cepat memahaminya. Sebastian juga menulis dalam Twitter.

Andrey Karpathy

Andrei Karpathy tidak memerlukan pengenalan. Selain menjadi salah seorang penyelidik pembelajaran mendalam yang paling terkenal di Bumi, dia mencipta alatan yang digunakan secara meluas, mis. arxiv pemulihara kewarasan sebagai projek sampingan. Tidak terhitung orang telah memasuki bidang ini melalui kursus Stanfordnya cs231n, dan akan berguna untuk anda mengetahuinya resipi latihan rangkaian saraf. Saya juga mengesyorkan menontonnya ucapan tentang cabaran dunia sebenar yang mesti diatasi oleh Tesla apabila cuba menerapkan pembelajaran mesin secara besar-besaran di dunia nyata. Ucapan itu bermaklumat, mengagumkan dan menenangkan. Sebagai tambahan kepada artikel tentang ML sendiri, Andrei Karpathy memberi nasihat hidup yang baik untuk saintis yang bercita-cita tinggi. Baca Andrey masuk Twitter dan Github.

Kejuruteraan Uber

Blog kejuruteraan Uber benar-benar mengagumkan dalam skala dan keluasan liputannya, meliputi banyak topik, khususnya Kecerdasan Buatan. Apa yang saya suka terutamanya tentang budaya kejuruteraan Uber ialah kecenderungan mereka untuk menghasilkan sangat menarik dan berharga Projek sumber terbuka pada kadar yang pantas. Berikut adalah beberapa contoh:

Blog OpenAI

Diketepikan kontroversi, blog OpenAI tidak dinafikan hebat. Dari semasa ke semasa, blog ini menyiarkan kandungan dan idea tentang pembelajaran mendalam yang hanya boleh didapati pada skala OpenAI: Hypothetical sesuatu fenomena keturunan berganda dalam. Pasukan OpenAI cenderung untuk membuat siaran jarang, tetapi ini adalah perkara penting.

Perkara yang perlu dibaca sebagai saintis data pada tahun 2020
sumber

Blog Tabuola

Blog Taboola tidak begitu terkenal seperti beberapa sumber lain dalam siaran ini, tetapi saya rasa ia unik - penulis menulis tentang masalah kehidupan sebenar yang sangat sederhana apabila cuba menggunakan ML dalam pembuatan untuk "normal " perniagaan: kurang tentang kereta pandu sendiri dan ejen RL memenangi juara dunia, lebih lanjut mengenai "bagaimana saya tahu bahawa model saya kini meramalkan perkara dengan keyakinan palsu?" Masalah ini berkaitan dengan hampir semua orang yang bekerja di lapangan, dan mereka mendapat kurang liputan akhbar berbanding topik AI yang lebih biasa, tetapi masih memerlukan bakat bertaraf dunia untuk menyelesaikan masalah ini dengan betul. Nasib baik, Taboola mempunyai kedua-dua bakat ini dan kesanggupan serta keupayaan untuk menulis mengenainya supaya orang lain juga boleh belajar.

Reddit

Bersama-sama dengan Twitter, tiada apa yang lebih baik di Reddit daripada terpikat dengan penyelidikan, alatan atau kebijaksanaan orang ramai.

Keadaan AI

Catatan diterbitkan hanya setiap tahun, tetapi dipenuhi dengan maklumat yang sangat padat. Berbanding dengan sumber lain dalam senarai ini, sumber ini lebih mudah diakses oleh ahli perniagaan bukan teknologi. Apa yang saya suka tentang ceramah itu ialah ia cuba memberikan pandangan yang lebih holistik tentang arah tuju industri dan penyelidikan, menggabungkan kemajuan dalam perkakasan, penyelidikan, perniagaan, dan juga geopolitik dari pandangan mata. Pastikan anda bermula pada penghujung untuk membaca tentang konflik kepentingan.

Podcast

Terus terang, saya rasa podcast kurang sesuai untuk meneroka topik teknikal. Lagipun, mereka hanya menggunakan audio untuk menerangkan topik, dan sains data ialah bidang yang sangat visual. Podcast cenderung memberi anda alasan untuk melakukan penyelidikan yang lebih mendalam kemudian atau mengadakan perbincangan falsafah yang menarik. Walau bagaimanapun, berikut adalah beberapa cadangan:

  • Podcast Lex Friedman, ketika dia bercakap dengan penyelidik terkemuka dalam bidang kecerdasan buatan. Episod dengan Francois Chollet sangat bagus!
  • Podcast Kejuruteraan Data. Senang mendengar tentang alatan infrastruktur data baharu.

Senarai Hebat

Terdapat kurang untuk dijejaki di sini, tetapi lebih banyak sumber yang berguna apabila anda mengetahui perkara yang anda cari:

Twitter

  • Matty Marianski
    Matty mencari cara yang cantik dan kreatif untuk menggunakan rangkaian saraf, dan sungguh menyeronokkan untuk melihat keputusannya pada suapan Twitter anda. Sekurang-kurangnya lihatlah ini hantar.
  • Ori Cohen
    Ori hanyalah mesin pemanduan blog. Dia menulis secara meluas tentang masalah dan penyelesaian untuk saintis data. Pastikan anda melanggan untuk dimaklumkan apabila artikel diterbitkan. miliknya kompilasi, khususnya, sangat mengagumkan.
  • Jeremy Howard
    Pengasas bersama fast.ai, sumber kreativiti dan produktiviti yang komprehensif.
  • Hamel Hussein
    Seorang jurutera ML kakitangan di Github, Hamel Hussain sibuk bekerja membuat dan melaporkan banyak alat untuk pengekod data.
  • Francois Chollet
    Pencipta Keras, sekarang cuba kemas kini pemahaman kita tentang apa itu kecerdasan dan cara mengujinya.
  • Hardmaru
    Saintis Penyelidik di Google Brain.

Kesimpulan

Siaran asal mungkin dikemas kini kerana pengarang menemui sumber kandungan yang hebat yang memalukan jika tidak dimasukkan dalam senarai. Sila hubungi beliau di Twitter, jika anda ingin mengesyorkan sumber baharu! Dan juga DAGsHub mengupah Peguambela [lebih kurang. terjemahan pengamal awam] dalam Sains Data, jadi jika anda mencipta kandungan Sains Data anda sendiri, sila tulis kepada pengarang siaran itu.

Perkara yang perlu dibaca sebagai saintis data pada tahun 2020
Kembangkan diri anda dengan membaca sumber yang disyorkan, dan menggunakan kod promosi HABR, anda boleh mendapat tambahan 10% daripada diskaun yang tertera pada sepanduk.

Lebih banyak kursus

Artikel Pilihan

Sumber: www.habr.com