Apa yang harus dibaca sebagai ilmuwan data pada tahun 2020

Apa yang harus dibaca sebagai ilmuwan data pada tahun 2020
Dalam postingan ini, kami membagikan kepada Anda pilihan sumber informasi berguna tentang Ilmu Data dari salah satu pendiri dan CTO DAGsHub, sebuah komunitas dan platform web untuk kontrol versi data dan kolaborasi antara ilmuwan data dan insinyur pembelajaran mesin. Pilihannya mencakup berbagai sumber, mulai dari akun Twitter hingga blog teknik lengkap, yang ditujukan bagi mereka yang tahu persis apa yang mereka cari. Detail di bawah potongan.

Dari penulis:
Anda adalah apa yang Anda makan, dan sebagai pekerja pengetahuan, Anda membutuhkan diet informasional yang baik. Saya ingin berbagi sumber informasi tentang Ilmu Data, kecerdasan buatan, dan teknologi terkait yang menurut saya paling berguna atau menarik. Saya harap ini membantu Anda juga!

Dua Menit Kertas

Saluran YouTube yang sangat cocok untuk mengikuti acara terbaru. Saluran ini sering diperbarui dan pembawa acara memiliki antusiasme dan kepositifan yang menular dalam semua topik yang dibahas. Harapkan liputan karya menarik tidak hanya pada AI, tetapi juga pada grafik komputer dan topik menarik lainnya secara visual.

Yannick Kilcher

Di saluran YouTube-nya, Yannick menjelaskan penelitian signifikan dalam pembelajaran mendalam secara detail teknis. Daripada membaca studi Anda sendiri, seringkali lebih cepat dan lebih mudah untuk menonton salah satu videonya untuk mendapatkan pemahaman yang lebih dalam tentang artikel-artikel penting. Penjelasannya menyampaikan esensi artikel tanpa mengabaikan matematika atau tersesat di tiga pohon pinus. Yannick juga membagikan pandangannya tentang bagaimana studi cocok satu sama lain, seberapa serius hasil harus diambil, interpretasi yang lebih luas, dan sebagainya. Pemula (atau praktisi non-akademis) merasa lebih sulit untuk menemukan penemuan ini sendiri.

distill.pub

Dengan kata-kata mereka sendiri:

Penelitian pembelajaran mesin harus jelas, dinamis, dan bersemangat. Dan Distill diciptakan untuk membantu penelitian.

Distill adalah publikasi penelitian pembelajaran mesin yang unik. Artikel dipromosikan dengan visualisasi yang memukau untuk memberi pembaca pemahaman topik yang lebih intuitif. Pemikiran dan imajinasi spasial cenderung bekerja sangat baik dalam membantu Anda memahami topik Pembelajaran Mesin dan Ilmu Data. Format publikasi tradisional, sebaliknya, strukturnya cenderung kaku, statis dan kering, dan kadang-kadang "matematis". Chris Olah, co-creator Distill, juga memiliki blog pribadi yang luar biasa di GitHub. Sudah lama tidak diperbarui, tetapi masih merupakan kumpulan penjelasan pembelajaran mendalam terbaik yang pernah ditulis. Secara khusus, itu sangat membantu saya описаниС LSTM!

Apa yang harus dibaca sebagai ilmuwan data pada tahun 2020
sumber

Sebastian Ruder

Sebastian Ruder menulis blog dan buletin yang sangat informatif, terutama tentang persimpangan jaringan saraf dan analisis teks bahasa alami. Dia juga memberikan banyak nasihat kepada para peneliti dan pembicara konferensi, yang bisa sangat membantu jika Anda seorang akademisi. Artikel-artikel Sebastian cenderung berbentuk ulasan, meringkas dan menjelaskan keadaan terkini dalam penelitian dan metode di area tertentu. Ini berarti bahwa artikel-artikel tersebut sangat berguna bagi para praktisi yang ingin mengetahui arah mereka dengan cepat. Sebastian juga menulis Twitter.

Andrey Karpaty

Andrei Karpaty tidak perlu diperkenalkan. Selain menjadi salah satu peneliti deep learning paling terkenal di dunia, dia menciptakan alat yang banyak digunakan seperti pemelihara kewarasan arsip sebagai proyek sampingan. Banyak orang memasuki dunia ini melalui kursus Stanford-nya. cs231n, dan akan berguna bagi Anda untuk mengetahuinya resep pelatihan jaringan saraf. Saya juga merekomendasikan untuk menontonnya pidato tentang masalah nyata yang harus diatasi Tesla ketika mencoba menerapkan pembelajaran mesin dalam skala besar di dunia nyata. Pidato itu informatif, mengesankan, dan menenangkan. Selain artikel tentang ML sendiri, Andrey Karpaty memberikan nasihat hidup yang baik untuk ilmuwan yang ambisius. Baca Andrew di Twitter dan Github.

Rekayasa Uber

Blog teknik Uber sangat mengesankan dalam hal skala dan luasnya cakupan, mencakup banyak topik, khususnya Kecerdasan buatan. Yang paling saya sukai dari budaya teknik Uber adalah kecenderungan mereka untuk merilis dengan sangat menarik dan berharga Proyek open source dengan kecepatan sangat tinggi. Berikut beberapa contohnya:

Blog OpenAI

Terlepas dari kontroversi, blog OpenAI memang luar biasa. Dari waktu ke waktu, blog memposting konten dan wawasan tentang pembelajaran mendalam yang hanya dapat dilakukan pada skala OpenAI: hipotetis fenomena penurunan ganda yang dalam. Tim OpenAI cenderung jarang memposting, tetapi ini adalah konten penting.

Apa yang harus dibaca sebagai ilmuwan data pada tahun 2020
sumber

Blog Tabola

Blog Taboola tidak setenar beberapa sumber lain dalam postingan ini, tetapi menurut saya ini unik - penulis menulis tentang masalah yang sangat biasa dan nyata saat mencoba menerapkan ML dalam produksi untuk bisnis "normal": lebih sedikit tentang mobil self-driving dan agen RL memenangkan juara dunia, lebih lanjut tentang "bagaimana saya tahu jika model saya sekarang memprediksi hal-hal dengan keyakinan palsu?". Masalah-masalah ini relevan bagi hampir semua orang yang bekerja di lapangan dan menerima liputan pers yang lebih sedikit daripada topik AI yang lebih umum, tetapi masih membutuhkan talenta kelas dunia untuk mengatasi masalah ini dengan benar. Untungnya, Taboola memiliki bakat dan kemauan serta kemampuan untuk menulis tentangnya sehingga orang lain dapat belajar juga.

Reddit

Bersamaan dengan Twitter, tidak ada yang lebih baik di Reddit selain terpikat pada penelitian, alat, atau kebijaksanaan orang banyak.

Keadaan AI

Posting diterbitkan hanya setiap tahun, tetapi diisi dengan informasi yang sangat padat. Dibandingkan dengan sumber lain dalam daftar ini, yang satu ini lebih mudah diakses oleh pebisnis non-teknis. Yang saya sukai dari pembicaraan ini adalah bahwa mereka mencoba untuk memberikan pandangan yang lebih holistik tentang ke mana arah industri dan penelitian, menyatukan kemajuan dalam perangkat keras, penelitian, bisnis, dan bahkan geopolitik dari pandangan mata burung. Pastikan untuk memulai dari akhir untuk membaca tentang konflik kepentingan.

Podcast

Terus terang, menurut saya podcast tidak cocok untuk mempelajari topik teknis. Lagi pula, mereka hanya menggunakan suara untuk menjelaskan topik, dan ilmu data adalah bidang yang sangat visual. Podcast cenderung memberi Anda alasan untuk menjelajah lebih dalam nanti, atau untuk terlibat dalam diskusi filosofis. Namun, berikut adalah beberapa rekomendasi:

  • podcast lex friedmanketika dia berbicara dengan peneliti terkemuka di bidang kecerdasan buatan. Episode dengan Francois Chollet sangat bagus!
  • Podcast Rekayasa Data. Senang mendengar tentang alat infrastruktur data baru.

Daftar yang mengagumkan

Ada lebih sedikit yang perlu diperhatikan di sini, tetapi lebih banyak sumber daya yang berguna setelah Anda mengetahui apa yang Anda cari:

Twitter

  • Matty Mariansky
    Matty menemukan cara yang indah dan kreatif untuk menggunakan jaringan saraf, dan sangat menyenangkan melihat hasilnya di umpan Twitter Anda. Lihatlah setidaknya ini posting.
  • Ori Cohen
    Ori hanyalah mesin penggerak blog. Dia banyak menulis tentang masalah dan solusi untuk ilmuwan data. Pastikan untuk berlangganan untuk diberitahu ketika sebuah artikel diterbitkan. Miliknya kompilasikhususnya sangat mengesankan.
  • Jeremy Howard
    Co-founder fast.ai, sumber komprehensif kreativitas dan produktivitas.
  • Hamel Husein
    Staf insinyur ML di Github, Hamel Hussain sibuk bekerja membuat dan melaporkan banyak alat untuk pembuat kode di domain data.
  • FranΓ§ois Chollet
    Pencipta Keras, sekarang mencoba perbarui pemahaman kita tentang apa itu kecerdasan dan bagaimana cara mengujinya.
  • hardmaru
    Ilmuwan riset di Google Brain.

Kesimpulan

Posting asli dapat diperbarui karena penulis menemukan sumber konten yang bagus yang sayang untuk tidak dimasukkan ke dalam daftar. Jangan ragu untuk menghubunginya Twitterjika Anda ingin merekomendasikan beberapa sumber baru! Dan juga DAGsHub menyewa Advokat [kira-kira. terjemahan Praktisi Publik] dalam Ilmu Data, jadi jika Anda membuat konten Ilmu Data Anda sendiri, jangan ragu untuk menulis ke penulis postingan.

Apa yang harus dibaca sebagai ilmuwan data pada tahun 2020
Kembangkan dengan membaca sumber yang direkomendasikan, dan dengan kode promosi HABR, Anda bisa mendapatkan tambahan 10% dari diskon yang tertera di banner.

Lebih banyak kursus

Artikel Pilihan

Sumber: www.habr.com