به عنوان یک دانشمند داده در سال 2020 چه بخوانیم

به عنوان یک دانشمند داده در سال 2020 چه بخوانیم
در این پست، منتخبی از منابع اطلاعات مفید در مورد Data Science را از بنیانگذار و مدیر ارشد فناوری DAGsHub، یک جامعه و پلتفرم وب برای کنترل نسخه داده ها و همکاری بین دانشمندان داده و مهندسان یادگیری ماشین با شما به اشتراک می گذاریم. این انتخاب شامل منابع مختلفی است، از حساب‌های توییتر گرفته تا وبلاگ‌های مهندسی تمام عیار، که هدفشان کسانی است که دقیقاً می‌دانند به دنبال چه هستند. جزئیات زیر برش.

از نویسنده:
شما همان چیزی هستید که می خورید، و به عنوان یک کارمند دانش به یک رژیم غذایی اطلاعاتی خوب نیاز دارید. من می‌خواهم منابع اطلاعاتی درباره علم داده، هوش مصنوعی و فناوری‌های مرتبط را که به نظرم مفیدتر یا جذاب‌تر هستند، به اشتراک بگذارم. امیدوارم این هم به شما کمک کند!

مقاله دو دقیقه ای

یک کانال یوتیوب که برای اطلاع از آخرین رویدادها مناسب است. کانال به طور مکرر به روز می شود و میزبان اشتیاق و اشتیاق مثبتی نسبت به همه موضوعات تحت پوشش دارد. انتظار پوشش کارهای جالب نه تنها در زمینه هوش مصنوعی، بلکه در زمینه گرافیک کامپیوتری و سایر موضوعات جذاب بصری را داشته باشید.

یانیک کیلچر

یانیک در کانال یوتیوب خود تحقیقات مهمی را در زمینه یادگیری عمیق با جزئیات فنی توضیح می دهد. به‌جای اینکه خودتان مطالعه را بخوانید، تماشای یکی از ویدیوهای آن برای به دست آوردن درک عمیق‌تر از مقالات مهم، اغلب سریع‌تر و آسان‌تر است. توضیحات بدون غفلت از ریاضیات یا گم شدن در سه کاج، ماهیت مقالات را منتقل می کند. یانیک همچنین نظرات خود را در مورد چگونگی تناسب مطالعات با یکدیگر، چگونگی جدی گرفتن نتایج، تفاسیر گسترده تر و موارد دیگر به اشتراک می گذارد. رسیدن به این اکتشافات برای تازه کارها (یا غیر آکادمیک) دشوارتر است.

Distill.pub

به قول خودشان:

تحقیقات یادگیری ماشینی باید واضح، پویا و پر جنب و جوش باشد. و Distill برای کمک به تحقیقات ایجاد شد.

Distill یک انتشارات منحصر به فرد با تحقیقات در زمینه یادگیری ماشین است. مقالاتی با تجسم های خیره کننده تبلیغ می شود تا به خواننده درک شهودی بیشتری از موضوعات بدهد. تفکر فضایی و تخیل در کمک به درک مباحث یادگیری ماشین و علم داده بسیار خوب عمل می کند. از سوی دیگر، قالب‌های نشر سنتی تمایل دارند ساختارشان سفت، ایستا و خشک باشد و گاهی اوقات "ریاضی". کریس اولاه، یکی از سازندگان Distill، یک وبلاگ شخصی شگفت انگیز نیز دارد GitHub. مدتی است که به روز نشده است، اما همچنان مجموعه ای از بهترین توضیحات در مورد موضوع یادگیری عمیق است که تاکنون نوشته شده است. مخصوصا خیلی به من کمک کرد описание LSTM!

به عنوان یک دانشمند داده در سال 2020 چه بخوانیم
منبع

سباستین رودر

سباستین رودر یک وبلاگ و خبرنامه بسیار روشنگر می نویسد، در درجه اول در مورد تقاطع شبکه های عصبی و متن کاوی زبان طبیعی. او همچنین توصیه های زیادی برای محققان و سخنرانان کنفرانس دارد که اگر در دانشگاه هستید می تواند بسیار مفید باشد. مقالات سباستین معمولاً به صورت مرور، خلاصه و توضیح وضعیت تحقیق و روش های فعلی در یک زمینه خاص است. این بدان معناست که مقالات برای تمرین‌کنندگانی که می‌خواهند به سرعت به اهداف خود دست یابند بسیار مفید هستند. سباستین همچنین می نویسد توییتر.

آندری کارپاتی

آندری کارپاتی نیازی به معرفی ندارد. او علاوه بر اینکه یکی از مشهورترین محققان یادگیری عمیق روی زمین است، ابزارهای پرکاربردی را ایجاد می کند، به عنوان مثال. نگهدارنده سلامت عقل arxiv به عنوان پروژه های جانبی افراد بیشماری از طریق دوره استنفورد او وارد این عرصه شده اند cs231n، و دانستن آن برای شما مفید خواهد بود دستور غذا آموزش شبکه های عصبی تماشای آن را هم توصیه می کنم سخنرانی در مورد چالش‌های دنیای واقعی که تسلا باید بر آن‌ها غلبه کند، هنگام تلاش برای به کارگیری یادگیری ماشینی در مقیاس انبوه در دنیای واقعی. سخنرانی آموزنده، تاثیرگذار و هوشیارانه است. آندری کارپاتی علاوه بر مقالاتی در مورد خود ML ارائه می دهد توصیه زندگی خوب برای دانشمندان جاه طلب. آندری را بخوانید توییتر و گیتهاب.

مهندسی اوبر

وبلاگ مهندسی Uber از نظر مقیاس و گستردگی پوشش واقعاً چشمگیر است و موضوعات زیادی را پوشش می دهد، به ویژه هوش مصنوعی. چیزی که من به خصوص در مورد فرهنگ مهندسی Uber دوست دارم، تمایل آنها به تولید بسیار جالب و ارزشمند است پروژه منبع باز با سرعتی سرسام آور در اینجا چند نمونه آورده شده است:

وبلاگ OpenAI

جدا از بحث ها، وبلاگ OpenAI غیرقابل انکار فوق العاده است. هر از گاهی، وبلاگ مطالب و ایده هایی در مورد یادگیری عمیق ارسال می کند که فقط در مقیاس OpenAI: فرضی است. پدیده فرود عمیق دوگانه تیم OpenAI تمایل دارد به ندرت پست بگذارد، اما این چیز مهمی است.

به عنوان یک دانشمند داده در سال 2020 چه بخوانیم
منبع

وبلاگ تابولا

وبلاگ Taboola به اندازه برخی از منابع دیگر در این پست شناخته شده نیست، اما من فکر می کنم منحصر به فرد است - نویسندگان در مورد مشکلات بسیار ساده و واقعی در هنگام تلاش برای استفاده از ML در تولید برای "عادی" می نویسند. کسب‌وکارها: کمتر در مورد اتومبیل‌های خودران و عوامل RL برنده قهرمانان جهان، بیشتر در مورد «از کجا بدانم که مدل من اکنون چیزها را با اعتماد به نفس کاذب پیش‌بینی می‌کند؟» این مشکلات تقریباً به همه افرادی که در این زمینه کار می کنند مربوط می شود و نسبت به موضوعات رایج تر هوش مصنوعی پوشش مطبوعاتی کمتری دریافت می کنند، اما هنوز هم برای حل صحیح این مشکلات نیاز به استعدادهای در سطح جهانی است. خوشبختانه، تابولا هم این استعداد را دارد و هم تمایل و توانایی نوشتن در مورد آن را دارد تا دیگران نیز یاد بگیرند.

ق

همراه با توییتر، هیچ چیز در Reddit بهتر از این نیست که به تحقیقات، ابزارها یا خرد جمعیت علاقه مند شوید.

وضعیت هوش مصنوعی

پست ها فقط سالانه منتشر می شوند، اما با اطلاعات بسیار فشرده پر می شوند. در مقایسه با سایر منابع موجود در این لیست، این منبع برای افراد تجاری غیر فناوری بیشتر قابل دسترسی است. چیزی که من در مورد گفتگوها دوست دارم این است که تلاش می‌کند دیدگاهی جامع‌تر از اینکه صنعت و تحقیقات به کجا می‌روند ارائه دهد و پیشرفت‌های سخت‌افزاری، تحقیقاتی، تجاری و حتی ژئوپلیتیک را از منظر پرنده به هم گره بزند. برای خواندن تضاد منافع حتما از آخر شروع کنید.

پادکست ها

صادقانه بگویم، من فکر می کنم که پادکست ها برای بررسی موضوعات فنی مناسب نیستند. از این گذشته، آنها فقط از صدا برای توضیح موضوعات استفاده می کنند و علم داده یک زمینه بسیار بصری است. پادکست‌ها بهانه‌ای به شما می‌دهند تا بعداً تحقیقات عمیق‌تری انجام دهید یا بحث‌های فلسفی جذابی داشته باشید. با این حال، در اینجا چند توصیه وجود دارد:

  • پادکست لکس فریدمن، همانطور که او با محققان برجسته در زمینه هوش مصنوعی صحبت می کند. اپیزودهای فرانسوا شوله به خصوص خوب هستند!
  • پادکست مهندسی داده. شنیدن در مورد ابزارهای زیرساخت داده جدید خوب است.

لیست های عالی

در اینجا چیزهای کمتری برای پیگیری وجود دارد، اما منابع بیشتری زمانی مفید هستند که بدانید به دنبال چه هستید:

توییتر

  • متی ماریانسکی
    متی روش‌های زیبا و خلاقانه‌ای برای استفاده از شبکه‌های عصبی پیدا می‌کند، و دیدن نتایج او در فید توییتر خود لذت بخش است. حداقل یه نگاهی بنداز این ارسال.
  • اوری کوهن
    اوری فقط یک ماشین رانندگی است وبلاگ ها. او به طور گسترده در مورد مشکلات و راه حل ها برای دانشمندان داده می نویسد. حتما مشترک شوید تا هنگام انتشار مقاله مطلع شوید. خود مجموعهبه ویژه، واقعاً چشمگیر است.
  • جرمی هاوارد
    یکی از بنیانگذاران fast.ai، منبع جامع خلاقیت و بهره وری.
  • همل حسین
    یک مهندس ML کارکنان در Github، Hamel Hussain مشغول ایجاد و گزارش دهی ابزارهای بسیاری برای کدگذارهای داده است.
  • فرانسوا شوله
    خالق Keras، در حال حاضر تلاش برای درک خود را از چیستی هوش و چگونگی آزمایش آن به روز کنیم.
  • هاردمارو
    دانشمند تحقیقاتی در Google Brain.

نتیجه

ممکن است پست اصلی به‌روزرسانی شود، زیرا نویسنده منابع خوبی از محتوا پیدا کرده است که حیف است در فهرست قرار نگیرد. با خیال راحت با او تماس بگیرید توییتر، اگر می خواهید منبع جدیدی را معرفی کنید! و همچنین DAGsHub استخدام می کند وکیل [حدود. ترجمه public practitioner] در Data Science، بنابراین اگر محتوای Data Science خود را ایجاد می کنید، با خیال راحت به نویسنده پست بنویسید.

به عنوان یک دانشمند داده در سال 2020 چه بخوانیم
با خواندن منابع توصیه شده و استفاده از کد تبلیغاتی خود را توسعه دهید HABR، می توانید 10% تخفیف اضافی درج شده روی بنر دریافت کنید.

دوره های بیشتر

مقالات پیشنهادی

منبع: www.habr.com