สิ่งที่ควรอ่านในฐานะนักวิทยาศาสตร์ข้อมูลในปี 2020

สิ่งที่ควรอ่านในฐานะนักวิทยาศาสตร์ข้อมูลในปี 2020
ในโพสต์นี้ เราแชร์แหล่งข้อมูลที่เป็นประโยชน์เกี่ยวกับ Data Science จากผู้ร่วมก่อตั้งและ CTO ของ DAGsHub ซึ่งเป็นแพลตฟอร์มชุมชนและเว็บสำหรับการควบคุมเวอร์ชันข้อมูลและการทำงานร่วมกันระหว่างนักวิทยาศาสตร์ข้อมูลและวิศวกรการเรียนรู้ของเครื่อง การเลือกรวมถึงแหล่งที่มาที่หลากหลาย ตั้งแต่บัญชี Twitter ไปจนถึงบล็อกวิศวกรรมเต็มรูปแบบ ซึ่งกำหนดเป้าหมายไปยังผู้ที่ทราบแน่ชัดว่าพวกเขากำลังมองหาอะไร รายละเอียดภายใต้การตัด

จากผู้เขียน:
คุณเป็นอย่างที่คุณกิน และในฐานะคนทำงานด้านความรู้ คุณต้องมีอาหารที่มีข้อมูลที่ดี ฉันต้องการแบ่งปันแหล่งข้อมูลเกี่ยวกับวิทยาศาสตร์ข้อมูล ปัญญาประดิษฐ์ และเทคโนโลยีที่เกี่ยวข้อง ซึ่งฉันคิดว่ามีประโยชน์หรือน่าสนใจที่สุด ฉันหวังว่านี่จะช่วยคุณได้เช่นกัน!

เอกสารสองนาที

ช่อง YouTube ที่เหมาะเป็นอย่างยิ่งในการติดตามเหตุการณ์ล่าสุด ช่องได้รับการอัปเดตบ่อยครั้งและโฮสต์มีความกระตือรือร้นและแง่บวกในทุกหัวข้อที่ครอบคลุม คาดหวังความครอบคลุมของงานที่น่าสนใจไม่เพียงแค่เกี่ยวกับ AI เท่านั้น แต่ยังครอบคลุมถึงคอมพิวเตอร์กราฟิกและหัวข้ออื่นๆ ที่ดึงดูดสายตาอีกด้วย

ยานนิค คิลเชอร์

Yannick อธิบายการวิจัยที่สำคัญเกี่ยวกับการเรียนรู้เชิงลึกในรายละเอียดทางเทคนิคในช่อง YouTube ของเขา แทนที่จะอ่านการศึกษาด้วยตัวเอง มักจะเร็วกว่าและง่ายกว่าหากดูวิดีโอใดวิดีโอหนึ่งเพื่อทำความเข้าใจบทความที่สำคัญอย่างลึกซึ้งยิ่งขึ้น คำอธิบายถ่ายทอดสาระสำคัญของบทความโดยไม่ละเลยคณิตศาสตร์หรือหลงทางในต้นสนสามใบ Yannick ยังแบ่งปันมุมมองของเขาเกี่ยวกับความสอดคล้องของการศึกษา การพิจารณาผลลัพธ์อย่างจริงจัง การตีความที่กว้างขึ้น และอื่นๆ ผู้เริ่มต้น (หรือผู้ปฏิบัติงานที่ไม่ใช่นักวิชาการ) พบว่ามันยากกว่าที่จะค้นพบสิ่งเหล่านี้ด้วยตัวเอง

distill.pub

ในคำพูดของพวกเขาเอง:

การวิจัยการเรียนรู้ของเครื่องต้องมีความชัดเจน ไดนามิก และมีชีวิตชีวา และดิสทิลถูกสร้างขึ้นเพื่อช่วยในการวิจัย

Distill เป็นสิ่งพิมพ์วิจัยการเรียนรู้ของเครื่องที่ไม่เหมือนใคร บทความได้รับการส่งเสริมด้วยการแสดงภาพที่สวยงามเพื่อให้ผู้อ่านเข้าใจหัวข้อได้ง่ายยิ่งขึ้น การคิดเชิงพื้นที่และจินตนาการมักจะทำงานได้ดีในการช่วยให้คุณเข้าใจหัวข้อ Machine Learning และ Data Science ในทางกลับกัน รูปแบบสิ่งพิมพ์แบบดั้งเดิมมีแนวโน้มที่จะมีโครงสร้างที่ตายตัว คงที่และแห้ง และในบางครั้ง "คณิตศาสตร์". Chris Olah ผู้ร่วมสร้าง Distill ยังดูแลบล็อกส่วนตัวที่น่าทึ่งที่ GitHub. ไม่ได้รับการอัปเดตเป็นเวลานาน แต่ยังคงเป็นชุดคำอธิบายการเรียนรู้เชิงลึกที่ดีที่สุดเท่าที่เคยเขียนมา โดยเฉพาะอย่างยิ่งมันช่วยฉันได้มาก описание แอลทีเอ็ม!

สิ่งที่ควรอ่านในฐานะนักวิทยาศาสตร์ข้อมูลในปี 2020
แหล่ง

เซบาสเตียน รูดิเกอร์

Sebastian Ruder เขียนบล็อกและจดหมายข่าวที่ให้ข้อมูลมาก โดยหลักแล้วเกี่ยวกับจุดตัดของโครงข่ายประสาทเทียมและการวิเคราะห์ข้อความภาษาธรรมชาติ เขายังให้คำแนะนำมากมายแก่นักวิจัยและวิทยากรการประชุม ซึ่งจะมีประโยชน์มากหากคุณอยู่ในสายวิชาการ บทความของ Sebastian มักจะอยู่ในรูปแบบของบทวิจารณ์ สรุปและอธิบายความทันสมัยของการวิจัยและวิธีการในพื้นที่ที่กำหนด ซึ่งหมายความว่าบทความมีประโยชน์อย่างมากสำหรับผู้ปฏิบัติงานที่ต้องการได้รับแบริ่งอย่างรวดเร็ว เซบาสเตียนเขียนด้วย Twitter.

อันเดรย์ คาร์ปาตี

Andrei Karpaty ไม่ต้องการคำแนะนำ นอกจากจะเป็นหนึ่งในนักวิจัยการเรียนรู้เชิงลึกที่มีชื่อเสียงที่สุดในโลกแล้ว เขายังสร้างเครื่องมือที่ใช้กันอย่างแพร่หลายเช่น เก็บถาวรรักษาสุขภาพจิต เป็นโครงการด้านข้าง ผู้คนนับไม่ถ้วนเข้าสู่อาณาจักรนี้ผ่านหลักสูตรสแตนฟอร์ดของเขา cs231nและมันจะเป็นประโยชน์สำหรับคุณที่จะรู้ ตำรับ การฝึกอบรมเครือข่ายประสาท ฉันแนะนำให้ดูด้วย การพูด เกี่ยวกับปัญหาที่แท้จริงที่เทสลาต้องเอาชนะเมื่อพยายามใช้แมชชีนเลิร์นนิงในวงกว้างในโลกแห่งความเป็นจริง คำพูดให้ข้อมูลที่น่าประทับใจและมีสติ นอกจากบทความเกี่ยวกับ ML แล้ว Andrey Karpaty ยังให้ คำแนะนำชีวิตที่ดี สำหรับ นักวิทยาศาสตร์ที่มีความทะเยอทะยาน. อ่านแอนดรูว์ได้ที่ Twitter และ Github.

อูเบอร์ เอ็นจิเนียริ่ง

บล็อกด้านวิศวกรรมของ Uber นั้นน่าประทับใจมากในแง่ของขนาดและความครอบคลุม โดยเฉพาะอย่างยิ่งครอบคลุมหัวข้อต่างๆ มากมาย ปัญญาประดิษฐ์. สิ่งที่ฉันชอบเป็นพิเศษเกี่ยวกับวัฒนธรรมทางวิศวกรรมของ Uber คือแนวโน้มที่จะเผยแพร่สิ่งที่น่าสนใจและมีคุณค่า โครงการ โอเพ่นซอร์สอย่างรวดเร็ว นี่คือตัวอย่างบางส่วน:

บล็อก OpenAI

นอกเหนือจากการโต้เถียงแล้ว บล็อก OpenAI นั้นยอดเยี่ยมอย่างปฏิเสธไม่ได้ ในบางครั้ง บล็อกจะโพสต์เนื้อหาและข้อมูลเชิงลึกเกี่ยวกับการเรียนรู้เชิงลึกที่สามารถมาในระดับ OpenAI เท่านั้น: สมมุติฐาน ปรากฏการณ์ โคตรลึกสองเท่า ทีมงาน OpenAI มีแนวโน้มที่จะโพสต์ไม่บ่อยนัก แต่เป็นเนื้อหาที่สำคัญ

สิ่งที่ควรอ่านในฐานะนักวิทยาศาสตร์ข้อมูลในปี 2020
แหล่ง

ทาบูล่าบล็อก

บล็อกของ Taboola ไม่ได้เป็นที่รู้จักกันดีเท่าแหล่งข้อมูลอื่น ๆ ในโพสต์นี้ แต่ฉันคิดว่ามันไม่เหมือนใคร - ผู้เขียนเขียนเกี่ยวกับปัญหาที่เกิดขึ้นจริงมากเมื่อพยายามใช้ ML ในการผลิตสำหรับธุรกิจ "ปกติ": น้อยลงเกี่ยวกับ รถยนต์ไร้คนขับและตัวแทน RL ที่คว้าแชมป์โลก เพิ่มเติมเกี่ยวกับ "ฉันจะรู้ได้อย่างไรว่าแบบจำลองของฉันกำลังคาดการณ์สิ่งต่างๆ ด้วยความมั่นใจที่ผิดพลาด" ประเด็นเหล่านี้เกี่ยวข้องกับเกือบทุกคนที่ทำงานในภาคสนามและได้รับการรายงานข่าวน้อยกว่าหัวข้อ AI ทั่วไป แต่ก็ยังต้องใช้ความสามารถระดับโลกเพื่อแก้ไขปัญหาเหล่านี้อย่างเหมาะสม โชคดีที่ Taboola มีทั้งพรสวรรค์และความเต็มใจและความสามารถในการเขียนเกี่ยวกับเรื่องนี้เพื่อให้คนอื่นสามารถเรียนรู้ได้เช่นกัน

Reddit

นอกจาก Twitter แล้ว ไม่มีอะไรที่ดีไปกว่า Reddit ในการค้นคว้าข้อมูล เครื่องมือ หรือภูมิปัญญาของฝูงชน

สถานะของ AI

มีการเผยแพร่โพสต์ทุกปีเท่านั้น แต่เต็มไปด้วยข้อมูลหนาแน่นมาก เมื่อเทียบกับแหล่งข้อมูลอื่นในรายการนี้ แหล่งข้อมูลนี้สามารถเข้าถึงได้มากกว่าสำหรับนักธุรกิจที่ไม่มีเทคโนโลยี สิ่งที่ฉันชอบเกี่ยวกับการพูดคุยคือพวกเขาพยายามให้มุมมองแบบองค์รวมมากขึ้นว่าอุตสาหกรรมและการวิจัยกำลังมุ่งหน้าไปทางไหน โดยเชื่อมโยงความก้าวหน้าในด้านฮาร์ดแวร์ การวิจัย ธุรกิจ และแม้แต่การเมืองจากมุมสูงเข้าด้วยกัน อย่าลืมเริ่มต้นในตอนท้ายเพื่ออ่านเกี่ยวกับผลประโยชน์ทับซ้อน

พอดคาสต์

ฉันคิดว่าพอดแคสต์ไม่เหมาะกับการเรียนรู้เกี่ยวกับหัวข้อทางเทคนิค ท้ายที่สุด พวกเขาใช้เพียงเสียงในการอธิบายหัวข้อต่างๆ และวิทยาศาสตร์ข้อมูลก็เป็นสาขาที่มองเห็นได้ชัดเจน พ็อดคาสท์มักจะเป็นข้ออ้างให้คุณสำรวจในเชิงลึกในภายหลัง หรือเพื่อการสนทนาเชิงปรัชญา อย่างไรก็ตาม ต่อไปนี้คือคำแนะนำบางประการ:

รายการที่ยอดเยี่ยม

มีอะไรให้ติดตามน้อยลง แต่มีแหล่งข้อมูลเพิ่มเติมที่เป็นประโยชน์เมื่อคุณรู้ว่าคุณกำลังมองหาอะไร:

Twitter

  • แม็ตตี้ มาเรียนสกี้
    Matty ค้นพบวิธีที่สวยงามและสร้างสรรค์ในการใช้โครงข่ายประสาทเทียม และเป็นเรื่องสนุกที่ได้เห็นผลลัพธ์ของเขาบนฟีด Twitter ของคุณ ลองดูอย่างน้อย นี้ เสา
  • โอริ โคเฮน
    Ori เป็นเพียงเครื่องจักรขับเคลื่อน บล็อก. เขาเขียนเกี่ยวกับปัญหาและวิธีแก้ปัญหาสำหรับนักวิทยาศาสตร์ข้อมูลอย่างกว้างขวาง อย่าลืมสมัครสมาชิกเพื่อรับการแจ้งเตือนเมื่อมีการเผยแพร่บทความ ของเขา ชุดโดยเฉพาะอย่างยิ่งน่าประทับใจจริงๆ
  • เจเรมี ฮาเวิร์ด
    ผู้ร่วมก่อตั้ง fast.ai แหล่งรวมความคิดสร้างสรรค์และประสิทธิภาพการทำงาน
  • ฮาเมล ฮุสเซน
    Hamel Hussain ซึ่งเป็นพนักงานวิศวกร ML ที่ Github กำลังง่วนอยู่กับการสร้างและรายงานเกี่ยวกับเครื่องมือมากมายสำหรับผู้เขียนโค้ดในโดเมนข้อมูล
  • ฟรองซัวส์ โชเล่ต์
    ผู้สร้าง Keras ในขณะนี้ พยายามที่จะ อัปเดตความเข้าใจของเราเกี่ยวกับความฉลาดและวิธีทดสอบ
  • ฮาร์ดมารู
    นักวิทยาศาสตร์การวิจัยที่ Google Brain

ข้อสรุป

โพสต์ต้นฉบับอาจได้รับการอัปเดตเนื่องจากผู้เขียนพบแหล่งเนื้อหาที่ยอดเยี่ยมซึ่งน่าเสียดายที่จะไม่รวมอยู่ในรายการ อย่าลังเลที่จะติดต่อเขา Twitterหากคุณต้องการแนะนำแหล่งข้อมูลใหม่! และ DAGsHub ด้วย จ้าง ผู้สนับสนุน [ประมาณ. แปล Public Practitioner] ใน Data Science ดังนั้นหากคุณสร้างเนื้อหา Data Science ของคุณเอง โปรดเขียนถึงผู้เขียนโพสต์

สิ่งที่ควรอ่านในฐานะนักวิทยาศาสตร์ข้อมูลในปี 2020
พัฒนาโดยการอ่านแหล่งที่แนะนำและตามรหัสส่งเสริมการขาย ฮาเบอร์คุณจะได้รับส่วนลดเพิ่มอีก 10% ตามที่ระบุไว้บนแบนเนอร์

หลักสูตรเพิ่มเติม

บทความที่แนะนำ

ที่มา: will.com