Yandex Resident Program หรือวิธีที่แบ็คเดอร์ที่มีประสบการณ์สามารถเป็นวิศวกร ML ได้

Yandex Resident Program หรือวิธีที่แบ็คเดอร์ที่มีประสบการณ์สามารถเป็นวิศวกร ML ได้

Yandex กำลังเปิดโปรแกรมที่อยู่อาศัยในด้านการเรียนรู้ของเครื่องสำหรับนักพัฒนาแบ็กเอนด์ที่มีประสบการณ์ หากคุณเขียนด้วยภาษา C++/Python เป็นจำนวนมาก และต้องการนำความรู้นี้ไปใช้กับ ML เราจะสอนวิธีการวิจัยเชิงปฏิบัติและจัดหาที่ปรึกษาที่มีประสบการณ์ คุณจะได้ทำงานเกี่ยวกับบริการหลักของ Yandex และได้รับทักษะในด้านต่างๆ เช่น โมเดลเชิงเส้นและการเพิ่มการไล่ระดับสี ระบบแนะนำ โครงข่ายประสาทเทียมสำหรับการวิเคราะห์ภาพ ข้อความ และเสียง คุณยังจะได้เรียนรู้วิธีประเมินโมเดลของคุณอย่างเหมาะสมโดยใช้หน่วยวัดออฟไลน์และออนไลน์

ระยะเวลาของโปรแกรมคือหนึ่งปี ในระหว่างที่ผู้เข้าร่วมจะได้ทำงานในแผนกข่าวกรองเครื่องจักรและการวิจัยของ Yandex ตลอดจนเข้าร่วมการบรรยายและสัมมนา การเข้าร่วมจะได้รับค่าตอบแทนและเกี่ยวข้องกับการทำงานเต็มเวลา: 40 ชั่วโมงต่อสัปดาห์ เริ่มตั้งแต่วันที่ 1 กรกฎาคมปีนี้ เปิดรับสมัครแล้ว และจะมีไปจนถึงวันที่ 1 พฤษภาคม 

และตอนนี้มีรายละเอียดเพิ่มเติม - เกี่ยวกับผู้ชมประเภทใดที่เรากำลังรอ กระบวนการทำงานจะเป็นอย่างไร และโดยทั่วไปแล้ว ผู้เชี่ยวชาญส่วนหลังสามารถเปลี่ยนไปใช้อาชีพใน ML ได้อย่างไร

ทิศทาง

บริษัทหลายแห่งมีโปรแกรม Residency ซึ่งรวมถึง Google และ Facebook เป็นต้น มุ่งเน้นไปที่ผู้เชี่ยวชาญระดับจูเนียร์และระดับกลางที่กำลังพยายามก้าวไปสู่การวิจัย ML โปรแกรมของเรามีไว้สำหรับผู้ชมที่แตกต่างกัน เราขอเชิญชวนนักพัฒนาแบ็กเอนด์ที่ได้รับประสบการณ์เพียงพอแล้ว และรู้แน่ว่าในความสามารถของตน พวกเขาจำเป็นต้องเปลี่ยนมาใช้ ML เพื่อรับทักษะการปฏิบัติ - ไม่ใช่ทักษะของนักวิทยาศาสตร์ - ในการแก้ปัญหาการเรียนรู้ของเครื่องทางอุตสาหกรรม นี่ไม่ได้หมายความว่าเราไม่สนับสนุนนักวิจัยรุ่นเยาว์ เราได้จัดโปรแกรมแยกต่างหากสำหรับพวกเขา - รางวัล ตั้งชื่อตาม Ilya Segalovich ซึ่งอนุญาตให้คุณทำงานใน Yandex ได้

ผู้อยู่อาศัยจะทำงานที่ไหน?

ในภาควิชาข่าวกรองและการวิจัยเครื่องจักร เราพัฒนาแนวคิดโครงการด้วยตนเอง แหล่งที่มาของแรงบันดาลใจหลักคือวรรณกรรมทางวิทยาศาสตร์ บทความ และกระแสนิยมในชุมชนการวิจัย ฉันและเพื่อนร่วมงานวิเคราะห์สิ่งที่เราอ่าน โดยดูว่าเราจะปรับปรุงหรือขยายวิธีการที่นักวิทยาศาสตร์เสนอได้อย่างไร ในเวลาเดียวกันเราแต่ละคนคำนึงถึงความรู้และความสนใจของเขากำหนดงานตามพื้นที่ที่เขาพิจารณาว่าสำคัญ แนวคิดสำหรับโครงการมักจะเกิดขึ้นที่จุดตัดของผลการวิจัยภายนอกและความสามารถของตนเอง

ระบบนี้ดีเพราะสามารถแก้ไขปัญหาทางเทคโนโลยีของบริการ Yandex ได้เป็นส่วนใหญ่ก่อนที่จะเกิดขึ้น เมื่อบริการประสบปัญหา ตัวแทนจะมาหาเรา ซึ่งส่วนใหญ่จะใช้เทคโนโลยีที่เราเตรียมไว้แล้ว ซึ่งสิ่งที่เหลืออยู่คือการนำไปใช้อย่างถูกต้องในผลิตภัณฑ์ หากมีบางอย่างไม่พร้อม อย่างน้อยเราก็จะจำได้อย่างรวดเร็วว่าเราสามารถ "เริ่มขุด" ได้ที่ไหน และบทความใดบ้างที่ควรค้นหาวิธีแก้ไข ดังที่เราทราบ วิธีการทางวิทยาศาสตร์คือการยืนบนไหล่ของยักษ์

จะทำอย่างไร

ที่ Yandex - และโดยเฉพาะในการจัดการของเรา - ML ที่เกี่ยวข้องทั้งหมดกำลังได้รับการพัฒนา เป้าหมายของเราคือการปรับปรุงคุณภาพของผลิตภัณฑ์ที่หลากหลาย และสิ่งนี้ทำหน้าที่เป็นแรงจูงใจในการทดสอบทุกอย่างใหม่ นอกจากนี้ยังมีบริการใหม่ ๆ ปรากฏขึ้นเป็นประจำ ดังนั้นโปรแกรมการบรรยายจึงประกอบด้วยประเด็นสำคัญทั้งหมด (ที่ได้รับการพิสูจน์แล้ว) ของการเรียนรู้ของเครื่องในการพัฒนาอุตสาหกรรม เมื่อรวบรวมส่วนหนึ่งของหลักสูตร ฉันใช้ประสบการณ์การสอนที่ School of Data Analysis รวมถึงสื่อการสอนและผลงานของครู SHAD คนอื่นๆ ฉันรู้ว่าเพื่อนร่วมงานของฉันก็ทำเช่นเดียวกัน

ในช่วงเดือนแรก การฝึกอบรมตามหลักสูตรจะคิดเป็นประมาณ 30% ของเวลาทำงานของคุณ จากนั้นประมาณ 10% อย่างไรก็ตาม สิ่งสำคัญคือต้องเข้าใจว่าการทำงานกับโมเดล ML เองจะยังคงใช้เวลาน้อยกว่ากระบวนการที่เกี่ยวข้องทั้งหมดประมาณสี่เท่า ซึ่งรวมถึงการเตรียมแบ็กเอนด์ การรับข้อมูล การเขียนไปป์ไลน์สำหรับการประมวลผลล่วงหน้า การเพิ่มประสิทธิภาพโค้ด การปรับให้เข้ากับฮาร์ดแวร์เฉพาะ ฯลฯ หากคุณต้องการ วิศวกร ML ก็คือนักพัฒนาแบบฟูลสแตก (เฉพาะที่เน้นการเรียนรู้ของเครื่องมากขึ้นเท่านั้น) สามารถแก้ปัญหาได้ตั้งแต่ต้นจนจบ แม้ว่าจะเป็นโมเดลสำเร็จรูป คุณอาจต้องดำเนินการเพิ่มเติมหลายประการ เช่น ทำการประมวลผลแบบขนานกับเครื่องหลายเครื่อง เตรียมการใช้งานในรูปแบบของตัวจัดการ ไลบรารี หรือส่วนประกอบของบริการเอง

ทางเลือกของนักเรียน
หากคุณรู้สึกว่าการเป็นวิศวกร ML โดยการทำงานเป็นนักพัฒนาแบ็กเอนด์เป็นครั้งแรกจะดีกว่า นี่ไม่เป็นความจริง การลงทะเบียนใน ShAD เดียวกันโดยไม่มีประสบการณ์จริงในการพัฒนาบริการ การเรียนรู้และการเป็นที่ต้องการอย่างมากในตลาดถือเป็นตัวเลือกที่ยอดเยี่ยม ผู้เชี่ยวชาญยานเดกซ์หลายคนลงเอยในตำแหน่งปัจจุบันด้วยวิธีนี้ หากบริษัทใดพร้อมเสนองานด้าน ML ให้คุณทันทีหลังเรียนจบ คุณก็ควรตอบรับข้อเสนอนี้เช่นกัน พยายามเข้าทีมที่ดีกับที่ปรึกษาที่มีประสบการณ์และเตรียมพร้อมที่จะเรียนรู้มากมาย

อะไรมักจะขัดขวางไม่ให้คุณทำ ML?

หากแบ็คเดอร์ปรารถนาที่จะเป็นวิศวกร ML เขาสามารถเลือกการพัฒนาได้จากสองด้าน โดยไม่คำนึงถึงโปรแกรมถิ่นที่อยู่

ประการแรก ศึกษาเป็นส่วนหนึ่งของหลักสูตรการศึกษาบางหลักสูตร บทเรียน Coursera จะทำให้คุณเข้าใกล้ความเข้าใจในเทคนิคพื้นฐานมากขึ้น แต่เพื่อที่จะดื่มด่ำกับอาชีพนี้ในระดับที่เพียงพอ คุณจะต้องทุ่มเทเวลาให้กับมันมากขึ้น ตัวอย่างเช่น สำเร็จการศึกษาจาก ShAD ในช่วงหลายปีที่ผ่านมา ShAD มีจำนวนหลักสูตรเกี่ยวกับแมชชีนเลิร์นนิงโดยตรงที่แตกต่างกันไป โดยเฉลี่ยแล้วประมาณ XNUMX หลักสูตร แต่ละอย่างมีความสำคัญและมีประโยชน์มากรวมถึงในความเห็นของบัณฑิตด้วย 

ประการที่สอง คุณสามารถมีส่วนร่วมในโครงการต่อสู้ที่คุณต้องใช้อัลกอริทึม ML อย่างใดอย่างหนึ่ง อย่างไรก็ตาม มีโครงการดังกล่าวน้อยมากในตลาดการพัฒนาไอที: การเรียนรู้ของเครื่องไม่ได้ใช้ในงานส่วนใหญ่ แม้แต่ในธนาคารที่กำลังสำรวจโอกาสที่เกี่ยวข้องกับ ML อย่างจริงจัง มีเพียงไม่กี่แห่งเท่านั้นที่มีส่วนร่วมในการวิเคราะห์ข้อมูล หากคุณไม่สามารถเข้าร่วมหนึ่งในทีมเหล่านี้ได้ ทางเลือกเดียวของคุณคือเริ่มโปรเจ็กต์ของคุณเอง (ซึ่งเป็นไปได้มากว่าคุณจะกำหนดเส้นตายของคุณเอง และนี่แทบไม่เกี่ยวข้องกับงานการผลิตการรบเลย) หรือเริ่มการแข่งขันใน กากเกิล.

ร่วมทีมกับสมาชิกชุมชนคนอื่นๆ และลองแข่งขันด้วยตัวเอง ค่อนข้างง่าย - โดยเฉพาะอย่างยิ่งหากคุณสำรองทักษะของคุณด้วยการฝึกอบรมและหลักสูตรที่กล่าวถึงใน Coursera การแข่งขันแต่ละครั้งมีกำหนดเวลา - มันจะทำหน้าที่เป็นแรงจูงใจสำหรับคุณและเตรียมคุณให้พร้อมสำหรับระบบที่คล้ายกันในบริษัทไอที นี่เป็นวิธีที่ดี - ซึ่งแยกออกจากกระบวนการจริงเล็กน้อยเช่นกัน บน Kaggle คุณจะได้รับข้อมูลที่ประมวลผลล่วงหน้าแม้ว่าจะไม่สมบูรณ์แบบเสมอไป อย่าเสนอที่จะคิดถึงการมีส่วนร่วมกับผลิตภัณฑ์ และที่สำคัญที่สุดคือไม่ต้องการโซลูชั่นที่เหมาะสมสำหรับการผลิต อัลกอริธึมของคุณอาจจะทำงานได้และมีความแม่นยำสูง แต่โมเดลและโค้ดของคุณจะเหมือนกับว่าแฟรงเกนสไตน์ถูกต่อเข้าด้วยกันจากส่วนต่างๆ - ในโปรเจ็กต์ที่ใช้งานจริง โครงสร้างทั้งหมดจะทำงานช้าเกินไป จะทำให้อัปเดตและขยายได้ยาก (เช่น อัลกอริธึมภาษาและเสียงจะถูกเขียนใหม่บางส่วนเสมอเมื่อภาษาพัฒนาขึ้น) บริษัทต่างๆ สนใจในความจริงที่ว่างานที่ระบุไว้สามารถทำได้ไม่เพียงแต่ตัวคุณเองเท่านั้น (เป็นที่ชัดเจนว่าคุณในฐานะผู้เขียนโซลูชันสามารถทำได้) แต่ยังโดยเพื่อนร่วมงานของคุณด้วย มีการพูดคุยถึงความแตกต่างระหว่างรายการกีฬาและรายการอุตสาหกรรม หลายและ Kaggle ให้ความรู้แก่ "นักกีฬา" อย่างแม่นยำ แม้ว่าจะทำได้ดีมาก ทำให้พวกเขาได้รับประสบการณ์บางอย่างก็ตาม

ฉันอธิบายการพัฒนาที่เป็นไปได้สองบรรทัด - การฝึกอบรมผ่านโปรแกรมการศึกษาและการฝึกอบรม "ในการต่อสู้" เช่น Kaggle โปรแกรมถิ่นที่อยู่เป็นการผสมผสานระหว่างสองวิธีนี้ การบรรยายและการสัมมนาในระดับ ShAD รวมถึงโครงการต่อสู้อย่างแท้จริงรอคุณอยู่

ที่มา: will.com

เพิ่มความคิดเห็น