ฉันจัดการฝึกอบรมแมชชีนเลิร์นนิงที่ NSU ได้อย่างไร

ฉันชื่อ Sasha และฉันชอบแมชชีนเลิร์นนิงและชอบสอนผู้คนด้วย ตอนนี้ฉันดูแลโปรแกรมการศึกษาที่ศูนย์วิทยาการคอมพิวเตอร์และกำกับโปรแกรมระดับปริญญาตรีด้านการวิเคราะห์ข้อมูลที่มหาวิทยาลัยแห่งรัฐเซนต์ปีเตอร์สเบิร์ก ก่อนหน้านั้นเขาทำงานเป็นนักวิเคราะห์ที่ Yandex และก่อนหน้านี้ในฐานะนักวิทยาศาสตร์: เขามีส่วนร่วมในการสร้างแบบจำลองทางคณิตศาสตร์ที่สถาบันวิทยาการคอมพิวเตอร์ของ SB RAS

ในโพสต์นี้ ฉันอยากจะบอกคุณว่าอะไรคือที่มาของแนวคิดในการเปิดตัวการฝึกอบรมการเรียนรู้ของเครื่องสำหรับนักศึกษา ผู้สำเร็จการศึกษาจาก Novosibirsk State University และคนอื่นๆ

ฉันจัดการฝึกอบรมแมชชีนเลิร์นนิงที่ NSU ได้อย่างไร

ฉันอยากจัดหลักสูตรพิเศษเกี่ยวกับการเตรียมตัวสำหรับการแข่งขันการวิเคราะห์ข้อมูลบน Kaggle และแพลตฟอร์มอื่นๆ มานานแล้ว ดูเหมือนเป็นความคิดที่ดี:

  • นักศึกษาและผู้ที่สนใจจะนำความรู้ทางทฤษฎีไปปฏิบัติและได้รับประสบการณ์ในการแก้ปัญหาในการแข่งขันสาธารณะ
  • นักศึกษาที่ได้อันดับสูงสุดในการแข่งขันดังกล่าวจะส่งผลดีต่อความน่าดึงดูดใจของ NSU สำหรับผู้สมัคร นักศึกษา และผู้สำเร็จการศึกษา สิ่งเดียวกันนี้เกิดขึ้นกับการฝึกเขียนโปรแกรมกีฬา
  • หลักสูตรพิเศษนี้เติมเต็มและขยายความรู้พื้นฐานอย่างสมบูรณ์แบบ: ผู้เข้าร่วมใช้โมเดลการเรียนรู้ของเครื่องอย่างอิสระ และมักจะจัดตั้งทีมที่แข่งขันในระดับโลก
  • มหาวิทยาลัยอื่นๆ ได้จัดการฝึกอบรมเช่นนี้แล้ว ผมจึงหวังว่าหลักสูตรพิเศษของ NSU จะประสบความสำเร็จ

ยิง

Akademgorodok แห่ง Novosibirsk มีรากฐานอันอุดมสมบูรณ์สำหรับความพยายามดังกล่าว: นักศึกษา ผู้สำเร็จการศึกษา และอาจารย์ของศูนย์วิทยาการคอมพิวเตอร์ และคณะเทคนิคที่เข้มแข็ง เช่น FIT, MMF, FF, การสนับสนุนที่แข็งแกร่งของการบริหาร NSU, ชุมชน ODS ที่กระตือรือร้น, วิศวกรที่มีประสบการณ์ และนักวิเคราะห์จากบริษัทไอทีต่างๆ ในเวลาเดียวกัน เราก็ได้เรียนรู้เกี่ยวกับโครงการทุนสนับสนุนจาก การลงทุนโบตัน — กองทุนสนับสนุนทีมที่ทำผลงานได้ดีในการแข่งขันกีฬา ML

เราพบผู้ฟังที่ NSU สำหรับการประชุมรายสัปดาห์ สร้างการแชทบน Telegram และเปิดตัวในวันที่ 1 ตุลาคมร่วมกับนักศึกษาและผู้สำเร็จการศึกษาจากศูนย์ CS 19 คนมาเรียนบทเรียนแรก มีหกคนเข้าร่วมการฝึกอบรมเป็นประจำ มีผู้เข้าร่วมประชุมอย่างน้อย 31 ครั้งในปีการศึกษา รวม XNUMX คน

ผลลัพธ์ครั้งแรก

ฉันกับพวกเขาพบกัน แลกเปลี่ยนประสบการณ์ หารือเกี่ยวกับการแข่งขัน และแผนการคร่าวๆ สำหรับอนาคต เราตระหนักได้อย่างรวดเร็วว่าการต่อสู้เพื่อแย่งชิงตำแหน่งในการแข่งขันวิเคราะห์ข้อมูลนั้นเป็นงานที่น่าเบื่อหน่าย คล้ายกับงานเต็มเวลาที่ไม่ได้รับค่าจ้าง แต่น่าสนใจและน่าตื่นเต้นมาก 🙂 หนึ่งในผู้เข้าร่วม Kaggle-master Maxim แนะนำให้เราก้าวไปข้างหน้าในการแข่งขันเป็นรายบุคคล และเพียงไม่กี่สัปดาห์ต่อมาก็รวมตัวกันเป็นทีมโดยคำนึงถึงคะแนนสาธารณะ นั่นคือสิ่งที่เราทำ! ในระหว่างการฝึกอบรมแบบเห็นหน้ากัน เราได้พูดคุยถึงโมเดล บทความทางวิทยาศาสตร์ และความซับซ้อนของไลบรารี Python และแก้ไขปัญหาร่วมกัน

ผลการแข่งขันภาคเรียนฤดูใบไม้ร่วง ได้แก่ เหรียญเงิน XNUMX เหรียญจากการแข่งขัน XNUMX รายการใน Kaggle: การระบุเกลือ TGS и การจำแนกทางดาราศาสตร์ของ PLAsTiCC. และอันดับที่สามในการแข่งขัน CFT เพื่อแก้ไขการพิมพ์ผิดด้วยเงินก้อนแรกที่ได้รับ (เป็นเงินตามที่นัก Keglers ที่มีประสบการณ์กล่าว)

ผลลัพธ์ทางอ้อมที่สำคัญอีกประการหนึ่งของหลักสูตรพิเศษคือการเปิดตัวและการกำหนดค่าคลัสเตอร์ NSU VKI พลังการประมวลผลทำให้อายุการใช้งานในการแข่งขันของเราดีขึ้นอย่างเห็นได้ชัด: CPU 40 ตัว, RAM 755Gb, GPU NVIDIA Tesla V8 100 ตัว

ฉันจัดการฝึกอบรมแมชชีนเลิร์นนิงที่ NSU ได้อย่างไร

ก่อนหน้านั้น เราเอาตัวรอดอย่างดีที่สุดเท่าที่จะทำได้: เราคำนวณโดยใช้แล็ปท็อปและเดสก์ท็อปส่วนตัว ใน Google Colab และใน Kaggle-kernels ทีมหนึ่งมีสคริปต์ที่เขียนเองซึ่งจะบันทึกโมเดลโดยอัตโนมัติ และรีสตาร์ทการคำนวณที่หยุดลงเนื่องจากขีดจำกัดเวลา

ในภาคการศึกษาฤดูใบไม้ผลิ เรายังคงรวบรวม แลกเปลี่ยนสิ่งที่ค้นพบที่ประสบความสำเร็จ และพูดคุยเกี่ยวกับวิธีแก้ปัญหาของเราในการแข่งขัน ผู้เข้าร่วมที่สนใจใหม่เริ่มมาหาเรา ในช่วงภาคเรียนฤดูใบไม้ผลิ เราคว้ามาได้หนึ่งเหรียญทอง สามเหรียญเงิน และเก้าเหรียญทองแดงในการแข่งขันแปดรายการใน Kaggle: เพ็ทไฟน์เดอร์, Santander, ความละเอียดทางเพศ, บัตรประจำตัวปลาวาฬ, Quora, แลนด์มาร์คของ Google และอื่น ๆ บรอนซ์ใน ความท้าทายเรคโก้อันดับที่ XNUMX ใน Changellenge>>Cup และที่ XNUMX (เรื่องเงินอีกครั้ง) ในการแข่งขัน Machine Learning ที่ แชมป์การเขียนโปรแกรม จากยานเดกซ์

สิ่งที่ผู้เข้าร่วมการฝึกอบรมพูด

มิคาอิล คาร์เชฟสกี
“ ฉันดีใจมากที่มีกิจกรรมดังกล่าวเกิดขึ้นที่นี่ในไซบีเรีย เพราะฉันเชื่อว่าการเข้าร่วมการแข่งขันเป็นวิธีที่เร็วที่สุดในการฝึกฝน ML สำหรับการแข่งขันดังกล่าว ฮาร์ดแวร์มีราคาค่อนข้างแพงในการซื้อเอง แต่ที่นี่คุณสามารถลองใช้ไอเดียต่างๆ ได้ฟรี"

คิริลล์ บรอดท์
“ก่อนที่จะมีการฝึกอบรม ML ฉันไม่ได้เข้าร่วมการแข่งขันเป็นพิเศษ ยกเว้นการฝึกอบรมและการแข่งขันฮินดู: ฉันไม่เห็นประเด็นในเรื่องนี้เนื่องจากฉันทำงานในสาขา ML และฉันก็คุ้นเคยกับมัน ภาคเรียนแรกที่ฉันเข้าเรียนในฐานะนักเรียน และเริ่มตั้งแต่ภาคการศึกษาที่ XNUMX ทันทีที่มีทรัพยากรคอมพิวเตอร์เข้ามา ฉันคิดว่าทำไมไม่เข้าร่วมด้วย และมันก็ทำให้ฉันติดใจ งาน ข้อมูล และตัวชี้วัดถูกคิดค้นและจัดเตรียมไว้สำหรับคุณ ดำเนินการต่อและใช้ MO อย่างเต็มประสิทธิภาพ ตรวจสอบโมเดลและเทคนิคที่ล้ำสมัย ถ้าไม่ใช่เพราะการฝึกอบรมและที่สำคัญไม่แพ้กันคือทรัพยากรด้านคอมพิวเตอร์ ฉันคงไม่ได้เริ่มเข้าร่วมเร็วๆ นี้”

อันเดรย์ เชเวเลฟ
“การฝึกอบรม ML แบบตัวต่อตัวช่วยให้ฉันค้นหาคนที่มีความคิดเหมือนกัน ซึ่งฉันสามารถเจาะลึกความรู้ในด้านแมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูลได้ นี่เป็นตัวเลือกที่ยอดเยี่ยมสำหรับผู้ที่ไม่มีเวลาว่างมากในการวิเคราะห์และดื่มด่ำกับหัวข้อการแข่งขันอย่างอิสระ แต่ยังต้องการอยู่ในหัวข้อนั้น”

เข้าร่วมกับเรา

การแข่งขันบน Kaggle และแพลตฟอร์มอื่นๆ จะฝึกฝนทักษะการปฏิบัติและเปลี่ยนเป็นงานที่น่าสนใจในสาขาวิทยาศาสตร์ข้อมูลอย่างรวดเร็ว คนที่มีส่วนร่วมในการแข่งขันที่ยากลำบากด้วยกันมักจะกลายเป็นเพื่อนร่วมงานและยังคงแก้ไขปัญหาที่เกี่ยวข้องกับงานได้สำเร็จ สิ่งนี้เกิดขึ้นกับเราเช่นกัน: Mikhail Karchevsky พร้อมกับเพื่อนในทีมไปทำงานให้กับบริษัทเดียวกันโดยใช้ระบบการแนะนำ

เมื่อเวลาผ่านไป เราวางแผนที่จะขยายกิจกรรมนี้ด้วยสิ่งพิมพ์ทางวิทยาศาสตร์และการมีส่วนร่วมในการประชุมการเรียนรู้ของเครื่อง เข้าร่วมกับเราในฐานะผู้เข้าร่วมหรือผู้เชี่ยวชาญในโนโวซีบีสค์ - เขียน ฉัน หรือ คิริลล์. จัดการฝึกอบรมที่คล้ายกันในเมืองและมหาวิทยาลัยของคุณ

ต่อไปนี้เป็นเอกสารสรุปเล็กๆ น้อยๆ ที่จะช่วยให้คุณดำเนินการตามขั้นตอนแรก:

  1. พิจารณาสถานที่และเวลาที่สะดวกสำหรับการเรียนภาคปกติ อย่างเหมาะสม - 1-2 ครั้งต่อสัปดาห์
  2. เขียนถึงผู้เข้าร่วมที่อาจสนใจเกี่ยวกับการประชุมครั้งแรก ก่อนอื่น คนเหล่านี้เป็นนักศึกษาของมหาวิทยาลัยเทคนิค ผู้เข้าร่วม ODS
  3. เริ่มแชทเพื่อหารือเกี่ยวกับสถานการณ์ปัจจุบัน: Telegram, VK, WhatsApp หรือโปรแกรมส่งข้อความอื่น ๆ ที่สะดวกที่สุด
  4. รักษาแผนการสอนที่เปิดเผยต่อสาธารณะ รายชื่อการแข่งขันและผู้เข้าร่วม และติดตามผลลัพธ์
  5. ค้นหาพลังการประมวลผลหรือทุนสนับสนุนฟรีในมหาวิทยาลัย สถาบันวิจัย หรือบริษัทใกล้เคียง
  6. กำไร!

ที่มา: www.habr.com

เพิ่มความคิดเห็น