我如何在 NSU 组织机器学习培训

我叫 Sasha,我喜欢机器学习以及教人。 现在,我负责监督计算机科学中心的教育项目,并指导圣彼得堡国立大学数据分析学士学位课程。 在此之前,他曾在Yandex担任分析师,更早的时候担任过科学家:在俄罗斯科学院SB计算机科学研究所从事数学建模工作。

在这篇文章中,我想告诉你为新西伯利亚州立大学的学生、毕业生和其他人启动机器学习培训的想法是怎样的。

我如何在 NSU 组织机器学习培训

我很早就想组织一门专门的课程来准备Kaggle和其他平台上的数据分析比赛。 这似乎是个好主意:

  • 学生和任何有兴趣的人都可以将理论知识应用于实践,并获得在公开竞赛中解决问题的经验。
  • 在此类竞赛中名列前茅的学生对新西伯利亚国立大学对申请者、学生和毕业生的吸引力有很好的影响。 体育编程训练也会发生同样的情况。
  • 这门特殊课程完美地补充和扩展了基础知识:参与者独立实施机器学习模型,并经常组建在全球水平上竞争的团队。
  • 其他大学已经开展过这样的培训,所以我希望新山大学的专题课程能取得成功。

发射

新西伯利亚科学院为此类努力提供了肥沃的土壤:计算机科学中心的学生、毕业生和教师以及强大的技术人员,例如 FIT、MMF、FF、NSU 管理部门的大力支持、活跃的 ODS 社区、经验丰富的工程师以及来自不同 IT 公司的分析师。 大约在同一时间,我们从 牡丹投资 — 该基金支持在 ML 体育比赛中取得良好成绩的团队。

我们在 NSU 找到了每周例会的观众,在 Telegram 上创建了聊天室,并于 1 月 19 日与计算机科学中心的学生和毕业生一起启动了该活动。 第一堂课有31人来听。 其中六人成为定期参加培训的人。 学年期间,共有 XNUMX 人至少参加过一次会议。

第一个结果

我和这些家伙见面,交流经验,讨论比赛和对未来的粗略计划。 很快我们就意识到,争夺数据分析比赛的席位是一项常规的、艰苦的工作,类似于无薪全职工作,但非常有趣和令人兴奋 🙂 其中一位参与者,Kaggle 大师 Maxim,建议我们首先在比赛中单独晋级,仅仅几周后,考虑到公开分数,就团结成团队。 这就是我们所做的! 在面对面的培训中,我们讨论了模型、科学文章和Python库的复杂性,并一起解决了问题。

秋季学期的结果是在 Kaggle 的两项比赛中获得三枚银牌: TGS盐鉴定 и PLAsTiCC 天文分类。 并在 CFT 纠正拼写错误比赛中获得第三名,并赢得了第一笔奖金(正如经验丰富的 keglers 所说,是奖金)。

本次专题课程的另一个非常重要的间接成果是NSU VKI集群的启动和配置。 其计算能力显着提高了我们的竞争力:40 个 CPU、755Gb RAM、8 个 NVIDIA Tesla V100 GPU。

我如何在 NSU 组织机器学习培训

在此之前,我们尽了最大努力生存下来:我们在个人笔记本电脑和台式机、Google Colab 和 Kaggle 内核中进行计算。 一个团队甚至有一个自写的脚本,可以自动保存模型并重新启动因时间限制而停止的计算。

春季学期,我们继续聚集在一起,交流成功的成果,讨论我们的竞赛解决方案。 新的感兴趣的参与者开始来到我们这里。 春季学期,我们在 Kaggle 的 XNUMX 项比赛中获得了 XNUMX 金、XNUMX 银和 XNUMX 铜的成绩: 宠物搜索器, 桑坦德, 性别分辨率, 鲸鱼识别, Quora的, 谷歌地标 和其他,铜牌 雷科挑战, Changellenge>>杯赛第三名,机器学习竞赛第一名(再次获得奖金) 编程锦标赛 来自 Yandex.

培训参与者怎么说

米哈伊尔·卡尔切夫斯基
“我很高兴这样的活动在西伯利亚开展,因为我相信参加比赛是掌握机器学习的最快方法。 对于这样的比赛,自己购买硬件相当昂贵,但在这里你可以免费尝试想法。”

基里尔·布罗德
“在机器学习训练出现之前,除了训练和印度教比赛之外,我并没有特别参加任何比赛:我不明白这有什么意义,因为我在机器学习领域工作过,而且我很熟悉它。 我作为学生参加的第一学期。 从第二学期开始,一旦计算资源可用,我就想,为什么不参加呢? 它让我着迷。 任务、数据和指标是为您发明和准备的,继续使用 MO 的全部功能,检查最先进的模型和技术。 如果没有培训,以及同样重要的计算资源,我不会很快开始参与。”

安德烈·舍维列夫
“面对面的机器学习培训帮助我找到了志同道合的人,与他们一起加深了我在机器学习和数据分析领域的知识。 对于那些没有太多空闲时间独立分析和沉浸在比赛话题中,但仍想融入话题的人来说,这也是一个绝佳的选择。”

加入我们

Kaggle 和其他平台上的竞赛磨练了实践技能,并迅速转化为数据科学领域有趣的工作。 一起参加艰难竞争的人们往往会成为同事,并不断成功地解决与工作相关的问题。 这也发生在我们身上:米哈伊尔·卡切夫斯基(Mikhail Karchevsky)和团队中的一位朋友一起为同一家公司的推荐系统工作。

随着时间的推移,我们计划通过科学出版物和参与机器学习会议来扩大这项活动。 加入我们作为新西伯利亚的参与者或专家 - 写 или 基里尔。 在您所在的城市和大学组织类似的培训。

这是一个小备忘单,可帮助您迈出第一步:

  1. 考虑一个方便的地点和时间进行常规课程。 最佳 - 每周 1-2 次。
  2. 写信给潜在感兴趣的参与者有关第一次会议的信息。 首先,他们是技术大学的学生,ODS 参与者。
  3. 开始聊天讨论时事:Telegram、VK、WhatsApp 或任何其他对大多数人来说方便的通讯工具。
  4. 维护可公开访问的课程计划、竞赛和参与者列表,并监控结果。
  5. 在附近的大学、研究机构或公司寻找免费的计算能力或补助金。
  6. 利润!

资料来源:www.habr.com

添加评论