为什么你应该参加黑客马拉松

为什么你应该参加黑客马拉松

大约一年半前,我开始参加黑客马拉松。 在此期间,我在莫斯科、赫尔辛基、柏林、慕尼黑、阿姆斯特丹、苏黎世和巴黎参加了20多场不同规模和主题的活动。 在所有活动中,我都以某种形式参与数据分析。 我喜欢来到新的城市,建立新的联系,提出新的想法,在短时间内实施旧的想法,以及在表演和公布结果时肾上腺素激增的感觉。

这篇文章是关于黑客马拉松主题的三篇文章中的第一篇,我将在其中告诉您什么是黑客马拉松以及为什么您应该开始参加黑客马拉松。 第二篇文章将讲述这些活动的阴暗面——组织者在活动期间如何犯下错误,以及这些错误导致了什么。 第三篇文章将致力于回答有关黑客马拉松相关主题的问题。

什么是黑客马拉松?

黑客马拉松是一项为期数天的活动,其目标是解决问题。 黑客马拉松中通常会出现几个问题,每个问题都作为一个单独的赛道呈现。 赞助公司提供任务描述、成功指标(指标可以是主观的,例如“新颖性和创造力”,也可以是客观的 - 延迟数据集的分类准确性)以及实现成功的资源(公司 API、数据集、硬件) 。 参赛者必须在规定的时间内提出问题、提出解决方案并展示其产品原型。 最好的解决方案将获得公司的奖励和进一步合作的机会。

黑客马拉松阶段

任务宣布后,黑客马拉松参与者组成团队:每个“孤独者”都会收到一个麦克风,并谈论所选择的任务、他的经验、想法以及他需要什么样的专家来实施。 有时,一个团队可能由一个能够以相当高的水平独立完成项目所有工作的人组成。 这与数据分析黑客马拉松相关,但在产品活动中通常被禁止或不受欢迎——组织者的目的是进一步继续该项目的工作,但已经在公司内; 与希望单独创建产品的参与者相比,组建的团队具有许多优势。 最佳团队通常由4人组成,包括:前端、后端、数据科学家和业务人员。 顺便说一句,数据科学和产品黑客马拉松之间的划分非常简单 - 如果有一个具有明确指标和排行榜的数据集,或者你可以通过 Jupyter Notebook 中的代码获胜 - 这就是数据科学黑客马拉松; 其他一切 - 您需要制作应用程序、网站或其他粘性物品的地方 - 杂货店。

通常,项目工作于周五晚上 9 点开始,截止日期是周日上午 10 点。 其中一些时间需要用来睡觉(我检查过,保持清醒和编码是失败的秘诀),这意味着参与者没有太多时间来生产任何高质量的东西。 为了帮助参与者,公司代表和导师都在现场。

项目工作始于与公司代表的沟通,因为他们更好地了解任务的细节、指标,并且很可能他们最终会评判你的工作。 此沟通的目的是了解哪些领域最相关以及您应该将注意力和时间集中在哪里。

在一次黑客马拉松中,任务被设置为对包含表格数据和图片以及明确指标(RMSE)的数据集执行回归。 在与公司的数据科学家交谈后,我意识到他们不需要回归,而是分类,但管理层的某人简单地认为最好通过这种方式解决问题。 他们需要分类不是为了增加货币指标,而是为了了解哪些参数在做出决策时最重要,然后手动处理它们。 即将最初的问题(用RMSE进行回归)改为分类; 评估的优先级从获得的准确性转变为解释结果的能力。 这反过来又消除了使用堆栈和黑盒算法的可能性。 这次对话节省了我很多时间,也增加了我获胜的机会。

了解需要做什么后,项目的实际工作就开始了。 您必须设置检查点 - 必须完成分配的任务的时间; 在此过程中,最好继续与导师(公司代表和技术专家)沟通,这对于调整项目路线很有用。 重新审视问题可以提出有趣的解决方案。

由于黑客松有大量的初学者参加,组织者举办讲座和大师班是一个很好的做法。 通常有三场讲座——关于如何将你的想法作为产品呈现,一场关于技术主题的讲座(例如,关于在机器学习中使用开放API,这样你就不必在两天内写出你的演讲文本,但使用现成的),关于推销的讲座(如何展示你的产品,如何在舞台上正确挥舞手臂,以免观众感到无聊)。 有各种各样的活动可以让参与者充满活力——瑜伽课程、桌上足球和网球,或者游戏机游戏。

周日早上,您需要向评审团展示您的工作成果。 在优秀的黑客马拉松中,一切都始于技术专业知识 - 您声称的东西真的有效吗? 这项检查的目的是从那些真正做了一些事情的人中淘汰那些拥有漂亮的演示和流行语但没有产品的团队。 不幸的是,并不是所有的黑客马拉松都具备技术专业知识,在某些情况下,一个拥有 12 张幻灯片并抱着“……区块链、量子计算,然后人工智能将完成它……”的心态的团队会赢得第一名。 这样的先例并不常见,但由于它们是最令人难忘的,所以很多人认为良好的演讲是黑客马拉松99%的胜利。 顺便说一句,演讲确实很重要,但它的贡献不超过30%。

参赛者表演结束后,评审团决定颁发优胜者奖。 黑客马拉松的正式部分到此结束。

参加黑客马拉松的动机

经验

就获得的经验而言,黑客马拉松是一项独特的活动。 自然界中没有多少地方可以让您在 2 天内从无到有实现一个想法并获得即时反馈。 在黑客马拉松期间,批判性思维、团队合作技能、时间管理、在压力情况下工作的能力、以易于理解的形式展示工作成果的能力、演示技巧等许多方面都得到了提高。 这就是为什么黑客马拉松对于拥有理论知识并希望获得现实世界经验的人来说是一个好地方。

奖品

通常,黑客马拉松第一名的奖金约为 1.5 - 10 欧元(在俄罗斯为 100-300 万卢布)。 参与的预期收益(预期值,EV)可以使用一个简单的公式计算:

EV = Prize * WinRate + Future_Value - Costs

哪里 奖金 — 奖品的大小(为简单起见,我们假设只有一个奖品);
赢率 — 获胜的概率(对于初学者团队,该值将限制为 10%,对于经验丰富的团队,该值将限制为 50% 或更高;我遇到过每次黑客马拉松都获得奖品的人,但这只是规则的一个例外从长远来看,他们的胜率将会降低100%);
未来值 - 显示参加黑客马拉松的未来利润的值:这可以是从获得的经验、建立的联系、收到的信息等中获得的利润。 这个值几乎不可能准确确定,但必须记住;
成本 ——交通、住宿等费用

参加的决定是根据黑客马拉松的 EV 与您在没有黑客马拉松的情况下想做的活动的 EV 的比较来做出的:如果您想在周末躺在沙发上挖鼻子,那么你可能应该参加黑客马拉松; 如果你花时间和你的父母或女朋友在一起,那么带他们参加一个团队参加黑客马拉松(开个玩笑,你自己决定),如果你是自由职业者,请比较美元小时。

根据我的计算,我可以说,在俄罗斯,对于初中级的平均数据科学家来说,参加黑客马拉松与正常工作日的金钱利润相当,但也存在细微差别(团队规模、类型)黑客马拉松、奖金等)。 一般来说,黑客马拉松目前并不是一笔财富,但它们可以很好地增加你的个人预算。

公司招聘和网络

对于公司来说,黑客马拉松是招聘新员工的方式之一。 对你来说,在黑客马拉松上展示你是一个合格的人并且知道如何工作比在面试中更容易,在黑板上旋转一棵二叉树(顺便说一句,这并不总是符合你的意愿)作为数据科学家从事真正的工作,但必须尊重传统)。 这种“战斗”条件下的测试可以取代测试日。

感谢黑客马拉松,我得到了第一份工作。 在黑客马拉松上,我展示了可以从数据中榨取更多的钱,并且我告诉了我将如何做到这一点。 我在一次黑客马拉松中启动了一个项目,并赢得了它,然后与赞助公司一起继续该项目。 这是我一生中的第四场黑客马拉松。

有机会获得独特的数据集

这是与数据科学黑客马拉松非常相关的一点,但并不是每个人都理解其重要性。 通常,赞助公司在活动期间提供真实的数据集。 这些数据是私人的,它是在保密协议下的,这并不妨碍我们向您展示真实数据集上的概念证明,而不是玩具泰坦尼克号上的概念证明。 将来,这样的结果对于申请本公司或竞争对手公司的工作,或证明类似项目的合理性将有很大帮助。 同意,在所有其他条件相同的情况下,完成经过积极评估的项目比没有更好。 总的来说,此类完成的项目起到了类似奖牌和地位的作用,但对于行业来说其价值更为明显。

Советы

一般来说,参加黑客马拉松是一种相当多样化的经历,很难制定一系列规则。 不过,在这里我想列出一些可以帮助初学者的观察结果:

  1. 即使您没有经验或团队,也不要害怕参加黑客马拉松。 想想你可以如何变得有用。 例如,也许您有一个有趣的想法或者您精通某个领域? 您可以在提出问题时使用您的领域知识并找到重要的解决方案。 或者也许您是 Google 中最优秀的? 如果您可以在 Github 中找到现成的实现,那么您的技能将节省大量时间。 或者你很擅长调整lightgbm参数? 在这种情况下,不要去参加黑客马拉松,而是在 Kagla 竞赛中证明这一点。
  2. 战术比行动更重要。 您在黑客马拉松中的目标是解决问题。 有时,要解决问题,您需要识别它。 检查您发现的问题是否确实与公司相关。 针对问题检查你的解决方案,问问自己你的解决方案是否是最佳的。 在评估您的解决方案时,他们将首先查看问题的相关性以及所提出的解决方案的充分性。 很少有人对你的神经网络的架构或你收到了多少手感兴趣。
  3. 尽可能多地参加黑客马拉松,但不要羞于放弃组织不佳的活动。
  4. 将您在黑客马拉松中的工作成果添加到您的简历中,并且不要害怕公开写下它。

为什么你应该参加黑客马拉松
黑客马拉松的本质。 简要地

来源: habr.com

添加评论