為什麼你應該參加黑客馬拉松

為什麼你應該參加黑客馬拉松

大約一年半前,我開始參加黑客松。 在此期間,我在莫斯科、赫爾辛基、柏林、慕尼黑、阿姆斯特丹、蘇黎世和巴黎參加了20多場不同規模和主題的活動。 在所有活動中,我都以某種形式參與數據分析。 我喜歡來到新的城市,建立新的聯繫,提出新的想法,在短時間內實施舊的想法,以及在表演和公佈結果時腎上腺素激增的感覺。

這篇文章是關於黑客馬拉松主題的三篇文章中的第一篇,我將在其中告訴您什麼是黑客馬拉松以及為什麼您應該開始參加黑客馬拉松。 第二篇文章將講述這些活動的陰暗面——組織者在活動期間如何犯下錯誤,以及這些錯誤導致了什麼。 第三篇文章將致力於回答有關黑客馬拉松相關主題的問題。

什麼是黑客馬拉松?

黑客馬拉松是一項為期數天的活動,目標是解決問題。 黑客馬拉松通常會出現幾個問題,每個問題都作為一個單獨的賽道呈現。 贊助公司提供任務描述、成功指標(指標可以是主觀的,例如“新穎性和創造力”,也可以是客觀的- 延遲數據集的分類準確性)以及實現成功的資源(公司API、數據集、硬體) . 參賽者必須在規定的時間內提出問題、提出解決方案並展示其產品原型。 最好的解決方案將獲得公司的獎勵和進一步合作的機會。

黑客松階段

任務宣布後,黑客馬拉松參與者組成團隊:每個「孤獨者」都會收到一個麥克風,並談論所選的任務、他的經驗、想法以及他需要什麼樣的專家來實施。 有時,一個團隊可能由一個能夠以相當高的水平獨立完成專案所有工作的人組成。 這與資料分析黑客馬拉松相關,但在產品活動中通常被禁止或不受歡迎——組織者的目的是進一步繼續該專案的工作,但已經在公司內; 與希望單獨創建產品的參與者相比,組建的團隊具有許多優勢。 最佳團隊通常由4人組成,包括:前端、後端、資料科學家和業務人員。 順便說一句,數據科學和產品黑客馬拉松之間的劃分非常簡單 - 如果有一個具有明確指標和排行榜的數據集,或者你可以通過 Jupyter Notebook 中的代碼獲勝 - 這就是數據科學黑客馬拉松; 其他一切 - 您需要製作應用程式、網站或其他黏性物品的地方 - 雜貨店。

通常,專案工作於週五晚上 9 點開始,截止日期是周日上午 10 點。 其中一些時間需要用來睡覺(我檢查過,保持清醒和編碼是失敗的秘訣),這意味著參與者沒有太多時間來生產任何高品質的東西。 為了幫助參與者,公司代表和導師都在現場。

專案工作始於與公司代表的溝通,因為他們更了解任務的細節、指標,並且很可能他們最終會評判你的工作。 此溝通的目的是了解哪些領域最相關以及您應該將注意力和時間集中在哪裡。

在一次黑客馬拉松中,任務被設定為對包含表格資料和圖片以及明確指標(RMSE)的資料集執行迴歸。 在與公司的資料科學家交談後,我意識到他們不需要回歸,而是分類,但管理層的某人簡單地認為最好透過這種方式解決問題。 他們需要分類不是為了增加貨幣指標,而是為了了解哪些參數在做出決策時最重要,然後手動處理它們。 即最初的問題(以RMSE進行迴歸)改為分類; 評估的優先順序從所獲得的準確性轉變為解釋結果的能力。 這反過來又消除了使用堆疊和黑盒演算法的可能性。 這次對話節省了我很多時間,也增加了我獲勝的機會。

了解需要做什麼後,專案的實際工作就開始了。 您必須設定檢查點 - 必須完成指派的任務的時間; 在此過程中,最好繼續與導師(公司代表和技術專家)溝通,這對於調整專案路線很有用。 重新檢視問題可以提出有趣的解決方案。

由於黑客馬拉鬆有大量的初學者參加,組織者舉辦講座和大師班是一個很好的做法。 通常有三場講座——關於如何將你的想法作為產品呈現,一場關於技術主題的講座(例如,關於在機器學習中使用開放API,這樣你就不必在兩天內寫出你的演講文本,但使用現成的),關於推銷的講座(如何展示你的產品,如何在舞台上正確揮舞手臂,以免觀眾感到無聊)。 有各種各樣的活動可以讓參與者充滿活力——瑜伽課程、桌上足球和網球,或遊戲機遊戲。

週日早上,您需要向評審團展示您的工作成果。 在優秀的黑客馬拉松中,一切都始於技術專業知識 - 您聲稱的東西真的有效嗎? 這項檢查的目的是從那些真正做了一些事情的人中淘汰那些擁有漂亮的演示和流行語但沒有產品的團隊。 不幸的是,並不是所有的黑客馬拉松都具備技術專業知識,在某些情況下,一個擁有12 張幻燈片並抱著“…區塊鏈、量子計算,然後人工智能將完成它…”的心態的團隊會贏得第一名。 這樣的先例並不常見,但由於它們是最令人難忘的,所以很多人認為良好的演講是黑客馬拉松99%的勝利。 順便說一句,演講確實很重要,但它的貢獻不超過30%。

參賽者表演結束後,評審團決定頒發優勝者獎。 黑客馬拉鬆的正式部分到此結束。

參加黑客鬆的動機

經驗

就所獲得的經驗而言,黑客馬拉松是一項獨特的活動。 大自然中沒有太多地方可以讓您在 2 天內從無到有實現想法並獲得即時回饋。 在黑客馬拉松期間,批判性思維、團隊合作技能、時間管理、在壓力情況下工作的能力、以易於理解的形式展示工作成果的能力、演示技巧等許多方面都得到了提高。 這就是為什麼黑客馬拉松對於擁有理論知識並希望獲得現實世界經驗的人來說是一個好地方。

獎品

通常,黑客馬拉松第一名的獎金約為 1.5 - 10 歐元(在俄羅斯為 100-300 萬盧布)。 參與的預期收益(預期值,EV)可以使用一個簡單的公式計算:

EV = Prize * WinRate + Future_Value - Costs

哪裡 獎金 — 獎品的大小(為簡單起見,我們假設只有一個獎品);
贏率 — 獲勝的機率(對於初學者團隊,該值將限制為10%,對於經驗豐富的團隊,該值將限制為50% 或更高;我遇到過每次黑客馬拉鬆都獲得獎品的人,但這只是規則的例外從長遠來看,他們的勝率將會降低100%);
未來值 - 顯示參加黑客馬拉鬆的未來利潤的值:這可以是從獲得的經驗、建立的聯繫、收到的資訊等中獲得的利潤。 這個值幾乎不可能準確確定,但必須記住;
費用 ——交通、住宿等費用

參加的決定是根據黑客馬拉鬆的 EV 與您在沒有黑客馬拉鬆的情況下想做的活動的 EV 的比較來做出的:如果您想在周末躺在沙發上挖鼻子,那麼你可能應該參加黑客馬拉松; 如果你花時間和你的父母或女朋友在一起,那麼帶他們參加一個團隊參加黑客馬拉松(開個玩笑,你自己決定),如果你是自由職業者,請比較美元小時。

根據我的計算,我可以說,在俄羅斯,對於初中級的平均資料科學家來說,參加黑客馬拉松與正常工作日的金錢利潤相當,但也存在細微差別(團隊規模、類型)黑客馬拉松、獎金等)。 一般來說,黑客馬拉松目前並不是一筆財富,但它們可以很好地增加你的個人預算。

公司招募與網絡

對公司來說,黑客馬拉松是招募新員工的方式之一。 對你來說,在黑客馬拉鬆上展示你是一個合格的人並且知道如何工作比在面試中更容易,在黑板上旋轉一棵二叉樹(順便說一句,這並不總是符合你的意願)作為資料科學家從事真正的工作,但必須尊重傳統)。 這種「戰鬥」條件下的測試可以取代測試日。

感謝黑客馬拉松,我得到了第一份工作。 在黑客馬拉鬆上,我展示了可以從數據中榨取更多的錢,並且我告訴了我將如何做到這一點。 我在一次黑客馬拉松中啟動了一個項目,並贏得了它,然後與贊助公司一起繼續該項目。 這是我人生中的第四場黑客馬拉松。

有機會獲得獨特的數據集

這是與數據科學黑客馬拉松非常相關的一點,但並不是每個人都理解其重要性。 通常,贊助公司在活動期間提供真實的數據集。 這些數據是私人的,它是在保密協議下的,這並不妨礙我們向您展示真實數據集上的概念證明,而不是玩具泰坦尼克號上的概念證明。 將來,這樣的結果對於申請本公司或競爭對手公司的工作,或證明類似專案的合理性將有很大幫助。 同意,在所有其他條件相同的情況下,完成經過積極評估的項目比沒有更好。 總的來說,此類完成的項目起到了類似獎牌和地位的作用,但對於行業來說其價值更為明顯。

Советы

一般來說,參加黑客馬拉松是一種相當多樣化的經歷,很難制定一系列規則。 不過,在這裡我想列出一些可以幫助初學者的觀察:

  1. 即使您沒有經驗或團隊,也不要害怕參加黑客馬拉松。 想想你可以如何變得有用。 例如,也許您有一個有趣的想法或您精通某個領域? 您可以在提出問題時使用您的領域知識並找到重要的解決方案。 或者也許您是 Google 中最優秀的? 如果您可以在 Github 中找到現成的實現,那麼您的技能將節省大量時間。 還是你很擅長調整lightgbm參數? 在這種情況下,不要去參加黑客馬拉松,而是在 Kagla 競賽中證明這一點。
  2. 戰術比行動更重要。 您在黑客馬拉松中的目標是解決問題。 有時,要解決問題,您需要識別它。 檢查您發現的問題是否確實與公司相關。 針對問題檢視你的解決方案,問問自己你的解決方案是否是最佳的。 在評估您的解決方案時,他們將首先查看問題的相關性以及所提出的解決方案的充分性。 很少有人對你的神經網路的架構或你收到了多少手感興趣。
  3. 盡可能多參加黑客馬拉松,但不要羞於放棄組織不佳的活動。
  4. 將您在黑客馬拉松中的工作成果添加到您的簡歷中,並且不要害怕公開寫下它。

為什麼你應該參加黑客馬拉松
黑客馬拉鬆的本質。 簡要地

來源: www.habr.com

添加評論