Чаму вам варта ўдзельнічаць у хакатонах

Чаму вам варта ўдзельнічаць у хакатонах

Прыкладна паўтара гады таму я пачаў удзельнічаць у хакатонах. За гэты часавы прамежак я паспеў прыняць удзел у больш за 20 мерапрыемствах рознага маштабу і тэматык у Маскве, Хельсінкі, Берліне, Мюнхене, Амстэрдаме, Цюрыху і Парыжы. Ва ўсіх мерапрыемствах я займаўся аналізам дадзеных у тым ці іншым выглядзе. Мне падабаецца прыязджаць у новыя для сябе гарады, наладжваць новыя кантакты, прыдумляць свежыя ідэі, рэалізоўваць старыя задумкі за кароткі прамежак часу і адрэналін падчас выступу і абвяшчэння вынікаў.

Дадзены пост - першы з трох пастоў на тэматыку хакатонаў, у ім я раскажу, што такое хакатоны, чаму вам варта пачаць удзельнічаць у хакатонах. Другая пасада будзе пра цёмны бок дадзеных мерапрыемстваў — пра тое, як арганізатары рабілі памылкі пры правядзенні, і да чаго яны прывялі. Трэці пост будзе прысвечаны адказам на пытанні пра каля-хакатонную тэматыку.

Што такое хакатон?

Хакатон - гэта мерапрыемства, якое праводзіцца на працягу некалькіх дзён, мэтай якога з'яўляецца вырашэнне якой-небудзь праблемы. Звычайна праблем на хакатоне некалькі, кожная прадстаўлена ў выглядзе асобнага трэка. Кампанія-спонсар дае апісанне задачы, метрыкі паспяховасці (метрыкі могуць быць суб'ектыўнымі накшталт "навізна і крэатыўнасць", а могуць быць аб'ектыўнымі – дакладнасць класіфікацыі на адкладзеным датасеце) і рэсурсы для дасягнення поспеху (API кампаніі, датасеты, "жалеза"). Удзельнікі за адведзены час павінны сфармуляваць праблему, прапанаваць рашэнне і паказаць прататып свайго прадукта. Найлепшыя рашэнні атрымліваюць прызы ад кампаніі і магчымасць далейшага супрацоўніцтва.

Этапы хакатона

Пасля абвяшчэння задач удзельнікі хакатона аб'ядноўваюцца ў каманды: кожны "адзіночка" атрымлівае мікрафон і гаворыць пра выбраную задачу, свой вопыт, ідэю і спецыялісты якога плана яму патрэбны для рэалізацыі. Часам каманда можа складацца з аднаго чалавека, які здольны выканаць усю працу над праектам самастойна на дастаткова высокім узроўні. Гэта актуальна для хакатонаў па аналізе дадзеных, але часта забаронена ці непажадана для прадуктовых мерапрыемстваў - арганізатары нацэлены на далейшы працяг працы над праектам, але ўжо ў кампаніі; сфарміраваная каманда валодае побач пераваг перад удзельнікамі якія пажадалі ствараць прадукт у адзіночку. Аптымальная каманда звычайна складаецца з 4 чалавек і ўключае ў сябе: фронтэнд, бэкэнд, дата саентыста і бізнэсавога чалавека. Дарэчы, падзел датасаенс/прадуктовыя хакатоны даволі просты - калі ёсць датасет з выразнай метрыкай і лідэрбордам або выйграць можна з кодам у jupyter notebook - гэта датасаенс хакатон; усё астатняе - дзе патрабуецца зрабіць прыкладанне, сайт або нешта заліпальнае - прадуктовы.

Звычайна старт працы над праектам пачынаецца ў 9 вечара пятніцы, а дэдлайн - 10 раніцы нядзелі. Частку гэтага часу неабходна адвесці на сон (не спаць і кадзіць - гэта дакладны шлях да правалу, я правяраў), а гэта азначае, што ва ўдзельнікаў не так шмат часу для таго каб зрабіць нешта якаснае. Каб дапамагчы ўдзельнікам, на пляцоўцы прысутнічаюць прадстаўнікі кампаніі і ментары.

Праца над праектам пачынаецца са зносін з прадстаўнікамі кампаніі, бо яны лепш разумеюць спецыфіку задачы, метрыкі і хутчэй за ўсё яны будуць судзіць вашыя працы ў канцы. Мэта дадзенага зносін - зразумець якія напрамкі найбольш актуальныя, і на чым варта сфакусаваць сваю ўвагу і час.

На адным хакатоне была пастаўлена задача рэгрэсіі на датасеце з таблічнымі дадзенымі і карцінкамі і выразнай метрыкай - RMSE. Пасля таго як я пагутарыў з датасаентыстам кампаніі, я зразумеў што ім патрэбна не рэгрэсія, а класіфікацыя, але проста нехта з менеджменту вырашыў што задачу лепш за ўсё вырашаць менавіта так. А класіфікацыя ім патрэбна не для таго каб атрымаць прырост грашовых метрык, а для таго каб зразумець якія параметры найболей важныя пры прыняцці рашэння і затым ужо апрацоўваць іх уручную. Гэта значыць пачатковая задача (рэгрэсія з RMSE) мяняецца на класіфікацыю; прыярытэт ацэнкі мяняецца з атрыманай дакладнасці да магчымасці растлумачыць вынік. Гэта ў сваю чаргу адкідае магчымасць выкарыстання стакінга і black box алгарытмаў. Такі дыялог зэканоміў мне процьму часу і павялічыў мае шанцы на перамогу.

Пасля таго як вы зразумелі, што вам трэба рабіць пачынаецца непасрэдная праца над праектам. Вы павінны ўсталяваць чэк-паніты - час, да якога неабходна выканаць пастаўленыя задачы; адначасна нядрэнна працягваць зносіны з ментарамі - прадстаўнікамі кампаніі і тэхнічнымі спецыялістамі - гэта карысна для карэкціроўкі маршруту вашага праекта. Свежы погляд на праблему можа падказаць цікавае рашэнне.

Паколькі ў хакатонах удзельнічае вялікая колькасць навічкоў, з боку арганізатараў добрым тонам з'яўляецца правядзенне лекцый і майстар-класаў. Звычайна лекцый тры - аб тым як прадставіць сваю ідэю ў выглядзе прадукта, лекцыя на тэхнічную тэматыку (да прыкладу аб ужыванні адкрытых API у машынным навучанні, каб вам не прыйшлося пісаць свой speech2text за два дні, а скарыстацца гатовым), лекцыя пра пітчынг (як прадставіць свой прадукт, як правільна махаць рукамі на сцэне, каб слухачам было не сумна). Бываюць розныя актыўнасці каб узбадзёрыць удзельнікаў - сесія ёгі, настольны футбол і тэніс ці гульня ў кансолі.

У раніцу нядзелі вам неабходна прадставіць вынікі вашай працы для журы. На добрых хакатонах усё пачынаецца з тэхнічнай экспертызы - ці сапраўды тое, што вы заяўляеце працуе? Мэта дадзенай праверкі - адсеяць каманды з прыгожай прэзентацыяй і buzzwords, але без прадукта ад хлопцаў якія рэальна нешта зрабілі. Нажаль, тэхнічная экспертыза прысутнічае не на ўсіх хакатонах і бываюць выпадкі калі каманда з 12 слайдамі і майндсетам “… blockchain, quantum computing, а тут АІ даробіць…” выйграе першае месца. Такія прэцэдэнты не такія частыя, але паколькі яны запамінаюцца лепш за ўсё, многія думаюць, што добрая прэзентацыя — гэта 99% перамогі ў хакатоне. Прэзентацыя, дарэчы, сапраўды важная, але яе ўклад - не больш за 30%.

Пасля выступлення ўдзельнікаў журы прымае рашэнне аб узнагароджанні пераможцаў. На гэтым афіцыйная частка хакатона завершана.

Матывацыя да ўдзелу ў хакатонах

Вопыт

З пункту гледжання атрыманага досведу, хакатон - гэта ўнікальнае мерапрыемства. У прыродзе існуе не так шмат месцаў, дзе можна рэалізаваць ідэю з нічога за 2 дні і атрымаць маментальны фідбэк аб сваёй працы. Падчас хакатона прапампоўваецца крытычнае мысленне, уменне працы ў камандзе, тайм менеджмент, уменне працы ў стрэсавай сітуацыі, уменне падаваць вынікі сваёй працы ў зразумелым выглядзе, навык прэзентацый і многія іншыя. Менавіта таму хакатоны - гэта выдатнае месца для людзей з тэарэтычнымі ведамі, якія жадаюць атрымаць рэальны вопыт.

прызы

Звычайна прызавы фонд хакатона складае прыкладна 1.5k - 10k еўра за першае месца (у Расіі - 100-300 тыс рублёў). Чаканую выгаду (expected value, EV) ад удзелу можна палічыць па няхітрай формуле:

EV = Prize * WinRate + Future_Value - Costs

дзе Прыз - Памер прыза (для прастаты будзем лічыць што прыз адзін);
WinRate - верагоднасць перамогі (для пачаткоўцаў каманды гэтае значэнне будзе абмежавана зверху 10%, для больш дасведчанай - 50% і вышэй; я сустракаў людзей, якія з кожнага хакатона сыходзілі з прызам, але гэта хутчэй выключэнне з правіл і на доўгай дыстанцыі іх вінрэйт будзе ніжэй 100%);
Future_Value — велічыня якая паказвае будучы прыбытак ад удзелу ў хакатоне: гэта можа быць прыбытак ад набытага досведу, наладжаных сувязяў, атрыманай інфармацыі і г.д. Дадзеную велічыню практычна немагчыма вызначыць дакладна, але пра яе трэба памятаць;
Выдаткі - выдаткі на транспарт, пражыванне, іншае.

Рашэнне аб удзеле прымаецца на падставе параўнання EV хакатона з EV актыўнасці, якой вы жадалі заняцца калі б хакатона не было: калі вы жадалі пакачацца на выходных на канапе і калупацца ў носе, то мусіць варта ўдзельнічаць у хакатоне; калі правесці час з бацькамі ці дзяўчынай - то бярыце іх у каманду на хакатон (жартую, вырашайце самі), калі пафрылансіць - параўноўвайце даляр-гадзіну.

Па сваіх разліках, магу сказаць што ў Расіі для сярэдняга дата саентыста ўзроўню джуніёр - мидл ўдзельнічаць у хакатонах сувымерна з грашовым прыбыткам ад звычайнага працоўнага дня, але ёсць і нюансы (памер каманды, тыпу хакатона, прызавога фонду і г.д.). У цэлым, хакатоны ў дадзены момант - гэта не залатое дно, але яны могуць даць прыемную дадатак да асабістага бюджэту.

Наём у кампанію і нетворкінг

Для кампаніі хакатон - гэта адзін са спосабаў найму новых супрацоўнікаў. Вам будзе значна лягчэй паказаць што вы адэкватны чалавек і ўмееце працаваць працу на хакатоне, чым на сумоўі, круцячы бінарным дрэвам на дошцы (што, дарэчы, не заўсёды адпавядае таму, што вы будзеце рабіць на сапраўднай працы датасаентыста, але традыцыі трэба шанаваць). Такая праверка ў "баявых" умовах можа замяніць тэставы дзень.

Сваю першую працу я атрымаў дзякуючы хакатон. На хакатоне я паказаў, што з дадзеных можна выціснуць больш грошай, расказаў як я збіраюся гэта зрабіць. Я пачаў праект на хакатоне, выйграў яго, затым працягнуў праект ужо ў кампаніі-фундатары. Гэта быў чацвёрты па ліку хакатон у маім жыцці.

Магчымасць атрымаць унікальны датасет

Гэта вельмі актуальны пункт для дата саенс хакатонаў, важнасць якога разумеюць не ўсе. Звычайна кампаніі-фундатары падаюць рэальныя датасеты пры правядзенні мерапрыемства. Гэтыя дадзеныя прыватныя, яны знаходзяцца пад NDA, што не мяшае паказаць вам proof of concept на рэальным датасет, а не на цацачным тытаніцы. У далейшым падобныя вынікі моцна дапамогуць пры працаўладкаванні ў дадзеную кампанію ці кампанію-канкурэнт ці пры абгрунтаванні падобных праектаў. Пагадзіцеся, што пры іншых роўных, мець выкананыя праекты, якія пазітыўна ацанілі лепш, чым не мець онных. У цэлым, падобныя рэалізаваныя праекты гуляюць падобную ролю з медалямі і статутамі на кагле, але для індустрыі іх каштоўнасць больш відавочная.

Саветы

У цэлым, праца на хакатоне - гэта даволі разнапланавы вопыт і цяжка сфармуляваць нейкі пералік правілаў. Аднак тут я хацеў бы прывесці пералік назіранняў, якія могуць дапамагчы навічку:

  1. Не бойцеся хадзіць на хакатоны нават калі ў вас няма досведу або каманды. Падумайце над тым, чым вы маглі б быць карысныя. Напрыклад у вас можа быць цікавая ідэя ці вы нядрэнна разбіраецеся ў якой-небудзь вобласці? Вы можаце выкарыстоўваць ваш domain knowledge пры фармуляванні праблемы і знайсці нетрывіяльныя шляхі вырашэння. Ці можа быць вы лепш за ўсіх умееце гугліць? Ваша ўменне дазволіць зэканоміць кучу часу, калі вы зможаце знайсці гатовыя рэалізацыі ў гітхабе. Ці вы вельмі добрае разбіраецеся ў цюнінгу параметраў lightgbm? У такім выпадку не хадзіце на хакатон, а дакажыце гэта ў спаборніцтвах кагла.
  2. Тактыка важнейшая за манеўры. Ваша задача на хакатоне - рашэнне праблемы. Часам, каб вырашыць праблему, яе трэба выявіць. Правярайце што ваша выяўленая праблема сапраўды актуальная для кампаніі. Правярайце ваша рашэнне на адпаведнасць праблемы, задайце сабе пытанне аб аптымальнасці вашага рашэння. Пры адзнацы вашага рашэння ў першую чаргу будуць глядзець на актуальнасць праблемы і адэкватнасць прапанаванага рашэння. Архітэктура вашай нейронавай сеткі ці колькі рук-аўк вы атрымалі мала каго цікавіць.
  3. Наведвайце як мага больш хакатонаў, але не саромейцеся сыходзіць з дрэнна-арганізаваных мерапрыемстваў.
  4. Дадавайце вынікі сваёй працы на хакатоне ў рэзюмэ і не бойцеся пісаць пра яго публічна.

Чаму вам варта ўдзельнічаць у хакатонах
Сутнасць хакатонаў. Коратка

Крыніца: habr.com

Дадаць каментар