QA: Hackathons

QA: Hackathons

Závěrečný díl trilogie hackathonu. V první část Mluvil jsem o motivaci účastnit se takových akcí. Druhá část byl věnován chybám pořadatelů a jejich výsledkům. Závěrečná část zodpoví otázky, které se do prvních dvou částí nevešly.

Řekněte nám, jak jste se začali účastnit hackathonů.
Studoval jsem magisterské studium na University of Lappeenranta při řešení soutěží v analýze dat. Můj typický den vypadal takto: vstávání v 8, pár párů na univerzitě, pak soutěže a kurzy až do půlnoci (zatímco se počítá odevzdání, sleduji přednášky nebo čtu články). Takový přísný harmonogram přinesl své ovoce a vyhrál jsem soutěž o analýzu dat MERC-2017 (o které se dokonce diskutovalo příspěvek na hubu). Vítězství mi dodalo sebevědomí, a když jsem náhodou narazil na informace o hackathonu SkinHack 2 v Moskvě, rozhodl jsem se navštívit rodiče a zároveň zjistit, co je to hackathon.

Samotný hackathon dopadl docela vtipně. Byly zde dvě skladby o analýze dat s jasnými metrikami a datový soubor s prize money ve výši 100 50 rublů. Třetí okruh byl o vývoji aplikací s cenou 50 XNUMX a nebyli tam žádní účastníci. V jednu chvíli pořadatel řekl, že okno s tlačítkem bez funkčnosti může vyhrát XNUMX tisíc, protože cenu nelze vyplatit. Programovat aplikace jsem se sice nezačal učit (nesoutěžím, kde mě snadno „otočí“), ale pro mě to byla jasná zpráva, že pole v hackathonech nejsou přeplněná.

Poté jsem vyřešil obě stopy analýzy dat samostatně. Našel jsem únik dat, který mi umožnil získat ideální rychlost, ale sloupec s únikem nebyl v testovacích datech, které jsem obdržel dvě hodiny před koncem akce (mimochodem, pak jsem pochopil, že přítomnost „cílové“ kolony ve vlaku se nepočítá jako únik). Zároveň se otevřel leaderboard, moje podání bez obličeje obsadilo třetí místo z pěti, na prvního byla velká mezera a já se rozhodl neztrácet čas a odešel.

Poté, co jsem s čerstvou myslí analyzoval, co se stalo, jsem našel spoustu chyb (jedním z mých zvyků je v duchu procházet, co se stalo s poznámkovým blokem a analyzovat chyby, jejich příčinu a co se mohlo změnit - takové příjemné dědictví poloprofesionální pokerové hry). Jedno ale bylo jasné – hackathony mají velkou hodnotu a já jsem to prostě musel zavést. Po této akci jsem začal dění a skupiny sledovat a následný hackathon na sebe nenechal dlouho čekat. Pak další a další...

Proč děláš hackathony a ne Kaglo?
Kagle se mi momentálně nelíbí. Od určité úrovně dovedností, bez konkrétních důvodů pro účast, se kagle stává méně užitečným než jiné aktivity. Dříve jsem se účastnil hodně, zřejmě se mi podařilo nějak „vypadnout“.

Proč hackathony a nepracovat na vlastním projektu?
Líbí se mi myšlenka vyrobit něco skvělého vlastníma rukama pomalým tempem. Kluci z ODS organizovali Pet projekty ODS pro každého, kdo chce strávit víkend prací na svém projektu s podobně smýšlejícími lidmi. Myslím, že se k nim brzy přidám.

Jak sháníte události?
Hlavní zdroj - hackathon.com (svět) a telegramový chat Ruští hackeři (Rusko). Navíc se oznámení o akcích objevují v reklamě na sociálních sítích a na linkedinu. Pokud nic nenajdete, můžete se podívat sem: mlh.io, devpost.com, hackevents.co, hackalist.org, HackathonsNear.me, hackathon.io.

Připravujete před účastí plán řešení nebo se vše rozhoduje za běhu? Například týden před hackathonem si říkáte: „Budeme tady potřebovat takového a takového specialistu, budeme ho muset hledat“?
Pokud je hackathon zaměřen na jídlo, ano, připravuji se. Pár týdnů předtím vymyslím, co budu dělat, zjistím, kdo by mohl být užitečný, a sestavím tým přátel nebo účastníků z minulých hackathonů.

Je opravdu možné hackat hackathon sám? Co dělat, když neexistuje tým?
Hackathony pro datovou vědu jsou skutečné (já jsem toho živým příkladem), hackathony s potravinami jsem neviděl, i když si to také myslím. Bohužel někdy organizátoři stanoví limit na minimální počet účastníků v týmu. Myslím, že je to dáno tím, že ne všichni „samotáři“ se dostanou do finále (tedy prostě odejdou s prvními potížemi), účast v týmu stále brzdí. I po skončení akce se od vás očekává, že budete na projektu dále pracovat. Bude snazší dovést projekt k realizaci s týmem.

Obecně platí, že moje rada je vždy se účastnit s týmem. Pokud nemáte vlastní tým, organizátoři vám vždy pomohou nějaký najít nebo vytvořit.

Jak se vyrovnáváte s únavou při hackathonu?
Na hackathonu máte na práci 2 dny, to je 48 hodin (30-48 hodin, pro snadnější počítání vezměme 48). Odebereme čas na spánek (16–20 hodin), přičemž nezbývá více než 30. Z toho 8 hodin (v průměru) skutečně strávíme produktivní prací. Pokud si správně zorganizujete svou práci (spánek, výživa, pobyt na čerstvém vzduchu, cvičení, minuta všímavosti, správná komunikace s týmem a přepínání činností), může být hluboká pracovní doba zvýšena na 12-14. Po takové práci se budete cítit vyčerpaní, ale bude to příjemná únava. Kódování bez spánku a přestávek, přerušované energetickými nápoji, je recept na neúspěch.

Máte vlastní hotové pipeline pro hackathony? Jak jste je získali, jak jsou uspořádány (jsou ve složkách se soubory .py, každý pro svůj vlastní úkol atd.) a jak je začít sami vytvářet?
V nových nepoužívám úplně hotová řešení z minulých hackathonů, ale mám vlastní zoo modelů a potrubí z minulých soutěží. Nemusím přepisovat standardní kusy od začátku (například správné cílové kódování nebo jednoduchá mřížka pro extrakci záměru z textu), což mi ušetří spoustu času.

Momentálně to vypadá takto: pro každou soutěž nebo hackathon je na GitHubu vlastní repo, ukládá notebooky, skripty a drobnou dokumentaci o tom, co se děje. Navíc existuje samostatné úložiště pro všechny druhy „triků“ v krabicích (jako správné cílové kódování s křížovou validací). Nemyslím si, že je to nejelegantnější řešení, ale zatím mi vyhovuje.

Začal bych uložením veškerého kódu do složek a napsáním krátké dokumentace (proč, co, jak jsem to udělal a výsledek).

Je reálné připravit MVP od nuly v tak krátkém čase nebo přicházejí všichni účastníci s hotovými řešeními?
Mohu říci pouze o projektech souvisejících s datovou vědou – ano, je to možné. MVP je pro mě kombinací dvou faktorů:

  • Životaschopný nápad prezentovaný jako produkt (tj. namalovaný na obchodní plátno). Vždy by mělo být jasné, proč a pro koho produkt vyrábíme. Někdy projekty s dobře podloženým designem, ale bez prototypu, získávají ceny, a to není překvapivé. Mnozí účastníci bohužel nemohou ignorovat hořkost porážky a připisují své neúspěchy krátkozrakosti pořadatelů, pokračujících ve stříhání modelů pro někoho neznámého na dalších hackathonech.
  • Nějaký indikátor toho, že můžete vyrobit tento produkt (aplikace, kód, popis potrubí).

Stává se, že tým přijde na hackathon s hotovým řešením a snaží se ho „ušít“ na míru instrukcí pořadatelů. Takové týmy jsou při technickém prověřování odříznuty nebo se „počítá jen část, kterou na webu udělali“. Neviděl jsem takové týmy jako vítěze, ale myslím si, že je pro ně stále výhodné hrát kvůli budoucí hodnotě (kontakty, datové soubory atd.).

Existují nějaké příklady přenesení řemesel implementovaných na hackathonech do výroby/startupu?
Ano. Měl jsem tři případy, kdy to přinesli do výroby. Jednou já, dvakrát - rukama někoho jiného, ​​na základě mých nápadů a kódu, který jsem napsal na hackathonu. Znám také pár týmů, které s firmou nadále spolupracovaly jako konzultanti. Konečné výsledky neznám, ale s největší pravděpodobností bylo něco dokončeno. Sám jsem startupy neorganizoval a nevím, že by to někdo dělal, i když jsem si jistý, že existují příklady.

Co byste si po účasti na mnoha hackathonech poradil, kdybyste se mohl vrátit v čase?

  1. Taktika je důležitější než manévry. Představte si každé řešení jako hotový produkt. Nápad, laptop Jupiter, algoritmus nestojí za nic, když není jasné, kdo to zaplatí.
  2. Než něco navrhnete, odpovězte na otázku ne „co?“, ale „proč?“ A jak?". Příklad: při navrhování jakéhokoli řešení ML nejprve přemýšlejte o ideálním algoritmu: co obdrží jako vstup, jak se jeho předpovědi použijí v budoucnu?
  3. Staňte se součástí týmu.

Čím se na hackathonech obvykle krmí?
Jídlo na hackathonech je obvykle špatné: pizza, energetické nápoje, soda. Téměř vždy je jídlo organizováno formou bufetu (nebo servírovacího stolu), ke kterému je obrovská fronta. V noci obvykle jídlo neposkytují, i když na jedné soutěži v Paříži se vyskytl případ, kdy jídlo zůstalo přes noc – chipsy, koblihy a cola. Představím si myšlenkový pochod organizátorů: „Co tam tedy programátoři jedí? Oh, přesně! Chipsy, koblihy - to je vše. Dejme jim tento odpad." Druhý den jsem se zeptal organizátorů: „Kluci, jde na noc udělat něco jiného? No, možná nějakou kaši?" Potom se na mě podívali jako na idiota. Slavná francouzská pohostinnost.

Na dobrých hackathonech se jídlo objednává do krabiček, dělí se na běžná, vegetariánská a košer jídla. Navíc dali ledničku s jogurty a müsli - pro ty, kteří se chtějí občerstvit. Čaj, káva, voda - standard. Vzpomínám si na Hack Moscow 2 hackathon - srdečně mě krmili borščem a řízky s bramborovou kaší v kantýně kanceláře 1C.

Příčetnost hackathonů závisí takříkajíc na odborné sféře organizátorů (např. nejlepší hackathony vedou konzultanti)?
Nejlepší hackathony byly od organizátorů, kteří hackathony buď organizovali dříve, nebo se jich dříve účastnili. Snad je to jediný faktor, na kterém závisí kvalita akce.

Jak pochopit, že nejste noob a je čas na hackathon?
Nejlepší čas jít na hackathon je před rokem. Druhý nejlepší čas je teď. Tak do toho, dělejte chyby, učte se – to je v pořádku. Dokonce ani neuronová síť – největší vynález člověka od doby, kdy se kolo a gradient nad stromy zvětšovaly – nedokáže v první epoše výcviku rozlišit kočku od psa.

Jaké „červené vlajky“ okamžitě naznačují, že akce nebude příliš dobrá a není třeba ztrácet čas?

  • Jasný popis toho, co je třeba udělat (relevantní pro produktové hackathony). Pokud při registraci dostanete jasný úkol, pak je lepší zůstat doma. V mé paměti nebyl jediný dobrý hackathon s technickými specifikacemi. Pro srovnání: Dobře – udělejte nám něco souvisejícího s analýzou zvukových konverzací. Špatné – udělejte nám aplikaci, která by dokázala rozdělit konverzaci na dvě samostatné zvukové stopy pro každého člověka.
  • Fond malých cen. Pokud budete požádáni, abyste vytvořili „Tinder pro internetový obchod s AI“ a cena za první místo je 500 eur a minimální velikost týmu 5 lidí, pravděpodobně nemá cenu ztrácet čas (ano, toto je skutečný hackathon, který byl konané v Mnichově).
  • Nedostatek dat (relevantní pro hackathony datové vědy). Organizátoři obvykle poskytují základní informace o akci a někdy i ukázkový datový soubor. Pokud to neposkytli, zeptejte se, nic vás to nebude stát. Pokud během 2-3 není jasné, jaké údaje budou poskytnuty a zda vůbec budou poskytnuty, je to varovný signál.
  • Noví organizátoři. Nebuďte líní a Google informace o organizátorech hackathonu. Pokud akci tohoto druhu pořádají poprvé, je velká pravděpodobnost, že se něco pokazí. Na druhou stranu, pokud pořadatel a členové poroty již hackathony pořádali nebo se v minulosti aktivně účastnili, je to zelená vlajka.

Na jednom hackathonu mi řekli: „Měl jsi nejlepší řešení v krátké době, ale promiň, hodnotíme týmovou práci a pracoval jsi sám. A teď, kdybyste do svého týmu vzal studenta nebo dívku...“? Setkal jste se někdy s takovou nespravedlností? jak jste to zvládli?
Ano, setkal jsem se s tím více než jednou. Jsem stoický ohledně všeho, co se děje: udělal jsem vše, co bylo v mých silách, pokud to nevyšlo, tak ano.

proč to všechno děláš?
To vše jen z nudy.

Zdroj: www.habr.com

Přidat komentář