Prošlog decembra održali smo sopstveni startup hakaton sa još šest kompanija Skolkovo. Bez korporativnih sponzora ili bilo kakve eksterne podrške, okupili smo dve stotine učesnika iz 20 gradova Rusije uz napore programske zajednice. U nastavku ću vam reći kako smo uspjeli, na koje smo zamke nailazili na tom putu i zašto smo odmah započeli saradnju sa jednim od pobjedničkih timova.
Interfejs aplikacije koji kontroliše Watts Battery module od finalista staze "Wet Hair"
Firma
Naša kompanija Watts Battery kreira modularne prijenosne elektrane. Proizvod je prijenosna elektrana 46x36x11 cm, sposobna da isporuči od 1,5 do 15 kilovata na sat. Četiri takva modula mogu osigurati potrošnju energije male seoske kuće za dva dana.
Iako smo prošle godine počeli isporučivati proizvodne uzorke, po svemu sudeći, Watts Battery je startup. Kompanija je osnovana 2016. godine i od iste godine je rezident Klastera energetski efikasnih tehnologija Skolkovo. Danas imamo 15 zaposlenih i ogroman zaostatak stvari koje bismo želeli da uradimo u nekoj fazi, ali trenutno nema. vreme je za to.
Ovo također uključuje isključivo softverske zadatke. Zašto?
Glavni zadatak modula je da obezbedi neprekidno, uravnoteženo snabdevanje energijom uz optimalnu cenu. Ako dođe do nestanka struje zbog razloga koji su izvan vaše kontrole, uvijek biste trebali imati rezervu kako biste u potpunosti napajali potrebno mrežno opterećenje za vrijeme trajanja nestanka. A kada je napajanje dobro, možete koristiti solarnu energiju da uštedite novac.
Najjednostavnija opcija je da bateriju možete puniti od sunca tokom dana i koristiti je uveče, ali tačno do nivoa koji je neophodan da u slučaju nestanka struje ne ostanete bez struje. Dakle, nikada se nećete naći u situaciji da ste cijelu večer napajali rasvjetu iz baterije (jer je jeftinije), ali noću vam je nestala struja i odmrznuo vam se frižider.
Jasno je da osoba rijetko može s velikom preciznošću predvidjeti količinu električne energije koja mu je potrebna, ali sistem naoružan prediktivnim modelom može. Stoga je mašinsko učenje kao takvo jedno od naših prioritetnih područja. Samo što smo trenutno fokusirani na razvoj hardvera i ne možemo izdvojiti dovoljno resursa za te zadatke, što nas je dovelo do Startup Hackathona.
Priprema, podaci, infrastruktura
Kao rezultat toga, krenuli smo u dva pravca: analitiku podataka i sistem upravljanja. Pored naše, bilo je još sedam numera od kolega.
Dok format hakatona nije bio određen, razmišljali smo o stvaranju „sopstvene atmosfere“, sa bodovnim sistemom: učesnici rade neke stvari koje nam se čine teškim i interesantnim i za to dobijaju bodove. Imali smo puno zadataka. Ali kako smo gradili strukturu hakatona, drugi organizatori su tražili da sve dovedemo u zajedničku formu, što smo i uradili.
Onda smo došli do sljedeće šeme: momci prave model na osnovu svojih podataka, zatim primaju naše podatke, koje model ranije nije vidio, uči i počinje predviđati. Pretpostavljalo se da se sve ovo može obaviti za 48 sati, ali nama je ovo bio prvi hakaton na naše podatke i možda smo precijenili vremenske resurse ili stepen spremnosti podataka. Na specijalizovanim hakatonima za mašinsko učenje takva vremenska linija bi bila norma, ali naš nije bio takav.
Maksimalno smo rasteretili softver i hardver modula i napravili verziju našeg uređaja specijalno za hakaton, sa vrlo jednostavnim i razumljivim internim interfejsom koji bi svaki programer mogao da podrži.
Za stazu baziranu na sistemu upravljanja postojala je mogućnost izrade mobilne aplikacije. Kako bismo spriječili sudionike da se razbijaju oko toga kako bi trebala izgledati i gubiti dodatno vrijeme, dali smo im dizajn aplikacije, super laganu, kako bi oni koji to žele mogli jednostavno "razvući" funkcije koje su im potrebne na nju. . Iskreno, nismo očekivali moralne dileme ovdje, ali jedan od timova je to shvatio na način da smo im ograničili let mašte, htjeli smo besplatno dobiti gotovo rješenje, a ne testirati ih u praksi. I oni su poleteli.
Drugi tim je odlučio napraviti potpuno drugačiju aplikaciju od nule i sve je uspjelo. Nismo insistirali da aplikacija bude baš ovakva, samo je trebalo da sadrži neke elemente koji demonstriraju tehnički nivo rješenja: grafikone, analitiku itd. Nagovještaj je bio i gotov dizajn.
Budući da bi analiza živog modula Watts Battery na hakatonu bila previše dugotrajna, dali smo učesnicima gotovi komad podataka za mjesec dana preuzet iz stvarnih modula naših klijenata (koje smo prethodno pažljivo anonimizirali). Pošto je bio jun, nije bilo ničega što bi uključilo sezonske promjene u analizu. Ali u budućnosti ćemo im dodati eksterne podatke, kao što su sezonske i klimatske karakteristike (danas je to industrijski standard).
Nismo željeli stvarati nerealna očekivanja među učesnicima, pa smo u najavi hakatona direktno rekli: rad će biti što bliži radu na terenu: bučni, prljavi podaci, koje niko posebno nije pripremao. Ali to je imalo i pozitivnu stranu: u duhu agilnosti, bili smo u stalnom kontaktu sa učesnicima, te promptno mijenjali zadatak i uslove prijema (više o tome u nastavku).
Također smo učesnicima dali pristup Amazon AWS-u (toliko aktivno da je Amazon blokirao jednu regiju; smislit ćemo šta ćemo s tim). Tamo možete implementirati IoT infrastrukturu i izgraditi potpuno rješenje za 24 sata, čak i koristeći jednostavne Amazon predloške. Ali na kraju, svako je krenuo svojim putem, radeći što je više moguće samostalno. Neki su uspjeli ispuniti vremenski rok, dok drugi nisu. Jedan tim, Nubble, koristio je Yandex.Cloud, dok su drugi koristili svoj vlastiti. hosting Čak smo bili spremni da ustupimo i domene (imamo registrovane), ali nisu bile potrebne.
Kako bismo odredili pobjednike u analitičkoj stazi, planirali smo upoređivanje rezultata za koje smo pripremili numeričke metrike. Ali na kraju to nije bilo potrebno činiti, jer iz raznih razloga tri od četiri učesnika nisu stigla do finala.
Što se tiče infrastrukture domaćinstva, tu nam je pomogao tehnopark Skolkovo koji nam je (besplatno) ustupio jednu od svojih udobnih modularnih prostorija sa video zidom za prezentacije i nekoliko manjih prostorija za rekreaciju i organizovanje keteringa.
Analitika
Cilj: samoučeći sistem koji identifikuje anomalije u potrošnji i radu modula na osnovu kontrolnih podataka. Namjerno smo zadržali što opštiju formulaciju kako bi učesnici mogli raditi s nama na razmišljanju o tome šta bi se moglo učiniti na osnovu dostupnih podataka.
Specifičnost: Kompleksniji od dva staza. Industrijski podaci imaju neke razlike od podataka u zatvorenim sistemima (na primjer, digitalni marketing). Ovdje morate razumjeti fizičku prirodu parametara koje pokušavate analizirati gledajući na sve kao na apstraktne serije brojeva. Na primjer, raspodjela potrošnje električne energije tokom dana. To je kao ritual: električni brijač se uključuje ujutru radnim danom, a mikser vikendom. Zatim suština samih anomalija. I ne zaboravite da je Watts baterija namijenjena za ličnu upotrebu, tako da će svaki klijent imati svoje rituale, a jedan univerzalni model neće raditi. Pronalaženje poznatih anomalija u podacima nije čak ni zadatak stvaranje sistema koji autonomno traži neoznačene anomalije. Uostalom, sve može biti anomalija, uključujući i podmukli ljudski faktor. Na primjer, u našim testnim podacima bio je slučaj kada je sistem bio prisiljen od strane korisnika u baterijski režim. Bez ikakvog razloga, korisnici to ponekad rade (rezerviram da ovaj korisnik testira modul umjesto nas i iz tog razloga ima pristup ručnoj kontroli modova; za ostale korisnike kontrola je potpuno automatska). Kao što je lako predvidjeti, u takvoj situaciji baterija se prilično aktivno prazni, a ako je opterećenje veliko, punjenje će prestati prije izlaska sunca ili pojave drugog izvora energije. U takvim slučajevima očekujemo da ćemo vidjeti neku vrstu obavijesti da je ponašanje sistema odstupilo od normalnog. Ili je osoba otišla i zaboravila isključiti pećnicu. Sistem vidi da je obično u ovo doba dana potrošnja 500 vati, a danas - 3,5 hiljada - anomalija! Kao Denis Macuev u avionu: "Ne razumem ništa o avionskim motorima, ali na putu do tamo motor je zvučao drugačije."
Grafikon prediktivnog modela na otvorenoj neuronskoj mreži Yandex CatBoost
Šta je kompaniji zaista potrebno?: samodijagnostički sistem unutar uređaja, prediktivna analitika, uključujući i bez mrežne infrastrukture (kao što pokazuje praksa, nisu svi naši klijenti u žurbi da spoje baterije na internet - većini je dovoljno da sve radi pouzdano), identifikacija anomalija, čiju prirodu još ne znamo, sistem za samoučenje bez nastavnika, grupisanje, neuronske mreže i čitav arsenal savremenih analitičkih metoda. Moramo shvatiti da je sistem počeo drugačije da se ponaša, čak i ako ne znamo šta se tačno promijenilo. Na samom hackathonu nam je bilo jako važno vidjeti da ima momaka koji su spremni zakoračiti u industrijsku analitiku ili su već u njoj, te traže nova područja za primjenu svojih sposobnosti. U početku sam se iznenadio da ima toliko prijavljenih: na kraju krajeva, ovo je vrlo specifična kuhinja, ali postepeno su svi osim jednog od četiri učesnika odustali, pa je donekle sve došlo na svoje mjesto.
Zašto to nije izvodljivo u ovoj fazi?: Glavni problem sa zadacima rudarenja podataka je nedostatak podataka. Danas u svijetu radi nekoliko desetina Watts Battery uređaja, ali mnogi od njih nisu povezani na mrežu, tako da naši podaci još nisu toliko raznoliki. Jedva smo sastrugali dvije anomalije - a one su se pojavile na prototipovima industrijske Watts Battery rade prilično stabilno. Da imamo internog inženjera mašinskog učenja, i da znamo - da, ovo se može istisnuti iz ovih podataka, ali želimo da dobijemo bolji kvalitet predviđanja - bila bi to jedna priča. Ali do sada nismo ništa uradili sa ovim podacima. Osim toga, to bi zahtijevalo duboko udubljenje sudionika u specifičnosti rada našeg proizvoda za to nije dovoljno dan i po.
Kako ste se odlučili?: Nisu odmah postavili tačan konačni zadatak. Umjesto toga, cijelih 48 sati vodili smo dijalog sa učesnicima i promptno saznavali šta su mogli dobiti, a šta ne. Na osnovu toga, u duhu kompromisa, zadatak je završen.
Šta ste dobili kao rezultat?: pobjednici staze uspjeli su očistiti podatke (istovremeno su otkrili "osobine" izračunavanja nekih parametara koje sami ranije nismo primijetili, jer neke podatke nismo koristili za rješavanje problema) , naglašavaju odstupanja od očekivanog ponašanja Watts Battery modula i postavljaju prediktivni model koji je u stanju da predvidi potrošnju energije sa visokim stepenom tačnosti. Da, ovo je samo faza izvodljivosti razvoja industrijskog rješenja, tada će biti potrebne sedmice mukotrpnog tehničkog rada, ali čak i ovaj prototip, kreiran direktno tokom hakatona, može biti osnova pravog industrijskog rješenja, što je rijetkost.
glavni zaključak: Na osnovu podataka koje imamo, moguće je postaviti prediktivnu analitiku, pretpostavili smo to, ali nismo imali resurse za provjeru. Učesnici hakatona su testirali i potvrdili našu hipotezu, a mi ćemo nastaviti da radimo sa pobednicima staza na ovom zadatku.
Grafikon prediktivnog modela na opensource neuronskoj mreži Facebook Prophet
Savjeti za budućnost: kada sastavljate zadatak, morate gledati ne samo na plan proizvodnje, već i na interese učesnika. Budući da naš hakaton nema novčane nagrade, igramo se na prirodnu radoznalost data naučnika i želju za rješavanjem novih, zanimljivih problema u kojima još niko ništa nije pokazao ili gdje se može pokazati bolje od postojećih rezultata. Ako odmah uzmete u obzir faktor interesovanja, nećete morati usput pomjeriti fokus.
Upravljanje
Cilj: (aplikacija) koja upravlja mrežom Watts Battery modula, sa ličnim nalogom, skladištenjem podataka u oblaku i praćenjem statusa.
Specifičnost: u ovoj stazi nismo tražili neko novo tehničko rješenje, mi, naravno, imamo svoje korisničko sučelje. Izabrali smo ga za hakaton da demonstriramo mogućnosti našeg sistema, uronimo u njega i proverimo da li je zajednica zainteresovana za temu razvoja pametnih sistema i alternativne energije. Mobilnu aplikaciju smo pozicionirali kao opciju da to možete učiniti ili ne učiniti po svom nahođenju. Ali po našem mišljenju, to dobro pokazuje kako su ljudi uspjeli organizirati pohranu podataka u oblaku, s pristupom iz nekoliko različitih izvora odjednom.
Šta je kompaniji zaista potrebno?: zajednica programera koji će osmisliti poslovne ideje, testirati hipoteze i kreirati radne alate za njihovu implementaciju.
Zašto to nije izvodljivo u ovoj fazi?: Obim tržišta je još uvijek premali za organsko formiranje takve zajednice.
Kako ste se odlučili?: Kao dio hakatona, sproveli smo neku vrstu fizikalne studije kako bismo vidjeli da li je moguće osmisliti ne samo karakteristike, već i punopravne poslovne modele oko našeg vrlo specifičnog proizvoda. Štaviše, da bi ljudi sposobni da implementiraju prototip to uradili, na kraju krajeva, ovdje - ne želim nikoga uvrijediti - ovo nije nivo programiranja trepereće LED diode na Arduinu (iako se to može učiniti s inovacijama) , ovde su potrebne prilično specifične veštine: razvoj backend i frontend sistema, razumevanje principa izgradnje skalabilnih sistema Interneta stvari.

Šta ste dobili kao rezultat?: dva tima su predložila potpune poslovne ideje za svoj rad: jedan se više fokusirao na ruski segment, drugi na strani. Odnosno, u finalu nisu samo rekli kako su došli do aplikacije, već su u suštini došli da posluju oko Wattsa. Momci su izneli kako vide upotrebu Watt-a u nekoliko poslovnih modela, dali statistiku, pokazali koji regioni imaju kakve probleme, koji zakoni se gde usvajaju, ocrtali globalni trend: nemodno je rudariti bitkoine, moderno je rudariti kilovate. Namjerno su došli do alternativne energije, što nam se jako svidjelo. Činjenica da su učesnici, pored ovoga, uspjeli kreirati radno tehničko rješenje sugerira da mogu samostalno pokrenuti startup.
glavni zaključak: Postoje timovi spremni da uzmu Watts Battery kao osnovu svog poslovnog modela, razviju ga i postanu partneri/pratioci kompanije. Neki od njih čak znaju kako identificirati MVP-a poslovne ideje i prvo raditi na njoj, nešto što danas nedostaje svuda u industriji. Ljudi ne razumiju kada treba stati, kada pustiti rješenje na tržište, iako rano, ali radno. U stvari, faza poliranja rješenja često se ne završava, tehnički rješenje prelazi granicu razumne složenosti, ulazi na tržište preopterećeno, više nije jasno koja je bila prvobitna ideja, šta je ciljanje korisnika, koji su poslovni modeli uključeno. Kao u vicu o Akunjinu, koji je napisao drugu knjigu dok je nekome potpisivao prethodnu. Ali ovdje je to urađeno u svom najčistijem obliku: evo grafikona, evo brojača, evo indikatora, evo predviđanja - to je sve, ništa drugo nije potrebno za pokretanje. Sa ovim možete otići do investitora i dobiti novac za pokretanje posla. Oni koji su našli ovu ravnotežu izašli su iz staze kao pobjednici.
Savjeti za budućnost: na sledećem hakatonu (planiramo ), možda ima smisla eksperimentirati s hardverom. Imamo vlastiti razvoj hardvera (jedna od prednosti Wattsa), u potpunosti kontroliramo proizvodnju i testiranje svega što radimo, ali nemamo dovoljno resursa da testiramo neke “hardverske” hipoteze. Vrlo je moguće da u zajednici sistemskih i niskorazvijenih programera i hardverskih programera ima onih koji će nam pomoći u tome i u budućnosti će postati naš partner u ovoj oblasti.
ljudi
Na hakatonu smo očekivali one koji žele da se okušaju u nekoj novoj oblasti (npr. maturante raznih škola programiranja), a ne one koji se specijalizuju za ovakav razvoj. Ali ipak smo očekivali da će prije hackathona odraditi mali pripremni rad, pročitati kako se općenito predviđa potrošnja energije i kako funkcioniraju sistemi Interneta stvari. Tako da svi dolaze ne samo iz zabave, tražeći zanimljive podatke i zadatke, već i uz prethodno uranjanje u predmetnu oblast. Sa naše strane razumijemo da je za to potrebno unaprijed objaviti dostupne podatke, njihov opis i preciznije zahtjeve za rezultat, objaviti API module itd.
Svi su imali približno isti tehnološki nivo, plus ili minus iste mogućnosti. U tom kontekstu, nivo harmonije nije bio posljednji faktor. Jedan broj ekipa nije pucao jer se nisu mogli jasno podijeliti na područja rada. Bilo je i onih u kojima je jedna osoba radila sav razvoj, ostali su bili zauzeti pripremanjem prezentacije, u drugima je neko dobio zadatke koje je radio, vjerovatno prvi put u životu.
Većina učesnika su bili mladi, što ne znači da među njima nije bilo jakih inženjera i programera za mašinsko učenje. Većina je došla u timovima; pojedinaca praktično nije bilo. Svi su sanjali o pobedi, neko je želeo da nađe posao u budućnosti, oko 20% ih je već našlo, mislim da će ova cifra rasti.
Nismo imali dovoljno hardverskih geekova, ali nadamo se da ćemo to nadoknaditi na drugom hackathonu.
Hackathon napredak
Kao što sam gore napisao, bili smo sa učesnicima veći deo 48 sati hakatona i, prateći njihove uspehe na kontrolnim punktovima, pokušali da prilagodimo zadatak i uslove za prihvatanje prve, analitičke staze tako da, s jedne strane, Učesnici su je mogli završiti u preostalom vremenu, a s druge strane nas je to zanimalo.
Posljednje pojašnjenje zadatka napravljeno je negdje oko posljednje kontrolne tačke, u subotu popodne (finale je bilo zakazano za nedjelju uveče). Sve smo još malo pojednostavili: uklonili smo zahtjev za preračunavanjem modela na novim podacima, ostavljajući podatke s kojima su timovi već radili. Poređenje metrika nam više nije dalo ništa, već su imali gotove rezultate na osnovu dostupnih podataka, a drugi dan su momci već bili umorni. Stoga smo odlučili da ih manje mučimo.
Međutim, tri od četiri učesnika nisu se plasirala u finale. Jedan tim je već na startu shvatio da ih više zanima staza naših kolega, drugi je neposredno pred finale shvatio da su u procesu obrade unapred filtrirali potrebne podatke i odbili da predstave svoj rad.
Ekipa “21 (Efekat mokre kose)” učestvovala je na obe naše numere do samog kraja. Htjeli su pokriti sve odjednom: strojno učenje, razvoj, aplikaciju i web stranicu. Sve dok im nismo zaprijetili povlačenjem u posljednji trenutak, vjerovali su da sve rade na vrijeme, iako je već na drugoj kontrolnoj tački bilo očito da s glavnim – mašinskim učenjem – ne mogu značajno napredovati: uglavnom su se nosili sa drugi blok, ali nije mogao predvidjeti potrošnju električne energije nisu bili spremni. Kao rezultat toga, kada smo odredili minimalni zadatak za kvalifikacije za prvi, oni su ipak izabrali drugi kolosijek.
Fit-predict je imao izbalansiranu kompoziciju skrojen za analitiku podataka, tako da su bili u stanju da prevaziđu sve. Bilo je primjetno da su momci bili zainteresirani za "dodirivanje" stvarnih industrijskih podataka. Odmah su se koncentrisali na glavnu stvar: analizu, čišćenje podataka, suočavanje sa svakom anomalijom. Činjenica da su uspeli da naprave model koji radi tokom hakatona je veliko dostignuće. U radnoj praksi to obično traje nedeljama: dok se podaci čiste, dok se u njih udubljuju. Stoga ćemo sigurno raditi s njima.
U drugom koloseku (menadžment) očekivali smo da svi urade sve za pola dana i da dođu tražiti da otežaju zadatak. U praksi smo jedva imali vremena da obavimo osnovni zadatak. Radili smo na JS-u i Pythonu, što odražava trenutno stanje u industriji.
I ovdje su rezultate postigli uigrani timovi u kojima je izgrađena podjela rada, vidjelo se ko šta radi.
Treći tim, FSociety, kao da ima rješenje, ali su na kraju odlučili da ne pokažu svoj razvoj, rekli su da ne smatraju da to funkcionira. Mi to poštujemo i nismo se svađali.
Pobjednik je bio tim „Striptizeti iz Bakua“, koji je umeo da se zaustavi, ne da juri za „drangulijama“, već da stvori MVP kojeg nije sramota da pokaže i koji je jasno da se može dalje razvijati i skalirati. Odmah smo im rekli da nas dodatne mogućnosti ne zanimaju previše. Ako žele registraciju putem QR koda, prepoznavanje lica, neka prvo naprave grafikone u aplikaciji, a onda preuzmu opcione.
U ovoj stazi „Mokra kosa“ je samouvereno ušla u finale, a razgovarali smo o daljoj saradnji sa njima i „Hustlersima“. Ovo drugo smo već upoznali u novoj godini.
Nadam se da će sve uspjeti, i radujemo se što ćemo se svi vidjeti na drugom hackathonu u martu!
izvor: www.habr.com
