Från fysiker till datavetenskap (från vetenskapens motorer till kontorsplankton). Den tredje delen

Från fysiker till datavetenskap (från vetenskapens motorer till kontorsplankton). Den tredje delen

Den här bilden är av Arthur Kuzin (n01z3), sammanfattar ganska exakt innehållet i blogginlägget. Som ett resultat av detta bör följande berättelse uppfattas mer som en fredagshistoria än som något extremt användbart och tekniskt. Dessutom är det värt att notera att texten är rik på engelska ord. Jag vet inte hur man översätter vissa av dem korrekt, och jag vill bara inte översätta några av dem.

Första delen.
Andra delen.

Hur övergången från en akademisk miljö till en industriell miljö gick till avslöjas i de två första avsnitten. I den här kommer samtalet att handla om vad som hände sedan.

Det var januari 2017. Vid den tiden hade jag lite mer än ett års arbetslivserfarenhet och jag arbetade i San Francisco i företaget TrueAccord som Sr. Dataforskare.

TrueAccord är ett inkassoföretag. Enkelt uttryckt - en inkassobyrå. Samlare brukar ringa mycket. Vi skickade många mejl, men ringde få samtal. Varje e-postmeddelande ledde till företagets hemsida, där gäldenären erbjöds rabatt på skulden och till och med fick betala i omgångar. Detta tillvägagångssätt ledde till bättre insamling, möjliggjorde skalning och mindre exponering för stämningar.

Företaget var normalt. Produkten är tydlig. Ledningen är sansad. Läget är bra.

I genomsnitt arbetar människor i dalen på ett ställe i ungefär ett och ett halvt år. Det vill säga, vilket företag du jobbar för är bara ett litet steg. I det här steget kommer du att samla in lite pengar, skaffa dig nya kunskaper, färdigheter, kopplingar och rader i ditt CV. Efter detta sker en övergång till nästa steg.

På självaste TrueAccord var jag med och bifogade rekommendationssystem till nyhetsbrev via e-post, samt att prioritera telefonsamtal. Effekten är förståelig och mättes ganska bra i dollar genom A/B-tester. Eftersom det inte fanns någon maskininlärning före min ankomst var effekten av mitt arbete inte dålig. Återigen, det är mycket lättare att förbättra något än något som redan är kraftigt optimerat.

Efter sex månaders arbete med dessa system höjde de till och med min grundlön från $150k till $163k. I samhället Open Data Science (ODS) det finns ett meme om $163k. Den växer med benen härifrån.

Allt detta var underbart, men det ledde inte någonstans, eller det ledde, men inte dit.

Jag har stor respekt för TrueAccord, både företaget och killarna jag jobbade med där. Jag lärde mig mycket av dem, men jag ville inte jobba länge med rekommendationssystem på en inkassobyrå. Från detta steg var man tvungen att gå i någon riktning. Om inte framåt och uppåt, så åtminstone i sidled.

Vad gillade jag inte?

  1. Ur ett maskininlärningsperspektiv gjorde problemen mig inte upphetsad. Jag ville ha något moderiktigt, ungdomligt, det vill säga Deep Learning, Computer Vision, något ganska nära vetenskap eller åtminstone alkemi.
  2. En startup, och till och med en inkassobyrå, har problem med att anställa högt kvalificerad personal. Som startup kan det inte betala mycket. Men som inkassobyrå tappar den i status. Grovt sett, om en tjej på en dejt frågar var du jobbar? Ditt svar: "På Google" låter i storleksordningar bättre än "inkassobyrå." Jag var lite störd av det faktum att för mina vänner som arbetar på Google och Facebook, till skillnad från mig, öppnade namnet på deras företag dörrar som: du kan bjudas in till en konferens eller möte som talare, eller mer intressanta personer skriver på LinkedIn med ett erbjudande att träffas och chatta över ett glas te. Jag älskar verkligen att kommunicera med människor jag inte känner personligen. Så om du bor i San Francisco, tveka inte att skriva - låt oss ta en kaffe och prata.
  3. Utöver mig arbetade tre Data Scientists i företaget. Jag arbetade med maskininlärning, och de arbetade med andra uppgifter inom datavetenskap, som är vanliga i alla startups från här till imorgon. Som ett resultat förstod de inte riktigt maskininlärning. Men för att växa måste jag kommunicera med någon, diskutera artiklar och den senaste utvecklingen och be om råd till slut.

Vad fanns tillgängligt?

  1. Utbildning: fysik, inte datavetenskap.
  2. Det enda programmeringsspråket jag kunde var Python. Det fanns en känsla av att jag behövde byta till C++, men jag kunde fortfarande inte komma runt det.
  3. Ett och ett halvt års arbete i branschen. Dessutom studerade jag varken Deep Learning eller Computer Vision på jobbet.
  4. Inte en enda artikel om Deep Learning / Computer Vision i CV:t.
  5. Det var en Kaggle Master-prestation.

Vad ville du?

  1. En position där det kommer att bli nödvändigt att träna många nätverk, och närmare datorseende.
  2. Det är bättre om det är ett stort företag som Google, Tesla, Facebook, Uber, LinkedIn, etc. Även om det är i ett nafs, skulle en start duga.
  3. Jag behöver inte vara den största maskininlärningsexperten i teamet. Det fanns ett stort behov av seniora kamrater, mentorer och all slags kommunikation, vilket var tänkt att påskynda inlärningsprocessen.
  4. Efter att ha läst blogginlägg om hur akademiker utan industriell erfarenhet har en total ersättning på 300-500 XNUMX $ per år, ville jag gå in på samma intervall. Det är inte så att det här stör mig så mycket, men eftersom de säger att detta är ett vanligt fenomen, men jag har mindre, så är detta en signal.

Uppgiften verkade helt lösbar, dock inte i den meningen att man kan hoppa in i vilket företag som helst, utan snarare att om man svälter så löser sig allt. Det vill säga, tiotals eller hundratals försök, och smärtan från varje misslyckande och varje avslag, bör användas för att skärpa fokus, förbättra minnet och sträcka ut dagen till 36 timmar.

Jag finjusterade mitt CV, började skicka ut det och gick på intervjuer. Jag flög förbi de flesta i kommunikationsstadiet med HR. Många människor krävde C++, men jag visste det inte, och jag hade en stark känsla av att jag inte skulle vara särskilt intresserad av positioner som krävde C++.

Värt att notera är att det ungefär samtidigt skedde en fasövergång i typen av tävlingar på Kaggle. Före 2017 fanns det mycket tabelldata och mycket sällan bilddata, men från och med 2017 fanns det många datorseendeuppgifter.

Livet flödade i följande läge:

  1. Jobba under dagen.
  2. När teknisk skärm / på plats tar du ledigt.
  3. Kvällar och helger Kaggle + artiklar / böcker / blogginlägg

Slutet av 2016 präglades av att jag gick med i gemenskapen Open Data Science (ODS), vilket förenklade mycket. Det finns många killar i samhället med rik industriell erfarenhet, vilket gjorde att vi kunde ställa många dumma frågor och få många smarta svar. Det finns också många mycket starka maskininlärningsspecialister av alla slag, vilket oväntat tillät mig, genom ODS, att avsluta problemet med regelbunden djupgående kommunikation om Data Science. Hittills, vad gäller ML, ger ODS mig många gånger mer än vad jag får på jobbet.

Jo, som vanligt har ODS tillräckligt med specialister på tävlingar på Kaggle och andra sajter. Att lösa problem i ett team är roligare och mer produktivt, så med skämt, svordomar, memes och annan nördig underhållning började vi lösa problem en efter en.

I mars 2017 - i ett lag med Serega Mushinsky - tredje plats för Detektering av Dstl-satellitbilder. Guldmedalj på Kaggle + $20k för två. I denna uppgift förbättrades arbetet med satellitbilder + binär segmentering via UNet. Blogginlägg om Habré om detta ämne.

Samma mars gick jag på en intervju på NVidia med Self Driving-teamet. Jag kämpade verkligen med frågor om objektdetektion. Det fanns inte tillräckligt med kunskap.

Som tur var började tävlingen Objektdetektion om flygbilder från samma DSTL samtidigt. Gud själv beordrade att lösa problemet och uppgradera. En månad med kvällar och helger. Jag tog upp kunskapen och slutade tvåa. Den här tävlingen hade en intressant nyans i reglerna, vilket ledde till att jag visades i Ryssland på federala och inte så federala kanaler. Jag kom på hem Lenta.ru, och i ett gäng tryckta och onlinepublikationer. Mail Ru Group fick lite positiv PR på min bekostnad och sina egna pengar, och grundläggande vetenskap i Ryssland berikades med 12000 XNUMX pund. Som vanligt skrevs det om detta ämne blogginlägg på hubr. Gå dit för detaljer.

Samtidigt kontaktade en Tesla-rekryterare mig och erbjöd mig att prata om tjänsten Computer Vision. Jag kom överens. Jag sprang igenom hemtagningen, två tekniska skärmar, en intervju på plats och hade ett mycket trevligt samtal med Andrei Karpathy, som precis hade anställts på Tesla som direktör för AI. Nästa steg är bakgrundskontroll. Efter det var Elon Musk tvungen att personligen godkänna min ansökan. Tesla har ett strikt Non Disclosure Agreement (NDA).
Jag klarade inte bakgrundskontrollen. Rekryteraren sa att jag chattar mycket online, vilket bryter mot NDA. Det enda stället där jag sa något om en intervju på Tesla var ODS, så den aktuella hypotesen är att någon tog en skärmdump och skrev till HR på Tesla, och jag togs bort från loppet på olämplig väg. Det var synd då. Nu är jag glad att det inte gick. Min nuvarande position är mycket bättre, även om det skulle vara väldigt intressant att arbeta med Andrey.

Direkt efter det kastade jag mig in i satellitbildtävlingen på Kaggle från Planet Labs - Förstå Amazonas från rymden. Problemet var enkelt och extremt tråkigt, ingen ville lösa det, men alla ville ha en gratis guldmedalj eller prispengar. Därför kom vi med ett team av Kaggle Masters på 7 personer överens om att vi skulle kasta järn. Vi tränade 480 nätverk i "fit_predict"-läget och gjorde en trevånings ensemble av dem. Vi slutade sjua. Blogginlägg som beskriver lösningen från Arthur Kuzin. Förresten, Jeremy Howard, som är vida känd som skaparen Snabb.AI slutade 23.

Efter tävlingens slut, genom en vän som arbetade på AdRoll, anordnade jag en Meetup i deras lokaler. Representanter för Planet Labs talade där om hur organisationen av tävlingen och datamärkningen såg ut från deras sida. Wendy Kwan, som jobbar på Kaggle och övervakade tävlingen, berättade om hur hon såg på det. Jag beskrev vår lösning, knep, tekniker och tekniska detaljer. Två tredjedelar av publiken löste detta problem, så frågorna ställdes rakt på sak och i allmänhet var allt coolt. Jeremy Howard var också där. Det visade sig att han slutade på 23:e plats eftersom han inte visste hur han skulle stapla modellen och att han inte alls kände till denna metod att konstruera ensembler.

Meetups i dalen om maskininlärning skiljer sig mycket från meetups i Moskva. Som regel är möten i dalen botten. Men vår blev bra. Tyvärr tryckte inte kamraten som skulle trycka på knappen och spela in allt :)

Efter det blev jag inbjuden att prata med tjänsten som Deep Learning Engineer på samma Planet Labs och omedelbart på plats. Jag klarade det inte. Formuleringen av avslaget är att det inte finns tillräckligt med kunskap i Deep Learning.

Jag designade varje tävling som ett projekt i LinkedIn. För DSTL-problemet skrev vi förtryck och la upp det på arxiv. Inte en artikel, men ändå bröd. Jag rekommenderar också till alla andra att blåsa upp sin LinkedIn-profil genom tävlingar, artiklar, färdigheter och så vidare. Det finns en positiv korrelation mellan hur många sökord du har i din LinkedIn-profil och hur ofta folk skickar meddelanden till dig.

Om jag på vintern och våren var väldigt teknisk, så hade jag i augusti både kunskap och självförtroende.

I slutet av juli kontaktade en kille som jobbade som Data Science-chef på Lyft mig på LinkedIn och bjöd in mig att fika och prata om livet, om Lyft, om TrueAccord. Vi pratade. Han erbjöd sig att intervjua sitt team för tjänsten som Data Scientist. Jag sa att alternativet fungerar, förutsatt att det är Computer Vision / Deep Learning från morgon till kväll. Han försäkrade att det inte fanns några invändningar från hans sida.

Jag skickade mitt CV och han laddade upp det till Lyfts interna portal. Efter det ringde rekryteraren mig för att öppna mitt CV och få reda på mer om mig. Redan från de första orden stod det klart att för honom var detta en formalitet, eftersom det var uppenbart för honom från hans CV att "Jag är inte ett material för Lyft." Jag antar att mitt CV efter det hamnade i papperskorgen.

Under hela den här tiden, medan jag intervjuades, diskuterade jag mina misslyckanden och fall i ODS och killarna gav mig feedback och hjälpte mig på alla möjliga sätt med råd, även om det, som vanligt, också var mycket vänligt trolling där.

En av ODS-medlemmarna erbjöd sig att koppla mig med sin vän, som är chef för teknik på Lyft. Inte tidigare sagt än gjort. Jag kommer till Lyft för lunch, och förutom denna vän finns det också en Head of Data Science och en produktchef som är ett stort fan av Deep Learning. Vid lunch pratade vi över DL. Och eftersom jag har tränat nätverk 24/7 i ett halvår, läst kubikmeter litteratur och kört uppgifter på Kaggle med mer eller mindre tydliga resultat, kunde jag prata om Deep Learning i timmar, både vad gäller nya artiklar och praktiska tekniker.

Efter lunch tittade de på mig och sa - det är direkt uppenbart att du är snygg, vill du prata med oss? Dessutom tillade de att det är uppenbart för mig att ta hem + teknisk skärm kan hoppas över. Och att jag omedelbart kommer att bjudas in på plats. Jag kom överens.

Efter det ringde den rekryteraren mig för att boka in en intervju på plats, och han var missnöjd. Han muttrade något om att inte hoppa över huvudet på dig.

Kom. Intervju på plats. Fem timmars kommunikation med olika människor. Det fanns inte en enda fråga om Deep Learning, eller om maskininlärning i princip. Eftersom det inte finns någon Deep Learning / Computer Vision, så är jag inte intresserad. Således var intervjuresultaten ortogonala.

Den här rekryteraren ringer och säger - grattis, du kom till den andra intervjun på plats. Allt detta är förvånande. Vilken är den andra på plats? Jag har aldrig hört talas om något sådant. Jag gick. Det finns ett par timmar där, den här gången handlar det om traditionell maskininlärning. Det är bättre. Men fortfarande inte intressant.

Rekryteraren ringer med gratulationer till att jag klarade den tredje intervjun på plats och lovar att detta kommer att bli den sista. Jag gick för att se den och det fanns både en DL och ett CV.

Jag hade en prior i många månader som sa till mig att det inte skulle komma något erbjudande. Jag kommer inte träna på tekniska färdigheter, utan på mjuka. Inte på den mjuka sidan, utan på att tjänsten kommer att läggas ner eller att företaget inte anställer ännu, utan bara testar marknaden och nivån på kandidater.

Mitten av augusti. Jag drack öl okej. Mörka tankar. 8 månader har gått och fortfarande inget erbjudande. Det är bra att vara kreativ under öl, speciellt om kreativiteten är konstig. En idé kommer till mig. Jag delar det med Alexey Shvets, som vid den tiden var postdoc vid MIT.

Tänk om du tar närmaste DL/CV-konferens, tittar på tävlingarna som hålls som en del av den, tränar något och lämnar in? Eftersom alla experter där bygger sina karriärer på detta och har gjort detta i många månader eller till och med år, har vi ingen chans. Men det är inte skrämmande. Vi gör en meningsfull inlämning, flyger till sista plats och efter det skriver vi en pre-print eller en artikel om hur vi inte är som alla andra och pratar om vårt beslut. Och artikeln finns redan på LinkedIn och i ditt CV.

Det vill säga, det verkar vara relevant och det finns mer korrekta sökord i CV:t, vilket borde öka chanserna att komma till teknikskärmen något. Kod och bidrag från mig, texter från Alexey. Spel förstås, men varför inte?

Inte tidigare sagt än gjort. Närmaste konferens som vi googlade var MICCAI och det var faktiskt tävlingar där. Vi träffade den första. Det var Gastrointestinal bildanalys (GIANA). Uppgiften har 3 deluppgifter. Det var 8 dagar kvar innan deadline. Jag nyktrade till på morgonen, men jag gav inte upp tanken. Jag tog mina pipelines från Kaggle och bytte dem från satellitdata till medicinsk data. 'fit_predict'. Alexey förberedde en tvåsidig beskrivning av lösningar för varje problem, och vi skickade den. Redo. I teorin kan du andas ut. Men det visade sig att det fanns en annan uppgift för samma verkstad (Segmentering av robotinstrument) med tre deluppgifter och att hennes deadline flyttades upp med 4 dagar, det vill säga vi kan göra 'fit_predict' där och skicka det. Det var vad vi gjorde.

Till skillnad från Kaggle hade dessa tävlingar sina egna akademiska detaljer:

  1. Ingen Leaderboard. Bidrag skickas via e-post.
  2. Du kommer att tas bort om en teamrepresentant inte kommer för att presentera lösningen på konferensen på Workshopen.
  3. Din plats på topplistan blir känd först under konferensen. Ett slags akademiskt drama.

MICCAI 2017-konferensen hölls i Quebec City. För att vara ärlig, i september började jag bli utbränd, så tanken på att ta en vecka ledigt från jobbet och åka till Kanada såg intressant ut.

Kom till konferensen. Jag kom till denna workshop, jag känner ingen, jag sitter i hörnet. Alla känner varandra, de kommunicerar, de slänger ur sig smarta medicinska ord. Recension av första tävlingen. Deltagarna pratar och pratar om sina beslut. Det är coolt där, med en gnistra. Min tur. Och jag skäms till och med på något sätt. De löste problemet, arbetade på det, avancerade vetenskapen, och vi är rent "fit_predict" från tidigare utveckling, inte för vetenskapen, utan för att öka vårt CV.

Han kom ut och sa att jag inte är någon expert på medicin heller, bad om ursäkt för att de hade slösat bort sin tid och visade mig en bild med lösningen. Jag gick ner till hallen.

De tillkännager den första deluppgiften – vi är först, och med marginal.
De andra och tredje annonserna.
De tillkännager den tredje - igen först och igen med en ledning.
General är den första.

Från fysiker till datavetenskap (från vetenskapens motorer till kontorsplankton). Den tredje delen

Officiellt pressmeddelande.

Några i publiken ler och tittar på mig med respekt. Andra, de som tydligen ansågs vara experter på området, hade vunnit bidrag för denna uppgift och hållit på med detta i många år, hade ett lite förvrängt ansiktsuttryck.

Nästa är den andra uppgiften, den med tre deluppgifter och som har flyttats fram med fyra dagar.

Här bad jag också om ursäkt och visade vår ena bild igen.
Samma historia. Två först, en sekund, vanligt först.

Jag tror att detta förmodligen är första gången i historien som en inkassobyrå vinner en medicinsk bildkonkurrens.

Och nu står jag på scenen, de ger mig något slags diplom och jag bombarderas. Hur fan kan det vara? Dessa akademiker spenderar skattebetalarnas pengar och arbetar för att förenkla och förbättra kvaliteten på arbetet för läkare, det vill säga i teorin, min förväntade livslängd, och någon kropp slet in hela den här akademiska personalen i den brittiska flaggan på några kvällar.

En bonus med detta är att i andra team kommer doktorander som har arbetat med dessa uppgifter i många månader att ha ett CV som är attraktivt för HR, det vill säga att de lätt kommer till teknikskärmen. Och framför mina ögon finns ett nyinkommet mejl:

A Googler recently referred you for the Research Scientist, Google Brain (United States) role. We carefully reviewed your background and experience and decided not to proceed with your application at this time.

I allmänhet frågar jag publiken direkt från scenen: "Vet någon var jag jobbar?" En av arrangörerna av tävlingen visste – han googlade vad TrueAccord var. Resten är det inte. Jag fortsätter: ”Jag jobbar på en inkassobyrå och på jobbet gör jag varken Computer Vision eller Deep Learning. Och på många sätt händer detta eftersom HR-avdelningarna på Google Brain och Deepmind filtrerar mitt CV, vilket inte ger mig en chans att visa teknisk utbildning. "

De lämnade över intyget, en paus. En grupp akademiker drar mig åt sidan. Det visade sig att detta är en Hälsogrupp med Deepmind. De blev så imponerade att de omedelbart ville prata med mig om den lediga tjänsten Research Engineer i deras team. (Vi pratade faktiskt. Det här samtalet varade i 6 månader, jag klarade ta hem, frågesport, men blev avskuren på teknikskärmen. 6 månader från början av kommunikationen till teknikskärmen är lång tid. Den långa väntan ger ett smakprov av värdelöshet. Forskningsingenjör vid Deepmind i London, mot bakgrund av TrueAccord skedde ett starkt steg upp, men mot bakgrund av min nuvarande position är det ett steg nedåt. Från ett avstånd på två år som har gått sedan dess är det bra att det inte gjorde det.)

Slutsats

Ungefär samtidigt fick jag ett erbjudande från Lyft som jag tackade ja till.
Baserat på resultaten från dessa två tävlingar med MICCAI publicerades följande:

  1. Automatisk instrumentsegmentering i robotassisterad kirurgi med hjälp av djupinlärning
  2. Angiodysplasi-detektering och lokalisering med djupa konvolutionella neurala nätverk
  3. 2017 Robotic instrument segmentering utmaning

Det vill säga, trots idéns vildhet, fungerar det bra att lägga till inkrementella artiklar och preprints genom tävlingar. Och under de följande åren gjorde vi det ännu värre.

Från fysiker till datavetenskap (från vetenskapens motorer till kontorsplankton). Den tredje delen

Jag har arbetat på Lyft de senaste åren med datorseende/djupinlärning för självkörande bilar. Dvs jag fick som jag ville ha. Och arbetsuppgifter, och ett företag med hög status, och starka kollegor, och allt annat gott.

Under dessa månader hade jag kommunikation med både stora företag Google, Facebook, Uber, LinkedIn och med ett hav av startups i olika storlekar.

Det gjorde ont i alla dessa månader. Universum berättar något som inte är särskilt trevligt varje dag. Regelbundet avslag, att regelbundet göra misstag och allt detta är smaksatt med en ihållande känsla av hopplöshet. Det finns inga garantier för att du kommer att lyckas, men det finns en känsla av att du är en dåre. Det påminner mycket om hur jag försökte hitta ett jobb direkt efter universitetet.

Jag tror att många sökte arbete i dalen och allt var mycket lättare för dem. Tricket, enligt min mening, är detta. Om du letar efter ett jobb inom ett område som du förstår, har mycket erfarenhet, och ditt CV säger detsamma, är det inga problem. Jag tog den och hittade den. Det finns många lediga platser.

Men om du letar efter ett jobb inom ett område som är nytt för dig, det vill säga när det inte finns någon kunskap, inga kopplingar och ditt CV säger något fel - i detta ögonblick blir allt extremt intressant.

Just nu skriver rekryterare regelbundet till mig och erbjuder sig att göra samma sak som jag gör nu, men i ett annat företag. Det är verkligen dags att byta jobb. Men det är ingen idé att göra det jag redan är bra på. För vad?

Men för vad jag vill har jag återigen varken kunskapen eller raderna i mitt CV. Låt oss se hur det hela slutar. Om allt går bra skriver jag nästa del. 🙂

Källa: will.com

Lägg en kommentar