Од физичара до науке о подацима (од мотора науке до канцеларијског планктона). Трећи део

Од физичара до науке о подацима (од мотора науке до канцеларијског планктона). Трећи део

Ова слика је Артхур Кузин (н01з3), прилично прецизно сумира садржај блог поста. Као резултат тога, следећи наратив треба више да се перципира као прича од петка него као нешто изузетно корисно и техничко. Поред тога, вреди напоменути да је текст богат енглеским речима. Не знам како да преведем неке од њих исправно, а неке једноставно не желим да преводим.

Први део.
Други део.

Како је дошло до преласка из академског у индустријско окружење открива се у прве две епизоде. У овом ће се разговарати о томе шта се даље догодило.

Био је јануар 2017. Тада сам имао нешто више од годину дана радног искуства и радио сам у Сан Франциску у компанији ТруеАццорд попут Ср. Дата Сциентист.

ТруеАццорд је стартап за наплату дугова. Једноставно речено - агенција за наплату. Колекционари обично много зову. Послали смо много мејлова, али смо обавили мало позива. Сваки мејл водио је на веб страницу компаније, где је дужнику понуђен попуст на дуг, па чак и дозвољено плаћање у ратама. Овај приступ је довео до боље наплате, омогућио скалирање и мању изложеност тужбама.

Друштво је било нормално. Производ је јасан. Управа је здрава. Локација је добра.

У просеку, људи у долини раде на једном месту око годину и по. Односно, свака компанија у којој радите је само мали корак. На овом кораку ћете прикупити нешто новца, стећи нова знања, вештине, везе и линије у свом животопису. Након овога следи прелазак на следећи корак.

У самом ТруеАццорд-у, био сам укључен у прикључивање система препорука на билтене е-поште, као и давање приоритета телефонским позивима. Утицај је разумљив и прилично је добро измерен у доларима кроз А/Б тестирање. Пошто пре мог доласка није било машинског учења, утицај мог рада није био лош. Опет, много је лакше побољшати нешто него нешто што је већ у великој мери оптимизовано.

После шест месеци рада на овим системима, чак су ми подигли основну плату са 150 хиљада долара на 163 хиљаде долара. У заједници Наука о отвореним подацима (ОДС) постоји мем око 163 хиљаде долара. Одавде расте са ногама.

Све је ово било дивно, али никуда није водило, или је водило, али не тамо.

Веома поштујем ТруеАццорд, и компанију и момке са којима сам тамо радио. Много сам научио од њих, али нисам желео дуго да радим на системима препорука у агенцији за наплату. Од овог корака морали сте да закорачите у неком правцу. Ако не напред и горе, онда барем бочно.

Шта ми се није допало?

  1. Из перспективе машинског учења, проблеми ме нису узбуђивали. Желео сам нешто модерно, младалачко, односно дубоко учење, компјутерски вид, нешто прилично блиско науци или бар алхемији.
  2. Стартуп, па чак и агенција за наплату, има проблема са запошљавањем висококвалификованог особља. Као стартуп, не може много да плати. Али као агенција за наплату губи статус. Грубо речено, ако вас девојка на састанку пита где радите? Ваш одговор: „На Гоогле-у“ звучи много боље од „агенције за наплату“. Мало ме је засметало што је мојим пријатељима који раде у Гуглу и Фејсбуку, за разлику од мене, име њихове компаније отворило врата попут: можете бити позвани на конференцију или састанак као говорник, или занимљивији људи пишу на ЛинкедИн-у са понудом да се сретнемо и ћаскамо уз чашу чаја. Заиста волим да комуницирам са људима које не познајем лично. Дакле, ако живите у Сан Франциску, не оклевајте да пишете - идемо на кафу и разговарамо.
  3. Поред мене, у компанији су радила три Дата Сциентистс. Ја сам радио на машинском учењу, а они су радили на другим задацима науке о подацима, који су уобичајени у сваком стартап-у од сада до сутра. Као резултат тога, нису баш разумели машинско учење. Али да бих растао, морам да комуницирам са неким, да разговарам о чланцима и најновијим дешавањима и да тражим савет, на крају.

Шта је било доступно?

  1. Образовање: физика, а не информатика.
  2. Једини програмски језик који сам познавао био је Питхон. Постојао је осећај да морам да пређем на Ц++, али још увек нисам могао да га заобиђем.
  3. Годину и по дана рада у индустрији. Штавише, на послу нисам студирао ни дубоко учење ни компјутерски вид.
  4. У резимеу нема ни једног чланка о дубоком учењу / компјутерском виду.
  5. Постојало је достигнуће Каггле Мастер.

Шта си хтео?

  1. Позиција на којој ће бити потребно обучити многе мреже, а ближе компјутерском виду.
  2. Боље је ако је то велика компанија као што су Гугл, Тесла, Фејсбук, Убер, ЛинкедИн итд. Иако у стисци, стартап би био добар.
  3. Не морам да будем највећи стручњак за машинско учење у тиму. Постојала је велика потреба за старијим друговима, менторима и свим видовима комуникације, што је требало да убрза процес учења.
  4. Након што сам прочитао постове на блогу о томе како дипломци без индустријског искуства имају укупну надокнаду од 300-500 хиљада долара годишње, желео сам да уђем у исти опсег. Није да ми ово толико смета, али пошто кажу да је то уобичајена појава, а ја имам мање, онда је ово сигнал.

Чинило се да је задатак потпуно решив, али не у смислу да се може ускочити у било које друштво, већ да ће, ако изгладнете, све испасти. Односно, десетине или стотине покушаја, и бол од сваког неуспеха и сваког одбијања, треба искористити за изоштравање фокуса, побољшање памћења и продужење дана на 36 сати.

Поправио сам свој животопис, почео да га шаљем и идем на интервјуе. Пролетео сам поред већине њих у фази комуникације са ХР-ом. Многи људи су захтевали Ц++, али ја то нисам знао, и имао сам снажан осећај да нећу бити много заинтересован за позиције које захтевају Ц++.

Вреди напоменути да је отприлике у исто време дошло до фазне транзиције у врсти такмичења на Кагглеу. Пре 2017. било је много табеларних података и веома ретко података о сликама, али од 2017. године било је много задатака компјутерског вида.

Живот је текао у следећем режиму:

  1. Радите током дана.
  2. Када се технички екран / на лицу места узмете слободно.
  3. Вечери и викендом Каггле + чланци / књиге / постови на блогу

Крај 2016. године обележило је то што сам се придружио заједници Наука о отвореним подацима (ОДС), што је поједноставило многе ствари. У заједници има доста момака са богатим индустријским искуством, што нам је омогућило да поставимо много глупих питања и добијемо много паметних одговора. Постоји и много веома јаких специјалиста за машинско учење свих врста, што ми је, неочекивано, омогућило, преко ОДС-а, да затворим питање редовном дубинском комуникацијом о науци о подацима. До сада, у смислу МЛ, ОДС ми даје много пута више од онога што добијем на послу.

Па, као и обично, ОДС има довољно стручњака за такмичења на Каггле-у и другим сајтовима. Решавање проблема у тиму је забавније и продуктивније, па смо уз шале, псовке, мемове и другу штреберску забаву почели да решавамо проблеме један по један.

У марту 2017. - у тиму са Серегом Мушинским - треће место за Детекција функција Дстл сателитских слика. Златна медаља на Кагглеу + 20 хиљада долара за двоје. На овом задатку је побољшан рад са сателитским снимцима + бинарна сегментација преко УНет-а. Пост на блогу на Хабреу на ову тему.

Истог марта отишао сам на интервју у НВидиа са Селф Дривинг тимом. Заиста сам се мучио са питањима о детекцији објеката. Није било довољно знања.

Срећом, у исто време је почело такмичење у детекцији објеката на снимцима из ваздуха са истог ДСТЛ-а. Сам Бог је наредио да се проблем реши и надогради. Месец вечери и викенда. Покупио сам знање и завршио други. Ово такмичење је имало занимљиву нијансу у правилима, што је довело до тога да сам у Русији приказан на федералним, а не тако савезним каналима. Успео сам хоме Лента.ру, и у гомили штампаних и онлајн публикација. Маил Ру Гроуп је добила мало позитивног ПР-а на мој рачун и свој новац, а фундаментална наука у Русији је обогаћена за 12000 фунти. Као и обично, писано је на ову тему блог пост на хубр. Идите тамо за детаље.

У исто време, Теслин регрутер ме је контактирао и понудио да разговарамо о позицији Цомпутер Висион. Сложио сам се. Пролетио сам кроз кућицу, два технолошка екрана, интервју на лицу места и имао веома пријатан разговор са Андрејем Карпатијем, који је управо био ангажован у Тесли као директор АИ. Следећа фаза је провера прошлости. Након тога, Елон Муск је морао лично да одобри моју пријаву. Тесла има строги уговор о неоткривању података (НДА).
Нисам прошао проверу. Регрутер је рекао да много ћаскам на мрежи, кршећи НДА. Једино место где сам ишта рекао о интервјуу у Тесли био је ОДС, тако да је тренутна хипотеза да је неко направио снимак екрана и писао ХР-у у Тесли, а ја сам уклоњен из трке из опасности. Тада је била срамота. Сада ми је драго што није успело. Моја тренутна позиција је много боља, иако би било веома интересантно радити са Андрејем.

Одмах након тога, ушао сам у такмичење у сателитским снимцима на Каггле-у Планет Лабс - Разумевање Амазона из свемира. Проблем је био једноставан и крајње досадан, нико није хтео да га реши, али су сви желели бесплатну златну медаљу или новчану награду. Стога смо се са тимом Каггле Мастерса од 7 људи договорили да ћемо бацати гвожђе. Обучили смо 480 мрежа у режиму 'фит_предицт' и од њих направили троспратни ансамбл. Завршили смо седми. Пост на блогу који описује решење од Артура Кузина. Иначе, Џереми Хауард, који је надалеко познат као креатор Фаст.АИ завршио 23.

По завршетку такмичења, преко пријатеља који је радио у АдРолл-у, организовао сам Меетуп у њиховим просторијама. Представници Планет Лабса говорили су о томе како је са њихове стране изгледала организација такмичења и обележавање података. Венди Кван, која ради у Кагглеу и надгледала је такмичење, говорила је о томе како је то видела. Описао сам наше решење, трикове, технике и техничке детаље. Две трећине публике је решило овај проблем, тако да су питања постављена до тачке и генерално све је било цоол. Јереми Ховард је такође био тамо. Испоставило се да је завршио на 23. месту јер није знао како да сложи модел и да уопште није знао за овај начин конструисања ансамбала.

Састанци у долини о машинском учењу се веома разликују од сусрета у Москви. По правилу, сусрети у долини су дно. Али наш је испао добар. Нажалост, друг који је требало да притисне дугме и све сними није притиснуо дугме :)

Након тога, позван сам да разговарам на позицији Инжењера дубоког учења у овој истој Планет Лабс, и то одмах на лицу места. Нисам прошао. Формулација одбијања је да нема довољно знања у дубоком учењу.

Свако такмичење сам осмислио као пројекат у ЛинкедИн. За ДСТЛ проблем смо писали предштампање и поставио на аркив. Није чланак, али ипак хлеб. Такође препоручујем свима осталима да надувају свој ЛинкедИн профил кроз такмичења, чланке, вештине и тако даље. Постоји позитивна корелација између тога колико кључних речи имате на свом ЛинкедИн профилу и колико често вам људи шаљу поруке.

Ако сам зими и на пролеће био врло технички, онда сам до августа имао и знање и самопоуздање.

Крајем јула, момак који је радио као менаџер за науку података у Лифту ме је контактирао на ЛинкедИн-у и позвао ме на кафу и разговор о животу, о Лифту, о ТруеАццорд-у. Разговарали смо. Понудио је интервју са својим тимом за позицију Дата Сциентист. Рекао сам да опција ради, под условом да је Цомпутер Висион/Дееп Леарнинг од јутра до вечери. Он је уверавао да са његове стране нема замерки.

Послао сам свој животопис и он га је поставио на Лифтов интерни портал. Након тога, регрутер ме је позвао да отворим своју биографију и сазнам више о мени. Већ од првих речи било је јасно да је то за њега формалност, јер му је из резимеа било очигледно да „ја нисам материјал за Лифт“. Претпостављам да је након тога мој животопис отишао у канту за смеће.

Све ово време, док сам био на интервјуу, разговарао сам о својим неуспесима и падовима у ОДС-у и момци су ми давали повратне информације и на сваки могући начин ми помагали саветима, иако је ту, као и обично, било и доста пријатељског троловања.

Један од чланова ОДС-а је понудио да ме повеже са својим пријатељем, који је директор инжењеринга у Лифту. Не пре речено него учињено. Долазим у Лифт на ручак, а поред овог пријатеља ту су и шеф одељења за науку о подацима и менаџер производа који је велики обожавалац дубоког учења. За ручком смо ћаскали преко ДЛ. А пошто већ пола године тренирам мреже 24/7, читам кубике литературе и извршавам задатке на Каггле-у са мање-више јасним резултатима, могао бих сатима да причам о дубоком учењу, како у смислу нових чланака тако и практичне технике .

После ручка су ме погледали и рекли - одмах се види да си згодан, хоћеш да разговараш са нама? Штавише, додали су да ми је јасно да се екран понети кући + технологија може прескочити. И да ћу одмах бити позван на лице места. Сложио сам се.

После тога ме је позвао тај регрутер да закаже разговор на лицу места и био је незадовољан. Промрмљао је нешто о томе да не прескачеш преко главе.

Дошао. Интервју на лицу места. Пет сати комуникације са различитим људима. Није било ниједно питање о дубоком учењу, нити о машинском учењу у принципу. Пошто не постоји Дубоко учење/Компјутерски вид, онда ме не занима. Дакле, резултати интервјуа су били ортогонални.

Овај регрутер зове и каже - честитам, прошли сте до другог интервјуа на лицу места. Ово је све изненађујуће. Шта је друго на лицу места? Никада нисам чуо за тако нешто. Отишао сам. Постоји неколико сати тамо, овог пута све о традиционалном машинском учењу. Тако је боље. Али још увек није занимљиво.

Регрутер ме зове са честиткама што сам прошао трећи интервју на лицу места и обећава да ће ово бити последњи. Отишао сам да видим и било је и ДЛ и ЦВ.

Имао сам претходника много месеци који ми је рекао да неће бити понуде. Нећу тренирати на техничким вештинама, већ на меким. Не на мекој страни, већ на чињеници да ће позиција бити затворена или да компанија још не запошљава, већ једноставно тестира тржиште и ниво кандидата.

Средином августа. Попио сам пиво у реду. Мрачне мисли. Прошло је 8 месеци и још увек нема понуде. Добро је бити креативан под пивом, посебно ако је креативност чудна. Паде ми на памет идеја. Делим то са Алексејем Швецом, који је у то време био постдоктор на МИТ-у.

Шта ако одеш на најближу ДЛ/ЦВ конференцију, погледаш такмичења која се одржавају у оквиру ње, обучиш нешто и предаш? Пошто сви тамошњи стручњаци на томе граде своје каријере и то раде месецима или чак годинама, немамо шансе. Али није страшно. Дајемо неки садржајан поднесак, летимо до последњег места, а након тога напишемо пре-принт или чланак о томе како нисмо као сви и причамо о својој одлуци. А чланак је већ на ЛинкедИн-у и у вашој биографији.

Односно, чини се да је релевантно и има више тачних кључних речи у животопису, што би требало мало да повећа шансе да дођете до техничког екрана. Код и поднесци од мене, текстови од Алексеја. Игра, наравно, али зашто не?

Не пре речено него учињено. Најближа конференција коју смо тражили била је МИЦЦАИ и тамо су се заправо одржавала такмичења. Погодили смо прву. Било је Анализа гастроинтестиналне слике (ГИАНА). Задатак има 3 подзадатка. До истека рока остало је још 8 дана. Отрезнио сам се ујутро, али нисам одустао од идеје. Узео сам своје цевоводе од Каггле-а и пребацио их са сателитских података на медицинске. 'фит_предицт'. Алексеј је припремио опис решења на две странице за сваки проблем, а ми смо га послали. Спреман. У теорији, можете издахнути. Али испоставило се да постоји још један задатак за исту радионицу (Роботска сегментација инструмената) са три подзадатка и да јој је рок померен за 4 дана, односно ту можемо да урадимо 'фит_предицт' и пошаљемо. То смо и урадили.

За разлику од Каггле-а, ова такмичења су имала своје академске специфичности:

  1. Но Леадербоард. Пријаве се шаљу е-поштом.
  2. Бићете уклоњени ако представник тима не дође да представи решење на конференцији на Радионици.
  3. Ваше место на табели постаје познато тек током конференције. Нека врста академске драме.

Конференција МИЦЦАИ 2017 одржана је у граду Квебек. Да будем искрен, до септембра сам почео да изгарам, па је идеја да узмем недељу дана одмора од посла и кренем у Канаду изгледала занимљиво.

Дошао на конференцију. Дошао сам на ову радионицу, не познајем никога, седим у ћошку. Сви се познају, комуницирају, избацују паметне медицинске речи. Преглед првог конкурса. Учесници говоре и говоре о својим одлукама. Тамо је кул, са сјајем. Мој ред. И некако ме је чак и срамота. Они су решили проблем, радили на њему, унапредили науку, а ми смо чисто „фит_предицт“ из прошлих дешавања, не ради науке, већ да бисмо побољшали наш животопис.

Изашао је и рекао да ни ја нисам стручњак за медицину, извинио се што су губили време и показао ми један слајд са решењем. Сишао сам у ходник.

Најављују први подзадатак – ми смо први, и то са маргином.
Најављују се други и трећи.
Најављују треће – опет прво и опет са вођством.
Генерал је први.

Од физичара до науке о подацима (од мотора науке до канцеларијског планктона). Трећи део

Званично саопштење за јавност.

Неки у публици се смеју и гледају ме са поштовањем. Други, они који су очигледно сматрани стручњацима у тој области, добили су грант за овај задатак и то су радили дуги низ година, имали су мало изобличен израз лица.

Следи други задатак, онај са три подзадатка и који је померен за четири дана унапред.

Овде сам се и ја извинио и поново показао наш један слајд.
Иста прича. Два прва, један други, први заједнички.

Мислим да је ово вероватно први пут у историји да је агенција за наплату победила на такмичењу за медицинско снимање.

И сад стојим на сцени, дају ми некакву диплому и бомбардују ме. Како то може бити? Ови академци троше новац пореских обвезника, раде на поједностављивању и побољшању квалитета рада лекара, односно, у теорији, мог животног века, а неко тело је цело ово академско особље за неколико вечери стргало у британску заставу.

Бонус за ово је то што ће у другим тимовима дипломирани студенти који раде на овим задацима много месеци имати биографију која је привлачна ХР-у, односно лако ће доћи до екрана технологије. А пред мојим очима је недавно примљена е-порука:

A Googler recently referred you for the Research Scientist, Google Brain (United States) role. We carefully reviewed your background and experience and decided not to proceed with your application at this time.

Генерално, одмах са бине питам публику: „Да ли неко зна где радим?“ Један од организатора такмичења је знао - гуглао је шта је ТруеАццорд. Остали нису. Настављам: „Радим за агенцију за наплату, а на послу не радим ни компјутерски вид ни дубоко учење. И на много начина, то се дешава зато што ХР одељења Гоогле Браин и Деепминд филтрирају мој животопис, не дајући ми прилику да покажем техничку обуку. "

Уручили сертификат, пауза. Група академика ме повлачи у страну. Испоставило се да је ово здравствена група са Деепминдом. Били су толико импресионирани да су одмах хтели да разговарају са мном о упражњеном месту истраживача у њиховом тиму. (Разговарали смо. Овај разговор је трајао 6 месеци, прошао сам тест, али сам био прекинут на техничком екрану. 6 месеци од почетка комуникације до техничког екрана је дуго. Дуго чекање даје укус бескорисности.Инжењер истраживања у Деепминд-у у Лондону, у позадини ТруеАццорд-а био је снажан искорак, али на позадини моје тренутне позиције то је искорак. Са дистанце од две године које су прошле од тада, то је добро да није.)

Закључак

Отприлике у исто време, добио сам понуду од Лифта, коју сам прихватио.
На основу резултата ова два конкурса са МИЦЦАИ објављени су:

  1. Аутоматска сегментација инструмента у хирургији уз помоћ робота користећи дубоко учење
  2. Откривање и локализација ангиодисплазије коришћењем дубоких конволуционих неуронских мрежа
  3. Изазов сегментације роботских инструмената 2017

То јест, упркос дивљини идеје, додавање инкременталних чланака и препринта путем конкурса добро функционише. А у наредним годинама смо то учинили још горе.

Од физичара до науке о подацима (од мотора науке до канцеларијског планктона). Трећи део

Радим у Лифту последњих неколико година радећи на рачунарском виду/дубоком учењу за аутомобиле који се самостално возе. Односно, добио сам шта сам хтео. И задаци, и компанија са високим статусом, и јаке колеге, и све друге доброте.

Током ових месеци, имао сам комуникацију са обе велике компаније Гугл, Фејсбук, Убер, ЛинкедИн, и са морем стартупова различитих величина.

Болело је свих ових месеци. Универзум вам сваки дан говори нешто не баш пријатно. Редовно одбацивање, редовно прављење грешака и све то је зачињено упорним осећајем безнађа. Нема гаранција да ћете успети, али постоји осећај да сте будала. Веома подсећа на то како сам покушавао да нађем посао одмах после универзитета.

Мислим да су многи тражили посао у долини и све им је било много лакше. Трик је, по мом мишљењу, у овоме. Ако тражите посао у области у коју се разумете, имате доста искуства, а ваш животопис каже исто, нема проблема. Узео сам и нашао. Пуно је слободних места.

Али ако тражите посао у области која вам је нова, односно када нема знања, нема веза и ваш животопис говори нешто погрешно – у овом тренутку све постаје изузетно занимљиво.

Тренутно ми регрутери редовно пишу и нуде да урадим исто што и сада радим, али у другој компанији. Заиста је време да промените посао. Али нема смисла да радим оно у чему сам већ добар. За шта?

Али за оно што желим, опет немам ни знања ни редова у својој биографији. Да видимо како ће се све ово завршити. Ако све буде како треба, написаћу следећи део. 🙂

Извор: ввв.хабр.цом

Додај коментар