Dmitrijus Kazakovas, Data Analytics Team Lead в Kolesa Group, делится инсайтами из первого казахстанского опроса специалистов по работе с данными.
Nuotraukoje: Dmitrijus Kazakovas
Помните популярную фразу о том, что Big Data больше всего напоминает подростковый секс – все о нем говорят, но никто не знает, есть ли он на самом деле. То же самое можно было сказать и о рынке специалистов по работе с данными (в Казахстане) – хайп есть, а кто за ним стоит (и есть ли там вообще хоть кто-то), не было до конца понятно – ни эйчарам, ни менеджерам, ни самим дата-сайентистам.
Mes leidžiame
Spoileris: Taip, jie tikrai egzistuoja, bet viskas nėra taip paprasta.
Puiki įžvalga. Во-первых, специалистов по работе с данными больше чем мы ожидали. Нам удалось опросить 300 человек, среди которых есть не только product-, marketing- и BI-аналитики, но и ML-, DWH-инженеры, что особенно порадовало. В самой большой группе оказались все те, кто называет себя дата-сайентистами – это 36% опрошенных. Покрывает это запрос рынка или нет, сказать сложно, потому что сам рынок только формируется.
Смущает распределение уровней должности – тимлидов и руководителей почти столько же, сколько джунов. Причин тому может быть несколько. Например, большое количество маленьких команд по 2-3 человека, в которых руководителем может быть специалист уровня миддла или сениора.
Kita priežastis gali būti šiuo metu rinkoje vyraujantis chaosas dėl vaidmenų ir funkcionalumo pasiskirstymo standartų. Komandos vadovai kartais skiriami tiems, kurie tiesiog dirba metais ar dvejais ilgiau nei kiti, neatsižvelgiant į įgūdžių ir žinių lygį. Tai matome funkcijų pasiskirstyme pagal pareigas – 38% vadovų ir komandų vadovų užsiima išankstiniu apdorojimu ir dar 33% pagrindine statistine analize.
Здесь мы попросили респондентов субъективно оценить уровень аналитики в их компаниях. Если присмотреться, можно увидеть, что 10% респондентов, которые работают в отделах аналитики из 2-3 человек, считают что у них “продвинутый уровень”.
Kas yra „pažengęs lygis“? BI-система работает отлично. Есть DWH и Big Data. Регулярно проводятся A/B-тесты. Есть работающие системы ML и DS в production. Решения принимаются только по данным. Отдел работы с данными и Data Science – один из ключевых в компании.
Всего перечисленного практически невозможно добиться отделом из 2-3 человек. Считаю, что такой результат опроса – это небольшая болезнь роста – ребятам пока не с кем себя сравнивать, чтобы определить свой уровень более объективно.
Kaip ir tikėtasi, duomenų mokslininkai didžiąją laiko dalį praleidžia ne itin sudėtingai matematikai ar inžinerijai, o išankstiniam duomenų apdorojimui, atsisiuntimui ir valymui. Kiekvienoje specializacijoje pirminis apdorojimas yra 3 geriausiųjų. Tačiau retai matome sudėtingus dalykus, tokius kaip ML modelių kūrimas ar darbas su dideliais duomenimis tarp geriausių 3 – tik tarp ML ir DWH inžinierių.
Yra ir pora liūdnų įžvalgų. Ekspertai patys nustato 40% savo užduočių. Kazachstane iki šiol tik geriausios vienaragių kompanijos išbandė darbo su dideliais duomenimis pranašumus ir išmoko tai daryti kompetentingai. Jie rinkai transliuoja, kad Big Data ir Machine Learning yra šaunūs, o antrasis ešelonas seka iš paskos, bet ne visada supranta, kaip veikia darbas su duomenimis. Todėl matome, kad specialistai kelia sau užduotis, o verslas ne visada žino, ko nori.
Удивило, что 20% специалистов вообще не знают, есть ли в их компании Data Warehouse. Да, и с системами управления базами данных не все так хорошо – 41% используют MySQL, а еще 34% – PostgreSQL. О чем это может говорить? Они работают скорее со small data.
В вопросе про системы хранения мы снова видим MySQL и даже (!) Excel. Но это может говорить, например, о том, что у большинства компаний просто-напросто еще нет запроса на работу с большими данными.
Здесь все снова неоднозначно. В целом зарплаты оказались чуть ниже, чем я ожидал.
Asmeniškai man sunku įsivaizduoti ML inžinierių, kuris būtų pasirengęs dirbti už 200 tūkstančių tengių - jis tikriausiai yra praktikantas. Arba tokių specialistų kompetencijos labai silpnos, arba įmonėms dar sunku adekvačiai įvertinti „Data Science“ darbą. Bet galbūt tai taip pat rodo, kad rinka vis dar yra savo brendimo pradžioje. Ir laikui bėgant atlyginimų lygis bus nustatytas tinkamesniu lygiu.
Šaltinis: www.habr.com