"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Dmitry Kazakov, Teymisstjóri gagnagreiningar hjá Kolesa Group, deilir innsýn úr fyrstu könnuninni í Kasakstan meðal gagnasérfræðinga.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?
Á mynd: Dmitry Kazakov

Mundu eftir vinsælu setningunni að Big Data líkist mest unglingakynlífi - allir tala um það, en enginn veit hvort það sé til í raun og veru. Hið sama mætti ​​segja um markaðinn fyrir gagnasérfræðinga (í Kasakstan) - það er efla, en hver stendur á bak við hann (og hvort það sé einhver þarna) var ekki alveg ljóst - hvorki fyrir HR, né stjórnendum, né heldur gagnafræðingarnir sjálfir.

Við eyddum rannsókn, þar sem þeir könnuðu meira en 300 sérfræðinga um laun þeirra, störf, færni, verkfæri og margt fleira.

Vindskeið: Já, þeir eru örugglega til, en allt er ekki svo einfalt.

Fín innsýn. Í fyrsta lagi eru fleiri gagnafræðingar en við bjuggumst við. Við náðum að taka viðtöl við 300 manns, þar á meðal voru ekki bara vöru-, markaðs- og BI sérfræðingar, heldur einnig ML og DWH verkfræðinga, sem var sérstaklega ánægjulegt. Stærsti hópurinn innihélt alla sem kalla sig gagnafræðinga - það eru 36% svarenda. Það er erfitt að segja til um hvort þetta dekki eftirspurn markaðarins eða ekki, því markaðurinn sjálfur er bara að myndast.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Dreifing starfsstiga er ruglingsleg - það eru næstum jafn margir hópstjórar og stjórnendur og yngri. Það geta verið nokkrar ástæður fyrir þessu. Til dæmis, mikill fjöldi lítilla teyma, 2-3 manna, þar sem leiðtoginn getur verið sérfræðingur á miðju eða eldri stigi.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Önnur ástæða getur verið sú ringulreið sem nú ríkir á markaðnum varðandi staðla í hlutverkaskiptingu og virkni. Stundum er teymi úthlutað þeim sem vinna einfaldlega einu eða tveimur árum lengur en aðrir, án þess að vísa til færni- og þekkingarstigs. Við sjáum þetta í dreifingu aðgerða eftir stöðu - 38% stjórnenda og teymisstjóra stunda forvinnslu og önnur 33% í grunntölfræðilegri greiningu.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Hér báðum við svarendur að meta huglægt hversu greiningarstigið er í fyrirtækjum sínum. Ef þú skoðar vel geturðu séð að 10% svarenda sem vinna í greiningardeildum 2-3 manna telja að þeir séu með „háþróað stig“.

Hvað er „háþróað stig“? BI kerfið virkar frábærlega. Það er DWH og Big Data. A/B próf eru gerð reglulega. Það eru starfandi ML og DS kerfi í framleiðslu. Ákvarðanir eru aðeins teknar á grundvelli gagna. Gagnavinnsla og gagnafræðideild er ein af lykildeildum fyrirtækisins.

Það er nánast ómögulegt að ná öllu ofangreindu með 2-3 manna deild. Ég held að þessi könnunarniðurstaða sé smávægilegur vaxtarverkur - strákarnir hafa ekki ennþá neinn til að bera sig saman við til að ákvarða stig þeirra á hlutlægari hátt.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Eins og við var að búast eyða gagnafræðingar mestum tíma sínum ekki í ofurflókna stærðfræði eða verkfræði, heldur í forvinnslu, niðurhal og hreinsun gagna. Í hverri sérhæfingu sjáum við forvinnslu í efstu 3. En við sjáum sjaldan flókna hluti eins og að þróa ML módel eða vinna með Big Data í topp 3 - aðeins meðal ML og DWH verkfræðinga.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Það eru líka nokkrar sorglegar innsýn. Sérfræðingar setja 40% af verkefnum sínum sjálfir. Í Kasakstan hafa hingað til aðeins efstu einhyrningsfyrirtæki reynt kosti þess að vinna með stór gögn og lært hvernig á að gera það á hæfileikaríkan hátt. Þeir senda út á markaðinn að Big Data og Machine Learning séu flott og annað þrep fylgir á eftir, en skilur ekki alltaf hvernig vinna með gögn virkar. Þess vegna sjáum við að sérfræðingar setja verkefni fyrir sig og fyrirtæki vita ekki alltaf hvað þeir vilja.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Það kom mér á óvart að 20% sérfræðinga vita ekki einu sinni hvort fyrirtæki þeirra sé með gagnavöruhús. Já, og með gagnagrunnsstjórnunarkerfi er ekki allt svo gott - 41% nota MySQL og önnur 34% nota PostgreSQL. Hvað gæti þetta þýtt? Þeir vinna frekar með lítil gögn.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Í spurningunni um geymslukerfi sjáum við aftur MySQL og jafnvel (!) Excel. En þetta gæti til dæmis bent til þess að flest fyrirtæki hafi einfaldlega ekki enn þá beiðni um að vinna með stór gögn.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Hér er allt aftur óljóst. Almennt séð voru launin aðeins lægri en ég bjóst við.

"Já, þeir eru til!" Hvað gera gagnavísindasérfræðingar í Kasakstan og hversu mikið vinna þeir sér inn?

Persónulega er erfitt fyrir mig að ímynda mér ML verkfræðing sem er tilbúinn að vinna fyrir 200 þúsund tenge - hann er líklega nemi. Annað hvort er hæfni slíkra sérfræðinga mjög veik eða það er enn erfitt fyrir fyrirtæki að leggja nægjanlega mat á störf Data Science. En kannski bendir þetta líka til þess að markaðurinn sé enn í byrjun þroska. Og með tímanum verður launastigi komið á viðunandi stigi.

Heimild: www.habr.com

Bæta við athugasemd