Dmitri Kazakov, Data Analytics Team Lead in Kolesa Group, sparte insights from the first Kazakhstan survey of data professionals.
In a photo: Dmitry Kazakov
Ricurdativi di a frasa populari chì Big Data hè più cum'è u sessu di l'adulescente - tutti ne parlanu, ma nimu sapi s'ellu esiste veramente. U stessu puderia esse dettu di u mercatu per i specialisti di dati (in Kazakistan) - ci hè un hype, ma quale hè daretu à questu (è s'ellu ci hè qualcunu quì) ùn era micca cumplettamente chjaru - nè à HR, nè à i gestori, nè à i scientifichi di dati stessi.
Avemu passatu
Spoiler: Iè, certamenti esistenu, ma tuttu ùn hè micca cusì simplice.
Bella insight. Prima, ci sò più scientisti di dati di ciò chì avemu aspittatu. Avemu riesciutu à entrevista 300 persone, trà quale ùn eranu micca solu analisti di produttu, marketing è BI, ma ancu ingegneri ML è DWH, chì era particularmente piacevule. U gruppu più grande includenu tutti quelli chì si chjamanu scientisti di dati - questu hè u 36% di i rispondenti. Hè difficiuli di dì chì questu copre a dumanda di u mercatu o micca, perchè u mercatu stessu hè solu esse furmatu.
A distribuzione di i livelli di travagliu hè cunfusa - ci sò quasi tanti capi di squadra è managers quant'è juniors. Ci pò esse parechje ragioni per questu. Per esempiu, un gran numaru di picculi squadre di 2-3 persone, in quale u capu pò esse un specialistu di livellu mediu o senior.
Un altru mutivu pò esse u caosu attualmente regnu in u mercatu in quantu à i normi in a distribuzione di roli è funziunalità. I capi di squadra sò qualchì volta attribuiti à quelli chì simpricimenti travaglianu un annu o dui più di l'altri, senza riferimentu à u livellu di cumpetenze è cunniscenze. Videmu questu in a distribuzione di e funzioni per pusizioni - 38% di i dirigenti è i capi di squadra sò impegnati in pre-processazione è un altru 33% in l'analisi statistiche basica.
Quì avemu dumandatu à i rispondenti per valutà subjectively u livellu di analitiche in i so cumpagnie. Se guardate attentamente, pudete vede chì u 10% di i rispondenti chì travaglianu in dipartimenti analitici di 2-3 persone crede chì anu un "livellu avanzatu".
Cosa hè "livellu avanzatu"? U sistema BI funziona bè. Ci hè DWH è Big Data. I testi A/B sò realizati regularmente. Ci sò sistemi ML è DS chì travaglianu in produzzione. E decisioni sò prese solu nantu à e dati. U dipartimentu di trattamentu di dati è scienza di dati hè unu di i chjave in a cumpagnia.
Hè quasi impussibile di ottene tutte e cose sopra cù un dipartimentu di 2-3 persone. Pensu chì u risultatu di l'inchiesta hè un ligeru dulore crescente - i picciotti ùn anu ancu à nimu per paragunà si per determinà u so livellu più obiettivu.
Comu s'aspittava, i scientisti di dati passanu a maiò parte di u so tempu micca in matematica super cumplessa o ingegneria, ma in preprocessing, downloading, and cleaning data. In ogni specializazione vedemu preprocessing in u top 3. Ma raramente vedemu cose cumplesse cum'è sviluppà mudelli ML o travaglià cù Big Data in u top 3 - solu trà ingegneri ML è DWH.
Ci hè ancu un paru di insights tristi. I sperti stabiliscenu 40% di i so compiti stessi. In u Kazakistan, finu à avà, solu l'imprese di l'unicornu anu pruvatu i benefizii di travaglià cù big data è hà amparatu cumu fà cumpetente. Trasmettenu à u mercatu chì Big Data è Machine Learning sò cool, è u sicondu echelon seguita, ma ùn capisce micca sempre cumu travaglià cù dati. Dunque, vedemu chì i spezialisti stabiliscenu e so attività per elli, è l'imprese ùn sanu micca sempre ciò chì volenu.
Eru surprised chì u 20% di i specialisti ùn sanu mancu se a so cumpagnia hà un Data Warehouse. Iè, è cù sistemi di gestione di basa di dati micca tuttu hè cusì bonu - 41% usa MySQL, è un altru 34% usa PostgreSQL. Chì puderia significà questu? U travagliu piuttostu cù picculi dati.
In a quistione nantu à i sistemi di almacenamentu, avemu vistu novu MySQL è ancu (!) Excel. Ma questu pò indicà, per esempiu, chì a maiò parte di e cumpagnie simpricimenti ùn anu micca ancu una dumanda di travaglià cù big data.
Quì tuttu hè torna ambiguu. In generale, i salarii eranu ligeramente più bassi di ciò chì m'aspittava.
In modu persunale, hè difficiule per mè imaginate un ingegnere ML chì hè prontu à travaglià per 200 mila tenge - hè probabilmente un internu. O e cumpetenze di tali specialisti sò assai debuli, o hè sempre difficiule per l'imprese per valutà bè u travagliu di Data Science. Ma forsi questu indica ancu chì u mercatu hè sempre à u principiu di a so maturazione. È cù u tempu, u livellu di i salarii serà stabilitu à un livellu più adattatu.
Source: www.habr.com