“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Dmitry Kazakov, Arweinydd Tîm Dadansoddi Data yn Kolesa Group, yn rhannu mewnwelediadau o arolwg cyntaf Kazakhstan o weithwyr proffesiynol data.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?
Yn y llun: Dmitry Kazakov

Cofiwch yr ymadrodd poblogaidd bod Data Mawr yn fwyaf tebyg i ryw yn eu harddegau - mae pawb yn siarad amdano, ond does neb yn gwybod a yw'n bodoli mewn gwirionedd. Gellid dweud yr un peth am y farchnad ar gyfer arbenigwyr data (yn Kazakhstan) - mae hype, ond nid oedd pwy sydd y tu ôl iddo (ac a oes unrhyw un yno o gwbl) yn gwbl glir - nid i AD, nac i reolwyr, nac i y gwyddonwyr data eu hunain.

Treuliasom ymchwil, lle buont yn arolygu mwy na 300 o arbenigwyr am eu cyflogau, swyddogaethau, sgiliau, offer a llawer mwy.

Spoiler: Ydyn, maent yn bendant yn bodoli, ond nid yw popeth mor syml.

Mewnwelediad braf. Yn gyntaf, mae mwy o wyddonwyr data na'r disgwyl. Llwyddom i gyfweld 300 o bobl, ac yn eu plith roedd nid yn unig ddadansoddwyr cynnyrch, marchnata a BI, ond hefyd peirianwyr ML a DWH, a oedd yn arbennig o braf. Roedd y grŵp mwyaf yn cynnwys pawb sy’n galw eu hunain yn wyddonwyr data – sef 36% o’r ymatebwyr. Mae'n anodd dweud a yw hyn yn cwmpasu galw'r farchnad ai peidio, oherwydd mae'r farchnad ei hun newydd gael ei ffurfio.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Mae dosbarthiad lefelau swyddi yn ddryslyd - mae bron cymaint o arweinwyr tîm a rheolwyr â rhai iau. Gall fod sawl rheswm am hyn. Er enghraifft, mae nifer fawr o dimau bach o 2-3 o bobl, lle gall yr arweinydd fod yn arbenigwr lefel ganol neu uwch.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Rheswm arall efallai yw'r anhrefn sy'n teyrnasu ar hyn o bryd yn y farchnad o ran safonau dosbarthu rolau a swyddogaethau. Weithiau mae arweinwyr tîm yn cael eu neilltuo i'r rhai sy'n gweithio blwyddyn neu ddwy yn hirach nag eraill, heb gyfeirio at lefel y sgiliau a'r wybodaeth. Gwelwn hyn wrth ddosbarthu swyddogaethau yn ôl safle - mae 38% o reolwyr ac arweinwyr tîm yn cymryd rhan mewn rhag-brosesu a 33% arall mewn dadansoddiad ystadegol sylfaenol.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Yma gofynnwyd i ymatebwyr asesu lefel y dadansoddeg yn eu cwmnïau yn oddrychol. Os edrychwch yn ofalus, gallwch weld bod 10% o ymatebwyr sy’n gweithio mewn adrannau dadansoddeg o 2-3 o bobl yn credu bod ganddyn nhw “lefel uwch.”

Beth yw “lefel uwch”? Mae'r system BI yn gweithio'n wych. Mae DWH a Data Mawr. Cynhelir profion A/B yn rheolaidd. Mae systemau ML a DS gweithredol wrth gynhyrchu. Gwneir penderfyniadau ar sail data yn unig. Mae'r adran prosesu data a gwyddor data yn un o'r rhai allweddol yn y cwmni.

Mae bron yn amhosibl cyflawni pob un o'r uchod gydag adran o 2-3 o bobl. Rwy’n meddwl bod canlyniad yr arolwg hwn yn boen sy’n cynyddu ychydig - nid oes gan y dynion eto neb i gymharu eu hunain ag ef er mwyn pennu eu lefel yn fwy gwrthrychol.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Yn ôl y disgwyl, mae gwyddonwyr data yn treulio'r rhan fwyaf o'u hamser nid ar fathemateg neu beirianneg hynod gymhleth, ond ar ragbrosesu, lawrlwytho a glanhau data. Ym mhob arbenigedd gwelwn ragbrosesu yn y 3 uchaf. Ond anaml y byddwn yn gweld pethau cymhleth fel datblygu modelau ML neu weithio gyda Data Mawr yn y 3 uchaf - dim ond ymhlith peirianwyr ML a DWH.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Mae yna hefyd un neu ddau o fewnwelediadau trist. Mae arbenigwyr yn gosod 40% o'u tasgau eu hunain. Yn Kazakhstan, hyd yn hyn dim ond y cwmnïau unicorn gorau sydd wedi rhoi cynnig ar fuddion gweithio gyda data mawr ac wedi dysgu sut i'w wneud yn gymwys. Maent yn darlledu i'r farchnad bod Data Mawr a Machine Learning yn cŵl, ac mae'r ail echelon yn dilyn y tu ôl, ond nid yw bob amser yn deall sut mae gweithio gyda data yn gweithio. Felly, gwelwn fod arbenigwyr yn gosod tasgau iddynt eu hunain, ac nid yw busnesau bob amser yn gwybod beth sydd ei eisiau arnynt.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Cefais fy synnu nad yw 20% o arbenigwyr hyd yn oed yn gwybod a oes gan eu cwmni Warws Data. Ydy, a gyda systemau rheoli cronfa ddata nid yw popeth cystal - mae 41% yn defnyddio MySQL, a 34% arall yn defnyddio PostgreSQL. Beth allai hyn ei olygu? Maent yn gweithio yn hytrach gyda data bach.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Yn y cwestiwn am systemau storio, rydym eto'n gweld MySQL a hyd yn oed (!) Excel. Ond gall hyn ddangos, er enghraifft, nad oes gan y rhan fwyaf o gwmnïau gais eto i weithio gyda data mawr.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Yma mae popeth eto'n amwys. Yn gyffredinol, roedd cyflogau ychydig yn is na'r disgwyl.

“Ie, maen nhw'n bodoli!” Beth mae arbenigwyr Gwyddor Data yn Kazakhstan yn ei wneud a faint maen nhw'n ei ennill?

Yn bersonol, mae'n anodd i mi ddychmygu peiriannydd ML sy'n barod i weithio am 200 mil tenge - mae'n debyg ei fod yn intern. Naill ai mae cymwyseddau arbenigwyr o'r fath yn wan iawn, neu mae'n dal yn anodd i gwmnïau werthuso gwaith Gwyddor Data yn ddigonol. Ond efallai bod hyn hefyd yn dangos bod y farchnad yn dal i fod ar ddechrau ei aeddfedrwydd. A thros amser, bydd lefel y cyflogau yn cael ei sefydlu ar lefel fwy digonol.

Ffynhonnell: hab.com

Ychwanegu sylw