Dmitri Kazakof, Data Analytics-spanleier by Kolesa Group, deel insigte uit die eerste Kazakhstan-opname van data-professionele persone.
Op die foto: Dmitri Kazakov
Onthou die gewilde frase dat Big Data die meeste soos tienerseks is – almal praat daaroor, maar niemand weet of dit werklik bestaan nie. Dieselfde kan gesê word oor die mark vir dataspesialiste (in Kazakstan) - daar is 'n hype, maar wie daaragter sit (en of daar enigsins iemand daar is) was nie heeltemal duidelik nie - nóg vir HR, nóg vir bestuurders, nóg vir die datawetenskaplikes self.
Ons spandeer
Bederf: Ja, hulle bestaan beslis, maar alles is nie so eenvoudig nie.
Lekker insig. Eerstens is daar meer datawetenskaplikes as wat ons verwag het. Ons het daarin geslaag om onderhoude te voer met 300 mense, onder wie nie net produk-, bemarkings- en BI-ontleders nie, maar ook ML- en DWH-ingenieurs, wat veral aangenaam was. Die grootste groep het almal ingesluit wat hulself datawetenskaplikes noem - dit is 36% van die respondente. Dit is moeilik om te sê of dit die mark se vraag dek of nie, want die mark self word net gevorm.
Die verspreiding van posvlakke is verwarrend – daar is amper net soveel spanleiers en bestuurders as juniors. Daar kan verskeie redes hiervoor wees. Byvoorbeeld, 'n groot aantal klein spanne van 2-3 mense, waarin die leier 'n middel- of seniorvlakspesialis kan wees.
Nog 'n rede kan die chaos wees wat tans in die mark heers oor standaarde in die verdeling van rolle en funksionaliteit. Spanleiers word soms toegeken aan diegene wat bloot 'n jaar of twee langer as ander werk, sonder verwysing na die vlak van vaardighede en kennis. Ons sien dit in die verspreiding van funksies volgens posisie - 38% van bestuurders en spanleiers is besig met voorafverwerking en nog 33% met basiese statistiese ontleding.
Hier het ons respondente gevra om die vlak van analise in hul maatskappye subjektief te assesseer. As jy mooi kyk, kan jy sien dat 10% van die respondente wat in ontledingsafdelings van 2-3 mense werk, glo dat hulle 'n "gevorderde vlak" het.
Wat is "gevorderde vlak"? Die BI-stelsel werk uitstekend. Daar is DWH en Big Data. A/B-toetse word gereeld uitgevoer. Daar is werkende ML- en DS-stelsels in produksie. Besluite word slegs op grond van data geneem. Die departement dataverwerking en datawetenskap is een van die sleutels in die maatskappy.
Dit is amper onmoontlik om al die bogenoemde te bereik met 'n departement van 2-3 mense. Ek dink dat hierdie opname-resultaat 'n effense groeipyn is - die ouens het nog nie iemand om hulself mee te vergelyk om hul peil meer objektief te bepaal nie.
Soos verwag, bestee datawetenskaplikes die meeste van hul tyd nie aan superkomplekse wiskunde of ingenieurswese nie, maar aan voorafverwerking, aflaai en skoonmaak van data. In elke spesialisasie sien ons voorverwerking in die top 3. Maar ons sien selde komplekse dinge soos die ontwikkeling van ML-modelle of werk met Big Data in die top 3 – net onder ML- en DWH-ingenieurs.
Daar is ook 'n paar hartseer insigte. Kenners stel 40% van hul take self op. In Kazakstan het tot dusver net top eenhoornmaatskappye die voordele van werk met groot data probeer en geleer hoe om dit bekwaam te doen. Hulle het aan die mark uitgesaai dat Big Data en Machine Learning cool is, en die tweede rang volg agter, maar verstaan nie altyd hoe werk met data werk nie. Daarom sien ons dat spesialiste vir hulself take stel, en besighede weet nie altyd wat hulle wil hê nie.
Ek was verbaas dat 20% van spesialiste nie eens weet of hul maatskappy 'n Data Warehouse het nie. Ja, en met databasisbestuurstelsels is nie alles so goed nie – 41% gebruik MySQL, en nog 34% gebruik PostgreSQL. Wat kan dit beteken? Hulle werk eerder met klein data.
In die vraag oor bergingstelsels sien ons weer MySQL en selfs (!) Excel. Maar dit kan byvoorbeeld daarop dui dat die meeste maatskappye eenvoudig nog nie 'n versoek het om met groot data te werk nie.
Hier is alles weer dubbelsinnig. Oor die algemeen was salarisse effens laer as wat ek verwag het.
Persoonlik is dit vir my moeilik om 'n ML-ingenieur voor te stel wat gereed is om vir 200 duisend tenge te werk - hy is waarskynlik 'n intern. Óf die bevoegdhede van sulke spesialiste is baie swak, óf dit is steeds moeilik vir maatskappye om die werk van Data Science voldoende te evalueer. Maar miskien dui dit ook daarop dat die mark nog heel aan die begin van sy rypwording is. En mettertyd sal die vlak van salarisse op 'n meer toereikende vlak vasgestel word.
Bron: will.com