“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

德米特里·卡扎科夫Kolesa Group 數據分析團隊負責人分享了哈薩克首次數據專業人員調查的見解。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?
照片中:德米特里·卡扎科夫

還記得一句流行的說法:大數據最像青少年的性行為——每個人都在談論它,但沒有人知道它是否真的存在。 對於資料專家市場(哈薩克)也可以這樣說 - 有炒作,但背後的人是誰(以及是否有人)並不完全清楚 - 無論是對人力資源部門,還是對經理,還是對資料科學家本身。

我們花費 研究,他們對 300 多名專家進行了調查,以了解他們的薪資、職能、技能、工具等等。

劇透: 是的,它們確實存在,但一切都不那麼簡單。

很好的見解。 首先,資料科學家的數量比我們預期的要多。 我們採訪了 300 人,其中不僅有產品、行銷和 BI 分析師,還有 ML 和 DWH 工程師,這尤其令人高興。 最大的群體包括所有自稱資料科學家的人——佔受訪者的 36%。 很難說這是否滿足了市場的需求,因為市場本身才剛剛形成。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

職位層級的分佈令人困惑——團隊領導和經理幾乎與初級人員一樣多。 這可能有幾個原因。 例如,大量2-3人的小型團隊,其中領導者可以是中高級專家。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

另一個原因可能是目前市場上關於角色和功能分配標準的混亂。 團隊領導有時會被分配給那些比其他人多工作一兩年的人,而不考慮技能和知識水平。 我們從按職位劃分的職能分佈中看到了這一點——38%的經理和團隊負責人從事預處理,另外33%從事基礎統計分析。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

在這裡,我們要求受訪者主觀評估其公司的分析水準。 如果你仔細觀察,你會發現,在 10-2 人的分析部門工作的受訪者中,有 3% 的人認為自己具有「高階水準」。

什麼是“高級”? BI 系統運作良好。 有 DWH 和大數據。 A/B 測試定期進行。 生產中存在可用的 ML 和 DS 系統。 僅根據數據做出決策。 數據處理和數據科學部門是公司的重點部門之一。

一個2-3人的部門幾乎不可能實現上述所有目標。 我認為這個調查結果是一個輕微的成長煩惱——這些傢伙還沒有任何人可以比較自己,以便更客觀地確定他們的水平。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

正如預期的那樣,資料科學家大部分時間不是花在超級複雜的數學或工程上,而是花在預處理、下載和清理資料上。 在每個專業中,我們都看到預處理位於前 3 名。 但我們很少看到開發 ML 模型或使用大數據等複雜的事情排在前 3 名中——僅在 ML 和 DWH 工程師中出現。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

還有一些令人悲傷的見解。 專家們自己設定了 40% 的任務。 在哈薩克,到目前為止,只有頂尖的獨角獸公司嘗試過使用大數據的好處,並學會如何勝任。 他們向市場宣傳大數據和機器學習很酷,第二梯隊緊隨其後,但他們並不總是了解如何處理數據。 因此,我們看到專家為自己設定任務,而企業並不總是知道他們想要什麼。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

讓我驚訝的是,20% 的專家甚至不知道他們的公司是否有資料倉儲。 是的,資料庫管理系統並不是一切都那麼好 - 41% 使用 MySQL,另外 34% 使用 PostgreSQL。 這意味著什麼? 他們更傾向於處理小數據。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

在儲存系統的問題中,我們再次看到MySQL,甚至(!)Excel。 但這可能表明,大多數公司根本還沒有使用大數據的請求。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

這裡一切又變得模稜兩可了。 整體來說,薪水比我預期的要低。

“是的,它們存在!” 哈薩克的數據科學專家做什麼的?他們賺多少錢?

就我個人而言,我很難想像一個 ML 工程師願意為 200 萬堅戈工作——他可能是實習生。 要不是這些專家的能力非常薄弱,就是企業仍然很難充分評估數據科學的工作。 但這或許也顯示市場仍處於成熟的初期。 隨著時間的推移,薪資水平將建立在更充足的水平上。

來源: www.habr.com

添加評論