「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

ドミトリー・カザコフ、Kolesa Group のデータ分析チーム リードは、データ専門家を対象としたカザフスタンの最初の調査からの洞察を共有しています。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?
写真内:ドミトリー・カザコフ

ビッグデータは十代のセックスに最も似ているという有名なフレーズを思い出してください。誰もがそれについて話しますが、それが実際に存在するかどうかは誰も知りません。 同じことが(カザフスタンの)データスペシャリストの市場についても言えます。誇大広告はありますが、その背後に誰がいるのか(そもそもそこに誰かがいるのかどうか)は完全には明らかではありませんでした。人事にも、管理者にも、管理者にもデータサイエンティスト自身です。

過ごした 調査では、300 人以上のスペシャリストを対象に、給与、職務、スキル、ツールなどについて調査しました。

ネタバレ: はい、それらは確かに存在しますが、すべてがそれほど単純ではありません。

素晴らしい洞察力。 まず、データサイエンティストの数が予想よりも多かったということです。 300 名にインタビューすることができました。その中には製品、マーケティング、BI アナリストだけでなく、ML や DWH エンジニアも含まれており、特に満足のいく結果でした。 最大のグループには、データサイエンティストを自称するすべての人々が含まれており、回答者の 36% に相当します。 市場自体が形成されつつあるため、これが市場の需要をカバーしているかどうかを判断するのは困難です。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

職務レベルの分布は複雑で、チームリーダーやマネージャーの数もジュニアとほぼ同じ数です。 これにはいくつかの理由が考えられます。 たとえば、リーダーが中級または上級レベルのスペシャリストである場合がある、2 ~ 3 人からなる多数の小規模チームです。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

もう 38 つの理由は、役割と機能の配分における標準に関して現在市場に蔓延している混乱にあると考えられます。 チームのリーダーは、スキルや知識のレベルに関係なく、単に他の人より 33 ~ XNUMX 年長く働いた人に割り当てられることがあります。 このことは、役職別の職務の分布からもわかります。マネージャーとチーム リーダーの XNUMX% が前処理に従事し、さらに XNUMX% が基本的な統計分析に従事しています。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

ここでは、回答者に自社の分析レベルを主観的に評価するよう依頼しました。 よく見ると、10 ~ 2 人の分析部門で働いている回答者の 3% が、自分には「上級レベル」があると考えていることがわかります。

「上級レベル」とは何ですか? BI システムは非常にうまく機能しています。 DWHとビッグデータがあります。 A/Bテストは定期的に実施されます。 実稼働環境では ML および DS システムが稼働しています。 意思決定はデータにのみ基づいて行われます。 データ処理およびデータ サイエンス部門は、社内の重要な部門の XNUMX つです。

上記のすべてを 2 ~ 3 人の部門で達成することはほぼ不可能です。 この調査結果は、ちょっとした成長痛だと思います。彼らには、自分のレベルをより客観的に判断するために比較する相手がまだいません。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

予想通り、データ サイエンティストは、非常に複雑な数学やエンジニアリングではなく、データの前処理、ダウンロード、クリーニングにほとんどの時間を費やしています。 どの専門分野でも、前処理が上位 3 位に入っています。 しかし、ML モデルの開発やビッグ データの操作などの複雑なものがトップ 3 に入っているのは、ML および DWH エンジニアの間でのみ見られることはほとんどありません。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

悲しい洞察もいくつかあります。 専門家は自分のタスクの 40% を自分で設定します。 カザフスタンでは、これまでトップユニコーン企業だけがビッグデータの活用の利点を試し、それを適切に行う方法を学んでいました。 彼らはビッグデータと機械学習が優れていることを市場に宣伝し、第 XNUMX 階層もそれに続きますが、データの操作がどのように機能するかを必ずしも理解しているわけではありません。 したがって、専門家が自分でタスクを設定し、企業が自分たちが何を望んでいるのかを必ずしも知っているわけではないことがわかります。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

スペシャリストの 20% が自分の会社にデータ ウェアハウスがあるかどうかさえ知らないことに驚きました。 はい、データベース管理システムに関しては、すべてがそれほど良いわけではありません。41% が MySQL を使用し、さらに 34% が PostgreSQL を使用しています。 これは何を意味するでしょうか? どちらかというと小さなデータを扱います。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

ストレージ システムに関する質問では、MySQL や (!) Excel も登場します。 しかしこれは、たとえば、ほとんどの企業がビッグデータを扱う要求をまだ持っていないことを示している可能性があります。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

ここでまたすべてが曖昧になります。 全体的に給与は思っていたより若干低かったです。

「はい、存在します!」 カザフスタンのデータ サイエンス スペシャリストは何をしており、どれくらい稼いでいますか?

個人的には、200 万テンゲで働く準備ができている ML エンジニアを想像するのは困難です。おそらくインターンでしょう。 そのような専門家の能力が非常に弱いか、企業がデータ サイエンスの仕事を適切に評価することが依然として難しいかのどちらかです。 しかしこれはおそらく、市場がまだ成熟の初期段階にあることを示しているのかもしれません。 そして時間の経過とともに、給与水準はより適切な水準に確立されるでしょう。

出所: habr.com

コメントを追加します