“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Dmitry Kazakov, Ketua Pasukan Analitis Data di Kolesa Group, berkongsi pandangan daripada tinjauan pertama Kazakhstan mengenai profesional data.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?
Dalam foto: Dmitry Kazakov

Ingat frasa popular bahawa Big Data adalah seperti seks remaja - semua orang bercakap mengenainya, tetapi tiada siapa yang tahu sama ada ia benar-benar wujud. Perkara yang sama boleh dikatakan mengenai pasaran untuk pakar data (di Kazakhstan) - terdapat gembar-gembur, tetapi siapa di belakangnya (dan sama ada terdapat sesiapa di sana sama sekali) tidak jelas sepenuhnya - tidak kepada HR, mahupun pengurus, mahupun kepada saintis data itu sendiri.

Kami belanjakan belajar, di mana mereka meninjau lebih daripada 300 pakar tentang gaji, fungsi, kemahiran, alatan dan banyak lagi mereka.

Spoiler: Ya, mereka pasti wujud, tetapi semuanya tidak begitu mudah.

Wawasan yang bagus. Pertama, terdapat lebih ramai saintis data daripada yang kami jangkakan. Kami berjaya menemu bual 300 orang, antaranya bukan sahaja penganalisis produk, pemasaran dan BI, tetapi juga jurutera ML dan DWH, yang amat menggembirakan. Kumpulan terbesar termasuk semua mereka yang menggelar diri mereka saintis data - iaitu 36% daripada responden. Sukar untuk mengatakan sama ada ini meliputi permintaan pasaran atau tidak, kerana pasaran itu sendiri baru dibentuk.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Pengagihan tahap pekerjaan mengelirukan - terdapat hampir sama ramai ketua pasukan dan pengurus sebagai junior. Mungkin terdapat beberapa sebab untuk ini. Sebagai contoh, sebilangan besar pasukan kecil 2-3 orang, di mana ketua boleh menjadi pakar peringkat pertengahan atau kanan.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Sebab lain mungkin adalah huru-hara yang sedang berlaku di pasaran mengenai piawaian dalam pengagihan peranan dan fungsi. Ketua pasukan kadangkala diberikan kepada mereka yang hanya bekerja satu atau dua tahun lebih lama daripada yang lain, tanpa merujuk kepada tahap kemahiran dan pengetahuan. Kami melihat ini dalam pengagihan fungsi mengikut kedudukan - 38% pengurus dan ketua pasukan terlibat dalam pra-pemprosesan dan 33% lagi dalam analisis statistik asas.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Di sini kami meminta responden menilai secara subjektif tahap analisis dalam syarikat mereka. Jika anda melihat dengan teliti, anda dapat melihat bahawa 10% daripada responden yang bekerja di bahagian analitik dengan 2-3 orang percaya bahawa mereka mempunyai "tahap lanjutan".

Apakah "tahap lanjutan"? Sistem BI berfungsi dengan baik. Terdapat DWH dan Data Besar. Ujian A/B dijalankan secara berkala. Terdapat sistem ML dan DS yang berfungsi dalam pengeluaran. Keputusan dibuat hanya berdasarkan data. Jabatan pemprosesan data dan sains data adalah salah satu yang penting dalam syarikat.

Hampir mustahil untuk mencapai semua perkara di atas dengan jabatan 2-3 orang. Saya berpendapat bahawa hasil tinjauan ini adalah sedikit kesakitan - mereka belum mempunyai sesiapa untuk membandingkan diri mereka untuk menentukan tahap mereka dengan lebih objektif.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Seperti yang dijangka, saintis data menghabiskan sebahagian besar masa mereka bukan untuk matematik atau kejuruteraan yang sangat kompleks, tetapi untuk prapemprosesan, memuat turun dan membersihkan data. Dalam setiap pengkhususan kami melihat prapemprosesan dalam 3 teratas. Tetapi kita jarang melihat perkara yang rumit seperti membangunkan model ML atau bekerja dengan Big Data dalam 3 teratas - hanya dalam kalangan jurutera ML dan DWH.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Terdapat juga beberapa pandangan yang menyedihkan. Pakar menetapkan 40% tugas mereka sendiri. Di Kazakhstan, setakat ini hanya syarikat unicorn terkemuka telah mencuba faedah bekerja dengan data besar dan mempelajari cara melakukannya dengan cekap. Mereka menyiarkan ke pasaran bahawa Big Data dan Pembelajaran Mesin adalah hebat, dan eselon kedua mengikuti di belakang, tetapi tidak selalu memahami cara bekerja dengan data berfungsi. Oleh itu, kami melihat bahawa pakar menetapkan tugas untuk diri mereka sendiri, dan perniagaan tidak selalu tahu perkara yang mereka mahukan.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Saya terkejut bahawa 20% pakar tidak tahu sama ada syarikat mereka mempunyai Gudang Data. Ya, dan dengan sistem pengurusan pangkalan data tidak semuanya begitu baik - 41% menggunakan MySQL, dan 34% lagi menggunakan PostgreSQL. Apakah maksud ini? Mereka bekerja agak dengan data kecil.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Dalam soalan mengenai sistem storan, kita sekali lagi melihat MySQL dan juga (!) Excel. Tetapi ini mungkin menunjukkan, sebagai contoh, bahawa kebanyakan syarikat masih belum mempunyai permintaan untuk bekerja dengan data besar.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Di sini semuanya lagi samar-samar. Secara umum, gaji adalah lebih rendah sedikit daripada yang saya jangkakan.

“Ya, mereka wujud!” Apakah yang pakar Sains Data di Kazakhstan lakukan dan berapa banyak pendapatan mereka?

Secara peribadi, sukar untuk saya membayangkan seorang jurutera ML yang bersedia untuk bekerja untuk 200 ribu tenge - dia mungkin seorang pelatih. Sama ada kecekapan pakar sedemikian sangat lemah, atau masih sukar bagi syarikat untuk menilai kerja Sains Data dengan secukupnya. Tetapi mungkin ini juga menunjukkan bahawa pasaran masih pada awal kematangannya. Dan lama kelamaan, tahap gaji akan ditetapkan pada tahap yang lebih mencukupi.

Sumber: www.habr.com

Tambah komen