"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

دمتري Kazakov, ڊيٽا تجزياتي ٽيم جي اڳواڻي ڪوليسا گروپ ۾، ڊيٽا جي ماهرن جي پهرين قزاقستان سروي کان بصيرت حصيداري ڪري ٿي.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟
تصوير ۾: دمتري Kazakov

مشهور جملي کي ياد رکو ته بگ ڊيٽا گهڻو ڪري نوجوان جنس وانگر آهي - هرڪو ان بابت ڳالهائيندو آهي، پر ڪو به نٿو ڄاڻي ته اهو اصل ۾ موجود آهي. ساڳيو ئي ڊيٽا ماهرن جي مارڪيٽ جي باري ۾ چئي سگهجي ٿو (قزاقستان ۾) - اتي hype آهي، پر ان جي پويان ڪير آهي (۽ ڇا اتي ئي ڪو به آهي) مڪمل طور تي واضح نه هو - نه HR ڏانهن، نه مينيجرن ڏانهن، نه ئي. ڊيٽا سائنسدان پاڻ.

اسان خرچ ڪيو اڀياس، جنهن ۾ انهن 300 کان وڌيڪ ماهرن کي انهن جي تنخواه، افعال، صلاحيتن، اوزار ۽ گهڻو ڪجهه بابت سروي ڪيو.

خراب ڪندڙ: ها، اهي ضرور موجود آهن، پر هر شيء ايترو سادو ناهي.

سٺي بصيرت. پهرين، اسان جي توقع کان وڌيڪ ڊيٽا سائنسدان آهن. اسان 300 ماڻهن سان انٽرويو ڪرڻ جو انتظام ڪيو، جن مان نه رڳو پراڊڪٽ، مارڪيٽنگ ۽ BI تجزيه نگار هئا، پر ML ۽ DWH انجنيئر پڻ هئا، جيڪي خاص طور تي خوش ٿيا. سڀ کان وڏي گروهه ۾ اهي سڀئي شامل هئا جيڪي پاڻ کي ڊيٽا سائنسدان سڏين ٿا - اهو 36 سيڪڙو جواب ڏيڻ وارن جو آهي. اهو چوڻ ڏکيو آهي ته ڇا اهو مارڪيٽ جي طلب کي ڍڪيندو آهي يا نه، ڇو ته مارڪيٽ پاڻ کي صرف ٺهيل آهي.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

نوڪريءَ جي سطحن جي ورڇ مونجهارو آهي - اتي لڳ ڀڳ جيتريون ٽيم ليڊز ۽ مئنيجر آهن جيئن جونيئر. ان جا ڪيترائي سبب ٿي سگهن ٿا. مثال طور، 2-3 ماڻهن جي ننڍي ٽيمن جو هڪ وڏو تعداد، جنهن ۾ اڳواڻ هڪ وچولي يا سينيئر سطح جو ماهر ٿي سگهي ٿو.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

هڪ ٻيو سبب ٿي سگهي ٿو افراتفري هن وقت مارڪيٽ ۾ حڪمراني جي معيار جي حوالي سان ڪردار ۽ ڪارڪردگي جي تقسيم ۾. ٽيم ليڊز ڪڏهن ڪڏهن انهن کي تفويض ڪيا ويندا آهن جيڪي صرف مهارت ۽ علم جي سطح جي حوالي کان سواءِ، ٻين جي ڀيٽ ۾ هڪ يا ٻه سال وڌيڪ ڪم ڪن ٿا. اسان ھن کي پوزيشن جي لحاظ کان افعال جي تقسيم ۾ ڏسون ٿا - 38٪ مينيجرز ۽ ٽيم ليڊر اڳ ۾ پروسيسنگ ۾ مصروف آھن ۽ ٻيو 33٪ بنيادي شمارياتي تجزيي ۾.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

هتي اسان جواب ڏيڻ وارن کان پڇيو ته موضوعي طور تي انهن جي ڪمپنين ۾ تجزياتي سطح جو جائزو وٺو. جيڪڏهن توهان ويجهڙائي سان ڏسندا، توهان ڏسي سگهو ٿا ته 10٪ جواب ڏيڻ وارا جيڪي 2-3 ماڻهن جي تجزياتي شعبن ۾ ڪم ڪن ٿا انهن کي يقين آهي ته انهن وٽ "ترقي يافته سطح" آهي.

ڇا آهي "اعلي سطح"؟ BI سسٽم عظيم ڪم ڪري ٿو. اتي DWH ۽ بگ ڊيٽا آهي. A/B ٽيسٽ باقاعده ڪيا ويندا آهن. پيداوار ۾ ايم ايل ۽ ڊي ايس سسٽم ڪم ڪري رهيا آهن. فيصلا صرف ڊيٽا جي بنياد تي ڪيا ويا آهن. ڊيٽا پروسيسنگ ۽ ڊيٽا سائنس ڊپارٽمينٽ ڪمپني ۾ اهم مان هڪ آهي.

2-3 ماڻهن جي ڊپارٽمينٽ سان مٿين سڀني کي حاصل ڪرڻ تقريبا ناممڪن آهي. مان سمجهان ٿو ته هن سروي جو نتيجو ٿورڙي وڌندڙ درد آهي - ڇوڪرن وٽ اڃا تائين ڪو به ناهي جيڪو پاڻ سان مقابلو ڪري سگهي ٿو انهن جي سطح کي وڌيڪ مقصد سان طئي ڪرڻ لاءِ.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

جيئن توقع ڪئي وئي، ڊيٽا سائنسدان پنهنجو گهڻو وقت سپر پيچيده رياضي يا انجنيئرنگ تي نه، پر ڊيٽا کي پري پروسيسنگ، ڊائون لوڊ ڪرڻ ۽ صاف ڪرڻ تي خرچ ڪن ٿا. هر اسپيشلائيزيشن ۾ اسان ڏسون ٿا اڳي پروسيسنگ مٿين 3 ۾. پر اسان گهٽ ۾ گهٽ پيچيده شيون ڏسندا آهيون جهڙوڪ ايم ايل ماڊلز کي ترقي ڪرڻ يا مٿين 3 ۾ بگ ڊيٽا سان ڪم ڪرڻ - صرف ML ۽ DWH انجنيئرن ۾.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

اُن ۾ به ڪي غمگين واقعا آهن. ماهر پنهنجو 40 سيڪڙو ڪم پاڻ مقرر ڪن ٿا. قزاقستان ۾، هينئر تائين صرف اعليٰ يونيڪارن ڪمپنين وڏي ڊيٽا سان ڪم ڪرڻ جا فائدا آزمايا آهن ۽ سکيو آهي ته ان کي قابليت سان ڪيئن ڪجي. اهي مارڪيٽ ۾ نشر ڪن ٿا ته بگ ڊيٽا ۽ مشين لرننگ ٿڌي آهي، ۽ ٻيو ايچلون پٺيان پوي ٿو، پر هميشه اهو نه سمجهي ٿو ته ڊيٽا سان ڪم ڪيئن ڪم ڪري ٿو. تنهن ڪري، اسان ڏسون ٿا ته ماهر پاڻ لاء ڪم مقرر ڪن ٿا، ۽ ڪاروبار هميشه نه ڄاڻندا آهن جيڪي اهي چاهيندا آهن.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

مون کي حيرت ٿي ته 20 سيڪڙو ماهرن کي به خبر ناهي ته انهن جي ڪمپني وٽ ڊيٽا گودام آهي. ها، ۽ ڊيٽابيس مينيجمينٽ سسٽم سان هر شي تمام سٺو ناهي - 41٪ استعمال ڪريو MySQL، ۽ ٻيو 34٪ استعمال ڪريو PostgreSQL. هن جو مطلب ڇا ٿي سگهي ٿو؟ اهي ڪم ڪن ٿا بلڪه ننڍي ڊيٽا سان.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

اسٽوريج سسٽم بابت سوال ۾، اسان ٻيهر ڏسون ٿا MySQL ۽ حتي (!) Excel. پر اهو ظاهر ڪري سگھي ٿو، مثال طور، ته اڪثر ڪمپنيون اڃا تائين وڏي ڊيٽا سان ڪم ڪرڻ جي درخواست نه آهن.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

هتي هر شيء ٻيهر مبهم آهي. عام طور تي، تنخواه منهنجي توقع کان ٿورو گهٽ هئي.

"ها، اهي موجود آهن!" قزاقستان ۾ ڊيٽا سائنس جا ماهر ڇا ڪندا آهن ۽ ڪيترو ڪمائيندا آهن؟

ذاتي طور تي، مون لاء هڪ ايم ايل انجنيئر جو تصور ڪرڻ ڏکيو آهي جيڪو 200 هزار ٽينج لاء ڪم ڪرڻ لاء تيار آهي - هو شايد هڪ انٽرنيشنل آهي. يا ته اهڙن ماهرن جون صلاحيتون ڏاڍا ڪمزور آهن، يا اهو اڃا به ڏکيو آهي ته ڪمپنين لاءِ ڊيٽا سائنس جي ڪم جو مناسب اندازو لڳائڻ. پر شايد اهو پڻ اشارو ڪري ٿو ته مارڪيٽ اڃا تائين ان جي پختگي جي شروعات ۾ آهي. ۽ وقت سان گڏ، تنخواه جي سطح کي وڌيڪ مناسب سطح تي قائم ڪيو ويندو.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو