ديمتري كازاكوف، قائد فريق تحليلات البيانات في Kolesa Group، يشارك رؤى من أول استطلاع في كازاخستان لمحترفي البيانات.
في الصورة: ديمتري كازاكوف
تذكر العبارة الشائعة التي تقول إن البيانات الضخمة تشبه إلى حد كبير ممارسة الجنس في سن المراهقة - يتحدث الجميع عنها، لكن لا أحد يعرف ما إذا كانت موجودة بالفعل. يمكن قول الشيء نفسه عن سوق متخصصي البيانات (في كازاخستان) - هناك ضجيج، ولكن من الذي يقف وراءه (وما إذا كان هناك أي شخص هناك على الإطلاق) لم يكن واضحًا تمامًا - لا للموارد البشرية ولا للمديرين ولا للمديرين. علماء البيانات أنفسهم.
أمضينا
المفسد: نعم، إنها موجودة بالتأكيد، لكن كل شيء ليس بهذه البساطة.
رؤية جميلة. أولاً، هناك عدد أكبر من علماء البيانات مما توقعنا. تمكنا من إجراء مقابلات مع 300 شخص، لم يكن من بينهم محللو المنتجات والتسويق وذكاء الأعمال فحسب، بل كانوا أيضًا مهندسي ML وDWH، الأمر الذي كان ممتعًا بشكل خاص. وتضمنت المجموعة الأكبر جميع أولئك الذين يطلقون على أنفسهم علماء البيانات - أي 36% من المشاركين. من الصعب القول ما إذا كان هذا يغطي طلب السوق أم لا، لأن السوق نفسه في طور التكوين.
يعد توزيع المستويات الوظيفية أمرًا مربكًا - حيث يوجد تقريبًا عدد من قادة الفرق والمديرين مثل المبتدئين. قد يكون هناك عدة أسباب لذلك. على سبيل المثال، عدد كبير من الفرق الصغيرة المكونة من 2-3 أشخاص، حيث يمكن أن يكون القائد متخصصًا على المستوى المتوسط أو الأعلى.
قد يكون السبب الآخر هو الفوضى السائدة حاليًا في السوق فيما يتعلق بمعايير توزيع الأدوار والوظائف. يتم أحيانًا تعيين قادة الفريق لأولئك الذين يعملون ببساطة لمدة عام أو عامين أطول من غيرهم، دون الرجوع إلى مستوى المهارات والمعرفة. ونرى ذلك في توزيع الوظائف حسب المنصب - حيث يشارك 38% من المديرين وقادة الفرق في المعالجة المسبقة و33% آخرين في التحليل الإحصائي الأساسي.
لقد طلبنا هنا من المشاركين إجراء تقييم شخصي لمستوى التحليلات في شركاتهم. إذا نظرت عن كثب، يمكنك أن ترى أن 10% من المشاركين الذين يعملون في أقسام التحليلات المكونة من 2-3 أشخاص يعتقدون أن لديهم "مستوى متقدم".
ما هو "المستوى المتقدم"؟ نظام BI يعمل بشكل رائع. هناك DWH والبيانات الكبيرة. يتم إجراء اختبارات A/B بانتظام. هناك أنظمة ML وDS عاملة في الإنتاج. يتم اتخاذ القرارات بناء على البيانات فقط. يعد قسم معالجة البيانات وعلوم البيانات أحد الأقسام الرئيسية في الشركة.
يكاد يكون من المستحيل تحقيق كل ما سبق بقسم مكون من 2-3 أشخاص. أعتقد أن نتيجة هذا الاستطلاع تمثل آلامًا طفيفة في النمو - ليس لدى الرجال حتى الآن أي شخص يقارنون أنفسهم به من أجل تحديد مستواهم بشكل أكثر موضوعية.
كما هو متوقع، يقضي علماء البيانات معظم وقتهم ليس في الرياضيات أو الهندسة المعقدة للغاية، ولكن في المعالجة المسبقة للبيانات وتنزيلها وتنظيفها. في كل تخصص نرى المعالجة المسبقة في أعلى 3. لكننا نادرًا ما نرى أشياء معقدة مثل تطوير نماذج ML أو العمل مع البيانات الضخمة في المراكز الثلاثة الأولى - فقط بين مهندسي ML وDWH.
هناك أيضًا بعض الأفكار المحزنة. يحدد الخبراء 40% من مهامهم بأنفسهم. وفي كازاخستان، لم تجرب حتى الآن سوى الشركات الكبرى الوحيدة فوائد العمل مع البيانات الضخمة وتعلمت كيفية القيام بذلك بكفاءة. إنهم يبثون إلى السوق أن البيانات الضخمة والتعلم الآلي أمران رائعان، وأن المستوى الثاني يتبعهما، ولكنهما لا يفهمان دائمًا كيفية العمل مع البيانات. لذلك، نرى أن المتخصصين يحددون المهام لأنفسهم، ولا تعرف الشركات دائمًا ما تريد.
لقد فوجئت بأن 20% من المتخصصين لا يعرفون حتى ما إذا كانت شركتهم لديها مستودع بيانات أم لا. نعم، ومع أنظمة إدارة قواعد البيانات ليس كل شيء على ما يرام - 41% يستخدمون MySQL، و34% آخرون يستخدمون PostgreSQL. ماذا يمكن أن يعني هذا؟ إنهم يعملون بدلاً من ذلك مع البيانات الصغيرة.
في مسألة أنظمة التخزين، نرى مرة أخرى MySQL وحتى (!) Excel. لكن هذا قد يشير، على سبيل المثال، إلى أن معظم الشركات ليس لديها بعد طلب للعمل مع البيانات الضخمة.
هنا كل شيء غامض مرة أخرى. بشكل عام، كانت الرواتب أقل قليلاً مما كنت أتوقع.
شخصيًا، من الصعب علي أن أتخيل مهندس تعلم الآلة مستعدًا للعمل مقابل 200 ألف تنغي - ربما يكون متدربًا. إما أن كفاءات هؤلاء المتخصصين ضعيفة جدًا، أو أنه لا يزال من الصعب على الشركات تقييم عمل علم البيانات بشكل مناسب. ولكن ربما يشير هذا أيضًا إلى أن السوق لا يزال في بداية نضوجه. ومع مرور الوقت، سيتم تحديد مستوى الرواتب على مستوى أكثر ملاءمة.
المصدر: www.habr.com