Dmitry Kazakov, Leiter des Data Analytics-Teams bei der Kolesa Group, gibt Erkenntnisse aus der ersten kasachischen Umfrage unter Datenwissenschaftlern weiter.

Auf dem Foto: Dmitry Kazakov
Denken Sie an den beliebten Satz, dass Big Data am ehesten mit Teenager-Sex vergleichbar sei â alle reden darĂŒber, aber niemand weiĂ, ob es das wirklich gibt. Dasselbe lieĂe sich ĂŒber den Markt fĂŒr Datenwissenschaftler (in Kasachstan) sagen â es herrscht ein Hype, aber wer dahinter steckt (und ob ĂŒberhaupt jemand dahinter steckt), war nicht ganz klar â weder der Personalabteilung noch den Managern noch den Datenwissenschaftlern selbst.
Wir verbrachten , in der ĂŒber 300 FachkrĂ€fte zu ihrem Gehalt, ihren Funktionen, FĂ€higkeiten, Werkzeugen und vielem mehr befragt wurden.
Spoiler: Ja, die gibt es definitiv, aber so eindeutig ist es nicht.
Eine erfreuliche Erkenntnis. Erstens gibt es mehr Datenwissenschaftler als wir erwartet hatten. Besonders erfreulich war, dass wir 300 Personen interviewen konnten, darunter nicht nur Produkt-, Marketing- und BI-Analysten, sondern auch ML- und DWH-Ingenieure. Die gröĂte Gruppe umfasste alle, die sich selbst als Datenwissenschaftler bezeichnen â 36 % der Befragten. Ob dies der Marktnachfrage entspricht, lĂ€sst sich nur schwer sagen, da sich der Markt selbst gerade erst herausbildet.

Die Verteilung der Job-Level ist verwirrend â es gibt fast genauso viele Teamleiter und Manager wie Junioren. DafĂŒr kann es mehrere GrĂŒnde geben. Beispielsweise eine groĂe Anzahl kleiner Teams mit 2â3 Personen, in denen der Leiter ein Spezialist auf mittlerer oder höherer Ebene sein kann.

Ein weiterer Grund könnte das Chaos sein, das derzeit auf dem Markt hinsichtlich der Standards fĂŒr die Rollen- und Funktionsverteilung herrscht. Manchmal werden Teamleiter aus den Reihen derjenigen ernannt, die einfach ein oder zwei Jahre lĂ€nger arbeiten als andere, ohne RĂŒcksicht auf ihr Qualifikations- oder Wissensniveau. Dies lĂ€sst sich an der Funktionsverteilung nach Positionen erkennen: 38 % der Manager und Teamleiter sind mit der Vorverarbeitung beschĂ€ftigt und weitere 33 % mit grundlegenden statistischen Analysen.


Hier haben wir die Befragten gebeten, den Grad der Analytik in ihrem Unternehmen subjektiv einzuschĂ€tzen. Bei genauerem Hinsehen fĂ€llt auf, dass 10 % der Befragten, die in Analytics-Abteilungen mit 2â3 Mitarbeitern arbeiten, sich selbst als âfortgeschrittenâ einstufen.
Was bedeutet âfortgeschrittenes Niveauâ? Das BI-System funktioniert hervorragend. Es gibt DWH und Big Data. Es werden regelmĂ€Ăig A/B-Tests durchgefĂŒhrt. Es gibt funktionierende ML- und DS-Systeme in der Produktion. Entscheidungen werden ausschlieĂlich auf Grundlage von Daten getroffen. Die Data Science-Abteilung ist eine der SchlĂŒsselabteilungen im Unternehmen.
Es ist praktisch unmöglich, all die oben genannten Ziele mit einer Abteilung von 2â3 Personen zu erreichen. Ich denke, dass dieses Umfrageergebnis eine kleine Anfangsschwierigkeit ist â die Jungs haben noch niemanden, mit dem sie sich vergleichen können, um ihr Niveau objektiver einzuschĂ€tzen.


Wie erwartet verbringen Datenwissenschaftler die meiste Zeit nicht mit hochkomplexer Mathematik oder Ingenieurswissenschaften, sondern mit der Vorverarbeitung, dem Entladen und der Bereinigung von Daten. In jeder Spezialisierung sehen wir die Vorverarbeitung in den Top 3. Aber wir sehen selten komplexe Dinge wie die Entwicklung von ML-Modellen oder die Arbeit mit Big Data in den Top 3 â nur unter ML- und DWH-Ingenieuren.

Es gibt auch ein paar traurige Erkenntnisse. 40 % der Aufgaben werden von den FachkrÀften selbst gestellt. In Kasachstan haben bisher nur die Top-Einhorn-Unternehmen die Vorteile der Arbeit mit Big Data kennengelernt und gelernt, diese kompetent umzusetzen. Sie verbreiten auf dem Markt, dass Big Data und maschinelles Lernen cool sind, und die zweite Ebene zieht nach, versteht aber nicht immer, wie die Datenarbeit organisiert ist. Daher stellen wir fest, dass Spezialisten sich selbst Aufgaben stellen und Unternehmen nicht immer wissen, was sie wollen.

Ich war ĂŒberrascht zu erfahren, dass 20 % der FachkrĂ€fte nicht einmal wissen, ob ihr Unternehmen ĂŒber ein Data Warehouse verfĂŒgt. Und mit den Systemen Datenbankverwaltung Nicht alles lĂ€uft so gut â 41 % nutzen MySQL und weitere 34 % PostgreSQL. Was bedeutet das? Sie arbeiten eher mit kleineren Datenmengen.

Bei der Frage nach Speichersystemen stoĂen wir erneut auf MySQL und sogar (!) Excel. Dies könnte aber beispielsweise darauf hindeuten, dass in den meisten Unternehmen schlicht noch kein Bedarf fĂŒr die Arbeit mit Big Data besteht.

Auch hier ist alles zweideutig. Insgesamt fielen die GehÀlter etwas niedriger aus als erwartet.

Persönlich kann ich mir nur schwer einen ML-Ingenieur vorstellen, der bereit ist, fĂŒr 200 Tenge zu arbeiten â wahrscheinlich ist er ein Praktikant. Entweder sind die Kompetenzen solcher Spezialisten sehr schwach ausgeprĂ€gt oder es fĂ€llt Unternehmen immer noch schwer, die Arbeit der Data Science angemessen zu bewerten. Aber vielleicht deutet dies auch darauf hin, dass sich der Markt noch in einem frĂŒhen Reifestadium befindet. Und mit der Zeit wird sich das Lohnniveau auf einem angemesseneren Niveau einpendeln.
Source: habr.com
