Data Engineer та Data Scientist: що вміють і скільки заробляють

Разом з Оленою Герасимовою, керівником факультету «Data Science та аналітика» у Нетології продовжуємо розбиратися, як взаємодіють між собою і чим відрізняються Data Scientist та Data Engineer.

У першій частині розповіли про основні відмінності Data Scientist та Data Engineer.

У цьому матеріалі поговоримо про те, якими знаннями та навичками повинні мати фахівці, яку освіту цінують роботодавці, як відбуваються співбесіди, а також скільки заробляють дата-інженери та дата-саєністисти. 

Що мають знати саєністи та інженери

Профільна освіта для обох спеціалістів - Computer Science.

Data Engineer та Data Scientist: що вміють і скільки заробляють

Будь-який фахівець за даними — дата-саентист чи аналітик — має вміти доводити коректність своїх висновків. Для цього не обійтися без знання статистики та пов'язаної зі статистикою базової математики.

Машинне навчання та інструменти аналізу даних незамінні в сучасному світі. Якщо звичні інструменти недоступні, потрібно мати навички швидкого вивчення нових інструментів, створення простих скриптів для автоматизації завдань.

Важливо відзначити, що фахівець із роботи з даними має ефективно донести результати аналізу. У цьому йому допоможе візуалізація даних або результатів проведених досліджень та перевірки гіпотез. Фахівці повинні вміти створювати діаграми та графіки, використовувати інструменти візуалізації, розуміти та роз'яснювати дані з дашбордів.

Data Engineer та Data Scientist: що вміють і скільки заробляють

Для інженера даних першому плані виходять три напрями.

Алгоритми та структури даних. Важливо набити руку в написанні коду та використанні основних структур та алгоритмів:

  • аналіз складності алгоритмів,
  • вміння писати зрозумілий код, що підтримується, 
  • пакетна обробка,
  • обробка у реальному часі.

Бази та сховища даних, Business Intelligence:

  • зберігання та обробка даних,
  • проектування цілісних систем,
  • Data Ingestion,
  • розподілені файлові системи

Hadoop та Big Data. Даних стає все більше, і на горизонті 3-5 років ці технології стануть потрібними кожному інженеру. Плюс:

  • Data Lakes,
  • робота з хмарними провайдерами.

машинне навчання буде використовуватися повсюдно і важливо розуміти, які бізнес-завдання воно допоможе вирішити. Не обов'язково вміти робити моделі (з цим впораються дата-саєністи), але потрібно розбиратися в їх застосуванні та відповідних вимог.

Скільки отримують інженери та саєністи

Дохід інженерів з обробки даних

У міжнародній практиці Початкова зарплата зазвичай становить $100 000 на рік і значно збільшується з досвідом, за даними Glassdoor. Крім того, компанії часто надають опціони на акції та 5-15% річних бонусів.

У Росії на початку кар'єри зарплата зазвичай не менше 50 тис. рублів у регіонах та 80 тис. у Москві. На цьому етапі не потрібний досвід, крім пройденого навчання.

Через 1-2 роки роботи - вилка 90-100 тис. рублів.

Виделка збільшується до 120-160 тис. через 2-5 років. Додаються такі фактори, як спеціалізація минулих компаній, розмір проектів, робота з big data та інше.

Після 5 років роботи легше шукати вакансії у суміжних відділах або відгукуватися на такі вузькоспеціалізовані позиції, як:

  • Архітектор чи провідний розробник у банку чи телеком — близько 250 тис.

  • Pre-Sales у вендора, з технологіями якого ви працювали найщільніше, - 200 тис. плюс можливий бонус (1-1,5 млн рублів). 

  • Експерти з впровадження Enterprise business application, як-от SAP, — до 350 тис.

Дохід дата-саентистів

Дослідження ринку аналітиків компанії «Нормальні дослідження» та рекрутингового агентства New.HR показує, що фахівці з Data Science отримують у середньому більшу зарплату, ніж аналітики інших спеціальностей. 

У Росії початкова зарплата дата-саєніста з досвідом роботи до року - від 113 тис. рублів. 

Як досвід роботи зараз також враховується проходження навчальних програм.

Через 1-2 роки такий фахівець вже може отримувати до 160 тис.

Для співробітника з досвідом роботи від 4-5 років вилка виростає до 310 тис.

Як відбуваються співбесіди

На заході випускники програм професійного навчання проходять першу співбесіду загалом через 5 тижнів після закінчення навчання. Близько 85% знаходять роботу через 3 місяці.

Процес проходження співбесід на вакансії інженера даних та дата-саентиста мало відрізняється. Зазвичай складається із п'яти етапів.

Резюме. Кандидатам із непрофільним попереднім досвідом (наприклад, з маркетингу) необхідно для кожної компанії підготувати докладний супровідний лист або мати рекомендації від представника цієї компанії.

Технічний скринінг. Проходить зазвичай по телефону. Складається з одного-двох складних і стільки ж простих питань, що стосуються стека роботодавця.

HR-інтерв'ю. Може проходити телефоном. На цьому етапі кандидата перевіряють на загальну адекватність та здатність спілкуватися.

Технічна співбесіда. Найчастіше відбувається очно. У різних компаніях рівень позицій у штатному розкладі відрізняється і називатися позиції можуть по-різному. Тому на цьому етапі перевіряють саме технічні знання.

Співбесіда з технічним директором/головним архітектором. Інженер і саєнтист — стратегічні позиції, а для багатьох компаній, до того ж, нові. Важливо, щоб потенційний колега сподобався керівнику та збігався з ним у поглядах.

Що допоможе саєнтистам та інженерам у кар'єрному зростанні

З'явилося чимало нових інструментів роботи з даними. І мало хто однаково добре розуміється на всіх. 

Багато компаній не готові наймати співробітників без досвіду роботи. Однак кандидати з мінімальною базою та знанням основ популярних інструментів можуть отримати потрібний досвід, якщо навчатимуться та розвиватимуться самостійно.

Корисні якості для дата-інженера та дата-саентиста

Бажання та вміння вчитися. Необов'язково відразу гнатися за досвідом або міняти роботу заради нового інструменту, але потрібно бути готовим перейти на нову область.

Прагнення автоматизації рутинних процесів. Це важливо не тільки для продуктивності, але й для підтримки високої якості даних та швидкості їхньої доставки до споживача.

Уважність та розуміння «що там під капотом» у процесів. Швидше вирішить завдання той фахівець, який має нагляд і досконале знання процесів.

Крім відмінного знання алгоритмів, структур даних та пайплайнів, потрібно навчитися мислити продуктами — бачити архітектуру та бізнес-рішення як єдину картину. 

Наприклад, корисно взяти будь-який відомий сервіс і вигадати для нього базу даних. Потім подумати, як розробити ETL і DW, які наповнять її даними, які будуть споживачі і що їм важливо знати про дані, а також як покупці взаємодіють із додатками: для пошуку роботи та знайомств, прокат автомобілів, додаток для подкастів, освітня платформа.

Позиції аналітика, дата-саентиста та інженера дуже близькі, тому переходити з одного напрямку до іншого можна швидше, ніж з інших сфер.

У будь-якому випадку, власникам будь-якого ІТ-бекграунду буде простіше, ніж тим, хто його не має. У середньому дорослі мотивовані люди переучуються і змінюють роботу кожні 1,5-2 роки. Легше це дається тим, хто навчається у групі та з наставником, порівняно з тими, хто спирається лише на відкриті джерела.

Від редакції Нетології

Якщо придивляєтесь до професії Data Engineer або Data Scientist, запрошуємо вивчити програми наших курсів:

Джерело: habr.com

Додати коментар або відгук