Göre
Hangi teknoloji becerilerinin en popüler olduğunu anlamak için veri mühendisi pozisyonundaki boş pozisyonları Ocak 2020'de olduğu gibi analiz ettim. Daha sonra sonuçları veri bilimci pozisyonundaki boş pozisyonlara ilişkin istatistiklerle karşılaştırdım ve bazı ilginç farklılıklar ortaya çıktı.
Çok fazla giriş yapmadan, iş ilanlarında en sık bahsedilen ilk on teknolojiyi burada bulabilirsiniz:
2020'de veri mühendisi pozisyonu için açık pozisyonlarda teknolojilerden bahsedilmesi
Bir veri mühendisinin sorumlulukları
Günümüzde veri mühendislerinin yaptığı iş, kuruluşlar için büyük önem taşıyor; bunlar, bilginin depolanmasından ve diğer çalışanların onunla çalışabileceği bir forma getirilmesinden sorumlu olan kişilerdir. Veri mühendisleri, birden fazla kaynaktan gelen verileri akışa almak veya toplu olarak işlemek için işlem hatları oluşturur. İşlem hatları daha sonra çıkarma, dönüştürme ve yükleme işlemlerini (başka bir deyişle ETL işlemlerini) gerçekleştirerek verileri daha sonraki kullanımlar için daha uygun hale getirir. Bundan sonra veriler daha derin işlenmek üzere analistlere ve veri bilimcilere sunulur. Son olarak veriler, kontrol panellerinde, raporlarda ve makine öğrenimi modellerinde yolculuğunu tamamlar.
Şu anda bir veri mühendisinin çalışmasında en çok hangi teknolojilerin talep edildiğine dair bir sonuca varmamı sağlayacak bilgiler arıyordum.
Yöntemler
Üç iş arama sitesinden bilgi topladım –
Her bir anahtar kelime için, her sitedeki toplam metin sayısından isabet yüzdesini ayrı ayrı hesapladım ve ardından üç kaynak için ortalama değeri hesapladım.
Bulgular
Aşağıda, her üç iş sahasında en yüksek puanlara sahip otuz teknik veri mühendisliği terimi bulunmaktadır.
Ve işte aynı sayılar, ancak tablo biçiminde sunulmuştur:
Hadi sırayla gidelim.
Sonuçlara Genel Bakış
İncelenen iş ilanlarının üçte ikisinden fazlasında hem SQL hem de Python görünüyor. İlk önce çalışmak mantıklı olan bu iki teknolojidir.
Boş pozisyonların yaklaşık yarısında Spark'tan bahsediliyor.
AWS, iş ilanlarının yaklaşık %45'inde görünür. Amazon tarafından üretilen bir bulut bilişim platformudur; tüm bulut platformları arasında en büyük pazar payına sahiptir.
Ardından Java ve Hadoop geliyor; kardeşleri için %40'ın biraz üzerinde.
Zaman makinesine binmek gibi
Daha sonra Hive, Scala, Kafka ve NoSQL'i görüyoruz; bu teknolojilerin her biri, gönderilen açık pozisyonların dörtte birinde belirtiliyor. Apache Hive, "SQL kullanarak dağıtılmış mağazalarda bulunan büyük veri kümelerini okumayı, yazmayı ve yönetmeyi kolaylaştıran" bir veri ambarı yazılımıdır.
Veri bilimci açık pozisyonlarındaki terimlerle karşılaştırma
Veri bilimi işverenleri arasında en yaygın olan otuz teknoloji terimini burada bulabilirsiniz. Bu listeyi yukarıda veri mühendisliği için anlatıldığı şekilde elde ettim.
2020'de veri bilimci pozisyonu için boş pozisyonlarda teknolojiden bahsediliyor
Toplam sayıdan bahsedecek olursak, daha önce ele alınan işe alımlarla karşılaştırıldığında %28 daha fazla boş kontenjan vardı (12'e karşılık 013). Veri bilimcileri için boş pozisyonlarda hangi teknolojilerin veri mühendislerine göre daha az yaygın olduğunu görelim.
Veri mühendisliğinde daha popüler
Aşağıdaki grafik, ortalama farkı %10'un üzerinde veya -%10'un altında olan anahtar kelimeleri göstermektedir.
Veri mühendisi ile veri bilimcisi arasındaki anahtar kelime sıklığı açısından en büyük farklar
AWS en önemli artışı gösteriyor: veri mühendisliğinde veri bilimine göre %25 daha düzenli görünüyor (toplam boş pozisyon sayısının sırasıyla yaklaşık %45'i ve %20'si). Fark fark ediliyor!
İşte aynı veriler biraz farklı bir sunumda - grafikte, veri mühendisi ve veri bilimci pozisyonundaki boş pozisyonlarda aynı anahtar kelimeye ilişkin sonuçlar yan yana yer alıyor.
Veri mühendisi ile veri bilimcisi arasındaki anahtar kelime sıklığı açısından en büyük farklar
Bir sonraki en büyük sıçramayı Spark'ta fark ettim; bir veri mühendisi çoğu zaman büyük verilerle çalışmak zorunda kalıyor.
Veri mühendisliğinde daha az popüler
Şimdi veri mühendisi açık pozisyonlarında hangi teknolojilerin daha az popüler olduğunu görelim.
Veri bilimi sektörüyle karşılaştırıldığında en keskin düşüş,
Hem veri mühendisliği hem de veri biliminde talep var
Her iki sette de ilk on pozisyondan sekizinin aynı olduğunu belirtmekte fayda var. SQL, Python, Spark, AWS, Java, Hadoop, Hive ve Scala, hem veri mühendisliği hem de veri bilimi sektörlerinde ilk on arasında yer aldı. Aşağıdaki grafikte veri mühendisi işverenleri arasında en popüler on beş teknolojiyi ve bunların yanında veri bilimcilere yönelik açık pozisyon oranlarını görebilirsiniz.
Öneriler
Veri mühendisliğine girmek istiyorsanız, aşağıdaki teknolojilerde uzmanlaşmanızı tavsiye ederim - bunları yaklaşık öncelik sırasına göre listeliyorum.
Изучите SQL. Я склоняю вас именно к PostgreSQL, потому что у него открытый код, большая популярность в сообществе и он находится в фазе роста. Как пользоваться языком, можно узнать из книги My Memorable SQL – ее пилотная версия доступна
En zorlu seviyede olmasa bile Python'da ustalaşın. Unutulmaz Python'um yeni başlayanlar için özel olarak tasarlanmıştır. Şu adresten satın alınabilir:
Python'a aşina olduğunuzda, veri temizleme ve işleme için kullanılan bir Python kütüphanesi olan pandalara geçin. Python'da yazma becerisi gerektiren bir şirkette çalışmayı hedefliyorsanız (ve bunların çoğunluğu budur), pandaların bilgisinin varsayılan olarak varsayılacağından emin olabilirsiniz. Şu anda pandalarla çalışmaya yönelik giriş kılavuzunu tamamlıyorum;
AWS'de uzmanlaşın. Veri mühendisi olmak istiyorsanız, deponuzda bir bulut platformu olmadan yapamazsınız ve AWS bunların en popüleridir. Kurslar bana çok yardımcı oldu
Bu listenin tamamını zaten tamamladıysanız ve veri mühendisi olarak işverenlerin gözünde daha da büyümek istiyorsanız, büyük verilerle çalışmak için Apache Spark'ı eklemenizi öneririm. Veri bilimci açık pozisyonları üzerine yaptığım araştırma ilginin azaldığını gösterse de, veri mühendisleri arasında bu durum hâlâ neredeyse her ikinci boş pozisyonda karşımıza çıkıyor.
sonunda
Veri mühendisleri için en çok talep gören teknolojilere ilişkin bu genel bakışı umarım faydalı bulmuşsunuzdur. Analist işlerinin nasıl gittiğini merak ediyorsanız, okuyun
Kaynak: habr.com