nurutkeun
Kuring nganalisa lowongan pikeun posisi insinyur data sapertos dina Januari 2020 pikeun ngartos kaahlian téknologi mana anu paling populér. Teras kuring ngabandingkeun hasil sareng statistik ngeunaan lowongan pikeun posisi élmuwan data - sareng sababaraha béda anu pikaresepeun muncul.
Tanpa seueur preamble, ieu mangrupikeun sapuluh téknologi anu paling sering disebatkeun dina postingan padamelan:
Sebutkeun téknologi dina lowongan pikeun posisi insinyur data dina 2020
Tanggung jawab insinyur data
Kiwari, pagawéan anu dilakukeun ku insinyur data penting pisan pikeun organisasi - ieu mangrupikeun jalma-jalma anu tanggung jawab pikeun nyimpen inpormasi sareng nyayogikeun kana bentuk anu tiasa dianggo ku pagawé sanés. Insinyur data ngawangun jalur pipa pikeun ngalirkeun data atanapi bets tina sababaraha sumber. Pipelines teras ngalakukeun operasi ékstraksi, transformasi, sareng ngamuat (dina kecap sanésna, prosés ETL), ngajantenkeun data langkung cocog pikeun dianggo salajengna. Saatos ieu, data dikintunkeun ka analis sareng élmuwan data pikeun ngolah anu langkung jero. Tungtungna, data mungkas perjalananna dina dasbor, laporan, sareng modél pembelajaran mesin.
Kuring milarian inpormasi anu ngamungkinkeun kuring ngagambar kacindekan ngeunaan téknologi mana anu paling dipénta dina karya insinyur data ayeuna.
Métode
Kuring ngumpulkeun inpormasi tina tilu situs milarian padamelan −
Pikeun unggal kecap konci, kuring ngitung persentase hits tina total jumlah téks dina unggal situs nyalira, teras ngitung rata-rata pikeun tilu sumber.
Hasil
Di handap ieu aya tilu puluh istilah rékayasa data téknis kalayan skor pangluhurna di sadaya tilu situs padamelan.
Sareng ieu mangrupikeun nomer anu sami, tapi dibere dina bentuk méja:
Hayu urang balik dina urutan.
Tinjauan hasil
Duanana SQL sareng Python muncul dina langkung ti dua per tilu bukaan padamelan anu diulas. Dua téknologi ieu anu asup akal pikeun diajar heula.
Spark disebutkeun dina ngeunaan satengah tina vacancies.
AWS muncul dina kira-kira 45% tina postingan padamelan. Éta mangrupikeun platform komputasi awan anu diproduksi ku Amazon; eta boga pangsa pasar pangbadagna diantara sakabeh platform awan.
Salajengna sumping Java sareng Hadoop - sakedik langkung ti 40% pikeun lanceukna.
Ieu kawas numpak dina mesin waktu
Teras we ningali Hive, Scala, Kafka sareng NoSQL - masing-masing téknologi ieu disebatkeun dina saparapat tina lowongan anu dikintunkeun. Apache Hive mangrupikeun parangkat lunak gudang data anu "ngagampangkeun maca, nyerat, sareng ngatur set data ageung anu aya di toko anu disebarkeun nganggo SQL."
Babandingan sareng istilah dina lowongan data scientist
Ieu tilu puluh istilah téknologi anu paling umum di antara pangusaha élmu data. Kuring meunang daptar ieu dina cara nu sarua sakumaha ditétélakeun di luhur pikeun rékayasa data.
Nyebutkeun téknologi dina lowongan pikeun posisi élmuwan data dina 2020
Lamun urang ngobrol ngeunaan jumlah total, dibandingkeun rekrutmen dianggap saméméhna, aya 28% leuwih vacancies (12 versus 013). Hayu urang tingali téknologi mana anu kirang umum dina lowongan pikeun élmuwan data tibatan pikeun insinyur data.
Leuwih populér di rékayasa data
Grafik di handap nembongkeun kecap konci kalayan bédana rata-rata leuwih gede ti 10% atawa kirang ti -10%.
Bedana panggedéna dina frékuénsi kecap konci antara insinyur data sareng élmuwan data
AWS nunjukkeun kanaékan anu paling signifikan: dina rékayasa data katingalina 25% langkung teratur tibatan élmu data (kira-kira 45% sareng 20% tina total jumlah lowongan, masing-masing). Bédana téh noticeable!
Ieu mangrupikeun data anu sami dina presentasi anu rada béda - dina grafik, hasil pikeun kecap konci anu sami dina lowongan pikeun posisi insinyur data sareng élmuwan data perenahna sisi-sisi.
Bedana panggedéna dina frékuénsi kecap konci antara insinyur data sareng élmuwan data
Luncat panggedéna salajengna anu kuring perhatikeun nyaéta di Spark - insinyur data sering kedah damel sareng data ageung.
Kurang populér dina rékayasa data
Ayeuna hayu urang tingali téknologi mana anu kirang populer dina lowongan insinyur data.
Turunna sharpest dibandingkeun sektor elmu data lumangsung dina
Paménta dina rékayasa data sareng élmu data
Ieu kudu dicatet yén dalapan ti sapuluh posisi munggaran dina duanana susunan anu sarua. SQL, Python, Spark, AWS, Java, Hadoop, Hive sareng Scala ngajantenkeun kana sapuluh luhur pikeun industri rékayasa data sareng élmu data. Dina grafik di handap ieu anjeun tiasa ningali lima belas téknologi anu paling populer di antawis pangusaha insinyur data, sareng di gigireunana nyaéta tingkat lowongan pikeun élmuwan data.
saran
Upami anjeun hoyong asup kana rékayasa data, kuring bakal mamatahan anjeun ngawasaan téknologi di handap ieu - Kuring daptar aranjeunna dina urutan prioritas perkiraan.
Diajar SQL. Kuring condong kana PostgreSQL sabab éta open source, populer pisan di masarakat, sareng dina fase kamekaran. Anjeun tiasa diajar kumaha ngagunakeun basa tina buku My Memorable SQL - versi pilotna sayogi
Master Python, sanajan henteu dina tingkat paling hardcore. Python Memorable abdi dirancang husus pikeun beginners. Ieu bisa dibeuli di
Sakali anjeun wawuh jeung Python, ngaléngkah ka pandas, perpustakaan Python anu dipaké pikeun beberesih jeung ngolah data. Upami anjeun badé damel di perusahaan anu meryogikeun kamampuan nyerat dina Python (sareng ieu mangrupikeun seuseueurna), anjeun tiasa yakin yén pangaweruh ngeunaan pandas bakal dianggap sacara standar. Kuring ayeuna nuju ngarengsekeun pituduh bubuka pikeun damel sareng panda - anjeun tiasa
Master AWS. Upami anjeun hoyong janten insinyur data, anjeun moal tiasa ngalakukeun tanpa platform awan di stash, sareng AWS mangrupikeun anu pang populerna di antarana. Kursus-kursus ngabantosan kuring pisan
Upami anjeun parantos ngabéréskeun sadaya daptar ieu sareng hoyong langkung maju dina panon dunungan salaku insinyur data, kuring nyarankeun nambihan Apache Spark pikeun damel sareng data ageung. Sanajan panalungtikan kuring ngeunaan lowongan data scientist némbongkeun turunna minat, diantara insinyur data masih muncul dina ampir unggal lowongan kadua.
Tungtungna
Abdi ngarepkeun anjeun mendakan tinjauan ieu ngeunaan téknologi anu paling dipénta pikeun insinyur data anu mangpaat. Upami anjeun heran kumaha padamelan analis, baca
sumber: www.habr.com