Miturut
Aku nganalisa lowongan kanggo posisi insinyur data nalika Januari 2020 kanggo ngerti katrampilan teknologi sing paling populer. Banjur aku mbandhingake asil karo statistik babagan lowongan kanggo posisi ilmuwan data - lan sawetara beda menarik muncul.
Tanpa akeh preamble, ing ngisor iki sepuluh teknologi paling umum sing paling kerep disebutake ing postingan proyek:
Sebutake teknologi ing lowongan kanggo posisi data engineer ing 2020
Tanggung jawab saka insinyur data
Dina iki, pakaryan sing ditindakake dening insinyur data penting banget kanggo organisasi - iki minangka wong sing tanggung jawab kanggo nyimpen informasi lan nggawa menyang wangun sing bisa ditindakake dening karyawan liyane. Insinyur data nggawe saluran pipa kanggo stream utawa batch data saka macem-macem sumber. Pipelines banjur nindakake operasi ekstraksi, transformasi, lan loading (kanthi tembung liya, proses ETL), nggawe data luwih cocog kanggo panggunaan luwih lanjut. Sawise iki, data kasebut dikirim menyang analis lan ilmuwan data kanggo proses sing luwih jero. Pungkasan, data mungkasi perjalanan ing dashboard, laporan, lan model pembelajaran mesin.
Aku nggoleki informasi sing bakal ngidini aku nggawe kesimpulan babagan teknologi sing paling dikarepake ing karya insinyur data saiki.
Tata cara
Aku ngumpulake informasi saka telung situs panelusuran proyek β
Kanggo saben tembung kunci, aku ngetung persentase hit saka jumlah total teks ing saben situs kanthi kapisah, banjur ngitung rata-rata kanggo telung sumber kasebut.
Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ
Ing ngisor iki ana telung puluh istilah teknik data teknis kanthi skor paling dhuwur ing kabeh telung situs kerja.
Lan ing ngisor iki nomer sing padha, nanging ditampilake ing wangun tabel:
Ayo budhal.
Review asil
SQL lan Python katon ing luwih saka rong pertiga saka lowongan kerja sing dideleng. Iki loro teknologi sing nggawe akal kanggo sinau dhisik.
Spark kasebut ing babagan setengah saka lowongan.
AWS katon ing kira-kira 45% postingan proyek. Iku platform komputasi maya sing diprodhuksi dening Amazon; duwe pangsa pasar paling gedhe ing antarane kabeh platform awan.
Sabanjure teka Jawa lan Hadoop - luwih saka 40% kanggo sedulure.
Iku kaya numpak ing mesin wektu
Banjur kita ndeleng Hive, Scala, Kafka lan NoSQL - saben teknologi kasebut kasebut ing seprapat saka lowongan sing diajukake. Apache Hive minangka piranti lunak gudang data sing "gampang maca, nulis, lan ngatur set data gedhe sing manggon ing toko sing disebar nggunakake SQL."
Perbandingan karo istilah ing lowongan data scientist
Mangkene telung puluh istilah teknologi sing paling umum ing antarane pengusaha ilmu data. Aku entuk dhaptar iki kanthi cara sing padha kaya sing kasebut ing ndhuwur kanggo teknik data.
Sebutake teknologi ing lowongan kanggo posisi ilmuwan data ing 2020
Yen kita ngomong babagan jumlah total, dibandhingake karo rekrutmen sing dianggep sadurunge, ana 28% luwih lowongan (12 lawan 013). Ayo ndeleng teknologi sing kurang umum ing lowongan kanggo ilmuwan data tinimbang kanggo insinyur data.
Luwih populer ing teknik data
Grafik ing ngisor iki nuduhake tembung kunci kanthi rata-rata bedane luwih saka 10% utawa kurang saka -10%.
Beda paling gedhe ing frekuensi tembung kunci antarane insinyur data lan ilmuwan data
AWS nuduhake kenaikan paling signifikan: ing teknik data katon 25% luwih rutin tinimbang ing ilmu data (kira-kira 45% lan 20% saka total lowongan, mungguh). Bentenipun katon!
Ing ngisor iki data sing padha ing presentasi sing rada beda - ing grafik, asil kanggo tembung kunci sing padha ing lowongan kanggo posisi insinyur data lan ilmuwan data dumunung ing sisih.
Beda paling gedhe ing frekuensi tembung kunci antarane insinyur data lan ilmuwan data
Lompat paling gedhe sabanjure sing dakcathet yaiku ing Spark - insinyur data asring kudu nggarap data gedhe.
Kurang populer ing teknik data
Saiki ayo goleki teknologi sing kurang populer ing lowongan data engineer.
Penurunan paling cetha dibandhingake karo sektor ilmu data dumadi ing
Dibutuhake ing teknik data lan ilmu data
Sampeyan kudu nyatet sing wolung saka sepuluh posisi pisanan ing loro set padha. SQL, Python, Spark, AWS, Java, Hadoop, Hive lan Scala mlebu ing sepuluh paling dhuwur kanggo industri teknik data lan ilmu data. Ing grafik ing ngisor iki sampeyan bisa ndeleng limalas teknologi sing paling populer ing antarane para pengusaha data engineer, lan ing jejere ana tingkat lowongan kanggo ilmuwan data.
Rekomendasi
Yen sampeyan pengin mlebu teknik data, aku bakal menehi saran supaya sampeyan bisa nguwasani teknologi ing ngisor iki - aku dhaptar kanthi prioritas.
Sinau SQL. Aku condong menyang PostgreSQL amarga iku open source, banget populer ing masyarakat, lan ing phase wutah. Sampeyan bisa sinau carane nggunakake basa saka buku My Memorable SQL - versi pilot kasedhiya
Master Python, sanajan ora ing tingkat paling hardcore. My Memorable Python dirancang khusus kanggo pamula. Bisa dituku ing
Sawise sampeyan kenal karo Python, pindhah menyang panda, perpustakaan Python sing digunakake kanggo ngresiki lan ngolah data. Yen sampeyan ngarahake kerja ing perusahaan sing mbutuhake kemampuan nulis ing Python (lan iki minangka mayoritas), sampeyan bisa yakin manawa kawruh babagan panda bakal dianggep minangka standar. Saiki aku lagi ngrampungake pandhuan pambuka kanggo nggarap panda - sampeyan bisa
Master AWS. Yen sampeyan pengin dadi insinyur data, sampeyan ora bisa nindakake tanpa platform maya ing stash, lan AWS sing paling populer. Kursus-kursus kasebut mbantu aku
Yen sampeyan wis ngrampungake kabeh dhaptar iki lan pengin luwih akeh ing mata para pengusaha minangka insinyur data, aku saranake nambahake Apache Spark kanggo nggarap data gedhe. Sanajan risetku babagan lowongan data scientist nuduhake penurunan kapentingan, ing antarane insinyur data isih katon ing meh saben lowongan detik.
Ing pungkasan
Muga-muga sampeyan nemokake ringkesan babagan teknologi sing paling dikarepake kanggo insinyur data sing migunani. Yen sampeyan kepingin weruh kepiye kerja analis, waca
Source: www.habr.com