Volgens
Ek het in Januarie 2020 vakatures vir die pos van data-ingenieur ontleed om te verstaan watter tegnologievaardighede die gewildste is. Toe het ek die resultate vergelyk met statistieke oor vakatures vir die datawetenskaplike-pos – en 'n paar interessante verskille het na vore gekom.
Sonder veel aanhef, hier is die top tien tegnologieë wat die meeste in posplasings genoem word:
Melding van tegnologieë in vakatures vir die pos van data-ingenieur in 2020
Verantwoordelikhede van 'n data-ingenieur
Vandag is die werk wat data-ingenieurs doen van groot belang vir organisasies – dit is die mense wat verantwoordelik is om inligting te stoor en in so 'n vorm te bring dat ander werknemers daarmee kan werk. Data-ingenieurs bou pyplyne om data uit verskeie bronne te stroom of te versamel. Pyplyne voer dan ekstraksie-, transformasie- en laaibewerkings uit (met ander woorde ETL-prosesse), wat die data meer geskik maak vir verdere gebruik. Hierna word die data aan ontleders en datawetenskaplikes voorgelê vir dieper verwerking. Uiteindelik eindig die data sy reis in dashboards, verslae en masjienleermodelle.
Ek was op soek na inligting wat my in staat sou stel om 'n gevolgtrekking te maak oor watter tegnologieë tans die meeste in die werk van 'n data-ingenieur is.
metodes
Ek het inligting van drie werksoekwebwerwe ingesamel −
Vir elke sleutelwoord het ek die persentasie treffers uit die totale aantal tekste op elke webwerf afsonderlik bereken, en dan die gemiddelde vir die drie bronne bereken.
Bevindinge
Hieronder is die dertig terme vir tegniese data-ingenieurswese met die hoogste tellings oor al drie werkswerwe.
En hier is dieselfde getalle, maar in tabelvorm aangebied:
Kom ons gaan in volgorde.
Hersiening van resultate
Beide SQL en Python verskyn in meer as twee derdes van die werksgeleenthede wat nagegaan is. Dit is hierdie twee tegnologieë wat sin maak om eerste te studeer.
Spark word in ongeveer die helfte van die vakatures genoem.
AWS verskyn in ongeveer 45% van posplasings. Dit is 'n wolkrekenaarplatform wat deur Amazon vervaardig word; dit het die grootste markaandeel onder alle wolkplatforms.
Volgende kom Java en Hadoop - 'n bietjie meer as 40% vir hul broer.
Dit is soos om in 'n tydmasjien te ry
Dan sien ons Hive, Scala, Kafka en NoSQL – elkeen van hierdie tegnologieë word genoem in 'n kwart van die vakatures wat ingedien is. Apache Hive is 'n datapakhuissagteware wat "dit maklik maak om groot datastelle wat in verspreide winkels woon, met behulp van SQL te lees, skryf en bestuur."
Vergelyking met terme in vakatures vir datawetenskaplikes
Hier is dertig tegnologieterme wat die algemeenste onder datawetenskap-werkgewers voorkom. Ek het hierdie lys op dieselfde manier verkry as wat hierbo beskryf is vir data-ingenieurswese.
Meldings van tegnologie in vakatures vir die pos van datawetenskaplike in 2020
As ons praat oor die totale getal, in vergelyking met die voorheen oorweegde werwing, was daar 28% meer vakatures (12 013 teenoor 9396 XNUMX). Kom ons kyk watter tegnologieë is minder algemeen in vakatures vir datawetenskaplikes as vir data-ingenieurs.
Meer gewild in data-ingenieurswese
Die grafiek hieronder wys sleutelwoorde met 'n gemiddelde verskil van meer as 10% of minder as -10%.
Die grootste verskille in navraagfrekwensie tussen data-ingenieur en datawetenskaplike
AWS toon die beduidendste toename: in data-ingenieurswese verskyn dit 25% meer gereeld as in datawetenskap (onderskeidelik ongeveer 45% en 20% van die totale aantal vakatures). Die verskil is merkbaar!
Hier is dieselfde data in 'n effens ander aanbieding - in die grafiek is die resultate vir dieselfde sleutelwoord in die vakatures vir die pos van data-ingenieur en data-wetenskaplike langs mekaar geleë.
Die grootste verskille in navraagfrekwensie tussen data-ingenieur en datawetenskaplike
Die volgende grootste sprong wat ek opgemerk het, was in Spark - 'n data-ingenieur moet dikwels met groot data werk.
Minder gewild in data-ingenieurswese
Kom ons kyk nou watter tegnologie minder gewild is in vakatures vir data-ingenieurs.
Die skerpste afname in vergelyking met die datawetenskapsektor het in
In aanvraag in beide data-ingenieurswese en datawetenskap
Daar moet kennis geneem word dat agt van die eerste tien posisies in beide stelle dieselfde is. SQL, Python, Spark, AWS, Java, Hadoop, Hive en Scala het dit in die top tien vir beide die data-ingenieurswese en datawetenskap industrieë gemaak. In die grafiek hieronder kan jy die vyftien gewildste tegnologieë onder data-ingenieur-werkgewers sien, en langs hulle is hul vakaturekoers vir datawetenskaplikes.
Aanbevelings
As jy by data-ingenieurswese wil ingaan, sal ek jou aanraai om die volgende tegnologieë te bemeester - ek lys hulle in volgorde van benaderde prioriteit.
Leer SQL. Ek neig na PostgreSQL omdat dit oopbron is, baie gewild in die gemeenskap en in 'n groeifase is. Jy kan leer hoe om die taal te gebruik uit die boek My Memorable SQL – die loodsweergawe daarvan is beskikbaar
Meester Python, selfs al is dit nie op die mees harde vlak nie. My Memorable Python is spesifiek ontwerp vir beginners. Dit kan gekoop word by
Sodra jy vertroud is met Python, gaan aan na pandas, 'n Python-biblioteek wat gebruik word vir die skoonmaak en verwerking van data. As jy mik om in 'n maatskappy te werk wat die vermoë vereis om in Python te skryf (en dit is die meerderheid daarvan), kan jy seker wees dat kennis van pandas by verstek aanvaar word. Ek is tans besig om 'n inleidende gids vir die werk met pandas klaar te maak - jy kan
Meester AWS. As jy 'n data-ingenieur wil word, kan jy nie sonder 'n wolkplatform in die voorraad nie, en AWS is die gewildste van hulle. Die kursusse het my baie gehelp
As jy reeds hierdie hele lys voltooi het en verder wil groei in die oë van werkgewers as 'n data-ingenieur, stel ek voor dat jy Apache Spark byvoeg om met groot data te werk. Alhoewel my navorsing oor vakatures vir datawetenskaplikes 'n afname in belangstelling getoon het, verskyn dit by data-ingenieurs steeds in byna elke tweede vakature.
Op die laaste
Ek hoop jy het hierdie oorsig van die mees-aanvraag-tegnologieë vir data-ingenieurs nuttig gevind. As jy wonder hoe ontleder-poste vaar, lees
Bron: will.com