Samkvæmt
Ég greindi laus störf í stöðu gagnaverkfræðings eins og þau eru í janúar 2020 til að skilja hvaða tæknikunnátta er vinsælust. Síðan bar ég niðurstöðurnar saman við tölfræði um laus störf í stöðu gagnafræðings - og þá kom í ljós áhugaverður munur.
Án mikillar forsögu eru hér tíu efstu tæknirnar sem oftast eru nefndar í atvinnutilkynningum:
Getið um tækni í lausum störfum í stöðu gagnaverkfræðings árið 2020
Ábyrgð gagnaverkfræðings
Í dag skiptir starfið sem gagnaverkfræðingar vinna miklu máli fyrir stofnanir - þetta er fólkið sem ber ábyrgð á að geyma upplýsingar og koma þeim í það form að aðrir starfsmenn geti unnið með þær. Gagnaverkfræðingar byggja leiðslur til að streyma eða safna gögnum frá mörgum aðilum. Leiðslur framkvæma síðan útdrátt, umbreytingu og hleðsluaðgerðir (með öðrum orðum, ETL ferli), sem gerir gögnin hentugri til frekari notkunar. Að þessu loknu eru gögnin send til greiningaraðila og gagnafræðinga til dýpri úrvinnslu. Að lokum enda gögnin ferð sína í mælaborðum, skýrslum og vélanámslíkönum.
Ég var að leita að upplýsingum sem gera mér kleift að draga ályktun um hvaða tækni er eftirsóttust í starfi gagnaverkfræðings um þessar mundir.
Aðferðir
Ég safnaði upplýsingum frá þremur atvinnuleitarsíðum −
Fyrir hvert leitarorð reiknaði ég út hlutfall heimsókna af heildarfjölda texta á hverri síðu fyrir sig og reiknaði síðan meðaltalið fyrir þessar þrjár heimildir.
Niðurstöður
Hér að neðan eru þrjátíu skilmálar fyrir tæknigagnaverkfræði með hæstu einkunnir á öllum þremur vinnusvæðum.
Og hér eru sömu tölur, en settar fram í töfluformi:
Förum í röð.
Farið yfir niðurstöður
Bæði SQL og Python birtast í meira en tveimur þriðju hluta þeirra starfa sem farið er yfir. Það eru þessar tvær tækni sem er skynsamlegt að læra fyrst.
Spark er nefndur í um helmingi lausra starfa.
AWS birtist í um það bil 45% af atvinnutilkynningum. Það er skýjatölvuvettvangur framleiddur af Amazon; það hefur stærstu markaðshlutdeild meðal allra skýjapalla.
Næst koma Java og Hadoop - aðeins meira en 40% fyrir bróður þeirra.
Þetta er eins og að hjóla í tímavél
Síðan sjáum við Hive, Scala, Kafka og NoSQL - hver þessara tækni er nefnd í fjórðungi innsendra lausra starfa. Apache Hive er gagnavöruhúsahugbúnaður sem „gerir það auðvelt að lesa, skrifa og stjórna stórum gagnasöfnum sem búa í dreifðum verslunum með því að nota SQL.
Samanburður við kjör í lausum störfum gagnafræðinga
Hér eru þrjátíu tæknihugtök sem eru algengust meðal vinnuveitenda í gagnavísindum. Ég fékk þennan lista á sama hátt og lýst er hér að ofan fyrir gagnaverkfræði.
Getið um tækni í lausum störfum í stöðu gagnafræðings árið 2020
Ef talað er um heildarfjöldann, miðað við ráðningar sem áður voru taldar, voru 28% fleiri laus störf (12 á móti 013). Við skulum sjá hvaða tækni er sjaldgæfari í lausum störfum fyrir gagnafræðinga en fyrir gagnafræðinga.
Vinsælli í gagnaverkfræði
Myndritið hér að neðan sýnir leitarorð með að meðaltali meiri munur en 10% eða minna en -10%.
Stærsti munurinn á leitarorðatíðni milli gagnafræðings og gagnafræðings
AWS sýnir mestu aukninguna: í gagnaverkfræði birtist það 25% oftar en í gagnafræði (um það bil 45% og 20% af heildarfjölda lausra starfa, í sömu röð). Munurinn er áberandi!
Hér eru sömu gögn í örlítið annarri framsetningu - á línuritinu eru niðurstöður fyrir sama leitarorð í lausum störfum í stöðu gagnafræðings og gagnafræðings staðsettar hlið við hlið.
Stærsti munurinn á leitarorðatíðni milli gagnafræðings og gagnafræðings
Næststærsta stökkið sem ég tók eftir var í Spark - gagnaverkfræðingur þarf oft að vinna með stór gögn.
Minna vinsæll í gagnaverkfræði
Nú skulum við sjá hvaða tækni er minna vinsæl í lausum störfum gagnaverkfræðinga.
Mesta samdrátturinn miðað við gagnavísindageirann átti sér stað í
Eftirsótt í bæði gagnaverkfræði og gagnafræði
Það skal tekið fram að átta af fyrstu tíu stöðunum í báðum settum eru þau sömu. SQL, Python, Spark, AWS, Java, Hadoop, Hive og Scala komust á topp tíu fyrir bæði gagnaverkfræði og gagnavísindaiðnaðinn. Á línuritinu hér að neðan má sjá fimmtán vinsælustu tæknina meðal vinnuveitenda gagnaverkfræðinga og við hlið þeirra er hlutfall lausra starfa hjá gagnafræðingum.
Tillögur
Ef þú vilt komast í gagnaverkfræði, myndi ég ráðleggja þér að ná tökum á eftirfarandi tækni - ég skrái þær í áætlaðri forgangsröð.
Lærðu SQL. Ég hallast að PostgreSQL vegna þess að það er opinn uppspretta, mjög vinsæll í samfélaginu og er á vaxtarskeiði. Þú getur lært hvernig á að nota tungumálið í bókinni My Memorable SQL - tilraunaútgáfa hennar er fáanleg
Master Python, jafnvel þó ekki á harðkjarnastigi. My Memorable Python er hannaður sérstaklega fyrir byrjendur. Það er hægt að kaupa á
Þegar þú hefur kynnt þér Python skaltu fara yfir í pandas, Python bókasafn sem er notað til að hreinsa og vinna gögn. Ef þú stefnir á að vinna í fyrirtæki sem krefst getu til að skrifa í Python (og þetta er meirihluti þeirra), geturðu verið viss um að sjálfgefið sé að þekking á pöndum sé gert ráð fyrir. Ég er núna að leggja lokahönd á kynningarleiðbeiningar um að vinna með pöndum - þú getur
Meistari AWS. Ef þú vilt verða gagnaverkfræðingur geturðu ekki verið án skýjapalls í geymslunni og AWS er vinsælastur þeirra. Námskeiðin hjálpuðu mér mikið
Ef þú hefur þegar lokið öllum þessum lista og vilt vaxa enn frekar í augum vinnuveitenda sem gagnaverkfræðingur, þá legg ég til að þú bætir Apache Spark við til að vinna með stór gögn. Þrátt fyrir að rannsóknir mínar á lausum störfum gagnafræðinga sýndu minnkandi áhuga, birtist hann hjá gagnaverkfræðingum enn í næstum öðru hverju lausu starfi.
Að lokum
Ég vona að þér hafi fundist þetta yfirlit yfir eftirsóttustu tækni fyrir gagnaverkfræðinga gagnlegt. Ef þú ert að velta fyrir þér hvernig greiningarstörfum gengur, lestu þá
Heimild: www.habr.com