Mukaan
Analysoin tietoinsinöörin avoimia työpaikkoja sellaisena kuin ne ovat tammikuussa 2020 ymmärtääkseni, mitkä teknologiataidot ovat suosituimpia. Sitten vertasin tuloksia tilastotieteilijöiden avoimista työpaikoista - ja mielenkiintoisia eroja tuli esiin.
Ilman suurta johdantoa, tässä on kymmenen parasta tekniikkaa, jotka mainitaan useimmin työpaikkailmoituksissa:
Teknologioiden maininta avoimissa työpaikoissa tietoinsinöörin tehtävään vuonna 2020
Tietosuunnittelijan tehtävät
Nykyään tietoinsinöörien työllä on suuri merkitys organisaatioille - he ovat vastuussa tiedon tallentamisesta ja saattamisesta sellaiseen muotoon, että muut työntekijät voivat työskennellä sen parissa. Tietosuunnittelijat rakentavat putkia datan suoratoistamiseksi tai eräajoin useista lähteistä. Liukulinjat suorittavat sitten poiminta-, muunnos- ja latausoperaatioita (eli ETL-prosesseja), mikä tekee tiedosta sopivampaa jatkokäyttöön. Tämän jälkeen tiedot toimitetaan analyytikoille ja datatieteilijöille syvempää käsittelyä varten. Lopuksi data päättää matkansa kojelaudoissa, raporteissa ja koneoppimismalleissa.
Etsin tietoa, jonka avulla voisin tehdä johtopäätöksen siitä, mitkä tekniikat ovat tällä hetkellä kysytyimpiä tietoinsinöörin työssä.
menetelmät
Keräsin tietoa kolmelta työnhakusivustolta −
Laskin jokaiselle avainsanalle osumien prosenttiosuuden kunkin sivuston tekstien kokonaismäärästä erikseen ja lasken sitten kolmen lähteen keskiarvon.
Tulokset
Alla on kolmekymmentä teknisen tiedon suunnittelutermiä, joilla on korkeimmat pisteet kaikilla kolmella työmaalla.
Ja tässä ovat samat numerot, mutta esitetty taulukkomuodossa:
Mennään järjestyksessä.
Tulosten tarkastelu
Sekä SQL että Python esiintyvät yli kahdessa kolmasosassa tarkastetuista työpaikoista. Juuri näitä kahta tekniikkaa on järkevää tutkia ensin.
Spark mainitaan noin puolessa avoimista työpaikoista.
AWS esiintyy noin 45 %:ssa työpaikkailmoituksista. Se on Amazonin valmistama pilvilaskenta-alusta; sillä on suurin markkinaosuus pilvialustojen joukossa.
Seuraavaksi tulevat Java ja Hadoop – hieman yli 40 % heidän veljelleen.
Se on kuin aikakoneessa ajamista
Sitten näemme Hiven, Scalan, Kafkan ja NoSQL:n – jokainen näistä teknologioista mainitaan neljänneksessä jätetyistä avoimista työpaikoista. Apache Hive on tietovarastoohjelmisto, jonka avulla on helppo lukea, kirjoittaa ja hallita suuria tietojoukkoja, jotka sijaitsevat hajautetuissa kaupoissa SQL:n avulla.
Vertailu termeihin datatieteilijöiden avoimissa työpaikoissa
Tässä on kolmekymmentä datatieteen työnantajien keskuudessa yleisintä teknologiatermiä. Sain tämän luettelon samalla tavalla kuin edellä on kuvattu tietotekniikan osalta.
Teknologia mainitaan avoimessa datatutkijan virassa 2020
Jos puhumme kokonaismäärästä, niin avoimia työpaikkoja oli 28 % enemmän kuin aiemmin harkittuun rekrytointiin (12 013 vs. 9396 XNUMX). Katsotaanpa, mitkä tekniikat ovat vähemmän yleisiä tietotieteilijöiden avoimissa työpaikoissa kuin tietoinsinööreissä.
Suositumpi tietotekniikassa
Alla oleva kaavio näyttää avainsanat, joiden keskimääräinen ero on yli 10 % tai alle -10 %.
Suurimmat erot avainsanojen esiintymistiheydessä tietotekniikan ja datatieteilijän välillä
Merkittävin kasvu on AWS:ssä: tietotekniikassa sitä esiintyy 25 % säännöllisemmin kuin datatieteessä (noin 45 % ja 20 % avoimien työpaikkojen kokonaismäärästä). Ero on havaittavissa!
Tässä samat tiedot hieman erilaisessa esityksessä - kaaviossa saman avainsanan tulokset tietoinsinöörin ja datatieteilijän viran avoimissa työpaikoissa sijaitsevat vierekkäin.
Suurimmat erot avainsanojen esiintymistiheydessä tietotekniikan ja datatieteilijän välillä
Seuraavaksi suurin hyppy, jonka huomasin, oli Sparkissa – datainsinöörin on usein työskenneltävä big datan kanssa.
Vähemmän suosittu tietotekniikassa
Katsotaan nyt, mitkä tekniikat ovat vähemmän suosittuja tietotekniikan avoimissa työpaikoissa.
Jyrkin lasku datatieteen sektoriin verrattuna tapahtui vuonna
Kysyntää sekä tietotekniikassa että datatieteessä
On huomattava, että kahdeksan ensimmäisestä kymmenestä paikasta molemmissa sarjoissa ovat samat. SQL, Python, Spark, AWS, Java, Hadoop, Hive ja Scala pääsivät kymmenen parhaan joukkoon sekä tietotekniikan että tietotieteen aloilla. Alla olevasta kaaviosta näet viisitoista suosituinta teknologiaa tietotekniikan työnantajien keskuudessa, ja niiden vieressä on heidän tietotieteilijöiden työpaikkojen määrä.
Suositukset
Jos haluat päästä tietotekniikkaan, neuvoisin sinua hallitsemaan seuraavat tekniikat - luettelen ne likimääräisen prioriteetin järjestyksessä.
Opi SQL. Nojaudun PostgreSQL:ään, koska se on avoimen lähdekoodin, erittäin suosittu yhteisössä ja kasvuvaiheessa. Voit oppia käyttämään kieltä kirjasta My Memorable SQL - sen pilottiversio on saatavilla
Hallitse Python, vaikka ei kovimmalla tasolla. My Memorable Python on suunniteltu erityisesti aloittelijoille. Sen voi ostaa osoitteesta
Kun olet tutustunut Pythoniin, siirry pandaan, Python-kirjastoon, jota käytetään tietojen puhdistamiseen ja käsittelyyn. Jos aiot työskennellä yrityksessä, joka vaatii kykyä kirjoittaa Pythonilla (ja tämä on suurin osa niistä), voit olla varma, että pandojen tuntemus oletetaan oletuksena. Olen parhaillaan viimeistelemässä johdanto-opasta pandojen kanssa työskentelemiseen – voit
Master AWS. Jos haluat tulla tietoinsinööriksi, et tule toimeen ilman pilvialustaa kätkössä, ja AWS on niistä suosituin. Kurssit auttoivat minua paljon
Jos olet jo suorittanut tämän koko luettelon ja haluat kasvaa edelleen työnantajien silmissä tietoinsinöörinä, suosittelen Apache Sparkin lisäämistä big datan parissa työskentelemiseen. Vaikka tutkimusni tietotieteilijöiden avoimista työpaikoista osoitti kiinnostuksen vähentymistä, tietoinsinöörien keskuudessa sitä esiintyy edelleen lähes joka toisella avoimella työpaikalla.
vihdoin
Toivottavasti tämä tietoteknologioiden kysytyimpien teknologioiden yleiskatsaus oli sinulle hyödyllinen. Jos mietit, kuinka analyytikkotyöt sujuvat, lue
Lähde: will.com