Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

De réir staitisticí 2019, tá innealtóir sonraí ina ghairm faoi láthair a bhfuil a éileamh ag fás níos tapúla ná aon cheann eile. Tá ról ríthábhachtach ag innealtóir sonraí in eagraíocht - ag cruthú agus ag cothabháil píblínte agus bunachair shonraí a úsáidtear chun sonraí a phróiseáil, a athrú agus a stóráil. Cad iad na scileanna a theastaíonn ó ionadaithe na gairme seo ar dtús? An bhfuil an liosta difriúil ón méid a theastaíonn ó eolaithe sonraí? Foghlaimeoidh tú faoi seo go léir ó mo alt.

Rinne mé anailís ar fholúntais do phost an innealtóra sonraí mar atá siad i mí Eanáir 2020 chun a thuiscint cé na scileanna teicneolaíochta is mó a bhfuil éileamh orthu. Ansin chuir mé na torthaí i gcomparáid le staitisticí ar fholúntais don seasamh eolaí sonraí - agus tháinig roinnt difríochtaí suimiúla chun cinn.

Gan mórán brollach, seo na deich dteicneolaíochtaí is fearr a luaitear go minic i bpostálacha poist:

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Luaigh teicneolaíochtaí atá i bhfolúntais don phost mar innealtóir sonraí in 2020

Déanaimis é a dhéanamh amach.

Freagrachtaí innealtóra sonraí

Sa lá atá inniu ann, tá an obair a dhéanann innealtóirí sonraí thar a bheith tábhachtach d'eagraíochtaí - is iad seo na daoine atá freagrach as faisnéis a stóráil agus a thabhairt isteach i cibé foirm a bhféadfaidh fostaithe eile oibriú leis. Tógann innealtóirí sonraí píblínte chun sonraí a shruthú nó a bhaisc ó fhoinsí iolracha. Ansin déanann píblínte oibríochtaí eastósctha, claochlaithe agus lódála (i bhfocail eile, próisis ETL), rud a fhágann go bhfuil na sonraí níos oiriúnaí le húsáid bhreise. Tar éis seo, cuirtear na sonraí faoi bhráid anailísithe agus eolaithe sonraí le haghaidh próiseála níos doimhne. Ar deireadh, cuireann na sonraí críoch lena aistear i ndeischláir, tuarascálacha, agus samhlacha meaisínfhoghlama.

Bhí mé ag lorg faisnéise a ligfeadh dom teacht ar chonclúid faoi na teicneolaíochtaí is mó a bhfuil éileamh orthu in obair innealtóra sonraí faoi láthair.

Modhanna

Bhailigh mé eolas ó thrí shuíomh cuardaigh fostaíochta - SimplyHired, Go deimhin и Monster agus d'fhéach sé ar na heochairfhocail a tháinig trasna i gcomhar le “innealtóir sonraí” i dtéacsanna na bhfolúntas a bhí dírithe ar chónaitheoirí SAM. Don tasc seo d'úsáid mé dhá leabharlann Python - Iarrataí и Anraith Álainn. I measc na heochairfhocail, chuir mé san áireamh iad siúd a bhí san áireamh sa liosta roimhe seo chun folúntais a anailísiú do phost eolaí sonraí, agus iad siúd a roghnaigh mé de láimh agus mé ag léamh tairiscintí fostaíochta d'innealtóirí sonraí. Ní raibh LinkedIn san áireamh sa liosta foinsí, ó cuireadh cosc ​​orm ansin tar éis mo iarracht dheireanach sonraí a bhailiú.

I gcás gach eochairfhocail, ríomh mé céatadán na n-amas ó líon iomlán na dtéacsanna ar gach suíomh ar leithligh, agus ansin ríomh mé an meán do na trí fhoinse.

Torthaí

Seo thíos na tríocha téarma innealtóireachta sonraí teicniúla leis na scóir is airde ar fud na dtrí shuíomh poist.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Agus seo iad na huimhreacha céanna, ach curtha i láthair i bhfoirm tábla:

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

A ligean ar dul in ord.

Athbhreithniú ar thorthaí

Tá SQL agus Python araon le feiceáil i níos mó ná dhá thrian de na hoscailtí poist a athbhreithníodh. Is iad an dá theicneolaíocht seo a bhfuil ciall le staidéar a dhéanamh orthu ar dtús. Python Is teanga ríomhchlárúcháin í a mbaintear úsáid as chun oibriú le sonraí, suíomhanna gréasáin a chruthú agus scripteanna a scríobh. SQL seasann do Structured Query Language; baineann sé le caighdeán arna chur i bhfeidhm ag grúpa teangacha agus úsáidtear é chun sonraí a aisghabháil ó bhunachair shonraí choibhneasta. Bhí an chuma air i bhfad ó shin agus tá sé cruthaithe go bhfuil sé an-resistant.

Luaitear Spark i thart ar leath de na folúntais. Apache Spark is “inneall mór aontaithe anailíse sonraí é le modúil ionsuite le haghaidh sruthú, SQL, meaisínfhoghlaim agus próiseáil graf.” Tá sé coitianta go háirithe i measc iad siúd a oibríonn le bunachair shonraí móra.

Tá AWS le feiceáil i thart ar 45% de na postálacha poist. Is ardán ríomhaireachta scamall é a mhonaraigh Amazon; tá an sciar den mhargadh is mó aige i measc na n-ardán scamall go léir.
Next teacht Java agus Hadoop - beagán níos mó ná 40% dá dheartháir. java Is teanga í a labhraítear go forleathan, a bhfuil tástáil chath uirthi a Suirbhé Forbróirí Thar-sreabhadh Cruachta 2019 bronnadh an deichiú háit i measc na dteangacha a chuireann uafás i measc ríomhchláraitheoirí. I gcodarsnacht leis sin, ba é Python an dara teanga ba mhó a thaitin leis. Tá an teanga Java á reáchtáil ag Oracle, agus is féidir gach rud a theastaíonn uait a bheith agat a thuiscint ón ngabháil scáileáin seo den leathanach oifigiúil ó Eanáir 2020.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Tá sé cosúil le marcaíocht i meaisín ama
Cluiche Apache Hadoop úsáideann an tsamhail ríomhchlárúcháin MapReduce le braislí freastalaí le haghaidh sonraí móra. Anois tá an tsamhail seo á thréigean níos mó.

Ansin feicimid Hive, Scala, Kafka agus NoSQL - luaitear gach ceann de na teicneolaíochtaí seo sa cheathrú cuid de na folúntais a cuireadh isteach. Is bogearraí trádstórais sonraí é Apache Hive a fhágann go bhfuil sé éasca é a léamh, a scríobh agus a bhainistiú bunachair shonraí mhóra a bhfuil cónaí orthu i siopaí dáilte ag baint úsáide as SQL.” Scala – teanga ríomhchlárúcháin a úsáidtear go gníomhach agus tú ag obair le sonraí móra. Go háirithe, cruthaíodh Spark i Scala. Sa rangú a luadh cheana ar theangacha eaglasta, tá Scala san aonú háit déag. Apache Kafka – ardán dáilte chun teachtaireachtaí sruthaithe a phróiseáil. An-tóir orthu mar mhodh chun sonraí a shruthú.

Bunachar sonraí NoSQL codarsnacht idir iad féin agus SQL. Tá difríocht eatarthu sa mhéid is go bhfuil siad neamhchoibhneasta, neamhstruchtúrtha, agus inscálaithe go cothrománach. Tá roinnt tóir ar NoSQL, ach tá an chuma ar an scéal go bhfuil an cur chuige i mbaol, fiú go dtí an pointe tairgí go dtiocfaidh sé in ionad SQL mar an paraidím stórála ceannasach.

Comparáid le téarmaí i bhfolúntais eolaithe sonraí

Seo tríocha téarma teicneolaíochta is coitianta i measc fostóirí eolaíochta sonraí. Fuair ​​​​mé an liosta seo ar an mbealach céanna a thuairiscítear thuas le haghaidh innealtóireacht sonraí.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Luann an teicneolaíocht atá i bhfolúntais don phost mar eolaí sonraí in 2020

Má labhairt linn faoin líon iomlán, i gcomparáid leis an earcaíocht a measadh roimhe seo, bhí 28% níos mó folúntais (12 i gcoinne 013). Feicfimid cé na teicneolaíochtaí atá chomh coitianta i bhfolúntais d'eolaithe sonraí ná mar atá d'innealtóirí sonraí.

Níos mó tóir san innealtóireacht sonraí

Taispeánann an graf thíos eochairfhocail le meándifríocht níos mó ná 10% nó níos lú ná -10%.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Na difríochtaí is mó i minicíocht eochairfhocal idir innealtóir sonraí agus eolaí sonraí

Léiríonn AWS an méadú is suntasaí: in innealtóireacht sonraí is cosúil go bhfuil sé 25% níos rialta ná san eolaíocht sonraí (thart ar 45% agus 20% de líon iomlán na bhfolúntas, faoi seach). Tá an difríocht faoi deara!

Seo na sonraí céanna i gcur i láthair beagán difriúil - sa ghraf, tá na torthaí don eochairfhocal céanna sna folúntais do phost innealtóir sonraí agus eolaí sonraí suite taobh le taobh.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Na difríochtaí is mó i minicíocht eochairfhocal idir innealtóir sonraí agus eolaí sonraí

Ba é an chéad léim eile is mó a thug mé faoi deara i Spark - is minic a bhíonn ar innealtóir sonraí oibriú le sonraí móra. Kafka méadú freisin 20%, is é sin, beagnach ceithre huaire i gcomparáid leis an toradh d'fholúntais eolaithe sonraí. Tá aistriú sonraí ar cheann de na príomhchúraimí atá ar innealtóir sonraí. Ar deireadh, bhí an líon tagairtí 15% níos airde i réimse na hinnealtóireachta sonraí do Java, NoSQL, Redshift, SQL agus Hadoop.

Níos lú tóir san innealtóireacht sonraí

Anois, déanaimis a fheiceáil cé na teicneolaíochtaí is lú tóir i bhfolúntais innealtóirí sonraí.
Tharla an laghdú is géire i gcomparáid leis an earnáil eolaíochta sonraí i R: tá an chuma air i thart ar 56% de na folúntais, anseo - ach amháin i 17%. go hiontach. Is teanga ríomhchláraithe í R a bhfuil fabhar ag eolaithe agus ag staitisteoirí uirthi, agus is í an t-ochtú teanga is mó eagla ar domhan í.

SAS le fáil freisin i bhfolúntais le haghaidh post innealtóir sonraí i bhfad níos lú go minic - is é an difríocht 14%. Is teanga dílseánaigh é SAS atá deartha chun oibriú le staitisticí agus sonraí. Pointe suimiúil: moltóireacht ar na torthaí mo chuid taighde ar oscailtí post d'eolaithe sonraí, tá go leor talún caillte aige le déanaí - níos mó ná aon teicneolaíocht eile.

Tá éileamh air san innealtóireacht sonraí agus san eolaíocht sonraí

Ba chóir a thabhairt faoi deara go bhfuil ocht gcinn de na chéad deich bpost sa dá shraith mar a chéile. Rinne SQL, Python, Spark, AWS, Java, Hadoop, Hive agus Scala é sna deich is fearr do na tionscail innealtóireachta sonraí agus eolaíochta sonraí araon. Sa ghraf thíos is féidir leat na cúig cinn déag de theicneolaíochtaí is coitianta i measc fostóirí innealtóirí sonraí a fheiceáil, agus in aice leo tá a ráta folúntais d'eolaithe sonraí.

Na scileanna is mó a bhfuil éileamh orthu i ngairm an innealtóra sonraí

Moltaí

Más mian leat dul i mbun innealtóireacht sonraí, mholfainn duit na teicneolaíochtaí seo a leanas a mháistir - déanaim iad a liostú in ord tosaíochta gar.

Foghlaim SQL. Tá mé ag claonadh i dtreo PostgreSQL toisc go bhfuil sé foinse oscailte, a bhfuil an-tóir air i measc an phobail, agus tá sé i gcéim fáis. Is féidir leat foghlaim conas an teanga a úsáid ón leabhar My Memorable SQL - tá a leagan píolótach ar fáil anseo.

Máistir Python, fiú mura bhfuil sé ar an leibhéal hardcore is mó. Tá My Memorable Python deartha go sonrach do thosaitheoirí. Is féidir é a cheannach ag Amazon, cóip leictreonach nó fisiciúil, do rogha féin, nó íoslódáil i bhformáid pdf nó epub ar an suíomh seo.

Nuair a bheidh tú eolach ar Python, bog ar aghaidh go pandas, leabharlann Python a úsáidtear chun sonraí a ghlanadh agus a phróiseáil. Má tá sé mar aidhm agat oibriú i gcuideachta a éilíonn an cumas chun scríobh i Python (agus is é seo an chuid is mó díobh), is féidir leat a bheith cinnte go nglacfar le heolas ar pandas de réir réamhshocraithe. Tá mé ag críochnú le treoir tosaigh faoi oibriú le pandas - is féidir leat liostáilionas nach gcaillfear nóiméad an scaoilte.

Máistir AWS. Más mian leat a bheith i d’innealtóir sonraí, ní féidir leat a dhéanamh gan ardán scamall sa stash, agus is é AWS an ceann is mó tóir orthu. Chuidigh na cúrsaí go mór liom Acadamh Linuxnuair a bhí mé ag staidéar innealtóireacht sonraí ar Google Cloud, is dóigh liom go mbeidh ábhair mhaith acu ar AWS freisin.

Má tá an liosta iomlán seo críochnaithe agat cheana féin agus gur mhaith leat fás a thuilleadh i súile na bhfostóirí mar innealtóir sonraí, molaim Apache Spark a chur leis le haghaidh oibriú le sonraí móra. Cé gur léirigh mo thaighde ar fholúntais eolaithe sonraí laghdú ar ús, i measc innealtóirí sonraí tá sé fós le feiceáil i mbeagnach gach soicind folúntas.

Faoi dheireadh

Tá súil agam go bhfuair tú an forbhreathnú seo ar na teicneolaíochtaí is mó éileamh d'innealtóirí sonraí úsáideach. Má tá tú ag smaoineamh ar conas atá ag éirí le poist anailísí, léigh mo alt eile. Innealtóireacht sona!

Foinse: will.com

Add a comment