Data Engineer en Data Scientist: wat se kinne dwaan en hoefolle se fertsjinje

Tegearre mei Elena Gerasimova, haad fan 'e fakulteit "Data Science and Analytics» Yn Netology bliuwe wy begripe hoe't se mei-inoar omgeane en hoe't Data Scientists en Data Engineers ferskille.

Yn it earste diel fertelden se oer de wichtichste ferskillen tusken Data Scientist en Data Engineer.

Yn dit materiaal sille wy prate oer wat kennis en feardichheden spesjalisten moatte hawwe, wat ûnderwiis wurdt wurdearre troch wurkjouwers, hoe't ynterviews wurde útfierd, en hoefolle data yngenieurs en data wittenskippers fertsjinje. 

Wat wittenskippers en yngenieurs moatte witte

De spesjalisearre oplieding foar beide spesjalisten is Computer Science.

Data Engineer en Data Scientist: wat se kinne dwaan en hoefolle se fertsjinje

Elke gegevenswittenskipper - gegevenswittenskipper as analist - moat de krektens fan har konklúzjes kinne bewize. Dêrfoar kinne jo net sûnder kennis statistyk en statistyk-relatearre basis wiskunde.

Tools foar masinelearen en gegevensanalyse binne ûnmisber yn 'e moderne wrâld. As de gewoane ark net beskikber binne, moatte jo de feardichheden hawwe fluch nije ark leare, ienfâldige skripts meitsje om taken te automatisearjen.

It is wichtich om te notearjen dat de gegevenswittenskipper de resultaten fan 'e analyse effektyf moat kommunisearje. It sil him hjirmei helpe data fisualisaasje of de resultaten fan ûndersyk en testen fan hypotezen. Spesjalisten moatte yn steat wêze om diagrammen en grafiken te meitsjen, fisualisaasje-ark brûke, en gegevens fan dashboards begripe en ferklearje.

Data Engineer en Data Scientist: wat se kinne dwaan en hoefolle se fertsjinje

Foar in data-yngenieur komme trije gebieten nei foaren.

Algoritmen en gegevensstruktueren. It is wichtich om goed te wurden by it skriuwen fan koade en it brûken fan basisstruktueren en algoritmen:

  • algoritme kompleksiteit analyze,
  • mooglikheid om dúdlike, ûnderhâldbere koade te skriuwen, 
  • batch ferwurking,
  • real-time ferwurking.

Databases en data warehouses, Business Intelligence:

  • gegevens opslach en ferwurking,
  • ûntwerp fan folsleine systemen,
  • Data opname,
  • ferspraat triem systemen.

Hadoop en Big Data. D'r binne hieltyd mear gegevens, en oer de hoarizon fan 3-5 jier sille dizze technologyen needsaaklik wurde foar elke yngenieur. Plus:

  • Data Lakes
  • wurkje mei wolkproviders.

Masine learen sil brûkt wurde oeral, en it is wichtich om te begripen hokker saaklike problemen it sil helpe oplosse. It is net nedich om modellen te meitsjen (datawittenskippers kinne dit omgean), mar jo moatte har tapassing en de oerienkommende easken begripe.

Hoefolle fertsjinje yngenieurs en wittenskippers?

Data Engineer Ynkommen

Yn ynternasjonale praktyk startsalarissen binne typysk $ 100 yn 't jier en ferheegje signifikant mei ûnderfining, neffens Glassdoor. Dêrneist bedriuwen faak biede stock opsjes en 000-5% jierlikse bonussen.

Yn Ruslân oan it begjin fan in karriêre, it salaris is meastal net minder as 50 tûzen roebel yn 'e regio en 80 tûzen yn Moskou. Gjin oare ûnderfining as foltôge training is op dit stadium fereaske.

Nei 1-2 jier wurk - in gabel fan 90-100 tûzen roebel.

De foarke nimt ta 120-160 tûzen yn 2-5 jier. Der komme faktoaren by as de spesjalisaasje fan eardere bedriuwen, de grutte fan projekten, wurk mei big data, ensfh.

Nei 5 jier wurk is it makliker om fakatueres te sykjen yn relatearre ôfdielingen of oan te freegjen foar heul spesjalisearre posysjes lykas:

  • Arsjitekt of leadûntwikkelder yn in bank of telekom - sawat 250 tûzen.

  • Pre-ferkeap fan de ferkeaper waans technologyen jo wurke mei meast nau - 200 tûzen plus in mooglike bonus (1-1,5 miljoen roebel). 

  • Eksperts yn de útfiering fan Enterprise saaklike applikaasjes, lykas SAP - oant 350 tûzen.

Ynkommen fan gegevens wittenskippers

Undersyk merk fan analysts fan it bedriuw "Normaal Undersyk" en de werving agintskip New.HR docht bliken dat Data Science spesjalisten krije gemiddeld in heger salaris as analysts fan oare spesjaliteiten. 

Yn Ruslân begjint it salaris fan in gegevenswittenskipper mei maksimaal in jier ûnderfining fan 113 tûzen roebel. 

It foltôgjen fan opliedingsprogramma's wurdt no ek rekken holden as wurkûnderfining.

Nei 1-2 jier kin sa'n spesjalist al oant 160 tûzen krije.

Foar in meiwurker mei 4-5 jier ûnderfining, de gabel ferheget nei 310 tûzen.

Hoe wurde ynterviews útfierd?

Yn it Westen hawwe ôfstudearden fan beropsopliedingsprogramma's har earste ynterview gemiddeld 5 wiken nei it ôfstudearjen. Sa'n 85% fynt nei 3 moannen in baan.

It ynterviewproses foar posysjes foar gegevensingenieur en gegevenswittenskipper is praktysk itselde. Gewoanlik bestiet út fiif stadia.

Gearfetting. Kandidaten mei net-kearn foarôfgeande ûnderfining (bgl. marketing) binne ferplichte om in detaillearre omslachbrief foar elk bedriuw te meitsjen of in referinsje te hawwen fan in fertsjintwurdiger fan dat bedriuw.

Technyske screening. It bart meast oer de telefoan. Bestiet út ien of twa komplekse en safolle ienfâldige fragen yn ferbân mei de hjoeddeiske stack fan de wurkjouwer.

HR ynterview. Kin dien wurde oer de telefoan. Op dit stadium wurdt de kandidaat hifke foar algemiene adekwaatheid en fermogen om te kommunisearjen.

Technysk ynterview. Meast faak it fynt plak yn persoan. Yn ferskate bedriuwen is it nivo fan posysjes yn 'e personielstafel oars, en posysjes kinne oars wurde neamd. Dêrom is it op dit stadium technyske kennis dy't wurdt hifke.

Ynterview mei CTO / Chief Architect. Yngenieur en wittenskipper binne strategyske posysjes, en foar in protte bedriuwen binne se ek nij. It is wichtich dat de manager de potinsjele kollega fynt en it mei him iens is yn syn opfettings.

Wat sil wittenskippers en yngenieurs helpe yn har karriêregroei?

In protte nije ark foar it wurkjen mei gegevens binne ferskynd. En in pear minsken binne like goed foar elkenien. 

In protte bedriuwen binne net ree om meiwurkers te hieren sûnder wurkûnderfining. Kandidaten mei in minimale eftergrûn en kennis fan 'e basis fan populêre ark kinne lykwols de nedige ûnderfining krije as se sels leare en ûntwikkelje.

Nuttige kwaliteiten foar in data-yngenieur en datawittenskipper

Begearte en fermogen om te learen. Jo hoege jo net direkt ûnderfining te jagen of wurk te feroarjen foar in nij ark, mar jo moatte ree wêze om te wikseljen nei in nij gebiet.

De winsk om routine prosessen te automatisearjen. Dit is wichtich net allinich foar produktiviteit, mar ek foar it behâld fan hege gegevenskwaliteit en snelheid fan levering oan 'e konsumint.

Opmerksumens en begryp fan "wat is ûnder de motorkap" fan prosessen. In spesjalist dy't observaasje en yngeande kennis fan 'e prosessen hat, sil it probleem rapper oplosse.

Neist poerbêste kennis fan algoritmen, gegevensstruktueren en pipelines, moatte jo leare te tinken yn produkten - sjoch arsjitektuer en saaklike oplossing as ien foto. 

It is bygelyks nuttich om elke bekende tsjinst te nimmen en dêr in databank foar te kommen. Tink dan oer hoe't jo ETL en DW kinne ûntwikkelje dy't it mei gegevens sille folje, wat foar konsuminten sille wêze en wat wichtich is foar har om te witten oer de gegevens, en ek hoe't keapers ynteraksje mei applikaasjes: foar wurksykjen en dating, autoferhier , podcastapplikaasje, edukatyf platfoarm.

De posysjes fan in analist, gegevenswittenskipper en yngenieur binne heul tichtby, sadat jo rapper fan de iene rjochting nei de oare kinne ferpleatse dan út oare gebieten.

Yn alle gefallen sil it makliker wêze foar dyjingen mei elke IT-eftergrûn dan foar dyjingen dy't it net hawwe. Yn trochsneed wurde motivearre folwoeksenen elke 1,5-2 jier omfoarme en feroarje fan baan. Dit is makliker foar dyjingen dy't studearje yn in groep en mei in mentor, yn ferliking mei dyjingen dy't allinich op iepen boarnen fertrouwe.

Fan de redaksje fan Netology

As jo ​​​​sykje nei it berop fan Data Engineer of Data Scientist, noegje wy jo út om ús kursusprogramma's te studearjen:

Boarne: www.habr.com

Add a comment