Sumala sa
Gisusi nako ang mga bakante alang sa posisyon sa data engineer kay naa sila sa Enero 2020 aron masabtan kung unsang mga kahanas sa teknolohiya ang labing popular. Dayon akong gitandi ang mga resulta sa mga estadistika sa mga bakante alang sa posisyon sa data scientist - ug mitumaw ang pipila ka makapaikag nga mga kalainan.
Kung walaβy daghang pasiuna, ania ang nag-una nga napulo nga mga teknolohiya nga kanunay nga gihisgutan sa mga pag-post sa trabaho:
Paghisgot sa mga teknolohiya sa mga bakante alang sa posisyon sa data engineer sa 2020
Mga responsibilidad sa usa ka data engineer
Karon, ang trabaho nga gihimo sa mga inhenyero sa datos hinungdanon kaayo alang sa mga organisasyon - kini ang mga tawo nga responsable sa pagtipig sa kasayuran ug pagdala niini sa ingon nga porma nga ang ubang mga empleyado makatrabaho niini. Ang mga inhenyero sa datos nagtukod og mga pipeline aron ma-stream o batch ang datos gikan sa daghang mga gigikanan. Ang mga pipeline dayon nagpahigayon sa pagkuha, pagbag-o, ug pagkarga nga mga operasyon (sa laing pagkasulti, mga proseso sa ETL), nga naghimo sa datos nga mas angay alang sa dugang nga paggamit. Pagkahuman niini, ang datos gisumite sa mga analista ug mga siyentipiko sa datos alang sa mas lawom nga pagproseso. Sa katapusan, ang datos nagtapos sa panaw niini sa mga dashboard, mga taho, ug mga modelo sa pagkat-on sa makina.
Nangita ko og impormasyon nga magtugot kanako sa paghimo og konklusyon mahitungod sa unsa nga mga teknolohiya ang labing gikinahanglan sa trabaho sa usa ka data engineer sa pagkakaron.
Mga pamaagi
Nagkolekta ko og impormasyon gikan sa tulo ka site sa pagpangita og trabaho β
Alang sa matag keyword, gikalkulo nako ang porsyento sa mga hit gikan sa kinatibuk-ang gidaghanon sa mga teksto sa matag site nga gilain, ug dayon gikalkulo ang kasagaran alang sa tulo ka mga tinubdan.
Π Π΅Π·ΡΠ»ΡΡΠ°ΡΡ
Sa ubos mao ang katloan nga teknikal nga mga termino sa engineering sa datos nga adunay labing taas nga marka sa tanan nga tulo nga mga site sa trabaho.
Ug ania ang parehas nga mga numero, apan gipresentar sa porma sa lamesa:
Magsunod-sunod ta.
Pagrepaso sa mga resulta
Ang SQL ug Python makita sa labaw sa dos-tersiya sa mga pag-abli sa trabaho nga gisusi. Kini ang duha ka teknolohiya nga makatarunganon nga tun-an una.
Gihisgotan ang Spark sa halos katunga sa mga bakante.
Ang AWS makita sa gibana-bana nga 45% sa mga pag-post sa trabaho. Kini usa ka plataporma sa cloud computing nga gigama sa Amazon; kini adunay pinakadako nga bahin sa merkado sa tanan nga mga platform sa panganod.
Sunod moabut ang Java ug Hadoop - labaw pa sa 40% alang sa ilang igsoon.
Morag nagsakay sa time machine
Dayon atong makita ang Hive, Scala, Kafka ug NoSQL - ang matag usa niini nga mga teknolohiya gihisgutan sa usa ka quarter sa gisumite nga mga bakante. Ang Apache Hive usa ka software sa data warehouse nga "nagpadali sa pagbasa, pagsulat, ug pagdumala sa dagkong mga dataset nga nagpuyo sa gipang-apod-apod nga mga tindahan gamit ang SQL."
Pagtandi sa mga termino sa mga bakanteng data scientist
Ania ang katloan ka termino sa teknolohiya nga kasagaran sa mga tag-iya sa data science. Nakuha nako kini nga lista sa parehas nga paagi sama sa gihulagway sa ibabaw alang sa data engineering.
Mga paghisgot sa teknolohiya sa mga bakante alang sa posisyon sa data scientist sa 2020
Kung hisgotan ang kinatibuk-ang gidaghanon, itandi sa gikonsiderar kaniadto nga recruitment, adunay 28% nga dugang nga mga bakante (12 kumpara sa 013). Atong tan-awon kung unsang mga teknolohiya ang dili kaayo kasagaran sa mga bakante alang sa mga siyentipiko sa datos kaysa sa mga inhenyero sa datos.
Mas popular sa data engineering
Ang graph sa ubos nagpakita sa mga keyword nga adunay average nga kalainan nga labaw sa 10% o ubos pa sa -10%.
Ang pinakadako nga kalainan sa keyword frequency tali sa data engineer ug data scientist
Gipakita sa AWS ang labing hinungdanon nga pagtaas: sa data engineering kini makita nga 25% nga mas kanunay kaysa sa data science (gibana-bana nga 45% ug 20% ββsa kinatibuk-ang gidaghanon sa mga bakante, matag usa). Mamatikdan ang kalainan!
Ania ang parehas nga datos sa usa ka gamay nga lahi nga presentasyon - sa graph, ang mga resulta alang sa parehas nga keyword sa mga bakante alang sa posisyon sa data engineer ug data scientist nahimutang sa kilid.
Ang pinakadako nga kalainan sa keyword frequency tali sa data engineer ug data scientist
Ang sunod nga pinakadako nga paglukso nga akong namatikdan mao ang Spark - usa ka inhenyero sa datos kanunay kinahanglan nga magtrabaho uban ang dagkong datos.
Dili kaayo popular sa data engineering
Karon atong tan-awon kung unsang mga teknolohiya ang dili kaayo popular sa mga bakante nga data engineer.
Ang labing grabe nga pagkunhod kung itandi sa sektor sa syensya sa datos nahitabo sa
Sa panginahanglan sa data engineering ug data science
Angay nga matikdan nga ang walo sa unang napulo ka mga posisyon sa duha ka set managsama. Ang SQL, Python, Spark, AWS, Java, Hadoop, Hive ug Scala nahimo kini nga top ten alang sa data engineering ug data science nga industriya. Sa graph sa ubos imong makita ang kinse ka labing inila nga mga teknolohiya sa mga employer sa data engineer, ug sunod niini mao ang ilang vacancy rate para sa mga data scientist.
rekomendasyon
Kung gusto nimo nga mosulod sa data engineering, tambagan ko ikaw sa pag-master sa mga mosunud nga teknolohiya - gilista nako sila sa han-ay sa gibanabana nga prayoridad.
Pagkat-on sa SQL. Nagsalig ako sa PostgreSQL tungod kay kini bukas nga gigikanan, sikat kaayo sa komunidad, ug naa sa yugto sa pagtubo. Makakat-on ka unsaon paggamit sa pinulongan gikan sa librong My Memorable SQL - ang pilot version niini anaa
Master Python, bisan kung dili sa labing hardcore nga lebel. Ang Akong Memorable Python gidisenyo alang sa mga nagsugod. Mahimo kini mapalit sa
Sa higayon nga pamilyar ka sa Python, padayon sa panda, usa ka librarya sa Python nga gigamit alang sa paglimpyo ug pagproseso sa datos. Kung nagtinguha ka nga magtrabaho sa usa ka kompanya nga nanginahanglan katakus sa pagsulat sa Python (ug kini ang kadaghanan sa kanila), makasiguro ka nga ang kahibalo sa mga panda mahunahuna nga default. Sa pagkakaron ako nagtapos sa usa ka pasiuna nga giya sa pagtrabaho uban sa mga panda - mahimo nimo
Master AWS. Kung gusto nimo mahimong usa ka inhenyero sa datos, dili nimo mahimo kung wala ang usa ka platform sa panganod sa stash, ug ang AWS ang labing inila sa kanila. Ang mga kurso nakatabang kaayo kanako
Kung nahuman na nimo kini nga tibuuk nga lista ug gusto nimo nga molambo pa sa mga mata sa mga tag-iya ingon usa ka inhenyero sa datos, gisugyot nako nga idugang ang Apache Spark alang sa pagtrabaho sa dagkong datos. Bisan kung ang akong panukiduki bahin sa mga bakanteng data scientist nagpakita sa pagkunhod sa interes, taliwala sa mga inhenyero sa datos makita gihapon kini sa halos matag segundo nga bakante.
Sa katapusan
Nanghinaut ko nga imong nakit-an kini nga kinatibuk-ang pagtan-aw sa labing gipangayo nga mga teknolohiya alang sa mga inhenyero sa datos nga mapuslanon. Kung nahibulong ka kung giunsa ang mga trabaho sa analista, basaha
Source: www.habr.com