ылайык
Кайсы технологиялык көндүмдөр эң популярдуу экенин түшүнүү үчүн мен 2020-жылдын январында маалымат инженеринин вакансияларын талдап чыктым. Андан кийин мен натыйжаларды статистикалык маалыматтар менен салыштырып көрдүм жана кээ бир кызыктуу айырмачылыктар пайда болду.
Көп преамбуласыз, бул жерде жумуш жарыяларында эң көп айтылган он технология:
2020-жылы маалымат инженери кызматына бош орундардагы технологияларды эске алуу
Маалымат инженеринин милдеттери
Бүгүнкү күндө маалымат инженерлери аткарган жумуш уюмдар үчүн чоң мааниге ээ - булар маалыматты сактоо жана аны башка кызматкерлер аны менен иштей ала тургандай формага келтирүү үчүн жооптуу адамдар. Маалымат инженерлери бир нече булактардан маалыматтарды агым же пакеттөө үчүн куурларды курат. Андан кийин түтүктөр экстракциялоо, трансформациялоо жана жүктөө операцияларын (башкача айтканда, ETL процесстерин) аткарып, маалыматтарды андан ары колдонууга ылайыктуу кылат. Андан кийин, маалыматтар аналитиктерге жана маалымат таануучуларга тереңирээк иштетүү үчүн берилет. Акыр-аягы, маалыматтар башкаруу панелдеринде, отчеттордо жана машина үйрөнүү моделдеринде өз сапарын аяктайт.
Мен азыр маалымат инженеринин ишинде кайсы технологиялар эң көп суроо-талапка ээ экендиги жөнүндө тыянак чыгарууга мүмкүндүк берүүчү маалыматты издеп жүрдүм.
ыкмалары
Мен үч жумуш издөө сайтынан маалымат чогултту -
Ар бир ачкыч сөз үчүн мен ар бир сайттагы тексттердин жалпы санынан өз-өзүнчө хиттердин пайызын эсептеп чыктым, андан кийин үч булак боюнча орточо эсепти эсептеп чыктым.
натыйжалары
Төмөндө бардык үч жумуш сайттарында эң жогорку баллга ээ болгон отуз техникалык маалымат инженериясынын шарттары бар.
Жана бул жерде ошол эле сандар, бирок таблица түрүндө берилген:
Тартип менен кетели.
Жыйынтыктарды карап чыгуу
SQL жана Python экөө тең каралып жаткан бош орундардын үчтөн экисинен көбүндө пайда болот. Дал ушул эки технология биринчи изилдөө үчүн мааниси бар.
Spark бош орундардын жарымына жакынында айтылат.
AWS жумуш жарыяларынын болжол менен 45% пайда болот. Бул Amazon тарабынан өндүрүлгөн булут эсептөө платформа болуп саналат; ал бардык булут платформаларынын арасында эң чоң рынок үлүшүнө ээ.
Кийинки Java жана Hadoop - алардын бир тууганы үчүн 40% дан бир аз көбүрөөк.
Бул убакыт машинасында жүргөндөй
Андан кийин биз Hive, Scala, Kafka жана NoSQLди көрөбүз - бул технологиялардын ар бири берилген вакансиялардын төрттөн биринде айтылган. Apache Hive - бул "SQL аркылуу бөлүштүрүлгөн дүкөндөрдө жайгашкан чоң маалымат топтомдорун окууну, жазууну жана башкарууну жеңилдеткен" маалымат кампасы.
Маалымат таануучу вакансиялардагы терминдер менен салыштыруу
Бул жерде маалымат илиминин жумуш берүүчүлөрүнүн арасында кеңири таралган отуз технологиялык термин бар. Мен бул тизмени маалымат инженериясы үчүн жогоруда айтылгандай эле алдым.
2020-жылы маалымат таануучу кызматына бош орундардагы технология жөнүндө айтылган
Эгерде жалпы сан жөнүндө айта турган болсок, буга чейин каралып жаткан ишке кабыл алуу менен салыштырганда, бош орундар 28% көп болгон (12 013 9396 XNUMXга каршы). Келгиле, маалымат инженерлерине караганда маалымат таануучулар үчүн бош орундарда кайсы технологиялар азыраак экенин карап көрөлү.
Маалымат инженериясында көбүрөөк популярдуу
Төмөнкү графикте орточо айырмасы 10%дан ашкан же -10%тен азыраак ачкыч сөздөр көрсөтүлгөн.
Маалымат инженери менен маалымат илимпозунун ортосундагы ачкыч сөз жыштыгындагы эң чоң айырмачылыктар
AWS эң олуттуу өсүштү көрсөтөт: маалымат инженериясында ал маалымат илимине караганда 25% көбүрөөк пайда болот (болжол менен 45% жана 20% бош орундардын жалпы санынын тиешелүүлүгүнө жараша). Айырмачылык байкалып турат!
Мына ошол эле маалыматтар бир аз башкача презентацияда - графикте маалымат инженери жана маалымат таануучу кызматына бош орундардагы бир эле ачкыч сөздүн натыйжалары жанаша жайгашкан.
Маалымат инженери менен маалымат илимпозунун ортосундагы ачкыч сөз жыштыгындагы эң чоң айырмачылыктар
Мен белгилеген кийинки эң чоң секирик Spark болду - маалымат инженери көбүнчө чоң маалыматтар менен иштеши керек.
Маалымат инженериясында анча популярдуу эмес
Эми маалымат инженери вакансияларында кайсы технологиялар анча популярдуу эмес экенин карап көрөлү.
Маалымат илими секторуна салыштырмалуу эң кескин төмөндөө жылы болгон
Маалымат инженериясында жана маалымат илиминде суроо-талап
Белгилей кетсек, эки комплекттеги биринчи он позициянын сегизи бирдей. SQL, Python, Spark, AWS, Java, Hadoop, Hive жана Scala аны маалымат инженериясы жана маалымат илими тармактары үчүн алдыңкы ондукка киргизишти. Төмөнкү графикте маалымат инженери боюнча иш берүүчүлөр арасында эң популярдуу он беш технологияны көрө аласыз жана алардын жанында маалымат илимпоздорунун вакансиясынын көрсөткүчү.
сунуштар
Эгер сиз маалымат инженериясына киргиңиз келсе, мен сизге төмөнкү технологияларды өздөштүрүүнү кеңеш берет элем - мен аларды болжолдуу приоритеттик тартипте тизмелеп берем.
SQL үйрөн. Мен PostgreSQLге ыктап жатам, анткени ал ачык булак, коомчулукта абдан популярдуу жана өсүү фазасында. Тилди кантип колдонууну My Memorable SQL китебинен үйрөнө аласыз - анын пилоттук версиясы бар
Master Python, эң катуу деңгээлде болбосо да. My Memorable Python үйрөнчүктөр үчүн атайын иштелип чыккан. Аны сатып алса болот
Python менен таанышкандан кийин, маалыматтарды тазалоо жана иштетүү үчүн колдонулган Python китепканасы болгон пандаларга өтүңүз. Эгер сиз Python тилинде жазуу жөндөмүн талап кылган компанияда иштөөнү максат кылып жатсаңыз (жана бул алардын көпчүлүгү), пандалар жөнүндө билим демейки боюнча кабыл алынат деп ишенсеңиз болот. Мен учурда пандалар менен иштөө боюнча таанышуу колдонмосун бүтүрүп жатам - сиз жасай аласыз
Master AWS. Эгер сиз маалымат инженери болгуңуз келсе, анда булут платформасысыз булут платформасы жок кыла албайсыз жана AWS алардын эң популярдуусу. Курстар мага абдан жардам берди
Эгер сиз бул тизмени толук бүтүргөн болсоңуз жана маалымат инженери катары иш берүүчүлөрдүн көз алдында андан ары өсүүнү кааласаңыз, мен чоң маалыматтар менен иштөө үчүн Apache Spark кошууну сунуштайм. Дата илимпоздорунун вакансиялары боюнча менин изилдөөм кызыгуунун азайгандыгын көрсөттү, бирок маалымат инженерлери арасында ал дагы эле дээрлик ар бир экинчи бош орунда пайда болот.
акыркы учурда
Маалымат инженерлери үчүн эң көп талап кылынган технологиялардын бул баяндамасын сиз пайдалуу деп таптыңыз деп үмүттөнөм. Эгерде сиз аналитиктердин жумушу кандай болуп жатканына кызыксаңыз, окуңуз
Source: www.habr.com