د
ما د ډیټا انجینر پوسټ لپاره خالي ځایونه تحلیل کړل ځکه چې دوی د جنوري 2020 کې دي ترڅو پوه شي چې کوم ټیکنالوژي مهارتونه خورا مشهور دي. بیا ما پایلې د ډیټا ساینس پوه موقعیت لپاره د خالي ځایونو احصایو سره پرتله کړې - او ځینې په زړه پوري توپیرونه راڅرګند شول.
د ډیرو وړاندیزونو پرته، دلته لس غوره ټیکنالوژي دي چې ډیری وختونه د دندې پوستونو کې یادونه کیږي:
په 2020 کې د ډیټا انجینر پوسټ لپاره په خالي ځایونو کې د ټیکنالوژیو یادونه
د ډیټا انجنیر مسؤلیتونه
نن ورځ، هغه کار چې د ډیټا انجنیران یې کوي د سازمانونو لپاره خورا مهم دی - دا هغه خلک دي چې د معلوماتو ذخیره کولو او داسې بڼه کې یې راوړي چې نور کارمندان ورسره کار کولی شي. د ډیټا انجینران د ډیری سرچینو څخه ډیټا جریان یا بسته کولو لپاره پایپ لاینونه جوړوي. پایپ لاینونه بیا د استخراج، بدلون، او بارولو عملیات ترسره کوي (په بل عبارت، د ETL پروسې)، ډاټا د نورو کارولو لپاره خورا مناسب کوي. له دې وروسته، ډاټا د ژورې پروسس لپاره شنونکو او ډیټا ساینس پوهانو ته سپارل کیږي. په نهایت کې ، ډاټا خپل سفر په ډشبورډونو ، راپورونو ، او د ماشین زده کړې ماډلونو کې پای ته رسوي.
زه د معلوماتو په لټه کې وم چې ما ته اجازه راکړئ چې پایلې راولولم چې دا مهال د ډیټا انجینر په کار کې د کوم ټیکنالوژۍ ډیری غوښتنې دي.
میتودونه
ما د کار لټون د دریو سایټونو څخه معلومات راټول کړل -
د هرې کلیمې لپاره، ما په جلا توګه په هر سایټ کې د متنونو ټولیز شمیر څخه د هټیو فیصده محاسبه کړه، او بیا د دریو سرچینو لپاره اوسط محاسبه کړه.
پایلې
لاندې دېرش تخنیکي ډیټا انجینري شرایط دي چې په ټولو دریو دندو سایټونو کې ترټولو لوړې نمرې لري.
او دلته ورته شمیرې دي، مګر د جدول په بڼه وړاندې شوي:
راځئ چې په ترتیب سره لاړ شو.
د پایلو بیاکتنه
دواړه SQL او Python د بیاکتنې د دندې خلاصولو دوه پر دریمه برخه کې ښکاري. دا دوه ټیکنالوژي دي چې لومړی د مطالعې لپاره معنی لري.
سپارک شاوخوا نیمایي خالي بستونو کې یادونه شوې.
AWS نږدې 45٪ د دندې پوستونو کې ښکاري. دا د کلاوډ کمپیوټري پلیټ فارم دی چې د ایمیزون لخوا تولید شوی؛ دا د ټولو کلاوډ پلیټ فارمونو په مینځ کې ترټولو لوی بازار ونډه لري.
بیا جاوا او هډوپ راځي - د دوی د ورور لپاره له 40٪ څخه لږ څه.
دا د وخت په ماشین کې د سواری په څیر دی
بیا موږ Hive، Scala، Kafka او NoSQL وګورو - د دې ټیکنالوژیو څخه هر یو د سپارل شوي خالي ځایونو په څلورمه برخه کې ذکر شوي. Apache Hive د ډیټا ګودام سافټویر دی چې "د SQL په کارولو سره توزیع شوي پلورنځیو کې میشته لوی ډیټاسیټونه لوستل ، لیکل او اداره کول اسانه کوي."
د ډیټا ساینس پوهانو خالي ځایونو کې شرایطو سره پرتله کول
دلته د ټیکنالوژۍ دېرش اصطلاحات دي چې د ډیټا ساینس کارمندانو ترمینځ خورا عام دي. ما دا لیست په ورته ډول ترلاسه کړ لکه څنګه چې د ډیټا انجینرۍ لپاره پورته بیان شوي.
په 2020 کې د ډیټا ساینس پوه پوسټ لپاره په خالي ځایونو کې د ټیکنالوژۍ یادونه
که موږ د ټول شمیر په اړه وغږیږو، د پخوا په پرتله د ګمارل شوي ګمارنې په پرتله، 28٪ ډیر خالي بستونه شتون لري (12 د 013 په پرتله). راځئ وګورو چې کوم ټیکنالوژي د ډیټا انجینرانو په پرتله د ډیټا ساینس پوهانو لپاره په خالي ځایونو کې لږ عام دي.
د ډیټا انجینرۍ کې ډیر مشهور
لاندې ګراف د 10٪ څخه ډیر یا د -10٪ څخه کم اوسط توپیر سره کلیدي ټکي ښیې.
د ډیټا انجینر او ډیټا ساینس پوه ترمینځ د کلیدي کلمې فریکونسۍ کې ترټولو لوی توپیر
AWS خورا د پام وړ زیاتوالی ښیې: د ډیټا انجینرۍ کې دا د ډیټا ساینس په پرتله په منظم ډول 25٪ ډیر ښکاري (په ترتیب سره د ټول خالي ځایونو شاوخوا 45٪ او 20٪). توپیر د پام وړ دی!
دلته په یو څه مختلف پریزنټشن کې ورته معلومات شتون لري - په ګراف کې ، د ډیټا انجینر او ډیټا ساینس پوه پوسټ لپاره په خالي ځایونو کې د ورته کلیمې پایلې څنګ په څنګ موقعیت لري.
د ډیټا انجینر او ډیټا ساینس پوه ترمینځ د کلیدي کلمې فریکونسۍ کې ترټولو لوی توپیر
بل لوی کود چې ما یادونه وکړه په سپارک کې وه - د ډیټا انجینر اکثرا د لوی ډیټا سره کار کوي.
د ډیټا انجینرۍ کې لږ مشهور
اوس راځئ وګورو چې کوم ټیکنالوژي د ډیټا انجینر خالي ځایونو کې لږ مشهور دي.
د ډیټا ساینس سکټور په پرتله خورا ګړندی کمښت په کې رامینځته شوی
د ډیټا انجینرۍ او ډیټا ساینس دواړو کې غوښتنې کې
دا باید په یاد ولرئ چې په دواړو سیټونو کې له لومړیو لسو پوستونو څخه اته یو شان دي. SQL، Python، Spark، AWS، Java، Hadoop، Hive او Scala دا د ډیټا انجینرۍ او ډیټا ساینس صنعتونو دواړو لپاره په غوره لسو کې ځای په ځای کړل. په لاندې ګراف کې تاسو کولی شئ د ډیټا انجینر کارمندانو ترمینځ پنځلس خورا مشهور ټیکنالوژي وګورئ ، او د دوی په څنګ کې د ډیټا ساینس پوهانو لپاره د دوی د خالي کولو کچه ده.
سپارښتنې
که تاسو غواړئ د ډیټا انجینرۍ ته لاړشئ ، زه به تاسو ته مشوره درکوم چې لاندې ټیکنالوژیو کې ماسټري وکړئ - زه یې د نږدې لومړیتوبونو په ترتیب سره لیست کوم.
SQL زده کړئ. زه د PostgreSQL په لور تکیه کوم ځکه چې دا خلاص سرچینه ده، په ټولنه کې خورا مشهور، او د ودې په مرحله کې دی. تاسو کولی شئ د My Memorable SQL کتاب څخه د ژبې کارولو څرنګوالی زده کړئ - د دې پیلوټ نسخه شتون لري
ماسټر پایتون ، حتی که په خورا سخت کچه کې نه وي. زما د یادولو وړ پایتون په ځانګړي ډول د پیل کونکو لپاره ډیزاین شوی. دا په کې اخیستل کیدی شي
یوځل چې تاسو د Python سره آشنا شئ ، پانډا ته لاړشئ ، د Python کتابتون چې د معلوماتو پاکولو او پروسس کولو لپاره کارول کیږي. که تاسو په یوه شرکت کې د کار کولو هدف یاست چې په پایتون کې د لیکلو وړتیا ته اړتیا لري (او دا د دوی اکثریت دی) ، تاسو ډاډه اوسئ چې د پانډا پوهه به په ډیفالټ فرض شي. زه اوس مهال د پانډا سره د کار کولو لپاره یو تعارفي لارښود بشپړوم - تاسو کولی شئ
ماسټر AWS. که تاسو غواړئ د ډیټا انجینر شئ ، تاسو نشئ کولی په سټیش کې د کلاوډ پلیټ فارم پرته ترسره کړئ ، او AWS د دوی خورا مشهور دی. کورسونو زما سره ډیره مرسته وکړه
که تاسو دمخه دا ټول لیست بشپړ کړی وي او غواړئ د ډیټا انجینر په توګه د کارمندانو په سترګو کې نور وده وکړئ ، زه وړاندیز کوم د لوی ډیټا سره کار کولو لپاره د اپاچي سپارک اضافه کول. که څه هم د ډیټا ساینس پوهانو خالي ځایونو په اړه زما څیړنې په علاقه کې کمښت ښودلی ، د ډیټا انجینرانو ترمینځ دا لاهم په نږدې هره ثانیه کې څرګندیږي.
په اخري کې
زه امید لرم چې تاسو د ډیټا انجینرانو لپاره د خورا تقاضا ټیکنالوژیو دا کتنه ګټوره موندلې. که تاسو حیران یاست چې د شنونکي دندې څنګه پرمخ ځي، ولولئ
سرچینه: www.habr.com