کے مطابق
میں نے ڈیٹا انجینئر کی آسامیوں کا تجزیہ کیا کیونکہ وہ جنوری 2020 میں ہیں یہ سمجھنے کے لیے کہ کون سی ٹیکنالوجی کی مہارتیں سب سے زیادہ مقبول ہیں۔ پھر میں نے نتائج کا موازنہ ڈیٹا سائنسدان کی آسامیوں کے اعدادوشمار سے کیا - اور کچھ دلچسپ اختلافات سامنے آئے۔
بہت زیادہ تمہید کے بغیر، یہاں سرفہرست دس ٹیکنالوجیز ہیں جن کا اکثر ملازمت کی پوسٹنگ میں ذکر کیا جاتا ہے:
2020 میں ڈیٹا انجینئر کے عہدے کے لیے خالی آسامیوں میں ٹیکنالوجیز کا ذکر
ڈیٹا انجینئر کی ذمہ داریاں
آج، ڈیٹا انجینئرز جو کام کرتے ہیں وہ تنظیموں کے لیے بہت اہمیت کا حامل ہے - یہ وہ لوگ ہیں جو معلومات کو ذخیرہ کرنے اور اسے اس شکل میں لانے کے ذمہ دار ہیں کہ دوسرے ملازمین اس کے ساتھ کام کر سکیں۔ ڈیٹا انجینئر متعدد ذرائع سے ڈیٹا کو سٹریم یا بیچ کرنے کے لیے پائپ لائن بناتے ہیں۔ اس کے بعد پائپ لائنیں نکالنے، تبدیلی، اور لوڈنگ کے کام انجام دیتی ہیں (دوسرے لفظوں میں، ETL عمل)، ڈیٹا کو مزید استعمال کے لیے زیادہ موزوں بناتی ہیں۔ اس کے بعد، ڈیٹا تجزیہ کاروں اور ڈیٹا سائنسدانوں کو گہری پروسیسنگ کے لیے پیش کیا جاتا ہے۔ آخر میں، ڈیٹا ڈیش بورڈز، رپورٹس، اور مشین لرننگ ماڈلز میں اپنا سفر ختم کرتا ہے۔
میں ایسی معلومات کی تلاش میں تھا جو مجھے اس نتیجے پر پہنچنے کی اجازت دے گی کہ اس وقت ڈیٹا انجینئر کے کام میں کن ٹیکنالوجیز کی سب سے زیادہ مانگ ہے۔
طریقے۔
میں نے ملازمت کی تلاش کی تین سائٹوں سے معلومات اکٹھی کیں۔
ہر کلیدی لفظ کے لیے، میں نے ہر سائٹ پر متن کی کل تعداد سے ہٹس کے فیصد کا الگ الگ حساب لگایا، اور پھر تین ذرائع کے لیے اوسط کا حساب لگایا۔
نتائج
ذیل میں تیس تکنیکی ڈیٹا انجینئرنگ کی اصطلاحات ہیں جن میں تینوں جاب سائٹس پر سب سے زیادہ اسکور ہیں۔
اور یہاں وہی نمبر ہیں، لیکن جدول کی شکل میں پیش کیے گئے ہیں:
آئیے ترتیب سے چلتے ہیں۔
نتائج کا جائزہ
SQL اور Python دونوں کام کے دو تہائی سے زیادہ مواقع پر نظرثانی کیے گئے ہیں۔ یہ دو ٹیکنالوجیز ہیں جو پہلے مطالعہ کرنے کا مطلب رکھتی ہیں۔
تقریباً نصف آسامیوں میں چنگاری کا ذکر ہے۔
AWS تقریباً 45% جاب پوسٹنگ میں ظاہر ہوتا ہے۔ یہ ایک کلاؤڈ کمپیوٹنگ پلیٹ فارم ہے جسے ایمیزون نے تیار کیا ہے۔ تمام کلاؤڈ پلیٹ فارمز میں اس کا سب سے بڑا مارکیٹ شیئر ہے۔
اس کے بعد جاوا اور ہڈوپ آئیں - ان کے بھائی کے لیے 40% سے کچھ زیادہ۔
یہ ٹائم مشین میں سوار ہونے کی طرح ہے۔
پھر ہم Hive، Scala، Kafka اور NoSQL دیکھتے ہیں - ان میں سے ہر ایک ٹیکنالوجی کا تذکرہ جمع کرائی گئی اسامیوں کے ایک چوتھائی میں کیا گیا ہے۔ Apache Hive ایک ڈیٹا ویئر ہاؤس سافٹ ویئر ہے جو "SQL کا استعمال کرتے ہوئے تقسیم شدہ اسٹورز میں رہنے والے بڑے ڈیٹاسیٹس کو پڑھنا، لکھنا اور ان کا نظم کرنا آسان بناتا ہے۔"
ڈیٹا سائنسدان کی اسامیوں کی شرائط کے ساتھ موازنہ
ڈیٹا سائنس کے آجروں میں سب سے زیادہ عام ٹیکنالوجی کی تیس اصطلاحات ہیں۔ میں نے یہ فہرست اسی طرح حاصل کی ہے جیسا کہ ڈیٹا انجینئرنگ کے لیے اوپر بیان کیا گیا ہے۔
2020 میں ڈیٹا سائنسدان کے عہدوں کے لیے خالی آسامیوں میں ٹیکنالوجی کا تذکرہ
اگر ہم کل تعداد کے بارے میں بات کریں، پہلے سمجھی جانے والی بھرتیوں کے مقابلے، 28% زیادہ اسامیاں تھیں (12 بمقابلہ 013)۔ آئیے دیکھتے ہیں کہ ڈیٹا انجینئرز کے مقابلے ڈیٹا سائنسدانوں کے لیے خالی آسامیوں میں کونسی ٹیکنالوجیز کم عام ہیں۔
ڈیٹا انجینئرنگ میں زیادہ مقبول
نیچے کا گراف 10% سے زیادہ یا -10% سے کم کے اوسط فرق کے ساتھ مطلوبہ الفاظ کو دکھاتا ہے۔
ڈیٹا انجینئر اور ڈیٹا سائنسدان کے درمیان مطلوبہ الفاظ کی فریکوئنسی میں سب سے بڑا فرق
AWS سب سے نمایاں اضافہ ظاہر کرتا ہے: ڈیٹا انجینئرنگ میں یہ ڈیٹا سائنس کی نسبت 25% زیادہ باقاعدگی سے ظاہر ہوتا ہے (تقریباً 45% اور 20% خالی آسامیوں کی کل تعداد میں، بالترتیب)۔ فرق نمایاں ہے!
یہاں قدرے مختلف پریزنٹیشن میں وہی ڈیٹا ہے - گراف میں، ڈیٹا انجینئر اور ڈیٹا سائنسدان کی آسامیوں کے لیے ایک ہی مطلوبہ الفاظ کے نتائج ساتھ ساتھ موجود ہیں۔
ڈیٹا انجینئر اور ڈیٹا سائنسدان کے درمیان مطلوبہ الفاظ کی فریکوئنسی میں سب سے بڑا فرق
اگلی سب سے بڑی چھلانگ جو میں نے نوٹ کی تھی وہ سپارک میں تھی - ایک ڈیٹا انجینئر کو اکثر بڑے ڈیٹا کے ساتھ کام کرنا پڑتا ہے۔
ڈیٹا انجینئرنگ میں کم مقبول
اب دیکھتے ہیں کہ ڈیٹا انجینئر کی اسامیوں میں کونسی ٹیکنالوجیز کم مقبول ہیں۔
ڈیٹا سائنس کے شعبے کے مقابلے میں سب سے زیادہ کمی آئی
ڈیٹا انجینئرنگ اور ڈیٹا سائنس دونوں میں مانگ ہے۔
واضح رہے کہ دونوں سیٹوں میں پہلی دس میں سے آٹھ پوزیشنیں ایک جیسی ہیں۔ SQL، Python، Spark، AWS، Java، Hadoop، Hive اور Scala نے اسے ڈیٹا انجینئرنگ اور ڈیٹا سائنس دونوں صنعتوں کے لیے ٹاپ ٹین میں جگہ دی۔ نیچے دیے گئے گراف میں آپ ڈیٹا انجینئر آجروں کے درمیان پندرہ مقبول ترین ٹیکنالوجیز دیکھ سکتے ہیں، اور ان کے آگے ڈیٹا سائنسدانوں کے لیے ان کی خالی جگہ کی شرح ہے۔
سفارشات
اگر آپ ڈیٹا انجینئرنگ میں جانا چاہتے ہیں، تو میں آپ کو مندرجہ ذیل ٹیکنالوجیز میں مہارت حاصل کرنے کا مشورہ دوں گا - میں ان کی فہرست اندازاً ترجیح کے مطابق کرتا ہوں۔
ایس کیو ایل سیکھیں۔ میں PostgreSQL کی طرف جھک رہا ہوں کیونکہ یہ اوپن سورس ہے، کمیونٹی میں بہت مقبول ہے، اور ترقی کے مرحلے میں ہے۔ آپ کتاب My Memorable SQL سے زبان استعمال کرنے کا طریقہ سیکھ سکتے ہیں - اس کا پائلٹ ورژن دستیاب ہے۔
ماسٹر ازگر، چاہے انتہائی سخت سطح پر نہ ہو۔ میرا یادگار ازگر خاص طور پر ابتدائی افراد کے لیے ڈیزائن کیا گیا ہے۔ پر خریدا جا سکتا ہے۔
ایک بار جب آپ Python سے واقف ہو جائیں تو، پانڈوں کی طرف بڑھیں، ایک Python لائبریری جو ڈیٹا کی صفائی اور پروسیسنگ کے لیے استعمال ہوتی ہے۔ اگر آپ کسی ایسی کمپنی میں کام کرنا چاہتے ہیں جس کے لیے Python میں لکھنے کی صلاحیت کی ضرورت ہو (اور یہ ان میں سے اکثریت ہے)، تو آپ یقین کر سکتے ہیں کہ پانڈوں کا علم ڈیفالٹ کے طور پر فرض کیا جائے گا۔ میں فی الحال پانڈا کے ساتھ کام کرنے کے لیے ایک تعارفی گائیڈ تیار کر رہا ہوں - آپ کر سکتے ہیں۔
ماسٹر AWS اگر آپ ڈیٹا انجینئر بننا چاہتے ہیں، تو آپ سٹیش میں کلاؤڈ پلیٹ فارم کے بغیر نہیں کر سکتے، اور AWS ان میں سب سے زیادہ مقبول ہے۔ کورسز نے میری بہت مدد کی۔
اگر آپ نے یہ پوری فہرست پہلے ہی مکمل کر لی ہے اور ایک ڈیٹا انجینئر کے طور پر آجروں کی نظروں میں مزید ترقی کرنا چاہتے ہیں، تو میں بڑے ڈیٹا کے ساتھ کام کرنے کے لیے Apache Spark کو شامل کرنے کا مشورہ دیتا ہوں۔ اگرچہ ڈیٹا سائنسدان کی اسامیوں پر میری تحقیق نے دلچسپی میں کمی کو ظاہر کیا، لیکن ڈیٹا انجینئرز کے درمیان یہ اب بھی تقریباً ہر دوسری جگہ پر ظاہر ہوتا ہے۔
آخر میں
مجھے امید ہے کہ آپ کو ڈیٹا انجینئرز کے لیے انتہائی مطلوبہ ٹیکنالوجیز کا یہ جائزہ کارآمد معلوم ہوا۔ اگر آپ سوچ رہے ہیں کہ تجزیہ کاروں کی ملازمتیں کیسے چل رہی ہیں، تو پڑھیں
ماخذ: www.habr.com