کیوں ڈیٹا سائنس ٹیموں کو جرنلسٹ کی ضرورت ہے، ماہرین کی نہیں۔

کیوں ڈیٹا سائنس ٹیموں کو جرنلسٹ کی ضرورت ہے، ماہرین کی نہیں۔
ہیروشی وتنابے/گیٹی امیجز

دی ویلتھ آف نیشنز میں ایڈم اسمتھ دکھاتا ہے کہ کس طرح محنت کی تقسیم پیداواری صلاحیت میں اضافے کا بنیادی ذریعہ بنتی ہے۔ ایک مثال پن فیکٹری کی اسمبلی لائن ہے: "ایک کارکن تار کو کھینچتا ہے، دوسرا اسے سیدھا کرتا ہے، تیسرا اسے کاٹتا ہے، چوتھا سرے کو تیز کرتا ہے، پانچواں سر کو فٹ کرنے کے لیے دوسرے سرے کو پیستا ہے۔" مخصوص افعال پر توجہ مرکوز کرنے کی وجہ سے، ہر ملازم اپنے تنگ کام میں ایک اعلیٰ تعلیم یافتہ ماہر بن جاتا ہے، جس سے عمل کی کارکردگی میں اضافہ ہوتا ہے۔ فی کارکن کی پیداوار کئی گنا بڑھ جاتی ہے، اور فیکٹری پن پیدا کرنے میں زیادہ موثر ہو جاتی ہے۔

فعالیت کے لحاظ سے محنت کی یہ تقسیم آج بھی ہمارے ذہنوں میں اس قدر پیوست ہے کہ ہم نے تیزی سے اپنی ٹیموں کو اس کے مطابق ترتیب دیا۔ ڈیٹا سائنس اس سے مستثنیٰ نہیں ہے۔ پیچیدہ الگورتھمک کاروباری صلاحیتوں کے لیے متعدد کام کے افعال کی ضرورت ہوتی ہے، اس لیے کمپنیاں عموماً ماہرین کی ٹیمیں تشکیل دیتی ہیں: محققین، ڈیٹا انجینئرز، مشین لرننگ انجینئرز، سبب اور اثر کے سائنسدان، وغیرہ۔ ماہرین کے کام کو پروڈکٹ مینیجر کے ذریعے فنکشنز کی منتقلی کے ساتھ اس انداز میں مربوط کیا جاتا ہے جو پن فیکٹری سے ملتا ہے: "ایک شخص ڈیٹا وصول کرتا ہے، دوسرا اسے ماڈل بناتا ہے، تیسرا اس پر عمل کرتا ہے، چوتھا اقدامات کرتا ہے" اور اسی طرح،

افسوس، پیداواری صلاحیت کو بہتر بنانے کے لیے ہمیں اپنی ڈیٹا سائنس ٹیموں کو بہتر نہیں بنانا چاہیے۔ تاہم، آپ یہ اس وقت کرتے ہیں جب آپ سمجھتے ہیں کہ آپ کیا بنا رہے ہیں: پن یا کچھ اور، اور صرف کارکردگی بڑھانے کی کوشش کرتے ہیں۔ اسمبلی لائنوں کا مقصد کام کو مکمل کرنا ہے۔ ہم بالکل جانتے ہیں کہ ہم کیا چاہتے ہیں - پن (جیسا کہ اسمتھ کی مثال میں)، لیکن کسی بھی پروڈکٹ یا سروس کا ذکر کیا جا سکتا ہے جس میں ضروریات پوری طرح پروڈکٹ کے تمام پہلوؤں اور اس کے رویے کو بیان کرتی ہیں۔ ملازمین کا کردار یہ ہے کہ وہ ان ضروریات کو ہر ممکن حد تک مؤثر طریقے سے پورا کریں۔

لیکن ڈیٹا سائنس کا مقصد کاموں کو مکمل کرنا نہیں ہے۔ بلکہ، مقصد یہ ہے کہ مضبوط نئے کاروباری مواقع کی تلاش اور ترقی کریں۔ الگورتھمک پروڈکٹس اور خدمات جیسے کہ سفارشی نظام، کسٹمر کے تعاملات، طرز کی ترجیحات کی درجہ بندی، سائز سازی، لباس کا ڈیزائن، لاجسٹکس کی اصلاح، موسمی رجحان کا پتہ لگانے اور بہت کچھ پہلے سے تیار نہیں کیا جا سکتا۔ ان کا مطالعہ کیا جانا چاہیے۔ نقل کرنے کے لیے کوئی بلیو پرنٹس نہیں ہیں، یہ موروثی غیر یقینی صورتحال کے ساتھ نئے امکانات ہیں۔ گتانک، ماڈل، ماڈل کی اقسام، ہائپر پیرامیٹر، تمام ضروری عناصر کو تجربہ، آزمائش اور غلطی، اور تکرار کے ذریعے سیکھنا چاہیے۔ پنوں کے ساتھ، تربیت اور ڈیزائن پیداوار سے پہلے کیا جاتا ہے. ڈیٹا سائنس کے ساتھ، آپ سیکھتے ہیں جیسا کہ آپ کرتے ہیں، پہلے نہیں۔

پن فیکٹری میں، جب تربیت سب سے پہلے آتی ہے، تو ہم پیداوار کی کارکردگی کو بہتر بنانے کے علاوہ پروڈکٹ کی کسی بھی خصوصیت کو بہتر بنانے کی نہ تو توقع رکھتے ہیں اور نہ ہی چاہتے ہیں۔ کاموں کو مہارت دینا معنی خیز ہے کیونکہ یہ عمل کی کارکردگی اور پیداوار میں مستقل مزاجی (حتمی مصنوعات میں تبدیلی کے بغیر) کا باعث بنتا ہے۔

لیکن جب پروڈکٹ اب بھی ترقی کر رہی ہے اور مقصد تربیت ہے، تخصص درج ذیل صورتوں میں ہمارے اہداف میں مداخلت کرتا ہے:

1. یہ ہم آہنگی کے اخراجات کو بڑھاتا ہے۔

یعنی وہ اخراجات جو اس وقت کے دوران جمع ہوتے ہیں جو بات چیت کرنے، بحث کرنے، جواز فراہم کرنے اور اس کام کو ترجیح دینے میں خرچ ہوتے ہیں جو کرنے کی ضرورت ہے۔ یہ اخراجات شامل لوگوں کی تعداد کے ساتھ انتہائی لکیری پیمانے پر ہوتے ہیں۔ (جیسا کہ J. رچرڈ ہیک مین نے ہمیں سکھایا، رشتوں کی تعداد r اسی طرح بڑھتی ہے جس طرح اس مساوات کے مطابق n اصطلاحات کی تعداد کے فنکشن کے مطابق ہوتی ہے: r = (n^2-n)/2۔ اور ہر رشتہ کچھ مقدار کو ظاہر کرتا ہے۔ لاگت کا رشتہ۔) جب ڈیٹا سائنسدانوں کو فنکشن کے ذریعے منظم کیا جاتا ہے، ہر مرحلے پر، ہر تبدیلی، ہر حوالے، وغیرہ کے ساتھ، بہت سے ماہرین کی ضرورت ہوتی ہے، جس سے ہم آہنگی کے اخراجات میں اضافہ ہوتا ہے۔ مثال کے طور پر، شماریاتی ماڈلرز جو نئی خصوصیات کے ساتھ تجربہ کرنا چاہتے ہیں انہیں ڈیٹا انجینئرز کے ساتھ ہم آہنگ ہونا پڑے گا جو جب بھی کچھ نیا کرنے کی کوشش کرنا چاہتے ہیں ڈیٹا سیٹ میں شامل کرتے ہیں۔ اسی طرح، تربیت یافتہ ہر نئے ماڈل کا مطلب یہ ہے کہ ماڈل ڈویلپر کو اسے پروڈکشن میں ڈالنے کے لیے کسی کے ساتھ ہم آہنگی کی ضرورت ہوگی۔ ہم آہنگی کی لاگت تکرار کی قیمت کے طور پر کام کرتی ہے، جو انہیں زیادہ مشکل اور مہنگی بناتی ہے اور مطالعہ کو ترک کرنے کا زیادہ امکان ہے۔ یہ سیکھنے میں مداخلت کر سکتا ہے۔

2. یہ انتظار کے اوقات کو مشکل بنا دیتا ہے۔

رابطہ کاری کے اخراجات سے بھی زیادہ مشکل کام کی شفٹوں کے درمیان ضائع ہونے والا وقت ہے۔ جب کہ کوآرڈینیشن لاگت کو عام طور پر گھنٹوں میں ماپا جاتا ہے - میٹنگز، بات چیت، ڈیزائن کے جائزے کرنے میں جو وقت لگتا ہے - انتظار کا وقت عام طور پر دنوں، ہفتوں یا مہینوں میں ماپا جاتا ہے! فنکشنل ماہرین کے نظام الاوقات میں توازن رکھنا مشکل ہے کیونکہ ہر ماہر کو متعدد منصوبوں میں تقسیم کیا جانا چاہیے۔ تبدیلیوں پر بات کرنے کے لیے ایک گھنٹے کی میٹنگ میں کام کے فلو کو ہموار کرنے میں ہفتے لگ سکتے ہیں۔ اور تبدیلیوں پر اتفاق کرنے کے بعد، بہت سے دوسرے منصوبوں کے تناظر میں اصل کام کی منصوبہ بندی کرنا ضروری ہے جو ماہرین کے کام کے وقت پر کام کرتے ہیں۔ کوڈ کی اصلاحات یا تحقیق پر مشتمل کام جس کو مکمل ہونے میں صرف چند گھنٹے یا دن لگتے ہیں وسائل کے دستیاب ہونے میں بہت زیادہ وقت لگ سکتا ہے۔ تب تک، تکرار اور سیکھنا معطل ہے۔

3. یہ سیاق و سباق کو تنگ کرتا ہے۔

محنت کی تقسیم مصنوعی طور پر سیکھنے کو محدود کر سکتی ہے تاکہ لوگوں کو ان کی خصوصیت میں رہنے کے لیے انعام دیا جا سکے۔ مثال کے طور پر، ایک تحقیقی سائنسدان جسے اپنی فعالیت کے دائرہ کار میں رہنا چاہیے وہ اپنی توانائی کو مختلف قسم کے الگورتھم کے ساتھ تجربہ کرنے پر مرکوز کرے گا: رجعت، عصبی نیٹ ورکس، بے ترتیب جنگل وغیرہ۔ بلاشبہ، اچھے الگورتھم کے انتخاب میں اضافہ میں بہتری آسکتی ہے، لیکن عام طور پر دیگر سرگرمیوں سے حاصل کرنے کے لیے اور بھی بہت کچھ ہے، جیسے کہ ڈیٹا کے نئے ذرائع کو مربوط کرنا۔ اسی طرح، یہ ایک ایسا ماڈل تیار کرنے میں مدد کرے گا جو ڈیٹا میں موجود ہر طرح کی وضاحتی طاقت کا استحصال کرے۔ تاہم، اس کی طاقت مقصدی فعل کو تبدیل کرنے یا بعض رکاوٹوں کو دور کرنے میں مضمر ہے۔ جب اس کا کام محدود ہو تو اسے دیکھنا یا کرنا مشکل ہوتا ہے۔ چونکہ ایک تکنیکی سائنسدان الگورتھم کو بہتر بنانے میں مہارت رکھتا ہے، اس لیے اس کے کچھ اور کرنے کا امکان بہت کم ہوتا ہے، چاہے اس سے اہم فوائد حاصل ہوں۔

ان علامات کو نام دینے کے لیے جو ظاہر ہوتے ہیں جب ڈیٹا سائنس ٹیمیں پن فیکٹریوں کے طور پر کام کرتی ہیں (مثال کے طور پر، سادہ اسٹیٹس اپ ڈیٹس میں): "ڈیٹا پائپ لائن میں تبدیلیوں کا انتظار کرنا" اور "ML Eng کے وسائل کا انتظار کرنا" عام بلاکر ہیں۔ تاہم، مجھے یقین ہے کہ زیادہ خطرناک اثر و رسوخ وہ ہے جسے آپ محسوس نہیں کرتے ہیں، کیونکہ آپ اس بات پر افسوس نہیں کر سکتے جو آپ پہلے سے نہیں جانتے۔ بے عیب عملدرآمد اور عمل کی کارکردگی کو حاصل کرنے سے حاصل ہونے والی خوش فہمی اس حقیقت کو چھپا سکتی ہے کہ تنظیمیں تربیت کے ان فوائد سے بے خبر ہیں جن سے وہ محروم ہیں۔

اس مسئلے کا حل یقیناً فیکٹری پن کے طریقہ کار سے چھٹکارا حاصل کرنا ہے۔ سیکھنے اور تکرار کی حوصلہ افزائی کرنے کے لیے، ڈیٹا سائنسدان کے کردار عام ہونے چاہئیں لیکن تکنیکی فنکشن سے آزاد وسیع ذمہ داریوں کے ساتھ، یعنی ڈیٹا سائنسدانوں کو منظم کریں تاکہ وہ سیکھنے کے لیے بہتر ہوں۔ اس کا مطلب ہے "مکمل اسٹیک ماہرین" کی خدمات حاصل کرنا—جنرل ماہرین جو تصور سے لے کر ماڈلنگ تک، نفاذ سے لے کر پیمائش تک مختلف کام انجام دے سکتے ہیں۔ یہ نوٹ کرنا ضروری ہے کہ میں یہ تجویز نہیں کر رہا ہوں کہ مکمل اسٹیک ٹیلنٹ کی خدمات حاصل کرنے سے ملازمین کی تعداد کم ہو جائے۔ بلکہ، میں صرف یہ سمجھوں گا کہ جب وہ مختلف طریقے سے منظم ہوتے ہیں، تو ان کی ترغیبات سیکھنے اور کارکردگی کے فوائد کے ساتھ بہتر طور پر منسلک ہوتے ہیں۔ مثال کے طور پر، فرض کریں کہ آپ کے پاس تین لوگوں کی ٹیم ہے جس میں تین کاروباری مہارتیں ہیں۔ پن فیکٹری میں، ہر ٹیکنیشن ہر کام کے لیے اپنے وقت کا ایک تہائی وقف کرے گا، کیونکہ کوئی دوسرا اپنا کام نہیں کر سکتا۔ ایک مکمل اسٹیک میں، ہر جنرلسٹ پورے کاروباری عمل، اسکیل اپ، اور تربیت کے لیے پوری طرح وقف ہے۔

پیداوار کے چکر میں کم لوگوں کی حمایت کے ساتھ، ہم آہنگی کم ہو جاتی ہے۔ جنرلسٹ خصوصیات کے درمیان روانی سے آگے بڑھتا ہے، مزید ڈیٹا شامل کرنے کے لیے ڈیٹا پائپ لائن کو بڑھاتا ہے، ماڈلز میں نئی ​​خصوصیات آزماتا ہے، کازل پیمائش کے لیے پروڈکشن میں نئے ورژن لگاتا ہے، اور جیسے ہی نئے آئیڈیاز سامنے آتے ہیں تیزی سے اقدامات کو دہراتے ہیں۔ بلاشبہ، اسٹیشن ویگن متوازی نہیں بلکہ ترتیب وار مختلف کام انجام دیتی ہے۔ سب کے بعد، یہ صرف ایک شخص ہے. تاہم، کسی کام کو مکمل کرنے میں عام طور پر کسی دوسرے مخصوص وسائل تک رسائی کے لیے درکار وقت کا صرف ایک حصہ لگتا ہے۔ لہذا، تکرار کا وقت کم ہو جاتا ہے.

ہمارا جنرلسٹ کسی خاص کام کے فنکشن میں ماہر کی طرح ہنر مند نہیں ہوسکتا ہے، لیکن ہم فنکشنل کمال یا چھوٹی بڑھی ہوئی بہتری کے لیے کوشش نہیں کرتے ہیں۔ بلکہ، ہم بتدریج اثرات کے ساتھ زیادہ سے زیادہ پیشہ ورانہ چیلنجوں کو سیکھنے اور دریافت کرنے کی کوشش کرتے ہیں۔ ایک مکمل حل کے لیے ایک جامع سیاق و سباق کے ساتھ، وہ ایسے مواقع دیکھتا ہے جن سے ایک ماہر محروم ہو جاتا ہے۔ اس کے پاس مزید خیالات اور زیادہ امکانات ہیں۔ وہ بھی ناکام۔ تاہم، ناکامی کی قیمت کم ہے اور سیکھنے کے فوائد زیادہ ہیں۔ یہ توازن تیز رفتار تکرار کو فروغ دیتا ہے اور سیکھنے کو انعام دیتا ہے۔

یہ نوٹ کرنا ضروری ہے کہ مکمل اسٹیک سائنسدانوں کو خودمختاری اور مہارت کے تنوع کی مقدار کا زیادہ تر انحصار ڈیٹا پلیٹ فارم کی مضبوطی پر ہے جس پر کام کرنا ہے۔ ایک اچھی طرح سے ڈیزائن کردہ ڈیٹا پلیٹ فارم ڈیٹا سائنسدانوں کو کنٹینرائزیشن، تقسیم شدہ پروسیسنگ، خودکار فیل اوور، اور دیگر جدید کمپیوٹنگ تصورات کی پیچیدگیوں سے نکالتا ہے۔ تجرید کے علاوہ، ایک مضبوط ڈیٹا پلیٹ فارم تجرباتی انفراسٹرکچر کو ہموار کنیکٹیویٹی فراہم کر سکتا ہے، خودکار نگرانی اور الرٹ کر سکتا ہے، خودکار اسکیلنگ اور الگورتھمک نتائج اور ڈیبگنگ کے تصور کو فعال کر سکتا ہے۔ یہ اجزاء ڈیٹا پلیٹ فارم انجینئرز کے ذریعہ ڈیزائن اور بنائے گئے ہیں، یعنی یہ ڈیٹا سائنسدان سے ڈیٹا پلیٹ فارم ڈویلپمنٹ ٹیم کو منتقل نہیں کیے جاتے ہیں۔ یہ ڈیٹا سائنس کا ماہر ہے جو پلیٹ فارم کو چلانے کے لیے استعمال ہونے والے تمام کوڈ کے لیے ذمہ دار ہے۔

میں بھی، ایک بار عمل کی کارکردگی کا استعمال کرتے ہوئے محنت کی فعال تقسیم میں دلچسپی رکھتا تھا، لیکن آزمائش اور غلطی (سیکھنے کا اس سے بہتر کوئی طریقہ نہیں) کے ذریعے، میں نے دریافت کیا کہ عام کردار سیکھنے اور اختراع کو بہتر بناتے ہیں اور صحیح میٹرکس فراہم کرتے ہیں: دریافت اور خصوصی نقطہ نظر سے زیادہ کاروباری مواقع پیدا کرنا۔ (منظم کرنے کے اس نقطہ نظر کے بارے میں جاننے کا ایک زیادہ مؤثر طریقہ یہ ہے کہ میں جس آزمائش اور غلطی سے گزرا ہوں وہ ہے ایمی ایڈمنڈسن کی کتاب ٹیم کولابریشن: کیسے آرگنائزیشنز سیکھیں، اختراع کریں، اور علمی معیشت میں مقابلہ کریں)۔

کچھ اہم مفروضے ہیں جو کچھ کمپنیوں میں کم یا زیادہ قابل اعتماد تنظیم سازی کے اس نقطہ نظر کو بنا سکتے ہیں۔ تکرار کا عمل آزمائش اور غلطی کی لاگت کو کم کرتا ہے۔ اگر غلطی کی قیمت زیادہ ہے، تو آپ انہیں کم کرنا چاہیں گے (لیکن طبی ایپلی کیشنز یا مینوفیکچرنگ کے لیے اس کی سفارش نہیں کی جاتی ہے)۔ مزید برآں، اگر آپ ڈیٹا کے پیٹا بائٹس یا ایکسابائٹس کے ساتھ کام کر رہے ہیں، تو ڈیٹا انجینئرنگ میں مہارت کی ضرورت پڑ سکتی ہے۔ اسی طرح، اگر آن لائن کاروباری صلاحیتوں کو برقرار رکھنا اور ان کی دستیابی ان کو بہتر بنانے سے زیادہ اہم ہے، تو فنکشنل ایکسیلنس سیکھنے کو روک سکتی ہے۔ آخر میں، مکمل اسٹیک ماڈل ان لوگوں کی رائے پر انحصار کرتا ہے جو اس کے بارے میں جانتے ہیں۔ وہ ایک تنگاوالا نہیں ہیں؛ آپ انہیں ڈھونڈ سکتے ہیں یا خود تیار کر سکتے ہیں۔ تاہم، ان کی زیادہ مانگ ہے اور انہیں اپنی طرف متوجہ کرنے اور برقرار رکھنے کے لیے مسابقتی معاوضے، مضبوط کارپوریٹ اقدار اور چیلنجنگ کام کی ضرورت ہوگی۔ یقینی بنائیں کہ آپ کی کمپنی کی ثقافت اس کی حمایت کر سکتی ہے۔

یہاں تک کہ ان تمام باتوں کے باوجود، مجھے یقین ہے کہ مکمل اسٹیک ماڈل بہترین ابتدائی حالات فراہم کرتا ہے۔ ان کے ساتھ شروع کریں، اور پھر شعوری طور پر محنت کی ایک فعال تقسیم کی طرف بڑھیں جب بالکل ضروری ہو۔

فنکشنل اسپیشلائزیشن کے دیگر نقصانات ہیں۔ یہ کارکنوں کی طرف سے ذمہ داری اور غیر فعالی کے نقصان کا باعث بن سکتا ہے۔ اسمتھ خود محنت کی تقسیم پر تنقید کرتا ہے، تجویز کرتا ہے کہ اس سے ٹیلنٹ میں کمی واقع ہوتی ہے، یعنی کارکنان جاہل ہو جاتے ہیں اور دستبردار ہو جاتے ہیں کیونکہ ان کے کردار چند دہرائے جانے والے کاموں تک محدود ہوتے ہیں۔ اگرچہ تخصص عمل کی کارکردگی فراہم کر سکتا ہے، لیکن اس سے کارکنوں کی حوصلہ افزائی کا امکان کم ہے۔

بدلے میں، ہمہ گیر کردار وہ تمام چیزیں مہیا کرتے ہیں جو ملازمت کی تسکین کا باعث بنتے ہیں: خود مختاری، مہارت اور مقصد۔ خود مختاری یہ ہے کہ وہ کامیابی حاصل کرنے کے لئے کسی چیز پر انحصار نہیں کرتے ہیں۔ مہارت مضبوط مسابقتی فوائد میں مضمر ہے۔ اور مقصد کا احساس ان کے تخلیق کردہ کاروبار پر اثر انداز ہونے کا موقع ہے۔ اگر ہم لوگوں کو ان کے کام کے بارے میں پرجوش کر سکتے ہیں اور کمپنی پر بڑا اثر ڈال سکتے ہیں، تو باقی سب کچھ اپنی جگہ پر آجائے گا۔

ماخذ: www.habr.com

نیا تبصرہ شامل کریں