2020 میں ڈیٹا سائنسدان کے طور پر کیا پڑھنا ہے۔

2020 میں ڈیٹا سائنسدان کے طور پر کیا پڑھنا ہے۔
اس پوسٹ میں، ہم آپ کے ساتھ DAGsHub کے شریک بانی اور CTO سے ڈیٹا سائنس کے بارے میں مفید معلومات کے ذرائع کا ایک انتخاب شیئر کرتے ہیں، جو ڈیٹا ورژن کنٹرول اور ڈیٹا سائنسدانوں اور مشین لرننگ انجینئرز کے درمیان تعاون کے لیے ایک کمیونٹی اور ویب پلیٹ فارم ہے۔ انتخاب میں ٹویٹر اکاؤنٹس سے لے کر مکمل انجینئرنگ بلاگز تک متعدد ذرائع شامل ہیں، جو ان لوگوں کو نشانہ بناتے ہیں جو بالکل جانتے ہیں کہ وہ کیا تلاش کر رہے ہیں۔ کٹ کے نیچے تفصیلات۔

مصنف سے:
آپ وہی ہیں جو آپ کھاتے ہیں، اور ایک علمی کارکن کے طور پر، آپ کو ایک اچھی معلوماتی خوراک کی ضرورت ہے۔ میں ڈیٹا سائنس، مصنوعی ذہانت اور متعلقہ ٹیکنالوجیز کے بارے میں معلومات کے ذرائع کا اشتراک کرنا چاہتا ہوں جو مجھے سب سے زیادہ مفید یا پرکشش لگتی ہیں۔ مجھے امید ہے کہ یہ بھی آپ کی مدد کرے گا!

دو منٹ کے کاغذات

ایک YouTube چینل جو تازہ ترین واقعات سے باخبر رہنے کے لیے موزوں ہے۔ چینل کو کثرت سے اپ ڈیٹ کیا جاتا ہے اور میزبان کا احاطہ کیے گئے تمام موضوعات میں ایک متعدی جوش اور مثبتیت ہے۔ نہ صرف AI پر بلکہ کمپیوٹر گرافکس اور دیگر بصری طور پر دلکش موضوعات پر بھی دلچسپ کام کی کوریج کی توقع کریں۔

یانک کلچر

اپنے YouTube چینل پر، Yannick تکنیکی تفصیل میں گہری سیکھنے میں اہم تحقیق کی وضاحت کرتا ہے۔ خود ایک مطالعہ پڑھنے کے بجائے، اہم مضامین کی گہری سمجھ حاصل کرنے کے لیے اس کی ویڈیوز میں سے کسی ایک کو دیکھنا اکثر تیز اور آسان ہوتا ہے۔ وضاحتیں ریاضی کو نظر انداز کیے بغیر یا تین پائنز میں کھو جانے کے بغیر مضامین کے نچوڑ کو بیان کرتی ہیں۔ Yannick اس بارے میں بھی اپنے خیالات کا اظہار کرتا ہے کہ مطالعہ کیسے ایک ساتھ فٹ بیٹھتا ہے، نتائج کو کس حد تک سنجیدگی سے لینا چاہیے، وسیع تر تشریحات، وغیرہ۔ مبتدی (یا غیر تعلیمی پریکٹیشنرز) کے لیے خود ان دریافتوں تک پہنچنا زیادہ مشکل ہوتا ہے۔

distill.pub

ان کے اپنے الفاظ میں:

مشین لرننگ ریسرچ کو واضح، متحرک اور متحرک ہونے کی ضرورت ہے۔ اور ڈسٹل کو تحقیق میں مدد کے لیے بنایا گیا تھا۔

ڈسٹل ایک منفرد مشین لرننگ ریسرچ پبلیکیشن ہے۔ مضامین کو شاندار تصورات کے ساتھ فروغ دیا جاتا ہے تاکہ قارئین کو موضوعات کی زیادہ بدیہی تفہیم فراہم کی جا سکے۔ مقامی سوچ اور تخیل مشین لرننگ اور ڈیٹا سائنس کے موضوعات کو سمجھنے میں بہت اچھی طرح سے کام کرتے ہیں۔ دوسری طرف، روایتی اشاعت کی شکلیں اپنی ساخت میں سخت، جامد اور خشک، اور بعض اوقات "ریاضی". کرس اولہ، ڈسٹل کے شریک تخلیق کار، پر ایک حیرت انگیز ذاتی بلاگ بھی برقرار رکھتے ہیں۔ GitHub کے. اسے کافی عرصے سے اپ ڈیٹ نہیں کیا گیا ہے، لیکن پھر بھی یہ اب تک لکھی گئی بہترین گہری سیکھنے کی وضاحتوں کا مجموعہ ہے۔ خاص طور پر، اس نے میری بہت مدد کی۔ تفصیل LSTM!

2020 میں ڈیٹا سائنسدان کے طور پر کیا پڑھنا ہے۔
ذرائع

سیبسٹین روڈر

Sebastian Ruder ایک بہت ہی معلوماتی بلاگ اور نیوز لیٹر لکھتا ہے، بنیادی طور پر عصبی نیٹ ورکس اور قدرتی زبان کے متن کے تجزیے کے بارے میں۔ وہ محققین اور کانفرنس کے مقررین کو بہت سارے مشورے بھی دیتا ہے، جو کہ اگر آپ اکیڈمی میں ہیں تو بہت مددگار ثابت ہو سکتے ہیں۔ سیبسٹین کے مضامین جائزوں کی شکل اختیار کرتے ہیں، کسی مخصوص علاقے میں تحقیق اور طریقوں میں آرٹ کی حالت کا خلاصہ اور وضاحت کرتے ہیں۔ اس کا مطلب یہ ہے کہ مضامین ان پریکٹیشنرز کے لیے انتہائی کارآمد ہیں جو جلدی سے اپنا اثر حاصل کرنا چاہتے ہیں۔ سیبسٹین بھی لکھتے ہیں۔ ٹویٹر.

اینڈری کارپیٹی

آندرے کارپیٹی کسی تعارف کے محتاج نہیں۔ زمین پر سب سے مشہور گہری سیکھنے والے محققین میں سے ایک ہونے کے علاوہ، وہ بڑے پیمانے پر استعمال ہونے والے اوزار تیار کرتا ہے جیسے آرکائیو سنٹی پریزر ضمنی منصوبوں کے طور پر. اس کے سٹینفورڈ کورس کے ذریعے لاتعداد لوگ اس دائرے میں داخل ہوئے۔ cs231n، اور یہ جاننا آپ کے لیے مفید ہوگا۔ ہدایت اعصابی نیٹ ورک کی تربیت. میں اسے دیکھنے کی بھی سفارش کرتا ہوں۔ تقریر حقیقی دنیا میں بڑے پیمانے پر مشین لرننگ کو لاگو کرنے کی کوشش کرتے وقت ٹیسلا کو جن حقیقی مسائل پر قابو پانا ضروری ہے۔ تقریر معلوماتی، متاثر کن اور سوچنے والی ہوتی ہے۔ خود ایم ایل کے بارے میں مضامین کے علاوہ، آندرے کارپیٹی دیتا ہے۔ اچھی زندگی کا مشورہ لیے مہتواکانکشی سائنسدانوں. اینڈریو کو پڑھیں ٹویٹر اور پر Github کے.

اوبر انجینئرنگ

Uber انجینئرنگ بلاگ پیمانے اور کوریج کی وسعت کے لحاظ سے واقعی متاثر کن ہے، خاص طور پر بہت سارے موضوعات کا احاطہ کرتا ہے۔ مصنوعی ذہانت. مجھے خاص طور پر Uber کے انجینئرنگ کلچر کے بارے میں جو چیز پسند ہے وہ ہے ان کا رجحان بہت دلچسپ اور قیمتی جاری کرنے کا ایک خطرناک رفتار سے اوپن سورس۔ یہاں کچھ مثالیں ہیں:

اوپن اے آئی بلاگ

تنازعہ کو ایک طرف رکھیں، اوپن اے آئی بلاگ بلا شبہ بہت اچھا ہے۔ وقتاً فوقتاً، بلاگ گہرے سیکھنے کے بارے میں مواد اور بصیرتیں پوسٹ کرتا ہے جو صرف OpenAI کے پیمانے پر آسکتا ہے: فرضی رجحان گہری ڈبل نزول. OpenAI ٹیم کبھی کبھار پوسٹ کرتی ہے، لیکن یہ اہم مواد ہیں۔

2020 میں ڈیٹا سائنسدان کے طور پر کیا پڑھنا ہے۔
ذرائع

ٹیبولا بلاگ

Taboola بلاگ اس پوسٹ کے کچھ دوسرے ذرائع کے طور پر معروف نہیں ہے، لیکن میرے خیال میں یہ منفرد ہے - مصنفین "عام" کاروبار کے لیے پروڈکشن میں ایم ایل کو لاگو کرنے کی کوشش کرتے وقت بہت ہی غیر معمولی، حقیقی مسائل کے بارے میں لکھتے ہیں: اس کے بارے میں کم سیلف ڈرائیونگ کاریں اور ورلڈ چیمپئنز جیتنے والے RL ایجنٹس، "مجھے کیسے معلوم ہوگا کہ میرا ماڈل اب غلط اعتماد کے ساتھ چیزوں کی پیش گوئی کر رہا ہے؟"۔ یہ مسائل فیلڈ میں کام کرنے والے تقریباً ہر فرد کے لیے متعلقہ ہیں اور زیادہ عام AI موضوعات کے مقابلے میں کم پریس کوریج حاصل کرتے ہیں، لیکن پھر بھی ان مسائل کو صحیح طریقے سے حل کرنے کے لیے عالمی سطح کے ہنر کی ضرورت ہوتی ہے۔ خوش قسمتی سے، Taboola کے پاس یہ ہنر اور اس کے بارے میں لکھنے کی خواہش اور صلاحیت دونوں ہیں تاکہ دوسرے لوگ بھی سیکھ سکیں۔

اٹ

ٹویٹر کے ساتھ ساتھ، Reddit پر تحقیق، ٹولز، یا ہجوم کی دانشمندی کو حاصل کرنے سے بہتر کوئی چیز نہیں ہے۔

اے آئی کی حالت

پوسٹس صرف سالانہ شائع ہوتی ہیں، لیکن معلومات سے بھری ہوتی ہیں۔ اس فہرست میں موجود دیگر ذرائع کے مقابلے میں، یہ غیر تکنیکی کاروباری لوگوں کے لیے زیادہ قابل رسائی ہے۔ مجھے بات چیت کے بارے میں جو چیز پسند ہے وہ یہ ہے کہ وہ صنعت اور تحقیق کس طرف جا رہے ہیں اس کے بارے میں ایک زیادہ جامع نظریہ دینے کی کوشش کرتے ہیں، ہارڈ ویئر، تحقیق، کاروبار، اور یہاں تک کہ جغرافیائی سیاست کو بھی پرندوں کی نظر سے جوڑتے ہیں۔ دلچسپی کے تنازعات کے بارے میں پڑھنے کے لیے آخر میں شروع کرنا یقینی بنائیں۔

پوڈکاسٹس

سچ کہوں تو، میرے خیال میں پوڈ کاسٹ تکنیکی موضوعات کے بارے میں سیکھنے کے لیے موزوں نہیں ہیں۔ آخرکار، وہ موضوعات کی وضاحت کے لیے صرف آواز کا استعمال کرتے ہیں، اور ڈیٹا سائنس ایک بہت ہی بصری فیلڈ ہے۔ پوڈکاسٹ آپ کو بعد میں مزید گہرائی میں دریافت کرنے یا فلسفیانہ گفتگو میں مشغول ہونے کا بہانہ دیتے ہیں۔ تاہم، یہاں کچھ سفارشات ہیں:

حیرت انگیز فہرستیں۔

یہاں پر نظر رکھنے کے لیے کم ہے، لیکن مزید وسائل جو آپ کو یہ معلوم ہونے کے بعد مددگار ثابت ہوتے ہیں کہ آپ کیا تلاش کر رہے ہیں:

ٹویٹر

  • میٹی ماریانسکی
    میٹی کو عصبی نیٹ ورکس استعمال کرنے کے خوبصورت، تخلیقی طریقے ملتے ہیں، اور آپ کے ٹویٹر فیڈ پر اس کے نتائج دیکھ کر لطف آتا ہے۔ کم از کم ایک نظر ڈالیں۔ یہ تیز.
  • اوری کوہن
    اوری صرف ایک ڈرائیونگ مشین ہے۔ بلاگز. وہ ڈیٹا سائنسدانوں کے مسائل اور حل کے بارے میں بڑے پیمانے پر لکھتے ہیں۔ مضمون شائع ہونے پر مطلع کرنے کے لیے سبسکرائب کرنا یقینی بنائیں۔ اس کا تالیفخاص طور پر واقعی متاثر کن ہے.
  • جیریمی ہاورڈ
    fast.ai کے شریک بانی، تخلیقی صلاحیتوں اور پیداوری کا ایک جامع ذریعہ۔
  • حمیل حسین
    Github میں ایک اسٹاف ایم ایل انجینئر، ہمل حسین ڈیٹا ڈومین میں کوڈرز کے لیے بہت سے ٹولز بنانے اور رپورٹ کرنے کے کام میں مصروف ہے۔
  • فرانسوا چولیٹ
    کیراس کا خالق، اب کرنے کی کوشش کر رہا ہے ہماری سمجھ کو اپ ڈیٹ کریں کہ ذہانت کیا ہے اور اسے کیسے جانچنا ہے۔
  • ہارڈمارو
    گوگل برین کے ریسرچ سائنسدان۔

حاصل يہ ہوا

اصل پوسٹ کو اپ ڈیٹ کیا جا سکتا ہے کیونکہ مصنف کو مواد کے بہترین ذرائع ملتے ہیں جنہیں فہرست میں شامل نہ کرنا شرم کی بات ہو گی۔ بلا جھجھک اس سے رابطہ کریں۔ ٹویٹراگر آپ کسی نئے ذریعہ کی سفارش کرنا چاہتے ہیں! اور DAGsHub بھی نوکری وکیل [تقریبا. ترجمہ پبلک پریکٹیشنر] ڈیٹا سائنس میں، لہذا اگر آپ اپنا ڈیٹا سائنس مواد بناتے ہیں، تو بلا جھجھک پوسٹ کے مصنف کو لکھیں۔

2020 میں ڈیٹا سائنسدان کے طور پر کیا پڑھنا ہے۔
تجویز کردہ ذرائع کو پڑھ کر اور پروموشنل کوڈ کے ذریعے تیار کریں۔ ایچ اے بی آر، آپ بینر پر دی گئی رعایت پر اضافی 10% حاصل کر سکتے ہیں۔

مزید کورسز

نمایاں مضامین

ماخذ: www.habr.com