پيشه ور ڊيٽا انجنيئر حاصل ڪرڻ لاء ليولنگ ​​پلان

مان گذريل اٺن سالن کان پروجيڪٽ مئنيجر طور ڪم ڪري رهيو آهيان (آئون ڪم تي ڪوڊ نٿو لکان)، جنهن جو قدرتي طور تي منهنجي ٽيڪنالاجي پس منظر تي منفي اثر پيو. مون فيصلو ڪيو ته منهنجي ٽيڪنيڪي خلا کي گهٽائڻ ۽ ڊيٽا انجنيئر جو پيشو حاصل ڪرڻ. ڊيٽا انجنيئر جي بنيادي مهارت ڊيٽا گودام کي ڊزائين ڪرڻ، تعمير ڪرڻ ۽ برقرار رکڻ جي صلاحيت آهي.

مون هڪ ٽريننگ پلان تيار ڪيو آهي، مان سمجهان ٿو ته اهو نه صرف منهنجي لاءِ مفيد ٿيندو. منصوبو ڪورسز جي آزاد مطالعي تي مرکوز آهي. روسي ۾ مفت ڪورسز کي ترجيح ڏني وئي آهي.

سيڪشن:

  • الگورتھم ۽ ڊيٽا جي جوڙجڪ. اهم سيڪشن. جيڪڏھن توھان ان جو مطالعو ڪريو، باقي سڀ ڪجھ ڪم ڪندو. اهو ضروري آهي ته ڪوڊ لکڻ ۽ بنيادي جوڙجڪ ۽ الگورتھم استعمال ڪرڻ ۾ ماهر ٿيڻ.
  • ڊيٽابيس ۽ ڊيٽا گودام، ڪاروباري ڄاڻ. اسان الگورتھم کان ڊيٽا اسٽوريج ۽ پروسيسنگ ڏانهن وڃو.
  • Hadoop ۽ بگ ڊيٽا. جڏهن ڊيٽابيس هارڊ ڊرائيو تي مناسب نه هجي، يا جڏهن ڊيٽا کي تجزيو ڪرڻ جي ضرورت هجي، پر ايڪسل هاڻي ان کي لوڊ نٿو ڪري سگهي، وڏي ڊيٽا شروع ٿئي ٿي. منهنجي خيال ۾، توهان کي هن حصي ڏانهن وڃڻ جي ضرورت آهي صرف پوئين ٻن جي اڀياس کان پوء.

الگورتھم ۽ ڊيٽا جي جوڙجڪ

منهنجي منصوبي ۾ مون شامل ڪيو پيٿون سکڻ، رياضي جي بنيادي ڳالهين جو جائزو وٺڻ ۽ الگورٿمائيزيشن.

ڊيٽابيس ۽ ڊيٽا گودام، ڪاروباري ڄاڻ

ڊيٽا گودامن جي تعمير سان لاڳاپيل موضوع، ETL، OLAP cubes اوزارن تي تمام گهڻو منحصر آهن، تنهن ڪري هن دستاويز ۾ آئون ڪورسز جي لنڪ مهيا نه ڪريان. اهو مشورو آهي ته اهڙي سسٽم جو مطالعو ڪرڻ لاء جڏهن هڪ مخصوص ڪمپني ۾ هڪ خاص منصوبي تي ڪم ڪري رهيو آهي. ETL سان واقف ٿيڻ لاء توھان ڪوشش ڪري سگھو ٿا نتيجو يا Airflow.

منهنجي خيال ۾، اهو ضروري آهي ته مطالعو ڪرڻ لاء جديد ڊيٽا گودام ڊيزائن جي طريقيڪار ڊيٽا والٽ لنڪ 1, لنڪ 2. ۽ اهو سکڻ جو بهترين طريقو اهو آهي ته ان کي وٺو ۽ ان کي هڪ سادي مثال سان لاڳو ڪريو. GitHub تي ڊيٽا والٽ لاڳو ڪرڻ جا ڪيترائي مثال آهن لنڪ. ڊيٽا گودامن تي هڪ جديد ڪتاب: هينس هولگرن پاران ڊيٽا والٽ سان گڏ Agile ڊيٽا گودام جي ماڊلنگ.

آخري استعمال ڪندڙن لاءِ بزنس انٽيليجنس ٽولز سان واقفيت حاصل ڪرڻ لاءِ، توھان استعمال ڪري سگھو ٿا مفت ڊزائينر آف رپورٽون، ڊيش بورڊ، ۽ مني ڊيٽا گودام Power BI ڊيسڪ ٽاپ. تعليمي مواد: لنڪ 1, لنڪ 2.

Hadoop ۽ بگ ڊيٽا

ٿڪل

اهو سڀ ڪجهه ناهي جيڪو توهان پڙهو ڪم تي لاڳو ڪري سگهجي ٿو. تنهن ڪري، توهان کي گريجوئيشن منصوبي جي ضرورت آهي جنهن ۾ توهان نئين علم کي لاڳو ڪرڻ جي ڪوشش ڪندا.

منصوبي ۾ ڊيٽا جي تجزيو ۽ مشين لرننگ سان لاڳاپيل موضوع شامل نه آهن، ڇاڪاڻ ته هي ڊيٽا سائنسدان جي پيشي سان وڌيڪ لاڳاپيل آهي. AWS ۽ Azure clouds سان لاڳاپيل موضوع پڻ نه آهن. اهي موضوع پليٽ فارم جي چونڊ تي تمام گهڻو منحصر آهن.

ڪميونٽي لاء سوال:
منهنجو پمپنگ پلان ڪيترو مناسب آهي؟ ڇا ختم ڪرڻ يا شامل ڪرڻ؟
مقالي جي طور تي توهان ڪهڙي منصوبي جي سفارش ڪندا؟

جو ذريعو: www.habr.com

تبصرو شامل ڪريو