نوٽس ڊيٽا سائنسدان: ڪٿي شروع ڪرڻ ۽ اهو ضروري آهي؟

نوٽس ڊيٽا سائنسدان: ڪٿي شروع ڪرڻ ۽ اهو ضروري آهي؟

TL؛ DR ڊيٽا سائنس بابت سوالن/جوابن لاءِ پوسٽ آهي ۽ پيشي ۾ داخل ٿيڻ ۽ ان ۾ ترقي ڪيئن ڪجي. آرٽيڪل ۾، آئون بنيادي اصولن ۽ سوالن جو تجزيو ڪندس ۽ توهان جي مخصوص سوالن جو جواب ڏيڻ لاء تيار آهيان - تبصرن ۾ لکو (يا ذاتي پيغام ۾)، مان ڪجهه ڏينهن اندر هر شيء جو جواب ڏيڻ جي ڪوشش ڪندس.

نوٽس جي "شيطانيت جي تاريخ" جي سيريز جي اچڻ سان، ڪيترا ئي پيغام ۽ تبصرا سوالن سان گڏ آيا ته ڪيئن شروع ڪجي ۽ ڪٿان کوٽجي، ۽ اڄ اسين انهن مکيه صلاحيتن ۽ سوالن جو تجزيو ڪنداسين جيڪي اشاعت کان پوء پيدا ٿيا.

هتي ڏنل هر شيءِ ڪنهن به حتمي سچائي جي دعويٰ نه ڪندي آهي ۽ ليکڪ جي موضوعي راءِ آهي. اسان انهن مکيه شين کي ٽوڙينداسين جيڪي عمل ۾ سڀ کان اهم نظر اچن ٿا.

ڇو ته هن واقعي جي ضرورت آهي

مقصد کي حاصل ڪرڻ لاءِ بهتر طور تي، انهي لاءِ ته اهو گهٽ ۾ گهٽ ڪنهن حد تائين مخصوص نظر اچي - توهان Facebook / Apple / Amazon / Netflix / Google تي ڊي ايس يا ريسرچ سائنسدان بڻجڻ چاهيو ٿا - ڏسو گهرجن، ٻوليون ۽ ضروري صلاحيتون سڌو سنئون ڪهڙي پوزيشن لاء. ڀرتي جو عمل ڇا آهي؟ اهڙي ڪردار ۾ هڪ عام ڏينهن ڪيئن گذري؟ اتي ڪم ڪندڙ هڪ شخص جو سراسري پروفائل ڇا نظر اچي ٿو؟

گهڻو ڪري عام تصوير اها آهي ته هڪ شخص حقيقت ۾ نه ٿو سمجهي ته هو ڇا چاهي ٿو ۽ اهو مڪمل طور تي واضح ناهي ته هن غير واضح تصوير لاء تيار ڪيئن ڪجي - تنهن ڪري، اهو ضروري آهي ته گهٽ ۾ گهٽ هڪ منصوبو آهي جيڪو توهان چاهيو ٿا.

ھدف جو موجوده منظر بيان ڪريو

جيتوڻيڪ اهو رستي ۾ تبديل ٿئي ٿو، ۽ اهو عام طور تي عام آهي - راند جي دوران منصوبن کي تبديل ڪرڻ - اهو توهان جي سامهون هڪ مقصد رکڻ ۽ ان تي ڌيان ڏيڻ، وقتي طور تي جائزو وٺڻ ۽ ٻيهر سوچڻ جي قابل آهي.

ڇا اھو آھي يا اھو اڃا تائين لاڳاپيل آھي

جڏهن توهان پوزيشن تي پهچي ويندا آهيو.

تصور ڪريو ته توھان جي پوزيشن کان اڳ توھان کي پي ايڇ ڊي حاصل ڪرڻ جي ضرورت آھي، صنعت ۾ 2-3 سالن تائين ڪم ڪريو ۽ عام طور تي ھڪڙي خانقاھ ۾ مراقبي ڪرڻ دوران پنھنجو وار ڪٽ ڪريو - ڇا ڊيٽا سائنس جي صورتحال ساڳي نه ٿيندي جھڙي اڳي اقتصاديات سان ھئي. ۽ وڪيل؟ ڇا سڀڪنھن شيء کي سڃاڻڻ کان ٻاهر تبديل ٿي ويندي علائقي ۾ جيڪي توهان ڪرڻ چاهيو ٿا.

ڇا اهو سٺو موقعو ناهي ته هرڪو هاڻي اتي پهچندو ۽ اسان هڪ تصوير ڏسنداسين جڏهن اتي ماڻهن جو هڪ وسيع پرت هوندو جيڪو پيشي ۾ داخل ٿيڻ جي ڪوشش ڪري رهيا آهن - ۽ شروع ڪرڻ لاءِ صرف هڪ ننڍڙي پوزيشن هوندي.

اهو ٿي سگهي ٿو موجوده رجحانات تي غور ڪرڻ جي قابل جڏهن رستو چونڊيو، نه رڳو مزدور مارڪيٽ جي موجوده حالت، پر اهو پڻ توهان جو خيال آهي ته اهو ڪيئن بدلجي رهيو آهي ۽ اهو ڪٿي آهي.

مثال طور، ليکڪ شيطانن جي ڊيٽا ڏانهن وڃڻ جو ارادو نه ڪيو، پر پي ايڇ ڊي دوران هن پاسي واري منصوبن کي ڏٺو، جيڪي مضبوط طور تي ڊي ايس سان مهارتن ۾ گونجندا هئا ۽، گريجوئيٽ اسڪول جي آخر ۾، قدرتي طور تي ماحول ڏانهن منتقل ڪيو ويو، هڪ سٺي پوزيشن ڏسي. .

جيڪڏهن راند جي دوران اهو ظاهر ٿئي ٿو ته اهو ضروري آهي ته ڪنهن ٻئي جاء تي وڃڻ گهرجي - ڇاڪاڻ ته اتي هاڻي سڀ کان وڌيڪ عمل آهي ۽ تمام دلچسپ عمل ٿي رهيو آهي، پوء، اسان اتي قدرتي طريقي سان وينداسين.

مهارت جي ڀڃڪڙي

اهي مهارتن جون مشروط قسمون آهن جيڪي مون کي DS ۾ مڪمل ۽ اثرائتو ڪم ڪرڻ لاءِ اهم لڳي رهيون آهن. الڳ الڳ، مان انگريزيءَ کي اجاگر ڪندس - سي ايس ۾ جيڪي به ڪم ڪريو سي سکو. اڳيون اهم درجا آهن.

پروگرامنگ / اسڪرپٽ

توهان کي ڪهڙي ٻولي ڄاڻڻ جي ضرورت آهي؟ پٿون؟ جاوا؟ شيل اسڪرپٽنگ؟ لوا؟ SQL؟ سي++؟

ڇا واقعي توهان کي ڪرڻ جي ضرورت آهي ۽ ڇو پروگرامنگ جي لحاظ کان - هتي پوزيشن جي حد تمام مختلف آهي.

مثال طور، مون کي اڪثر پيچيده منطق، سوالن، ماڊلز، اينالائيٽڪس، ۽ عام طور تي تشريح ڪيل سسٽم کي لاڳو ڪرڻو پوندو آهي، پر اڪثر عام ۽ معقول ماڻهن کان سواءِ، تقريبن ڪڏهن به ڪوڊ جي رفتار جي گهرج نه هوندي آهي.

تنهن ڪري، منهنجو مهارت سيٽ انهن کان بلڪل مختلف آهي جيڪي Tensorflow لائبريري لکن ٿا ۽ l1 ڪيش جي موثر استعمال لاءِ ڪوڊ کي بهتر ڪرڻ بابت سوچين ٿا ۽ اهڙيون شيون، پوءِ ڏسو ته توهان کي ڪهڙي ضرورت آهي ۽ سکڻ جي صحيح طريقي جو اندازو لڳايو.

مثال طور، python لاء، ماڻهو اڳ ۾ ئي ٺهيل آهن هڪ نقشو ٻولي سکڻ.

يقينا توهان جي ضرورتن لاءِ اڳ ۾ ئي تجربا تجربا آهن ۽ سٺا ذريعا آهن - توهان کي فهرست تي فيصلو ڪرڻ جي ضرورت آهي ۽ اهو ڪرڻ شروع ڪيو.

ڪاروباري عملن کي سمجھڻ

ان کان سواء، ڪٿي به نه: توهان کي سمجهڻ جي ضرورت آهي ڇو ته توهان هن عمل ۾ گهربل آهيو، توهان ڇا ڪري رهيا آهيو ۽ ڇو. گهڻو ڪري اهو آهي جيڪو توهان کي گهڻو وقت بچائي سگهي ٿو، توهان جي فائدي کي وڌايو ۽ وقت ۽ وسيلا برباد نه ڪريو.

عام طور تي، مان پاڻ کان هيٺيان سوال پڇان ٿو:

  • مان ڪمپني ۾ ڇا ڪريان؟
  • ڇو؟
  • ڪير استعمال ڪندو ۽ ڪيئن؟
  • مون وٽ ڪهڙا آپشن آهن؟
  • پيرا ميٽرن جون حدون ڇا آهن؟

هتي پيرا ميٽرن جي باري ۾ ٿورو وڌيڪ آهي: توهان اڪثر ڪري ڪم جي رسم الخط کي تبديل ڪري سگهو ٿا جيڪڏهن توهان ڄاڻو ٿا ته ڪجهه قربان ڪري سگهجي ٿو: مثال طور، تفسير يا ان جي برعڪس، هتي ٻه سيڪڙو ڪردار ادا نه ڪندا ۽ اسان وٽ تمام گهڻو آهي. تڪڙو حل، ۽ ڪلائنٽ کي ان جي ضرورت آهي، ڇاڪاڻ ته هو ان وقت لاء ادا ڪري ٿو جڏهن پائپ لائن AWS ۾ هلندڙ آهي.

رياضي

هتي توهان سڀ ڪجهه پاڻ سوچيو ۽ سمجھو - بنيادي رياضي جي ڄاڻ کان سواء، توهان گرينيڊ سان هڪ بندر کان وڌيڪ ڪجهه نه آهيو (معاف ڪجو رينڊم فاريسٽ سان) - تنهنڪري توهان کي گهٽ ۾ گهٽ بنيادي شيون سمجهڻ جي ضرورت آهي. جيڪڏهن مون کي تمام گهٽ فهرست ٺاهڻ گهرجي، پوء ان ۾ شامل هوندو:

  • لڪير الجبرا - وسيلن جو هڪ وڏو تعداد گوگل لاءِ آسان آهي، ڏسو ته ڇا توهان لاءِ مناسب آهي؛
  • رياضياتي تجزيو - (گهٽ ۾ گهٽ پهرين ٻن سيمسٽرز جي مقدار ۾)؛
  • امڪاني نظريو مشين سکيا ۾ هر جڳهه آهي.
  • Combinatorics - اهو اصل ۾ ٿيورور جو پورو پورو آهي.
  • گراف جو نظريو - گهٽ ۾ گهٽ BASIC؛
  • Algorithms - گهٽ ۾ گهٽ پهرين ٻن سيمسٽرز جو حجم (ڏسو ڪرمن جون سفارشون سندس ڪتاب ۾)؛
  • Mathlogic - گهٽ ۾ گهٽ بنيادي.

عملي ڊيٽا تجزيو ۽ تصور

سڀ کان وڌيڪ بنيادي شين مان هڪ آهي توهان جي هٿن کي ڊيٽا ۾ گندي حاصل ڪرڻ کان ڊپ نه ٿيڻ جي قابل آهي ۽ ڊيٽا سيٽ جي هڪ جامع تجزيي کي منظم ڪرڻ، پروجيڪٽ ۽ جلدي ڊيٽا جي تصور ۾ اڇلائي.

تحقيقي ڊيٽا جي تجزيي کي صرف ڪجهه قدرتي ٿيڻ گهرجي، ٻين سڀني ڊيٽا جي تبديلين وانگر ۽ يونڪس نوڊس کان هڪ سادي پائپ لائن ۾ اڇلائڻ جي صلاحيت (اڳوڻي آرٽيڪل ڏسو) يا هڪ پڙهڻ ۽ سمجھڻ وارو نوٽ بڪ لکڻ.

الڳ الڳ، مان بصري جو ذڪر ڪندس: اهو بهتر آهي ته هڪ ڀيرو ڏسڻ لاء سئو ڀيرا ٻڌڻ کان.

مئنيجر کي گراف ڏيکاريو انگن جي سيٽ کان سئو ڀيرا وڌيڪ آسان ۽ صاف آهي، تنهنڪري matplotlib، seaborn ۽ ggplot2 توهان جا دوست آهن.

نرم صلاحيتن

اهو هڪجهڙو ضروري آهي ته توهان پنهنجا خيال، گڏوگڏ نتيجا ۽ خدشا (وغيره) ٻين تائين پهچائڻ جي قابل ٿي وڃو - پڪ ڪريو ته توهان واضح طور تي ٽيڪنيڪل ۽ ڪاروباري اصطلاحن ۾ مسئلو بيان ڪري سگهو ٿا.

توهان وضاحت ڪري سگهو ٿا ساٿين، مينيجرز، اعليٰ آفيسرن، گراهڪن ۽ هر ڪنهن کي جنهن کي ان جي ضرورت آهي، ڇا ٿي رهيو آهي، توهان ڪهڙي قسم جي ڊيٽا تي ڪم ڪيو ۽ توهان کي ڪهڙي قسم جا نتيجا مليا.

توهان جا چارٽ ۽ دستاويز توهان جي بغير پڙهڻ گهرجن. اھو آھي، توھان کي توھان ڏانھن وڃڻ جي ضرورت نھ آھي اھو سمجھڻ لاءِ ته اتي ڇا لکيل آھي.

توھان پوائنٽ حاصل ڪرڻ ۽ / يا پروجيڪٽ / توھان جي ڪم کي دستاويز ڪرڻ لاءِ واضح پيشڪش ڪري سگھو ٿا.

توهان معقول ۽ غير جذباتي طور تي پنهنجي پوزيشن کي بيان ڪري سگهو ٿا، چئو "ها / نه" يا سوال / فيصلي جي حمايت ڪريو.

تربيتي سيشن

اتي ڪيتريون ئي مختلف جڳھون آھن جتي توھان ھي سڀ سکي سگھوٿا. مان هڪ مختصر فهرست ڏيندس - مون ان مان هر شيء جي ڪوشش ڪئي آهي ۽، ايماندار ٿيڻ لاء، هر شيء کي ان جا فائدا ۽ نقصان آهن. ڪوشش ڪريو ۽ فيصلو ڪريو ته توهان کي ڇا مناسب آهي، پر مان تمام گهڻي صلاح ڏيان ٿو ڪيترن ئي اختيارن کي آزمائي ۽ هڪ تي ٽنگ نه وڃايو.

  • آن لائين ڪورس: ڪورسرا، udacity، Edx، وغيره؛
  • نوان اسڪول: آن لائن ۽ آف لائن - SkillFactory، SAD، MADE؛
  • ڪلاسيڪل اسڪول: يونيورسٽي ماسٽر پروگرام ۽ جديد تربيتي ڪورس؛
  • پروجيڪٽس - توهان صرف اهي ڪم چونڊي سگهو ٿا جيڪي توهان سان دلچسپي رکن ٿا ۽ انهن کي ڪٽيو، انهن کي گٿب تي پوسٽ ڪندي؛
  • انٽرنشپس - هتي ڪجهه تجويز ڪرڻ ڏکيو آهي، توهان کي اهو ڳولڻو پوندو ته ڇا موجود آهي ۽ مناسب اختيارن کي ڳولهيو.

ڇا اهو ضروري آهي؟

نتيجي ۾، شايد مان ٽي ذاتي اصول شامل ڪندس جن کي مان پاڻ تي عمل ڪرڻ جي ڪوشش ڪريان ٿو.

  • دلچسپ هجڻ گهرجي؛
  • اندروني خوشي آڻيو (= گهٽ ۾ گهٽ تڪليف جو سبب نه آهي)؛
  • ”تنهنجو ٿيڻ“.

ڇو ته اهي بلڪل؟ اهو تصور ڪرڻ ڏکيو آهي ته توهان ڏينهن کان پوء ڪجهه ڪري رهيا آهيو ۽ توهان ان کي پسند نه ڪندا يا دلچسپي نه ڪندا. تصور ڪريو ته توھان ھڪڙو ڊاڪٽر آھيو ۽ ماڻھن سان ڳالھ ٻولھ ڪرڻ کان نفرت ڪريو ٿا - اھو ضرور ڪنھن طرح ڪم ڪري سگھي ٿو، پر توھان مريضن جي وهڪري سان مسلسل نااميد رھندؤ جيڪي توھان کان ڪجھ پڇڻ چاھيو ٿا. اهو ڊگهي عرصي ۾ ڪم نٿو ڪري.

مون خاص طور تي اندروني خوشين جو ذڪر ڇو ڪيو؟ اهو مون کي لڳي ٿو ته اهو وڌيڪ ترقي لاء ضروري آهي ۽، اصول ۾، سکيا وارو عمل. مان واقعي مزو وٺان ٿو جڏهن مان ڪجهه پيچيده خصوصيت کي مڪمل ڪرڻ جو انتظام ڪريان ٿو ۽ هڪ ماڊل ٺاهيو يا هڪ اهم پيٽرولر جي حساب سان. مون کي مزو ايندو آهي جڏهن منهنجو ڪوڊ جمالياتي طور تي خوشگوار ۽ سٺو لکيل آهي. تنهن ڪري، اهو دلچسپ آهي ته ڪجهه نئون مطالعو ڪرڻ ۽ سڌو سنئون ڪنهن به اهم حوصلا جي ضرورت ناهي.

"توهان جو هجڻ" اهو ئي احساس آهي جيڪو توهان هن بابت ڪرڻ چاهيو ٿا. مون وٽ هڪ ننڍڙي ڪهاڻي آهي. ننڍپڻ کان وٺي، مون کي راڪ ميوزڪ جو شوق هو (۽ ڌاتو - سالمون!) ۽ ڪيترا ماڻهو سکڻ چاهيندا هئا ته ڪيئن راند ڪجي، ۽ بس. اهو ظاهر ٿيو ته مون کي ٻڌڻ ۾ نه آيو ۽ نه آواز - اهو مون کي تمام گهڻو پريشان نه ڪيو (۽ مون کي اهو چوڻ گهرجي ته اهو اسٽيج تي ڪيترن ئي اداڪارين کي پريشان نه ڪندو آهي)، ۽ هڪ اسڪول جي ٻار جي حيثيت ۾ مون کي گٽار مليو ... ۽ اهو واضح ٿي ويو ته مون واقعي پسند نه ڪيو هو ڪلاڪن لاءِ ويهڻ ۽ ان تي کيڏڻ. اهو ڏکيو هو، اهو هميشه مون کي لڳي ٿو ته ڪنهن قسم جي گندگي نڪرندي هئي - مون کي ان ۾ بلڪل مزو نه آيو ۽ صرف بيوقوف، بيوقوف ۽ مڪمل طور تي ناقابل محسوس ڪيو. مون لفظي طور تي پاڻ کي مجبور ڪيو ته لٺ جي هيٺان ڪلاس لاءِ ويهان، ۽ عام طور تي اهو گهوڙي جي چاري ۾ نه هو.

ساڳئي وقت، مان ڪافي سڪون سان ڪلاڪن جا ڪلاڪ ويٺي رهيس ته ڪنهن قسم جي رانديڪا ٺاهي، هڪ اسڪرپٽ استعمال ڪندي ڪنهن شيءِ کي فليش تي متحرڪ ڪرڻ لاءِ (يا ڪا ٻي شيءِ) ۽ مون کي جهنگلي طور تي حوصلا افزائي ڪئي وئي ته راند ۾ عنصرن کي ختم ڪريان يا ان جي ميڪانڪس سان ڊيل ڪريان. تحريڪ ۽ / يا ٽئين پارٽي جي لائبريرين کي ڳنڍڻ، پلگ ان ۽ ٻيو سڀ ڪجهه.

۽ ڪجهه نقطي تي مون محسوس ڪيو ته گٽار وڄائڻ منهنجو ناهي ۽ مان واقعي ٻڌڻ پسند ڪريان ٿو، راند ڪرڻ نه. ۽ منهنجيون اکيون جلجي ويون جڏهن مون رانديون ۽ ڪوڊ لکيو (ان وقت هر قسم جي ڌاتو ٻڌي)، ۽ اهو ئي مون کي پسند آيو، ۽ اهو ئي مون کي ڪرڻ گهرجي ها.

ڇا توھان وٽ ٻيا سوال آھن؟

يقينن، اسان سڀني عنوانن ۽ سوالن جي ذريعي نه ٿي سگهيا، تنهنڪري تبصرو لکندا ۽ ذاتي طور تي - مان هميشه سوال پڇڻ لاء خوش آهيان.

نوٽس ڊيٽا سائنسدان: ڪٿي شروع ڪرڻ ۽ اهو ضروري آهي؟

نوٽس ڊيٽا سائنسدان: ڪٿي شروع ڪرڻ ۽ اهو ضروري آهي؟

جو ذريعو: www.habr.com

تبصرو شامل ڪريو