ڊيٽا سائنس جي صلاحيتن کي بهتر ڪرڻ لاءِ 14 اوپن سورس پروجيڪٽ (آسان، عام، سخت)
شروعاتي لاء ڊيٽا سائنس
1. جذبي جو تجزيو (متن ذريعي جذبي جو تجزيو)
ماخذ ڪوڊ استعمال ڪندي مڪمل ڊيٽا سائنس پروجيڪٽ تي عمل درآمد چيڪ ڪريو - آر ۾ جذبي تجزيي پروجيڪٽ.
جذبن جو تجزيو لفظن جو تجزيو آهي جذبات ۽ رايا جو تعين ڪرڻ لاءِ، جيڪي ٿي سگهن ٿا مثبت يا منفي. هي هڪ قسم جي درجه بندي آهي جنهن ۾ طبقن کي بائنري ٿي سگهي ٿو (مثبت ۽ منفي) يا جمع (خوش، ناراض، اداس، گندو ...). اسان هن ڊيٽا سائنس پروجيڪٽ کي R ۾ لاڳو ڪنداسين ۽ ڊيٽا سيٽ کي "janeaustenR" پيڪيج ۾ استعمال ڪنداسين. اسان عام مقصد جي لغتن کي استعمال ڪنداسين جيئن ته AFINN، bing ۽ loughran، هڪ اندروني جوائن کي انجام ڏيو، ۽ آخر ۾ اسين نتيجو ڏيکارڻ لاء هڪ لفظ ڪلائوڊ ٺاهينداسين.
اچو ته ھاڻي سکو ته مختلف لائبريرين کي ڪيئن استعمال ڪجي. هي ڊيٽا سائنس پروجيڪٽ ليبروسا استعمال ڪري ٿو تقرير جي سڃاڻپ لاءِ. SER تقرير مان انساني جذبات ۽ متاثر ٿيندڙ رياستن کي سڃاڻڻ جو عمل آهي. جيئن ته اسان اسان جي آوازن سان جذبات کي ظاهر ڪرڻ لاء سر ۽ پچ استعمال ڪندا آهيون، SER لاڳاپيل آهي. پر جيئن ته جذبات تابع آهن، آڊيو تشريح هڪ مشڪل ڪم آهي. اسان استعمال ڪنداسين ايم ايف سي سي، ڪروما ۽ ميل افعال ۽ استعمال ڪنداسين RAVDESS ڊيٽا سيٽ جذبات جي سڃاڻپ لاءِ. اسان هن ماڊل لاءِ MLPC ڪلاسفير ٺاهينداسين.
هي پائٿون سان گڏ هڪ دلچسپ ڊيٽا سائنس آهي. صرف هڪ تصوير استعمال ڪندي، توهان هڪ شخص جي جنس ۽ عمر جي اڳڪٿي ڪرڻ سکندا. ان ۾ اسان توهان کي ڪمپيوٽر ويزن ۽ ان جي اصولن کان واقف ڪنداسين. اسان تعمير ڪنداسين convolutional neural نيٽ ورڪ ۽ Adience dataset تي Tal Hassner ۽ Gil Levy پاران تربيت يافته ماڊل استعمال ڪندا. رستي ۾ اسان ڪجهه .pb، .pbtxt، .prototxt ۽ .caffemodel فائلون استعمال ڪنداسين.
هي هڪ ڊيٽا بصري منصوبو آهي ggplot2 سان جنهن ۾ اسين استعمال ڪنداسين R ۽ ان جي لائبريرين ۽ مختلف پيٽرولن جو تجزيو ڪنداسين. اسان Uber Pickups New York City dataset استعمال ڪنداسين ۽ سال جي مختلف وقتن جي فريم لاءِ تصويري شڪل ٺاهينداسين. اهو اسان کي ٻڌائي ٿو ته وقت ڪيئن اثر انداز ڪري ٿو گراهڪ جي سفر.
ٻولي R
ڊيٽا سيٽ / پيڪيج: نيو يارڪ شهر جي ڊيٽا سيٽ ۾ Uber Pickups
اوندهه ۾ ڊرائيونگ انتهائي خطرناڪ آهي، ۽ هر سال لڳ ڀڳ هڪ هزار حادثا ٿين ٿا ڊرائيورن جي ڊرائيونگ دوران سمهڻ سبب. هن Python پروجيڪٽ ۾، اسان هڪ اهڙو سسٽم ٺاهينداسين جيڪو ننڊ جي ڊرائيورن کي ڳولي سگهي ٿو ۽ انهن کي آڊيو سگنل سان پڻ خبردار ڪري سگهي ٿو.
هي منصوبو Keras ۽ OpenCV استعمال ڪندي لاڳو ڪيو ويو آهي. اسان منهن ۽ اکين جي چڪاس لاءِ OpenCV استعمال ڪنداسين ۽ Keras سان اسان اکين جي حالت (اوپن يا بند) کي ڊيپ نيورل نيٽ ورڪ ٽيڪنالاجي استعمال ڪندي درجه بندي ڪنداسين.
Chatbots ڪاروبار جو هڪ لازمي حصو آهن. گھڻن ڪاروبارن کي پنھنجي گراهڪن کي خدمتون پيش ڪرڻيون پونديون آھن ۽ انھن جي خدمت ڪرڻ لاءِ تمام گھڻي افرادي قوت، وقت ۽ ڪوشش لڳندي آھي. Chatbots ڪجھ عام سوالن جو جواب ڏيڻ سان توھان جي گراهڪ جي رابطي جو گھڻو حصو پاڻمرادو ڪري سگھي ٿو جيڪي گراهڪ پڇن ٿا. هتي بنيادي طور تي ٻه قسم جا چيٽ بوٽس آهن: ڊومين مخصوص ۽ اوپن ڊومين. هڪ ڊومين-مخصوص چيٽ بوٽ اڪثر ڪري استعمال ڪيو ويندو آهي مخصوص مسئلو حل ڪرڻ لاءِ. تنهن ڪري، توهان کي پنهنجي فيلڊ ۾ مؤثر طريقي سان ڪم ڪرڻ لاء ان کي ترتيب ڏيڻ جي ضرورت آهي. اوپن ڊومين چيٽ بوٽس ڪي به سوال پڇي سگهجن ٿا، تنهن ڪري انهن کي تربيت ڏيڻ لاءِ ڊيٽا جي وڏي مقدار جي ضرورت آهي.
هن ڊيٽا سائنس پروجيڪٽ ۾، اسان مشين سکيا ذريعي فلم جي سفارشن تي عمل ڪرڻ لاءِ آر استعمال ڪنداسين. سفارش وارو نظام ٻين صارفين جي ترجيحن ۽ برائوزنگ تاريخ جي بنياد تي فلٽرنگ جي عمل ذريعي صارفين کي تجويزون موڪلي ٿو. جيڪڏهن A ۽ B پسند ڪن ٿا گهر اڪيلو، ۽ B پسند ڪن ٿا مون ڇوڪرين کي، ته پوءِ توهان تجويز ڪري سگهو ٿا A - اهي به پسند ڪري سگهن ٿا. هي گراهڪن کي پليٽ فارم سان لهه وچڙ ڪرڻ جي اجازت ڏئي ٿو.
خريدار جي ڀاڱيداري هڪ مشهور ايپليڪيشن آهي غير نگراني تعليم. ڪلسترنگ استعمال ڪندي، ڪمپنيون ڪسٽمر حصن کي سڃاڻڻ لاء هڪ امڪاني صارف جي بنياد کي نشانو بڻائڻ لاء. اهي گراهڪ کي گروپن ۾ ورهائيندا آهن عام خاصيتن جهڙوڪ جنس، عمر، مفادن ۽ خرچ جي عادتن جي مطابق ته جيئن اهي مؤثر طريقي سان هر گروهه کي پنهنجون شيون مارڪيٽ ۾ آڻي سگهن. اسان استعمال ڪنداسين K- جو مطلب آهي ڪلستر ڪرڻ، انهي سان گڏ جنس ۽ عمر جي لحاظ کان ورڇ کي ڏسو. اسان ان کان پوء انهن جي سالياني آمدني ۽ خرچ جي سطح جو تجزيو ڪنداسين.
حادثن کان بچڻ لاءِ هر ڊرائيور لاءِ روڊ نشانيون ۽ ٽريفڪ ضابطا تمام ضروري آهن. قاعدي جي پيروي ڪرڻ لاء، توهان کي پهريان سمجهڻ جي ضرورت آهي ته روڊ جي نشاني ڪيئن نظر اچي ٿي. هڪ شخص کي لازمي طور تي سڀني روڊن جي نشانين کي سکڻ گهرجي ان کان اڳ جو هن کي ڪنهن به گاڏي هلائڻ جو لائسنس ڏنو وڃي. پر هاڻي خود مختيار گاڏين جو تعداد وڌي رهيو آهي، ۽ ويجهي مستقبل ۾ هڪ شخص هاڻي آزاديء سان ڪار هلائڻ نه ڪندو. روڊ سائن ريڪگنيشن پروجيڪٽ ۾، توهان سکندا ته ڪيئن هڪ پروگرام روڊ جي نشانين جي قسم کي ان پٽ طور تصوير ڪڍڻ سان سڃاڻي سگهي ٿو. جرمن ٽريفڪ سائن ريڪگنيشن بينچ مارڪ (GTSRB) ڊيٽا سيٽ کي استعمال ڪيو ويندو آهي هڪ گہرے اعصابي نيٽ ورڪ کي تعمير ڪرڻ لاءِ انهي طبقي کي سڃاڻڻ لاءِ جنهن سان ٽرئفڪ جي نشاني جو تعلق آهي. اسان ايپليڪيشن سان رابطو ڪرڻ لاءِ هڪ سادي GUI پڻ ٺاهيندا آهيون.