تربيتي منصوبن لاءِ 52 ڊيٽا سيٽ

  1. مال ڪسٽمر ڊيٽا سيٽ - دڪانن جي ڊيٽا: id، جنس، عمر، آمدني، خرچ جي درجه بندي. (درخواست جا اختيار: مشين لرننگ سان ڪسٽمر سيگمينٽيشن پروجيڪٽ)
  2. Iris Dataset - نئين سکندڙن لاءِ هڪ ڊيٽا سيٽ، جنهن ۾ مختلف گلن لاءِ سيپلن ۽ پنن جي سائيز شامل آهن.
  3. MNIST ڊيٽا سيٽ - هٿ سان لکيل انگن جو هڪ ڊيٽا سيٽ. 60 ٽريننگ تصويرون ۽ 000 ٽيسٽ تصويرون.
  4. بوسٽن هائوسنگ ڊيٽا سيٽ نمونن جي سڃاڻپ لاءِ هڪ مشهور ڊيٽا سيٽ آهي. بوسٽن ۾ گھرن بابت معلومات تي مشتمل آھي: اپارٽمنٽ جو تعداد، رينجر جي قيمت، جرم جي انڊيڪس.
  5. جعلي خبرون ڳولڻ واري ڊيٽا سيٽ - خبرن جي نشانين سان 7796 داخلا شامل آهن: صحيح يا غلط. (پٿون ۾ سورس ڪوڊ سان گڏ ايپليڪيشن آپشن: جعلي خبرن جي چڪاس پٿون پروجيڪٽ )
  6. شراب جي معيار جي ڊيٽا سيٽ - شراب بابت معلومات تي مشتمل آهي: 4898 رڪارڊ 14 پيٽرولن سان.
  7. SOCR ڊيٽا - Heights and Weights Dataset - شروع ڪرڻ لاء سٺو اختيار. 25 سالن جي عمر وارن ماڻهن جي قد ۽ وزن جا 000 رڪارڊ شامل آهن.

    تربيتي منصوبن لاءِ 52 ڊيٽا سيٽ

    مضمون جو ترجمو EDISON سافٽ ويئر جي مدد سان ڪيو ويو، جيڪو ڏاکڻي چين مان آرڊر مڪمل ڪري ٿو ”بهترين“، انهي سان گڏوگڏ ويب ايپليڪيشنون ۽ ويب سائيٽون ٺاهي ٿو.

  8. پارڪنسن ڊيٽا سيٽ پارڪنسن جي بيماري سان مريضن جا 195 رڪارڊ، 25 تجزياتي پيٽرولن سان. بيمار ماڻهن ۽ صحتمند ماڻهن جي وچ ۾ فرق جي ابتدائي تشخيص لاءِ استعمال ٿي سگهي ٿو. (پٿون ۾ سورس ڪوڊ سان گڏ ايپليڪيشن آپشن: پارڪنسن جي بيماري کي ڳولڻ تي مشين لرننگ پروجيڪٽ)
  9. ٽائيٽينڪ ڊيٽا سيٽ - ٽريننگ سيٽ ۾ 891 مسافرن (عمر، جنس، رشتيدار بورڊ تي، وغيره) جي معلومات تي مشتمل آهي ۽ 418 ٽيسٽ سيٽ ۾.
  10. Uber Pickups Dataset - 4.5 ۾ Uber تي 2014 ملين ۽ 14 ۾ 2015 ملين سفرن بابت ڄاڻ. (آر ۾ سورس ڪوڊ سان ايپليڪيشن آپشن: Uber ڊيٽا تجزيو پروجيڪٽ ۾ R)
  11. Chars74k ڊيٽا سيٽ - 64 طبقن جي برطانوي ۽ ڪينيڊين علامتن جون تصويرون شامل آهن: 0-9، A-Z، a-z. 7700 7.7k قدرتي تصويرون، 3400k هٿ سان لکيل، 62000 ڪمپيوٽر سان ٺهيل فونٽس.
  12. ڪريڊٽ ڪارڊ فراڊ جي سڃاڻپ ڊيٽا سيٽ - سمجھوتي ڪيل ڪريڊٽ ڪارڊ جي ٽرانزيڪشن بابت معلومات تي مشتمل آھي. (درخواست جو اختيار ذريعو سان: ڪريڊٽ ڪارڊ فراڊ ڊيٽيڪشن مشين لرننگ پروجيڪٽ)
  13. Chatbot Intents Dataset - هڪ JSON فائل جنهن ۾ مختلف ٽيگ شامل آهن: سلام، الوداع، Hospital_search، pharmacy_search، وغيره. سوال جواب ٽيمپليٽ جو هڪ سيٽ شامل آهي. (پٿون ۾ سورس ڪوڊ سان گڏ ايپليڪيشن آپشن: پٿون ۾ چيٽ بوٽ پروجيڪٽ)
  14. اينرون اي ميل ڊيٽا سيٽ - 150 اينرون مينيجرز جا اڌ لک خط شامل آهن.
  15. Yelp ڊيٽا سيٽ - تي مشتمل آهي 1,2 ملين سفارشون 1,6 ملين صارفين کان 1,2 ملين تنظيمن بابت.
  16. خطرناڪ ڊيٽا سيٽ - مشهور ٽيليويزن گيم مان 200 کان وڌيڪ سوال ۽ جواب جي رڪارڊنگ.
  17. سفارش ڪندڙ سسٽم ڊيٽا سيٽ - UCSD يونيورسٽي مان ڊيٽا سيٽن جي مجموعن سان گڏ هڪ پورٽل. مشهور سائيٽن تي نظرثانين جي رڪارڊ تي مشتمل آهي (Goodreads، Amazon). سفارش ڪندڙ سسٽم ٺاهڻ لاء بهترين. (آر ۾ سورس ڪوڊ سان ايپليڪيشن آپشن: فلم جي سفارش واري سسٽم پروجيڪٽ ۾ آر )
  18. UCI اسپامبيس ڊيٽا سيٽ - اسپام ڳولڻ لاءِ هڪ تربيتي ڊيٽا سيٽ. 4601 اکرن تي مشتمل آھي 57 ميٽا ڊيٽا پيٽرولر سان.
  19. Flickr 30k ڊيٽا سيٽ - 30 کان وڌيڪ تصويرون ۽ ڪيپشن. (Flickr 8k ڊيٽا سيٽ - 8000 تصويرون. پٿون ماخذ پروجيڪٽ: تصويري ڪيپشن جنريٽر پٿون پروجيڪٽ)
  20. IMDB جائزو - ٽريننگ سيٽ ۾ 25 فلمن جا جائزو ۽ 000 ٽيسٽ سيٽ ۾. (آر ۾ سورس ڪوڊ سان ايپليڪيشن آپشن: جذباتي تجزيو ڊيٽا سائنس پروجيڪٽ)
  21. MS COCO ڊيٽا سيٽ - 1,5 ملين ٽيگ ٿيل تصويرون.
  22. CIFAR-10 ۽ CIFAR-100 ڊيٽا سيٽ - CIFAR-10 ۾ 60,000 ننڍيون تصويرون شامل آهن 32*32 پکسلز نمبر 0-9. CIFAR-100 - ترتيب سان، 0-100.
  23. GTSRB (جرمن ٽريفڪ سائن ريڪگنيشن بينچ مارڪ) ڊيٽا سيٽ - 50 روڊ نشانين جون 000 تصويرون. (پٿون ۾ سورس ڪوڊ سان گڏ ايپليڪيشن آپشن: ٽريفڪ نشانين جي سڃاڻپ پٿون پروجيڪٽ)
  24. ImageNet ڊيٽا سيٽ - هر جملي ۾ 100 کان وڌيڪ جملا ۽ اٽڪل 000 تصويرون شامل آهن.
  25. Breast Histopathology Images Dataset - ڊيٽا سيٽ ۾ چھاتی جي ڪينسر جي نمونن جون تصويرون شامل آهن. (ايپليڪيشن آپشن آن سورس ڪوڊ سان چھاتی جي ڪينسر جي درجي بندي پٿون پروجيڪٽ)
  26. Cityscapes Dataset - مختلف شهرن ۾ گهٽين جي وڊيو تسلسل جي اعلي معيار جي تشريح تي مشتمل آهي.
  27. Kinetics ڊيٽا سيٽ - اٽڪل 6,5 ملين اعليٰ معيار جي وڊيوز لاءِ URL لنڪ تي مشتمل آهي.
  28. MPII انساني پوزيشن ڊيٽا سيٽ - ڊيٽا سيٽ ۾ 25 گڏيل تشريحن سان گڏ انساني پوز جون تصويرون شامل آهن.
  29. 20BN-ڪجهه-ڪجهه ڊيٽا سيٽ v2 - اعلي معيار جي وڊيوز جو هڪ سيٽ جيڪو ڏيکاري ٿو ته هڪ شخص ڪيئن عمل ڪري ٿو.
  30. اعتراض 365 ڊيٽا سيٽ - اعلي معيار جي تصويرن جو هڪ ڊيٽا سيٽ اعتراض بائونڊنگ باڪس سان.
  31. فوٽو اسڪيچنگ ڊيٽا سيٽ - 1000 کان وڌيڪ تصويرن تي مشتمل آھي انھن جي خاڪي ڊرائنگ سان.
  32. CQ500 ڊيٽا سيٽ - ڊيٽا سيٽ ۾ سر جي 491 CT اسڪين 193 سلائسون شامل آهن.
  33. IMDB-وڪي ڊيٽا سيٽ - جنس ۽ عمر جي لحاظ سان نشان لڳل چهرن جي 5 ملين کان وڌيڪ تصويرن سان گڏ ڊيٽا سيٽ. (ايپليڪيشن آپشن آن سورس ڪوڊ سان جنس ۽ عمر جي سڃاڻپ پٿون پروجيڪٽ)
  34. يوٽيوب 8 ايم ڊيٽا سيٽ - هڪ ليبل ٿيل وڊيو ڊيٽا سيٽ جنهن ۾ 6,1 ملين يوٽيوب ويڊيو IDs شامل آهن
  35. شهري آواز 8K ڊيٽا سيٽ - شهري آواز جي ڊيٽا جو هڪ سيٽ (8732 طبقن مان 10 شهري آوازن تي مشتمل آهي).
  36. LSUN ڊيٽا سيٽ - منظرن ۽ شين جي لکين رنگين تصويرن جو هڪ ڊيٽابيس (اٽڪل 59 ملين تصويرون، 10 مختلف منظر جا زمرا ۽ 20 مختلف اعتراض جا قسم).
  37. RAVDESS ڊيٽا سيٽ - جذباتي تقرير جو آڊيو بصري ڊيٽابيس. (ايپليڪيشن آپشن آن سورس ڪوڊ سان تقرير جذبات جي سڃاڻپ پٿون پروجيڪٽ)
  38. Librispeech Dataset - ڊيٽا سيٽ تي مشتمل آهي 1000 ڪلاڪ انگريزي تقرير جي مختلف تلفظن سان.
  39. Baidu Apolloscape Dataset - خود ڊرائيونگ ٽيڪنالاجيز جي ترقي لاءِ ڊيٽا سيٽ.
  40. Quandl ڊيٽا پورٽل - اقتصادي ۽ مالي ڊيٽا جو مخزن (اتي آهي مفت ۽ ادا ڪيل مواد).
  41. ورلڊ بئنڪ اوپن ڊيٽا پورٽل - عالمي بئنڪ پاران ترقي پذير ملڪن کي جاري ڪيل قرضن تي معلومات.
  42. IMF ڊيٽا پورٽل هڪ بين الاقوامي پئسي فنڊ پورٽل آهي جيڪو بين الاقوامي فنانس، قرض جي شرح، سيڙپڪاري، پرڏيهي مٽاسٽا جي ذخيرن ۽ شين تي ڊيٽا شايع ڪري ٿو.
  43. آمريڪي اقتصادي ايسوسيئيشن (AEA) ڊيٽا پورٽل - يو ايس ميڪرو اقتصادي ڊيٽا ڳولڻ لاءِ هڪ وسيلو.
  44. Google Trends ڊيٽا پورٽل - گوگل رجحان ڊيٽا بصري طور تي ڊيٽا کي ڳولڻ ۽ تجزيو ڪرڻ لاء استعمال ڪري سگھجي ٿو.
  45. فنانشل ٽائمز مارڪيٽ ڊيٽا پورٽل دنيا جي مالي مارڪيٽن تي تازه ترين معلومات لاء هڪ وسيلو آهي.
  46. Data.gov پورٽل - آمريڪي حڪومت کليل ڊيٽا پورٽل (زراعت، صحت، آبهوا، تعليم، توانائي، فنانس، سائنس ۽ تحقيق، وغيره).
  47. ڊيٽا پورٽل: اوپن گورنمينٽ ڊيٽا (ڀارت) هندستان جي کليل حڪومتي ڊيٽا پليٽ فارم آهي.
  48. کاڌو ماحول ائٽلس ڊيٽا پورٽل - آمريڪا ۾ غذائيت تي تحقيقي ڊيٽا تي مشتمل آهي.
  49. صحت ڊيٽا پورٽل يو ايس ڊپارٽمينٽ آف هيلٿ اينڊ هيومن سروسز جو پورٽل آهي.
  50. مرڪز بيمارين جي ڪنٽرول ۽ روڪٿام لاءِ ڊيٽا پورٽل - صحت سان لاڳاپيل ڊيٽا جي وسيع رينج تي مشتمل آهي.
  51. لنڊن ڊيٽا اسٽور پورٽل - لنڊن ۾ ماڻهن جي زندگين بابت ڊيٽا.
  52. ڪينيڊا حڪومت اوپن ڊيٽا پورٽل - ڪينيڊين بابت کليل ڊيٽا جو هڪ پورٽل (زراعت، آرٽ، ميوزڪ، تعليم، حڪومت، صحت، وغيره)

وڌيڪ پڙهو

جو ذريعو: www.habr.com

تبصرو شامل ڪريو