تربیتی منصوبوں کے لیے 52 ڈیٹا سیٹس

  1. مال کے صارفین کا ڈیٹاسیٹ - اسٹور کے زائرین کا ڈیٹا: آئی ڈی، جنس، عمر، آمدنی، اخراجات کی درجہ بندی۔ (درخواست کا اختیار: مشین لرننگ کے ساتھ کسٹمر سیگمنٹیشن پروجیکٹ)
  2. ایرس ڈیٹاسیٹ - ابتدائیوں کے لیے ایک ڈیٹاسیٹ، جس میں مختلف پھولوں کے لیے سیپل اور پنکھڑیوں کے سائز ہوتے ہیں۔
  3. MNIST ڈیٹاسیٹ - ہاتھ سے لکھے ہوئے نمبروں کا ڈیٹا سیٹ۔ 60 ٹریننگ امیجز اور 000 ٹیسٹ امیجز۔
  4. بوسٹن ہاؤسنگ ڈیٹاسیٹ پیٹرن کی شناخت کے لیے ایک مقبول ڈیٹاسیٹ ہے۔ بوسٹن میں مکانات کے بارے میں معلومات پر مشتمل ہے: اپارٹمنٹس کی تعداد، کرایے کی قیمتیں، کرائم انڈیکس۔
  5. جعلی خبروں کا پتہ لگانے والا ڈیٹا سیٹ - خبروں کے نشانات کے ساتھ 7796 اندراجات پر مشتمل ہے: درست یا غلط۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: جعلی خبروں کا پتہ لگانے والا ازگر پروجیکٹ )
  6. شراب کے معیار کا ڈیٹاسیٹ - شراب کے بارے میں معلومات پر مشتمل ہے: 4898 پیرامیٹرز کے ساتھ 14 ریکارڈ۔
  7. SOCR ڈیٹا - اونچائی اور وزن کا ڈیٹا سیٹ - شروع کرنے کا ایک اچھا آپشن۔ 25 سال کی عمر کے لوگوں کے قد اور وزن کے 000 ریکارڈز پر مشتمل ہے۔

    تربیتی منصوبوں کے لیے 52 ڈیٹا سیٹس

    مضمون کا ترجمہ EDISON سافٹ ویئر کے تعاون سے کیا گیا تھا، جو جنوبی چین کے آرڈرز کو "بہترین طریقے سے" پورا کرتا ہےاور ویب ایپلیکیشنز اور ویب سائٹس تیار کرتا ہے۔.

  8. پارکنسن ڈیٹاسیٹ پارکنسنز کے مرض میں مبتلا مریضوں کے 195 ریکارڈ، 25 تجزیہ پیرامیٹرز کے ساتھ۔ بیمار لوگوں اور صحت مند لوگوں کے درمیان فرق کی ابتدائی تشخیص کے لیے استعمال کیا جا سکتا ہے۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: پارکنسنز کی بیماری کا پتہ لگانے پر مشین لرننگ پروجیکٹ)
  9. ٹائٹینک ڈیٹاسیٹ - ٹریننگ سیٹ میں 891 اور ٹیسٹ سیٹ میں 418 مسافروں (عمر، جنس، بورڈ پر موجود رشتہ دار وغیرہ) کے بارے میں معلومات پر مشتمل ہے۔
  10. Uber Pickups ڈیٹا سیٹ — 4.5 میں Uber پر 2014 ملین اور 14 میں 2015 ملین ٹرپس کے بارے میں معلومات۔ (آر میں سورس کوڈ کے ساتھ درخواست کا اختیار: آر میں Uber ڈیٹا تجزیہ پروجیکٹ)
  11. Chars74k ڈیٹاسیٹ - 64 کلاسوں کے برطانوی اور کینیڈین علامتوں کی تصاویر پر مشتمل ہے: 0-9، AZ، ​​az۔ 7700 7.7k قدرتی تصاویر، 3400k ہاتھ سے لکھے ہوئے، 62000 کمپیوٹر سنتھیسائزڈ فونٹس۔
  12. کریڈٹ کارڈ فراڈ کا پتہ لگانے والا ڈیٹا سیٹ - سمجھوتہ شدہ کریڈٹ کارڈز کے لین دین کے بارے میں معلومات پر مشتمل ہے۔ (ذریعہ کے ساتھ درخواست کا اختیار: کریڈٹ کارڈ فراڈ ڈیٹیکشن مشین لرننگ پروجیکٹ)
  13. چیٹ بوٹ انٹینٹ ڈیٹاسیٹ — ایک JSON فائل جس میں مختلف ٹیگز شامل ہیں: مبارکباد، الوداع، ہسپتال_تلاش، فارمیسی_تلاش، وغیرہ۔ سوال جواب ٹیمپلیٹس کا ایک سیٹ پر مشتمل ہے۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: ازگر میں چیٹ بوٹ پروجیکٹ)
  14. اینرون ای میل ڈیٹاسیٹ - اینرون کے 150 مینیجرز کے نصف ملین خطوط پر مشتمل ہے۔
  15. ییلپ ڈیٹاسیٹ - تقریباً 1,2 ملین تنظیموں کے 1,6 ملین صارفین کی طرف سے 1,2 ملین سفارشات پر مشتمل ہے۔
  16. خطرے سے متعلق ڈیٹاسیٹ - مقبول ٹیلی ویژن گیم سے 200 سے زیادہ سوال و جواب کی ریکارڈنگ۔
  17. تجویز کنندہ سسٹمز ڈیٹاسیٹ - UCSD یونیورسٹی کے ڈیٹاسیٹس کے مجموعے کے ساتھ ایک پورٹل۔ مقبول سائٹس (Goodreads، Amazon) پر جائزوں کے ریکارڈ پر مشتمل ہے۔ سفارشی نظام بنانے کے لیے بہت اچھا ہے۔ (آر میں سورس کوڈ کے ساتھ درخواست کا اختیار: آر میں مووی ریکمنڈیشن سسٹم پروجیکٹ )
  18. UCI اسپامبیس ڈیٹاسیٹ - سپیم کا پتہ لگانے کے لیے ایک تربیتی ڈیٹا سیٹ۔ 4601 میٹا ڈیٹا پیرامیٹرز کے ساتھ 57 حروف پر مشتمل ہے۔
  19. فلکر 30k ڈیٹا سیٹ - 30 سے زیادہ تصاویر اور سرخیاں۔ (فلکر 8k ڈیٹا سیٹ - 8000 تصاویر۔ ازگر سورس پروجیکٹ: تصویری کیپشن جنریٹر ازگر پروجیکٹ)
  20. IMDB کے جائزے - ٹریننگ سیٹ میں 25 فلمی جائزے اور 000 ٹیسٹ سیٹ میں۔ (آر میں سورس کوڈ کے ساتھ درخواست کا اختیار: جذباتی تجزیہ ڈیٹا سائنس پروجیکٹ)
  21. MS COCO ڈیٹاسیٹ - 1,5 ملین ٹیگ شدہ تصاویر۔
  22. CIFAR-10 اور CIFAR-100 ڈیٹاسیٹ - CIFAR-10 میں 60,000*32 پکسلز نمبر 32-0 کی 9 چھوٹی تصاویر ہیں۔ CIFAR-100 - بالترتیب، 0-100۔
  23. GTSRB (جرمن ٹریفک سائن ریکگنیشن بینچ مارک) ڈیٹا سیٹ - 50 سڑک کے نشانات کی 000 تصاویر۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: ٹریفک سائنز ریکگنیشن ازگر پروجیکٹ)
  24. امیج نیٹ ڈیٹاسیٹ - 100 سے زیادہ جملے اور فی جملہ تقریباً 000 تصاویر پر مشتمل ہے۔
  25. بریسٹ ہسٹوپیتھولوجی امیجز ڈیٹاسیٹ - ڈیٹاسیٹ چھاتی کے کینسر کے نمونوں کی تصاویر پر مشتمل ہے۔ (سورس کوڈ کے ساتھ ایپلیکیشن کا آپشن آن ہے۔ بریسٹ کینسر کی درجہ بندی ازگر پروجیکٹ)
  26. سٹی اسکیپس ڈیٹاسیٹ - مختلف شہروں میں سڑکوں کے ویڈیو تسلسل کے اعلی معیار کی تشریحات پر مشتمل ہے۔
  27. کائینیٹکس ڈیٹاسیٹ - تقریباً 6,5 ملین اعلیٰ معیار کی ویڈیوز کا URL لنک پر مشتمل ہے۔
  28. MPII انسانی پوز ڈیٹاسیٹ - ڈیٹاسیٹ میں مشترکہ تشریحات کے ساتھ انسانی پوز کی 25 تصاویر شامل ہیں۔
  29. 20BN-something-something ڈیٹاسیٹ v2 - اعلیٰ معیار کی ویڈیوز کا ایک سیٹ جو دکھاتا ہے کہ کوئی شخص کچھ کارروائی کیسے کرتا ہے۔
  30. آبجیکٹ 365 ڈیٹا سیٹ - آبجیکٹ باؤنڈنگ بکس کے ساتھ اعلیٰ معیار کی تصاویر کا ڈیٹاسیٹ۔
  31. فوٹو اسکیچنگ ڈیٹاسیٹ - 1000 سے زیادہ تصاویر پر مشتمل ہے جس میں ان کی خاکہ نگاری ہے۔
  32. CQ500 ڈیٹاسیٹ - ڈیٹاسیٹ میں 491 سلائسوں کے ساتھ سر کے 193 CT اسکین ہیں۔
  33. IMDB-Wiki ڈیٹاسیٹ - جنس اور عمر کے لحاظ سے نشان زد چہروں کی 5 ملین سے زیادہ تصاویر والا ڈیٹا سیٹ۔ (سورس کوڈ کے ساتھ ایپلیکیشن کا آپشن آن ہے۔ جنس اور عمر کا پتہ لگانے والا ازگر پروجیکٹ)
  34. یوٹیوب 8 ایم ڈیٹاسیٹ - ایک لیبل شدہ ویڈیو ڈیٹاسیٹ جس میں 6,1 ملین یوٹیوب ویڈیو IDs ہیں۔
  35. اربن ساؤنڈ 8K ڈیٹاسیٹ - شہری آواز کے اعداد و شمار کا ایک سیٹ (8732 کلاسوں کی 10 شہری آوازوں پر مشتمل ہے)۔
  36. LSUN ڈیٹاسیٹ - مناظر اور اشیاء کی لاکھوں رنگین تصاویر کا ڈیٹاسیٹ (تقریباً 59 ملین تصاویر، 10 مختلف منظر کے زمرے اور 20 مختلف آبجیکٹ زمرے)۔
  37. RAVDESS ڈیٹاسیٹ - جذباتی تقریر کا آڈیو ویزوئل ڈیٹا بیس۔ (سورس کوڈ کے ساتھ ایپلیکیشن کا آپشن آن ہے۔ اسپیچ ایموشن ریکگنیشن ازگر پروجیکٹ)
  38. Librispeech ڈیٹاسیٹ - ڈیٹاسیٹ میں مختلف لہجوں کے ساتھ 1000 گھنٹے کی انگریزی تقریر ہوتی ہے۔
  39. Baidu Apolloscape ڈیٹا سیٹ - سیلف ڈرائیونگ ٹیکنالوجیز کی ترقی کے لیے ایک ڈیٹاسیٹ۔
  40. Quandl ڈیٹا پورٹل - معاشی اور مالیاتی ڈیٹا کا ذخیرہ (مفت اور ادا شدہ مواد موجود ہے)۔
  41. ورلڈ بینک اوپن ڈیٹا پورٹل - عالمی بینک کی طرف سے ترقی پذیر ممالک کو جاری کردہ قرضوں کی معلومات۔
  42. آئی ایم ایف ڈیٹا پورٹل ایک بین الاقوامی مالیاتی فنڈ پورٹل ہے جو بین الاقوامی مالیات، قرض کی شرح، سرمایہ کاری، غیر ملکی زرمبادلہ کے ذخائر اور اجناس کا ڈیٹا شائع کرتا ہے۔
  43. امریکن اکنامک ایسوسی ایشن (AEA) ڈیٹا پورٹل - یو ایس میکرو اکنامک ڈیٹا کو تلاش کرنے کا ایک وسیلہ۔
  44. گوگل ٹرینڈز ڈیٹا پورٹل - گوگل ٹرینڈ ڈیٹا کو بصری طور پر دریافت کرنے اور ڈیٹا کا تجزیہ کرنے کے لیے استعمال کیا جا سکتا ہے۔
  45. فنانشل ٹائمز مارکیٹ ڈیٹا پورٹل دنیا بھر کی مالیاتی منڈیوں کے بارے میں تازہ ترین معلومات کا وسیلہ ہے۔
  46. Data.gov پورٹل - امریکی حکومت اوپن ڈیٹا پورٹل (زراعت، صحت، آب و ہوا، تعلیم، توانائی، مالیات، سائنس اور تحقیق وغیرہ)۔
  47. ڈیٹا پورٹل: اوپن گورنمنٹ ڈیٹا (انڈیا) ہندوستان کا اوپن گورنمنٹ ڈیٹا پلیٹ فارم ہے۔
  48. فوڈ انوائرمنٹ اٹلس ڈیٹا پورٹل - ریاستہائے متحدہ میں غذائیت سے متعلق تحقیقی ڈیٹا پر مشتمل ہے۔
  49. ہیلتھ ڈیٹا پورٹل امریکی محکمہ صحت اور انسانی خدمات کا ایک پورٹل ہے۔
  50. بیماریوں کے کنٹرول اور روک تھام کے مراکز ڈیٹا پورٹل - صحت سے متعلق ڈیٹا کی ایک وسیع رینج پر مشتمل ہے۔
  51. لندن ڈیٹا اسٹور پورٹل - لندن میں لوگوں کی زندگیوں کے بارے میں ڈیٹا۔
  52. کینیڈا گورنمنٹ اوپن ڈیٹا پورٹل - کینیڈا کے بارے میں کھلے ڈیٹا کا ایک پورٹل (زراعت، فن، موسیقی، تعلیم، حکومت، صحت کی دیکھ بھال، وغیرہ)

مزید پڑھ

ماخذ: www.habr.com

نیا تبصرہ شامل کریں