ایرس ڈیٹاسیٹ - ابتدائیوں کے لیے ایک ڈیٹاسیٹ، جس میں مختلف پھولوں کے لیے سیپل اور پنکھڑیوں کے سائز ہوتے ہیں۔
MNIST ڈیٹاسیٹ - ہاتھ سے لکھے ہوئے نمبروں کا ڈیٹا سیٹ۔ 60 ٹریننگ امیجز اور 000 ٹیسٹ امیجز۔
بوسٹن ہاؤسنگ ڈیٹاسیٹ پیٹرن کی شناخت کے لیے ایک مقبول ڈیٹاسیٹ ہے۔ بوسٹن میں مکانات کے بارے میں معلومات پر مشتمل ہے: اپارٹمنٹس کی تعداد، کرایے کی قیمتیں، کرائم انڈیکس۔
پارکنسن ڈیٹاسیٹ پارکنسنز کے مرض میں مبتلا مریضوں کے 195 ریکارڈ، 25 تجزیہ پیرامیٹرز کے ساتھ۔ بیمار لوگوں اور صحت مند لوگوں کے درمیان فرق کی ابتدائی تشخیص کے لیے استعمال کیا جا سکتا ہے۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: پارکنسنز کی بیماری کا پتہ لگانے پر مشین لرننگ پروجیکٹ)
ٹائٹینک ڈیٹاسیٹ - ٹریننگ سیٹ میں 891 اور ٹیسٹ سیٹ میں 418 مسافروں (عمر، جنس، بورڈ پر موجود رشتہ دار وغیرہ) کے بارے میں معلومات پر مشتمل ہے۔
چیٹ بوٹ انٹینٹ ڈیٹاسیٹ — ایک JSON فائل جس میں مختلف ٹیگز شامل ہیں: مبارکباد، الوداع، ہسپتال_تلاش، فارمیسی_تلاش، وغیرہ۔ سوال جواب ٹیمپلیٹس کا ایک سیٹ پر مشتمل ہے۔ (ازگر میں سورس کوڈ کے ساتھ درخواست کا اختیار: ازگر میں چیٹ بوٹ پروجیکٹ)
ییلپ ڈیٹاسیٹ - تقریباً 1,2 ملین تنظیموں کے 1,6 ملین صارفین کی طرف سے 1,2 ملین سفارشات پر مشتمل ہے۔
خطرے سے متعلق ڈیٹاسیٹ - مقبول ٹیلی ویژن گیم سے 200 سے زیادہ سوال و جواب کی ریکارڈنگ۔
تجویز کنندہ سسٹمز ڈیٹاسیٹ - UCSD یونیورسٹی کے ڈیٹاسیٹس کے مجموعے کے ساتھ ایک پورٹل۔ مقبول سائٹس (Goodreads، Amazon) پر جائزوں کے ریکارڈ پر مشتمل ہے۔ سفارشی نظام بنانے کے لیے بہت اچھا ہے۔ (آر میں سورس کوڈ کے ساتھ درخواست کا اختیار: آر میں مووی ریکمنڈیشن سسٹم پروجیکٹ)
UCI اسپامبیس ڈیٹاسیٹ - سپیم کا پتہ لگانے کے لیے ایک تربیتی ڈیٹا سیٹ۔ 4601 میٹا ڈیٹا پیرامیٹرز کے ساتھ 57 حروف پر مشتمل ہے۔
آئی ایم ایف ڈیٹا پورٹل ایک بین الاقوامی مالیاتی فنڈ پورٹل ہے جو بین الاقوامی مالیات، قرض کی شرح، سرمایہ کاری، غیر ملکی زرمبادلہ کے ذخائر اور اجناس کا ڈیٹا شائع کرتا ہے۔