আইরিস ডেটাসেট — নতুনদের জন্য একটি ডেটাসেট, যেখানে বিভিন্ন ফুলের জন্য সিপাল এবং পাপড়ির আকার রয়েছে।
MNIST ডেটাসেট - হাতে লেখা সংখ্যার একটি ডেটাসেট। 60 প্রশিক্ষণের ছবি এবং 000 পরীক্ষার ছবি।
বোস্টন হাউজিং ডেটাসেট প্যাটার্ন শনাক্তকরণের জন্য একটি জনপ্রিয় ডেটাসেট। বোস্টনের বাড়িগুলির তথ্য রয়েছে: অ্যাপার্টমেন্টের সংখ্যা, ভাড়ার দাম, অপরাধ সূচক৷
পারকিনসন ডেটাসেট — পারকিনসন রোগে আক্রান্ত রোগীর 195টি রেকর্ড, 25টি বিশ্লেষণ পরামিতি সহ। অসুস্থ মানুষ এবং সুস্থ মানুষের মধ্যে পার্থক্য প্রাথমিক মূল্যায়নের জন্য ব্যবহার করা যেতে পারে। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: পারকিনসন্স ডিজিজ সনাক্তকরণের উপর মেশিন লার্নিং প্রকল্প)
টাইটানিক ডেটাসেট — ট্রেনিং সেটে যাত্রীদের (বয়স, লিঙ্গ, বোর্ডে থাকা আত্মীয়, ইত্যাদি) 891 এবং পরীক্ষা সেটে 418 জন সম্পর্কে তথ্য রয়েছে৷
Chars74k ডেটাসেট — 64টি শ্রেণীর ব্রিটিশ এবং কানাডিয়ান প্রতীকের ছবি রয়েছে: 0-9, AZ, az। 7700 7.7k প্রাকৃতিক ছবি, 3400k হাতে লেখা, 62000 কম্পিউটার সংশ্লেষিত ফন্ট।
চ্যাটবট ইন্টেন্টস ডেটাসেট — একটি JSON ফাইল যাতে বিভিন্ন ট্যাগ থাকে: শুভেচ্ছা, বিদায়, হাসপাতাল_সার্চ, ফার্মেসি_সার্চ ইত্যাদি। প্রশ্ন-উত্তর টেমপ্লেটের একটি সেট রয়েছে। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: পাইথনে চ্যাটবট প্রকল্প)
ইয়েলপ ডেটাসেট — প্রায় 1,2 মিলিয়ন সংস্থার 1,6 মিলিয়ন ব্যবহারকারীর কাছ থেকে 1,2 মিলিয়ন সুপারিশ রয়েছে।
বিপদজনক ডেটাসেট — জনপ্রিয় টেলিভিশন গেম থেকে 200 এর বেশি প্রশ্ন-উত্তর রেকর্ডিং।
সুপারিশকারী সিস্টেম ডেটাসেট — UCSD বিশ্ববিদ্যালয় থেকে ডেটাসেটের সংগ্রহ সহ একটি পোর্টাল। জনপ্রিয় সাইটগুলিতে পর্যালোচনার রেকর্ড রয়েছে (গুডরিডস, অ্যামাজন)। সুপারিশকারী সিস্টেম তৈরির জন্য দুর্দান্ত। (R-এ সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: আর-এ মুভি রেকমেন্ডেশন সিস্টেম প্রজেক্ট)
UCI Spambase ডেটাসেট স্প্যাম সনাক্তকরণের জন্য একটি প্রশিক্ষণ ডেটাসেট। 4601টি মেটাডেটা প্যারামিটার সহ 57টি অক্ষর রয়েছে৷