প্রশিক্ষণ প্রকল্পের জন্য 52 ডেটাসেট

  1. মল গ্রাহকদের ডেটাসেট — স্টোরের দর্শকদের ডেটা: আইডি, লিঙ্গ, বয়স, আয়, খরচের রেটিং। (আবেদনের বিকল্প: মেশিন লার্নিং সহ গ্রাহক বিভাজন প্রকল্প)
  2. আইরিস ডেটাসেট — নতুনদের জন্য একটি ডেটাসেট, যেখানে বিভিন্ন ফুলের জন্য সিপাল এবং পাপড়ির আকার রয়েছে।
  3. MNIST ডেটাসেট - হাতে লেখা সংখ্যার একটি ডেটাসেট। 60 প্রশিক্ষণের ছবি এবং 000 পরীক্ষার ছবি।
  4. বোস্টন হাউজিং ডেটাসেট প্যাটার্ন শনাক্তকরণের জন্য একটি জনপ্রিয় ডেটাসেট। বোস্টনের বাড়িগুলির তথ্য রয়েছে: অ্যাপার্টমেন্টের সংখ্যা, ভাড়ার দাম, অপরাধ সূচক৷
  5. ফেক নিউজ ডিটেকশন ডেটাসেট — সংবাদ চিহ্ন সহ 7796 এন্ট্রি রয়েছে: সত্য বা মিথ্যা। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: ফেক নিউজ সনাক্তকরণ পাইথন প্রকল্প )
  6. ওয়াইন মানের ডেটাসেট — ওয়াইন সম্পর্কে তথ্য রয়েছে: 4898 প্যারামিটার সহ 14 রেকর্ড।
  7. SOCR ডেটা - উচ্চতা এবং ওজন ডেটাসেট - শুরু করার জন্য একটি ভাল বিকল্প। 25 বছর বয়সী মানুষের উচ্চতা এবং ওজনের 000 রেকর্ড রয়েছে।

    প্রশিক্ষণ প্রকল্পের জন্য 52 ডেটাসেট

    নিবন্ধটি EDISON সফ্টওয়্যারের সহায়তায় অনুবাদ করা হয়েছিল, যা দক্ষিণ চীন থেকে আদেশ "চমৎকারভাবে" পূরণ করেএবং ওয়েব অ্যাপ্লিকেশন এবং ওয়েবসাইট বিকাশ করে.

  8. পারকিনসন ডেটাসেট — পারকিনসন রোগে আক্রান্ত রোগীর 195টি রেকর্ড, 25টি বিশ্লেষণ পরামিতি সহ। অসুস্থ মানুষ এবং সুস্থ মানুষের মধ্যে পার্থক্য প্রাথমিক মূল্যায়নের জন্য ব্যবহার করা যেতে পারে। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: পারকিনসন্স ডিজিজ সনাক্তকরণের উপর মেশিন লার্নিং প্রকল্প)
  9. টাইটানিক ডেটাসেট — ট্রেনিং সেটে যাত্রীদের (বয়স, লিঙ্গ, বোর্ডে থাকা আত্মীয়, ইত্যাদি) 891 এবং পরীক্ষা সেটে 418 জন সম্পর্কে তথ্য রয়েছে৷
  10. উবার পিকআপস ডেটাসেট — 4.5 সালে Uber-এ 2014 মিলিয়ন এবং 14 সালে 2015 মিলিয়ন ভ্রমণের তথ্য। (R-এ সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: R-এ উবার ডেটা বিশ্লেষণ প্রকল্প)
  11. Chars74k ডেটাসেট — 64টি শ্রেণীর ব্রিটিশ এবং কানাডিয়ান প্রতীকের ছবি রয়েছে: 0-9, AZ, az। 7700 7.7k প্রাকৃতিক ছবি, 3400k হাতে লেখা, 62000 কম্পিউটার সংশ্লেষিত ফন্ট।
  12. ক্রেডিট কার্ড জালিয়াতি সনাক্তকরণ ডেটাসেট — আপস করা ক্রেডিট কার্ডের লেনদেন সম্পর্কে তথ্য রয়েছে। (উত্স সহ অ্যাপ্লিকেশন বিকল্প: ক্রেডিট কার্ড জালিয়াতি সনাক্তকরণ মেশিন লার্নিং প্রকল্প)
  13. চ্যাটবট ইন্টেন্টস ডেটাসেট — একটি JSON ফাইল যাতে বিভিন্ন ট্যাগ থাকে: শুভেচ্ছা, বিদায়, হাসপাতাল_সার্চ, ফার্মেসি_সার্চ ইত্যাদি। প্রশ্ন-উত্তর টেমপ্লেটের একটি সেট রয়েছে। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: পাইথনে চ্যাটবট প্রকল্প)
  14. এনরন ইমেইল ডেটাসেট — 150 জন এনরন পরিচালকের অর্ধ মিলিয়ন চিঠি রয়েছে।
  15. ইয়েলপ ডেটাসেট — প্রায় 1,2 মিলিয়ন সংস্থার 1,6 মিলিয়ন ব্যবহারকারীর কাছ থেকে 1,2 মিলিয়ন সুপারিশ রয়েছে।
  16. বিপদজনক ডেটাসেট — জনপ্রিয় টেলিভিশন গেম থেকে 200 এর বেশি প্রশ্ন-উত্তর রেকর্ডিং।
  17. সুপারিশকারী সিস্টেম ডেটাসেট — UCSD বিশ্ববিদ্যালয় থেকে ডেটাসেটের সংগ্রহ সহ একটি পোর্টাল। জনপ্রিয় সাইটগুলিতে পর্যালোচনার রেকর্ড রয়েছে (গুডরিডস, অ্যামাজন)। সুপারিশকারী সিস্টেম তৈরির জন্য দুর্দান্ত। (R-এ সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: আর-এ মুভি রেকমেন্ডেশন সিস্টেম প্রজেক্ট )
  18. UCI Spambase ডেটাসেট স্প্যাম সনাক্তকরণের জন্য একটি প্রশিক্ষণ ডেটাসেট। 4601টি মেটাডেটা প্যারামিটার সহ 57টি অক্ষর রয়েছে৷
  19. Flickr 30k ডেটাসেট — 30 এর বেশি ছবি এবং ক্যাপশন। (Flickr 8k ডেটাসেট - 8000 ছবি। পাইথন উত্স প্রকল্প: চিত্র ক্যাপশন জেনারেটর পাইথন প্রকল্প)
  20. IMDB পর্যালোচনা — ট্রেনিং সেটে 25 মুভি রিভিউ এবং 000 টেস্ট সেটে। (R-এ সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: সেন্টিমেন্ট অ্যানালাইসিস ডেটা সায়েন্স প্রজেক্ট)
  21. MS COCO ডেটাসেট - 1,5 মিলিয়ন ট্যাগ করা ছবি।
  22. CIFAR-10 এবং CIFAR-100 ডেটাসেট — CIFAR-10-এ 60,000-32 নম্বর 32*0 পিক্সেলের 9টি ছোট ছবি রয়েছে। CIFAR-100 - যথাক্রমে, 0-100।
  23. GTSRB (জার্মান ট্রাফিক সাইন রিকগনিশন বেঞ্চমার্ক) ডেটাসেট — 50টি রাস্তার চিহ্নের 000টি ছবি। (পাইথনে সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প: ট্রাফিক সাইন রিকগনিশন পাইথন প্রজেক্ট)
  24. ইমেজনেট ডেটাসেট — প্রতি বাক্যাংশে 100টির বেশি বাক্যাংশ এবং প্রায় 000টি চিত্র রয়েছে৷
  25. ব্রেস্ট হিস্টোপ্যাথলজি ইমেজ ডেটাসেট — ডেটাসেটে স্তন ক্যান্সারের নমুনার ছবি রয়েছে। (সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প স্তন ক্যান্সার শ্রেণীবিভাগ পাইথন প্রকল্প)
  26. সিটিস্কেপ ডেটাসেট — বিভিন্ন শহরের রাস্তার ভিডিও সিকোয়েন্সের উচ্চ মানের টীকা রয়েছে।
  27. গতিবিদ্যা ডেটাসেট - প্রায় 6,5 মিলিয়ন উচ্চ-মানের ভিডিওগুলির একটি URL লিঙ্ক রয়েছে৷
  28. MPII মানুষের পোজ ডেটাসেট — ডেটাসেটে যৌথ টীকা সহ মানুষের ভঙ্গির 25 ছবি রয়েছে।
  29. 20BN-কিছু-কিছু ডেটাসেট v2 - উচ্চ-মানের ভিডিওর একটি সেট যা দেখায় যে একজন ব্যক্তি কীভাবে কিছু ক্রিয়া সম্পাদন করে।
  30. অবজেক্ট 365 ডেটাসেট — অবজেক্ট বাউন্ডিং বাক্স সহ উচ্চ-মানের চিত্রগুলির একটি ডেটাসেট।
  31. ফটো স্কেচিং ডেটাসেট — তাদের রূপরেখা অঙ্কন সহ 1000 টিরও বেশি চিত্র রয়েছে৷
  32. CQ500 ডেটাসেট — ডেটাসেটে 491টি স্লাইস সহ মাথার 193টি সিটি স্ক্যান রয়েছে।
  33. IMDB-উইকি ডেটাসেট — লিঙ্গ এবং বয়স দ্বারা চিহ্নিত মুখের 5 মিলিয়নেরও বেশি চিত্র সহ একটি ডেটাসেট৷ (সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প লিঙ্গ ও বয়স নির্ণয় পাইথন প্রকল্প)
  34. Youtube 8M ডেটাসেট - একটি লেবেলযুক্ত ভিডিও ডেটাসেট যাতে 6,1 মিলিয়ন ইউটিউব ভিডিও আইডি রয়েছে৷
  35. আরবান সাউন্ড 8K ডেটাসেট — শহুরে শব্দ ডেটার একটি সেট (8732টি ক্লাস থেকে 10টি শহুরে শব্দ রয়েছে)।
  36. LSUN ডেটাসেট - দৃশ্য এবং বস্তুর লক্ষ লক্ষ রঙিন চিত্রের একটি ডেটাসেট (প্রায় 59 মিলিয়ন ছবি, 10টি ভিন্ন দৃশ্যের বিভাগ এবং 20টি ভিন্ন বস্তুর বিভাগ)।
  37. RAVDESS ডেটাসেট - আবেগপূর্ণ বক্তৃতার অডিওভিজ্যুয়াল ডাটাবেস। (সোর্স কোড সহ অ্যাপ্লিকেশন বিকল্প স্পিচ ইমোশন রিকগনিশন পাইথন প্রজেক্ট)
  38. Librispeech ডেটাসেট — ডেটাসেটে বিভিন্ন উচ্চারণ সহ 1000 ঘণ্টার ইংরেজি বক্তৃতা রয়েছে।
  39. Baidu Apolloscape ডেটাসেট - স্ব-ড্রাইভিং প্রযুক্তির বিকাশের জন্য একটি ডেটাসেট।
  40. Quandl ডেটা পোর্টাল — অর্থনৈতিক এবং আর্থিক ডেটার ভান্ডার (এখানে বিনামূল্যে এবং অর্থপ্রদানের সামগ্রী রয়েছে)।
  41. বিশ্বব্যাংক ওপেন ডাটা পোর্টাল — উন্নয়নশীল দেশগুলিতে বিশ্বব্যাংক কর্তৃক জারি করা ঋণের তথ্য।
  42. IMF ডেটা পোর্টাল একটি আন্তর্জাতিক মুদ্রা তহবিল পোর্টাল যা আন্তর্জাতিক অর্থ, ঋণের হার, বিনিয়োগ, বৈদেশিক মুদ্রার রিজার্ভ এবং পণ্যের তথ্য প্রকাশ করে।
  43. আমেরিকান ইকোনমিক অ্যাসোসিয়েশন (AEA) ডেটা পোর্টাল - ইউএস ম্যাক্রো ইকোনমিক ডেটা অনুসন্ধানের জন্য একটি সংস্থান৷
  44. গুগল ট্রেন্ডস ডেটা পোর্টাল - Google প্রবণতা ডেটা দৃশ্যত ডেটা অন্বেষণ এবং বিশ্লেষণ করতে ব্যবহার করা যেতে পারে।
  45. ফাইন্যান্সিয়াল টাইমস মার্কেট ডেটা পোর্টাল সারা বিশ্বের আর্থিক বাজারের আপ-টু-ডেট তথ্যের জন্য একটি সম্পদ।
  46. Data.gov পোর্টাল - মার্কিন সরকার উন্মুক্ত ডেটা পোর্টাল (কৃষি, স্বাস্থ্য, জলবায়ু, শিক্ষা, শক্তি, অর্থ, বিজ্ঞান এবং গবেষণা, ইত্যাদি)।
  47. ডেটা পোর্টাল: সরকারী ডেটা খুলুন (ভারত) ভারতের উন্মুক্ত সরকারি ডেটা প্ল্যাটফর্ম।
  48. খাদ্য পরিবেশ অ্যাটলাস ডেটা পোর্টাল — মার্কিন যুক্তরাষ্ট্রে পুষ্টি সম্পর্কিত গবেষণা তথ্য রয়েছে।
  49. স্বাস্থ্য তথ্য পোর্টাল মার্কিন স্বাস্থ্য ও মানব সেবা বিভাগের একটি পোর্টাল।
  50. সেন্টার ফর ডিজিজ কন্ট্রোল অ্যান্ড প্রিভেনশন ডেটা পোর্টাল — স্বাস্থ্য-সম্পর্কিত ডেটার বিস্তৃত পরিসর রয়েছে।
  51. লন্ডন ডেটাস্টোর পোর্টাল - লন্ডনে মানুষের জীবন সম্পর্কে তথ্য।
  52. কানাডা সরকার ওপেন ডেটা পোর্টাল - কানাডিয়ানদের (কৃষি, শিল্প, সঙ্গীত, শিক্ষা, সরকার, স্বাস্থ্যসেবা ইত্যাদি) সম্পর্কে খোলা তথ্যের একটি পোর্টাল

আরও পড়ুন

উত্স: www.habr.com

একটি মন্তব্য জুড়ুন