ለስልጠና ፕሮጀክቶች 52 የውሂብ ስብስቦች

  1. የገበያ ማዕከል ደንበኞች የውሂብ ስብስብ - የመደብር ጎብኝዎች መረጃ፡ መታወቂያ፣ ጾታ፣ ዕድሜ፣ ገቢ፣ የወጪ ደረጃ። (የማመልከቻ አማራጭ፡- የደንበኛ ክፍፍል ፕሮጀክት ከማሽን መማር ጋር)
  2. አይሪስ የውሂብ ስብስብ - ለተለያዩ አበቦች የሴፓል እና የአበባ ቅጠሎች መጠን የያዘ ለጀማሪዎች የውሂብ ስብስብ።
  3. MNIST የውሂብ ስብስብ - በእጅ የተጻፉ ቁጥሮች የውሂብ ስብስብ. 60 የሥልጠና ምስሎች እና 000 የሙከራ ምስሎች።
  4. የቦስተን ቤቶች ዳታ ስብስብ ለስርዓተ ጥለት ማወቂያ ታዋቂ የውሂብ ስብስብ ነው። በቦስተን ስላሉ ቤቶች መረጃ ይዟል፡ የአፓርታማዎች ብዛት፣ የኪራይ ዋጋ፣ የወንጀል መረጃ ጠቋሚ።
  5. የውሸት ዜና ማወቂያ ዳታ ስብስብ - ከዜና ምልክቶች ጋር 7796 ግቤቶችን ይዟል፡ እውነት ወይም ሀሰት። (የመተግበሪያ አማራጭ በ Python ውስጥ ከምንጭ ኮድ ጋር፡- የውሸት ዜና ማወቂያ Python ፕሮጀክት )
  6. የወይን ጥራት የውሂብ ስብስብ - ስለ ወይን መረጃ ይዟል: 4898 መዛግብት ከ 14 መለኪያዎች ጋር.
  7. የ SOCR ውሂብ - የቁመቶች እና የክብደት የውሂብ ስብስብ - ለመጀመር ጥሩ አማራጭ። የ25 አመት እድሜ ያላቸው ሰዎች ቁመት እና ክብደት 000 መዝገቦችን ይዟል።

    ለስልጠና ፕሮጀክቶች 52 የውሂብ ስብስቦች

    ጽሑፉ የተተረጎመው በ EDISON ሶፍትዌር ድጋፍ ነው, እሱም ከደቡብ ቻይና የሚመጡ ትዕዛዞችን “በሚያምር ሁኔታ” አሟልቷል, እንዲሁም የድር መተግበሪያዎችን እና ድር ጣቢያዎችን ያዘጋጃል።.

  8. ፓርኪንሰን የውሂብ ስብስብ - የፓርኪንሰን በሽታ ያለባቸው ታካሚዎች 195 መዝገቦች, 25 የትንታኔ መለኪያዎች. በታመሙ ሰዎች እና በጤናማ ሰዎች መካከል ያለውን ልዩነት ለቅድመ ግምገማ ሊያገለግል ይችላል። (የመተግበሪያ አማራጭ በ Python ውስጥ ከምንጭ ኮድ ጋር፡- የፓርኪንሰን በሽታን በመለየት ላይ የማሽን መማሪያ ፕሮጀክት)
  9. ታይታኒክ የውሂብ ስብስብ - ስለ ተሳፋሪዎች (ዕድሜ, ጾታ, ዘመዶች, ወዘተ) በስልጠና ስብስብ ውስጥ እና 891 በፈተና ስብስብ ውስጥ መረጃን ይዟል.
  10. Uber Pickups የውሂብ ስብስብ - በ 4.5 በኡበር ላይ ስለ 2014 ሚሊዮን ጉዞዎች እና በ 14 2015 ሚሊዮን ያህል መረጃ ። (የመተግበሪያ አማራጭ በ R ውስጥ ከምንጭ ኮድ ጋር፡- የኡበር መረጃ ትንተና ፕሮጀክት በአር)
  11. Chars74k የውሂብ ስብስብ - የ 64 ክፍሎች የብሪቲሽ እና የካናዳ ምልክቶች ምስሎችን ይዟል: 0-9, AZ, az. 7700 7.7k የተፈጥሮ ምስሎች፣ 3400k በእጅ የተጻፈ፣ 62000 በኮምፒውተር የተዋሃዱ ፎንቶች።
  12. የክሬዲት ካርድ ማጭበርበር ማወቂያ ዳታ ስብስብ - ስለ ተበላሹ የክሬዲት ካርዶች ግብይቶች መረጃ ይዟል። (የመተግበሪያ አማራጭ ከምንጩ ጋር፡- የክሬዲት ካርድ ማጭበርበር ማወቂያ ማሽን መማሪያ ፕሮጀክት)
  13. የChatbot Intents የውሂብ ስብስብ - የተለያዩ መለያዎችን የያዘ የJSON ፋይል፡ ሰላምታ፣ ሰላምታ፣ የሆስፒታል_ፍለጋ፣ የፋርማሲ_ፍለጋ፣ ወዘተ የጥያቄ-መልስ አብነቶች ስብስብ ይዟል። (የመተግበሪያ አማራጭ በ Python ውስጥ ከምንጭ ኮድ ጋር፡- የቻትቦት ፕሮጀክት በፓይዘን)
  14. የኢንሮን የኢሜል መረጃ ስብስብ - ከ 150 የኢንሮን አስተዳዳሪዎች ግማሽ ሚሊዮን ደብዳቤዎችን ይዟል.
  15. የ Yelp የውሂብ ስብስብ - 1,2 ሚሊዮን ምክሮችን ከ1,6 ሚሊዮን ተጠቃሚዎች ወደ 1,2 ሚሊዮን ድርጅቶች ይዟል።
  16. የጆፓርዲ የውሂብ ስብስብ — ከ200 በላይ የጥያቄ እና መልስ ቅጂዎች በታዋቂው የቴሌቪዥን ጨዋታ።
  17. Recommender Systems Dataset - ከUCSD ዩኒቨርሲቲ የውሂብ ስብስቦች ስብስብ ያለው ፖርታል. በታዋቂ ጣቢያዎች (Goodreads፣ Amazon) ላይ የግምገማ መዝገቦችን ይዟል። የአማካሪ ስርዓቶችን ለመፍጠር በጣም ጥሩ። (የመተግበሪያ አማራጭ በ R ውስጥ ከምንጭ ኮድ ጋር፡- የፊልም ጥቆማ ስርዓት ፕሮጀክት በአር )
  18. UCI Spambase የውሂብ ስብስብ - አይፈለጌ መልዕክትን ለመለየት የሥልጠና ዳታ ስብስብ። 4601 ፊደሎችን ከ57 ሜታዳታ መለኪያዎች ጋር ይዟል።
  19. ፍሊከር 30k የውሂብ ስብስብ - ከ30 በላይ ምስሎች እና መግለጫ ጽሑፎች። (ፍሊከር 8k የውሂብ ስብስብ - 8000 ምስሎች. የፓይዘን ምንጭ ፕሮጀክት፡- የምስል መግለጫ ጄነሬተር Python ፕሮጀክት)
  20. IMDB ግምገማዎች - በስልጠና ስብስብ ውስጥ 25 የፊልም ግምገማዎች እና 000 በሙከራ ስብስብ ውስጥ። (የመተግበሪያ አማራጭ በ R ውስጥ ከምንጭ ኮድ ጋር፡- ስሜት ትንተና ውሂብ ሳይንስ ፕሮጀክት)
  21. የ MS COCO የውሂብ ስብስብ - 1,5 ሚሊዮን መለያ የተደረገባቸው ምስሎች።
  22. CIFAR-10 እና CIFAR-100 የውሂብ ስብስብ - CIFAR-10 60,000 ትናንሽ ምስሎች 32*32 ፒክስል ቁጥሮች 0-9 ይዟል። CIFAR-100 - በቅደም ተከተል, 0-100.
  23. GTSRB (የጀርመን የትራፊክ ምልክት ማወቂያ መለኪያ) የውሂብ ስብስብ - የ 50 የመንገድ ምልክቶች 000 ምስሎች. (የመተግበሪያ አማራጭ በ Python ውስጥ ከምንጭ ኮድ ጋር፡- የትራፊክ ምልክቶች እውቅና የ Python ፕሮጀክት)
  24. ImageNet የውሂብ ስብስብ - በአንድ ሐረግ ከ100 በላይ ሀረጎች እና ወደ 000 የሚጠጉ ምስሎችን ይዟል።
  25. የጡት ሂስቶፓቶሎጂ ምስሎች የውሂብ ስብስብ - የመረጃው ስብስብ የጡት ካንሰር ናሙናዎችን ምስሎች ይዟል. (የመተግበሪያ አማራጭ ከምንጭ ኮድ ጋር የጡት ካንሰር ምደባ Python ፕሮጀክት)
  26. የከተማ ገጽታ ዳታ ስብስብ - በተለያዩ ከተሞች ውስጥ ስለ ጎዳናዎች የቪዲዮ ቅደም ተከተሎች ከፍተኛ ጥራት ያላቸውን ማብራሪያዎች ይዟል።
  27. የኪነቲክስ የውሂብ ስብስብ - ወደ 6,5 ሚሊዮን የሚጠጉ ከፍተኛ ጥራት ያላቸውን ቪዲዮዎች የዩአርኤል አገናኝ ይዟል።
  28. MPII የሰው አቀማመጥ መረጃ ስብስብ - የመረጃው ስብስብ 25 የሰዎች አቀማመጥ ምስሎች ከጋራ ማብራሪያዎች ጋር ይዟል።
  29. 20BN-የሆነ ነገር-የሆነ ነገር የውሂብ ስብስብ v2 - አንድ ሰው አንዳንድ ድርጊቶችን እንዴት እንደሚፈጽም የሚያሳዩ ከፍተኛ ጥራት ያላቸው ቪዲዮዎች ስብስብ።
  30. ነገር 365 የውሂብ ስብስብ - የነገሮች ማሰሪያ ሳጥኖች ያሉት ከፍተኛ ጥራት ያላቸው ምስሎች የውሂብ ስብስብ።
  31. የፎቶ ንድፍ መረጃ ስብስብ - ከ1000 በላይ ምስሎችን ከነሥዕሎቻቸው ይዟል።
  32. CQ500 የውሂብ ስብስብ - የመረጃው ስብስብ 491 ቁርጥራጮች ያሉት 193 ሲቲ ስካን የጭንቅላት ይዟል።
  33. IMDB-Wiki የውሂብ ስብስብ - በጾታ እና በእድሜ ምልክት የተደረገባቸው ከ5 ሚሊዮን በላይ የፊት ምስሎች ያለው የውሂብ ስብስብ። (የመተግበሪያ አማራጭ ከምንጭ ኮድ ጋር ጾታ እና ዕድሜ ማወቂያ Python ፕሮጀክት)
  34. Youtube 8M የውሂብ ስብስብ - 6,1 ሚሊዮን የዩቲዩብ ቪዲዮ መታወቂያዎችን የያዘ የተሰየመ የቪዲዮ ዳታ ስብስብ
  35. የከተማ ድምጽ 8K የውሂብ ስብስብ - የከተማ ድምጽ መረጃ ስብስብ (ከ 8732 ክፍሎች 10 የከተማ ድምፆችን ይዟል).
  36. LSUN የውሂብ ስብስብ - በሚሊዮኖች የሚቆጠሩ የቀለም ምስሎች የትዕይንቶች እና የነገሮች መረጃ ስብስብ (ወደ 59 ሚሊዮን ምስሎች ፣ 10 የተለያዩ የትዕይንት ምድቦች እና 20 የተለያዩ የነገሮች ምድቦች)።
  37. RAVDESS የውሂብ ስብስብ - የስሜታዊ ንግግር ኦዲዮቪዥዋል ዳታቤዝ። (የመተግበሪያ አማራጭ ከምንጭ ኮድ ጋር የንግግር ስሜት እውቅና Python ፕሮጀክት)
  38. Librispeech የውሂብ ስብስብ — የመረጃው ስብስብ የ1000 ሰአታት የእንግሊዝኛ ንግግር ከተለያዩ ዘዬዎች ጋር ይዟል።
  39. Baidu Apolloscape የውሂብ ስብስብ - በራስ የመንዳት ቴክኖሎጂዎችን ለማዳበር የውሂብ ስብስብ።
  40. የኳንድል ዳታ ፖርታል - የኢኮኖሚ እና የፋይናንስ ውሂብ ማከማቻ (ነጻ እና የሚከፈልበት ይዘት አለ).
  41. የአለም ባንክ የመረጃ ፖርታል ክፈት - የዓለም ባንክ ለታዳጊ አገሮች የሚሰጠው ብድር ላይ መረጃ.
  42. IMF የውሂብ ፖርታል የዓለም አቀፍ የገንዘብ ፈንድ ፖርታል ነው, በዓለም አቀፍ ፋይናንስ, የዕዳ መጠን, ኢንቨስትመንት, የውጭ ምንዛሪ ክምችቶች እና ሸቀጦች ላይ መረጃዎችን ያሳትማል.
  43. የአሜሪካ ኢኮኖሚክስ ማህበር (AEA) የውሂብ ፖርታል - የአሜሪካን ማክሮ ኢኮኖሚ መረጃን ለመፈለግ የሚያስችል ምንጭ።
  44. Google Trends የውሂብ ፖርታል - የጉግል አዝማሚያ መረጃን በእይታ ለመመርመር እና ለመተንተን ጥቅም ላይ ሊውል ይችላል።
  45. የፋይናንሺያል ታይምስ ገበያ ውሂብ ፖርታል ከዓለም ዙሪያ ላሉ የፋይናንስ ገበያዎች ወቅታዊ መረጃ ምንጭ ነው።
  46. Data.gov ፖርታል - የአሜሪካ መንግስት ክፍት የመረጃ ፖርታል (ግብርና ፣ ጤና ፣ የአየር ንብረት ፣ ትምህርት ፣ ኢነርጂ ፣ ፋይናንስ ፣ ሳይንስ እና ምርምር ፣ ወዘተ.)
  47. የውሂብ ፖርታል፡ የመንግስት ውሂብ ክፈት (ህንድ) የህንድ ክፍት የመንግስት የመረጃ መድረክ ነው።
  48. የምግብ አካባቢ አትላስ ውሂብ ፖርታል - በዩናይትድ ስቴትስ ውስጥ ስለ አመጋገብ ጥናት መረጃ ይዟል.
  49. የጤና መረጃ ፖርታል የዩኤስ የጤና እና የሰብአዊ አገልግሎት መምሪያ ፖርታል ነው።
  50. የበሽታ መቆጣጠሪያ እና መከላከያ ማእከሎች የውሂብ ፖርታል - ብዙ ከጤና ጋር የተገናኙ መረጃዎችን ይዟል።
  51. የለንደን የውሂብ ማከማቻ ፖርታል - በለንደን ውስጥ የሰዎች ሕይወት መረጃ።
  52. የካናዳ መንግስት የውሂብ ፖርታል ክፈት - ስለ ካናዳውያን (ግብርና ፣ ጥበብ ፣ ሙዚቃ ፣ ትምህርት ፣ መንግስት ፣ ጤና አጠባበቅ ፣ ወዘተ) ክፍት የመረጃ ፖርታል ።

ተጨማሪ ያንብቡ

ምንጭ: hab.com

አስተያየት ያክሉ