52 nga mga datos alang sa mga proyekto sa pagbansay

  1. Dataset sa mga kustomer sa Mall - datos sa mga bisita sa tindahan: id, gender, edad, kita, rating sa paggasto. (Opsyon sa aplikasyon: Proyekto sa Pagbahinbahin sa Kustomer nga adunay Pagkat-on sa Machine)
  2. Iris Dataset - usa ka dataset alang sa mga nagsugod, nga adunay mga gidak-on sa mga sepal ug mga petals alang sa lainlaing mga bulak.
  3. MNIST Dataset - usa ka dataset sa sinulat sa kamot nga mga numero. 60 ka mga hulagway sa pagbansay ug 000 ka mga hulagway sa pagsulay.
  4. Ang Boston Housing Dataset usa ka sikat nga dataset alang sa pag-ila sa pattern. Naglangkob sa kasayuran bahin sa mga balay sa Boston: gidaghanon sa mga apartment, presyo sa pag-abang, indeks sa krimen.
  5. Dataset sa Deteksiyon sa Pekeng Balita — naglangkob sa 7796 ka mga entry nga adunay mga marka sa balita: tinuod o dili tinuod. (Ang kapilian sa aplikasyon nga adunay source code sa Python: Proyekto sa Python Detection sa Peke nga Balita )
  6. Dataset sa kalidad sa bino — Naglangkob sa kasayuran bahin sa bino: 4898 nga mga rekord nga adunay 14 nga mga parameter.
  7. Data sa SOCR - Mga Data sa Taas ug Timbang - usa ka maayong kapilian sa pagsugod sa. Naglangkob sa 25 nga mga rekord sa gitas-on ug gibug-aton sa 000-anyos nga mga tawo.

    52 nga mga datos alang sa mga proyekto sa pagbansay

    Ang artikulo gihubad uban ang suporta sa EDISON Software, nga nagtuman sa mga mando gikan sa Southern China nga "maayo kaayo"Ug nagpalambo sa mga aplikasyon sa web ug mga website.

  8. Parkinson Dataset - 195 nga mga rekord sa mga pasyente nga adunay sakit nga Parkinson, nga adunay 25 nga mga parameter sa pagtuki. Mahimong gamiton alang sa pasiuna nga pagsusi sa kalainan tali sa mga masakiton ug himsog nga mga tawo. (Ang kapilian sa aplikasyon nga adunay source code sa Python: Proyekto sa Pagkat-on sa Machine sa Pagsusi sa Sakit sa Parkinson)
  9. Titanic Dataset — Naglangkob sa kasayuran bahin sa mga pasahero (edad, gender, paryente nga sakay, ug uban pa) 891 sa set sa pagbansay ug 418 sa set sa pagsulay.
  10. Uber Pickups Dataset — impormasyon bahin sa 4.5 ka milyon nga biyahe sa Uber sa 2014 ug 14 ka milyon sa 2015. (Opsyon sa aplikasyon nga adunay source code sa R: Uber Data Analysis Project sa R)
  11. Chars74k nga Dataset — naglangkob sa mga hulagway sa mga simbolo sa Britanya ug Canada sa 64 ka klase: 0-9, AZ, az. 7700 7.7k natural nga mga hulagway, 3400k nga sinulat sa kamot, 62000 nga computer synthesized nga mga font.
  12. Dataset sa Pagsusi sa Panglimbong sa Credit Card — Naglangkob sa kasayuran bahin sa mga transaksyon sa nakompromiso nga mga credit card. (Opsyon sa aplikasyon nga adunay gigikanan: Credit Card Fraud Detection Machine Learning Project)
  13. Chatbot Intents Dataset - usa ka JSON file nga adunay lainlaing mga tag: mga pagtimbaya, panamilit, pagpangita sa ospital, pagpangita sa parmasya, ug uban pa. Naglangkob sa usa ka hugpong sa mga template sa tubag sa pangutana. (Ang kapilian sa aplikasyon nga adunay source code sa Python: Chatbot Project sa Python)
  14. Enron Email Dataset - adunay tunga sa milyon nga mga sulat gikan sa 150 ka mga manager sa Enron.
  15. Ang Yelp Dataset - adunay 1,2 milyon nga rekomendasyon gikan sa 1,6 milyon nga tiggamit mga 1,2 milyon nga mga organisasyon.
  16. Dataset sa peligro — kapin sa 200 ka pangutana-ug-tubag nga mga rekording gikan sa sikat nga dula sa telebisyon.
  17. Dataset sa Sistema sa Rekomendasyon — usa ka portal nga adunay koleksyon sa mga datos gikan sa UCSD University. Naglangkob sa mga rekord sa mga pagsusi sa mga sikat nga site (Goodreads, Amazon). Maayo alang sa paghimo sa mga sistema sa pagrekomenda. (Opsyon sa aplikasyon nga adunay source code sa R: Proyekto sa Sistema sa Rekomendasyon sa Pelikula sa R )
  18. UCI Spambase Dataset - usa ka dataset sa pagbansay alang sa pag-ila sa spam. Naglangkob sa 4601 ka letra nga adunay 57 metadata nga mga parameter.
  19. Flickr 30k Dataset - labaw pa sa 30 nga mga imahe ug mga kapsyon. (Flickr 8k Dataset — 8000 ka mga hulagway. Proyekto sa tinubdan sa Python: Image Caption Generator Python Project)
  20. Mga review sa IMDB — 25 nga mga pagsusi sa pelikula sa set sa pagbansay ug 000 sa set sa pagsulay. (Opsyon sa aplikasyon nga adunay source code sa R: Pag-analisa sa Sentimento sa Data Science Project)
  21. Ang datos sa MS COCO - 1,5 milyon nga gi-tag nga mga imahe.
  22. CIFAR-10 ug CIFAR-100 dataset — Ang CIFAR-10 adunay 60,000 ka gagmay nga mga hulagway sa 32*32 pixels nga numero 0-9. CIFAR-100 - matag usa, 0-100.
  23. GTSRB (German traffic sign recognition benchmark) Dataset — 50 ka hulagway sa 000 ka karatula sa dalan. (Ang kapilian sa aplikasyon nga adunay source code sa Python: Pag-ila sa Mga Karatula sa Trapiko nga Proyekto sa Python)
  24. Dataset sa ImageNet - adunay labaw pa sa 100 nga mga hugpong sa mga pulong ug mga 000 nga mga imahe matag hugpong sa mga pulong.
  25. Dataset sa Mga Imahe sa Histopathology sa Dughan - ang dataset adunay mga hulagway sa mga sample sa kanser sa suso. (Opsyon sa aplikasyon nga adunay source code sa Proyekto sa Python Klasipikasyon sa Kanser sa Suso)
  26. Dataset sa Cityscapes - adunay taas nga kalidad nga mga anotasyon sa mga han-ay sa video sa mga kadalanan sa lainlaing mga lungsod.
  27. Dataset sa Kinetics - adunay usa ka link sa URL sa hapit 6,5 milyon nga taas nga kalidad nga mga video.
  28. MPII human pose dataset - ang dataset adunay 25 nga mga imahe sa mga pose sa tawo nga adunay managsama nga mga anotasyon.
  29. 20BN-usa ka butang-usa ka butang nga dataset v2 - usa ka set sa taas nga kalidad nga mga video nga nagpakita kung giunsa paghimo sa usa ka tawo ang usa ka aksyon.
  30. Object 365 Dataset - usa ka dataset sa taas nga kalidad nga mga imahe nga adunay mga kahon sa pagbugkos sa butang.
  31. Data sketching sa litrato - adunay labaw pa sa 1000 nga mga imahe sa ilang mga drowing sa outline.
  32. CQ500 Dataset — ang dataset adunay 491 CT scan sa ulo nga adunay 193 ka hiwa.
  33. IMDB-Wiki dataset - usa ka dataset nga adunay labaw pa sa 5 milyon nga mga imahe sa mga nawong nga gimarkahan sa gender ug edad. (Opsyon sa aplikasyon nga adunay source code sa Gender & Age Detection Python Project)
  34. Youtube 8M Dataset - Usa ka gimarkahan nga dataset sa video nga adunay 6,1 milyon nga Youtube video ID
  35. Urban Sound 8K nga dataset — usa ka set sa urban sound data (naglangkob sa 8732 urban sounds gikan sa 10 ka klase).
  36. LSUN Dataset - usa ka dataset sa minilyon nga kolor nga mga hulagway sa mga talan-awon ug mga butang (mga 59 ka milyon nga mga hulagway, 10 ka lain-laing mga kategoriya sa talan-awon ug 20 ka lain-laing mga kategoriya sa butang).
  37. RAVDESS Dataset - audiovisual database sa emosyonal nga sinultihan. (Opsyon sa aplikasyon nga adunay source code sa Speech Emotion Recognition Python Project)
  38. Librispeech Dataset — ang dataset adunay 1000 ka oras nga English nga sinultihan nga adunay lainlaing mga accent.
  39. Baidu Apolloscape Dataset - usa ka dataset alang sa pagpalambo sa self-driving nga mga teknolohiya.
  40. Quandl Data Portal — tipiganan sa datos sa ekonomiya ug pinansyal (adunay libre ug bayad nga sulud).
  41. Ang World Bank Open Data Portal — impormasyon bahin sa mga pautang nga gi-isyu sa World Bank sa mga nag-uswag nga mga nasud.
  42. IMF Data Portal mao ang usa ka internasyonal nga monetary fund portal nga nagpatik sa data sa internasyonal nga pinansya, utang rates, investment, foreign exchange reserves ug mga palaliton.
  43. Portal sa Data sa American Economic Association (AEA). - Usa ka kapanguhaan alang sa pagpangita sa US macroeconomic data.
  44. Google Trends Data Portal - Ang datos sa uso sa Google mahimong magamit aron makita ug matuki ang datos.
  45. Portal sa Data sa Financial Times Market usa ka kapanguhaan alang sa labing bag-ong kasayuran sa mga merkado sa pinansyal gikan sa tibuuk kalibutan.
  46. Portal sa Data.gov - Bukas nga portal sa datos sa gobyerno sa US (agrikultura, kahimsog, klima, edukasyon, kusog, pinansya, siyensya ug panukiduki, ug uban pa).
  47. Portal sa Data: Bukas nga datos sa gobyerno (India) mao ang open government data platform sa India.
  48. Ang palibot sa pagkaon Atlas Data Portal — Naglangkob sa datos sa panukiduki bahin sa nutrisyon sa Estados Unidos.
  49. Portal sa Data sa Panglawas maoy portal sa US Department of Health and Human Services.
  50. Centers for Disease Control and Prevention Data Portal - Naglangkob sa usa ka halapad nga datos nga may kalabotan sa kahimsog.
  51. Portal sa London Datastore - datos bahin sa kinabuhi sa mga tawo sa London.
  52. Bukas nga Portal sa Data sa Gobyerno sa Canada - usa ka portal sa bukas nga datos bahin sa mga Canadiano (agrikultura, arte, musika, edukasyon, gobyerno, pag-atiman sa panglawas, ug uban pa)

Basaha ang dugang pa

Source: www.habr.com

Idugang sa usa ka comment