52 datasets fun ikẹkọ ise agbese

  1. Ile Itaja Onibara Dataset - data ti awọn alejo ile itaja: id, akọ-abo, ọjọ-ori, owo-wiwọle, idiyele inawo. (Aṣayan ohun elo: Ise agbese ipin Onibara pẹlu Ẹkọ ẹrọ)
  2. Iris Dataset - dataset kan fun awọn olubere, ti o ni awọn iwọn ti sepals ati petals fun ọpọlọpọ awọn ododo.
  3. MNIST Data Iṣeto - dataset ti awọn nọmba ti a fi ọwọ kọ. Awọn aworan ikẹkọ 60 ati awọn aworan idanwo 000.
  4. Iwe data Ibugbe Boston jẹ ipilẹ data olokiki fun idanimọ apẹrẹ. Ni alaye nipa awọn ile ni Boston: nọmba awọn iyẹwu, awọn idiyele iyalo, atọka ilufin.
  5. Iro iroyin Iwari Dataset - ni awọn titẹ sii 7796 pẹlu awọn ami iroyin: otitọ tabi eke. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Iro News erin Python Project )
  6. waini didara dataset - ni alaye nipa ọti-waini: awọn igbasilẹ 4898 pẹlu awọn aye 14.
  7. SOCR data - Giga ati Iwọn Dataset - aṣayan ti o dara lati bẹrẹ pẹlu. Ni awọn igbasilẹ 25 ti giga ati iwuwo ti awọn eniyan ọdun 000 ni.

    52 datasets fun ikẹkọ ise agbese

    A tumọ nkan naa pẹlu atilẹyin EDISON Software, eyiti mu awọn aṣẹ ṣẹ lati Gusu China “dara julọ”Ati ndagba awọn ohun elo wẹẹbu ati awọn oju opo wẹẹbu.

  8. Pakinsini Dataset - Awọn igbasilẹ 195 ti awọn alaisan ti o ni arun Pakinsini, pẹlu awọn aye itupalẹ 25. Le ṣee lo fun iṣayẹwo akọkọ ti iyatọ laarin awọn eniyan aisan ati awọn eniyan ilera. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Iṣẹ Ẹkọ Ẹrọ lori Ṣiṣawari Arun Pakinsini)
  9. Titanic Dataset - ni alaye nipa awọn ero (ọjọ ori, akọ-abo, awọn ibatan lori ọkọ, bbl) 891 ninu eto ikẹkọ ati 418 ninu eto idanwo.
  10. Uber Pickups Dataset - alaye nipa awọn irin-ajo miliọnu 4.5 lori Uber ni ọdun 2014 ati miliọnu 14 ni ọdun 2015. (Aṣayan ohun elo pẹlu koodu orisun ni R: Uber Data Analysis Project ni R)
  11. Chars74k Dataset - ni awọn aworan ti British ati Canadian aami ti 64 kilasi: 0-9, AZ, az. 7700 7.7k adayeba images, 3400k afọwọkọ, 62000 kọmputa sise nkọwe.
  12. Kirẹditi Kaadi Jegudujera Dataset - ni alaye nipa awọn iṣowo ti awọn kaadi kirẹditi ti o gbogun. (Aṣayan ohun elo pẹlu orisun: Kirẹditi kaadi jegudujera erin Machine Learning Project)
  13. Chatbot Intents Dataset - faili JSON kan ti o ni awọn aami oriṣiriṣi: ikini, o dabọ, iwadii ile-iwosan, wiwa ile elegbogi, ati bẹbẹ lọ. Ni akojọpọ awọn awoṣe idahun ibeere kan ni. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Chatbot Project ni Python)
  14. Enron Imeeli Dataset - ni idaji miliọnu awọn lẹta lati ọdọ awọn alakoso 150 Enron.
  15. Eto data Yelp - ni awọn iṣeduro miliọnu 1,2 lati awọn olumulo miliọnu 1,6 nipa awọn ẹgbẹ miliọnu 1,2.
  16. Jeopardy Dataset - diẹ sii ju awọn igbasilẹ ibeere ati idahun 200 lati ere tẹlifisiọnu olokiki.
  17. Oluṣeto Systems Dataset - ọna abawọle pẹlu ikojọpọ ti awọn iwe data lati Ile-ẹkọ giga UCSD. Ni awọn igbasilẹ ti awọn atunwo lori awọn aaye olokiki (Goodreads, Amazon). Nla fun ṣiṣẹda awọn ọna ṣiṣe iṣeduro. (Aṣayan ohun elo pẹlu koodu orisun ni R: Eto Iṣeduro Fiimu ni R )
  18. UCI Spambase Dataset - ipilẹ data ikẹkọ fun wiwa àwúrúju. Ni awọn lẹta 4601 pẹlu awọn paramita metadata 57 ninu.
  19. Flicker 30k Dataset - diẹ sii ju awọn aworan 30 ati awọn akọle. (Flicker 8k Dataset - 8000 awọn aworan. Python orisun ise agbese: Aworan ifori monomono Python Project)
  20. IMDB agbeyewo - Awọn atunyẹwo fiimu 25 ni eto ikẹkọ ati 000 ninu eto idanwo. (Aṣayan ohun elo pẹlu koodu orisun ni R: Irora Analysis Data Science Project)
  21. MS COCO dataset - 1,5 milionu awọn aworan ti a samisi.
  22. CIFAR-10 ati CIFAR-100 dataset - CIFAR-10 ni awọn aworan kekere 60,000 ti awọn nọmba piksẹli 32 * 32 0-9. CIFAR-100 - lẹsẹsẹ, 0-100.
  23. GTSRB (Ala ti idanimọ ami ijabọ German) Eto data - Awọn aworan 50 ti awọn ami opopona 000. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Traffic Sign Idanimọ Python Project)
  24. ImageNet data - ni diẹ sii ju awọn gbolohun ọrọ 100 ati nipa awọn aworan 000 fun gbolohun kan.
  25. Oyan Histopathology Images Dataset - awọn dataset ni awọn aworan ti awọn ayẹwo akàn igbaya. (Aṣayan ohun elo pẹlu koodu orisun lori Breast Cancer Classification Python Project)
  26. Datasetscapes Cityscapes - ni awọn asọye didara giga ti awọn ilana fidio ti awọn opopona ni awọn ilu oriṣiriṣi.
  27. Kinetics Dataset - ni ọna asopọ URL kan si bii 6,5 milionu awọn fidio ti o ni agbara giga.
  28. MPII eda eniyan duro dataset - datasetiti naa ni awọn aworan 25 ti awọn iduro eniyan pẹlu awọn asọye apapọ.
  29. 20BN-nkankan-nkankan dataset v2 - ṣeto awọn fidio ti o ni agbara giga ti o fihan bi eniyan ṣe n ṣe diẹ ninu awọn iṣe.
  30. Nkan 365 Dataset - data ti awọn aworan didara ga pẹlu awọn apoti didi ohun.
  31. Apẹrẹ aworan aworan - ni diẹ sii ju awọn aworan 1000 pẹlu awọn iyaworan laini wọn.
  32. CQ500 data - dataset naa ni awọn ọlọjẹ 491 CT ti ori pẹlu awọn ege 193.
  33. IMDB-Wiki dataset - ipilẹ data pẹlu diẹ sii ju awọn aworan miliọnu 5 ti awọn oju ti samisi nipasẹ akọ ati ọjọ-ori. (Aṣayan ohun elo pẹlu koodu orisun lori Iwa-ori & Iwari Ọjọ ori Python Project)
  34. Youtube 8M Dataset - Aami data fidio fidio ti o ni awọn ID fidio Youtube 6,1 milionu
  35. Urban Sound 8K dataset - Eto ti data ohun ilu (ni awọn ohun ilu 8732 ni lati awọn kilasi 10).
  36. LSUN data - data ti awọn miliọnu awọn aworan awọ ti awọn iwoye ati awọn nkan (nipa awọn aworan miliọnu 59, awọn ẹka iṣẹlẹ 10 oriṣiriṣi ati awọn ẹka ohun elo oriṣiriṣi 20).
  37. RAVDESS Dataset - audiovisual database ti ẹdun ọrọ. (Aṣayan ohun elo pẹlu koodu orisun lori Ọrọ imolara idanimọ Python Project)
  38. Iwe-ipamọ Dataset - dataset naa ni awọn wakati 1000 ti ọrọ Gẹẹsi pẹlu awọn asẹnti oriṣiriṣi.
  39. Baidu Apolloscape Dataset - ipilẹ data fun idagbasoke awọn imọ-ẹrọ awakọ ti ara ẹni.
  40. Quandl Data Portal - ibi ipamọ ti ọrọ-aje ati data inawo (ọfẹ ati akoonu ti o san wa).
  41. Oju-ọna Data ti Banki Agbaye Ṣii - alaye lori awọn awin ti Banki Agbaye funni si awọn orilẹ-ede to sese ndagbasoke.
  42. IMF Data Portal jẹ ọna abawọle inawo inawo kariaye ti o ṣe atẹjade data lori inawo agbaye, awọn oṣuwọn gbese, idoko-owo, awọn ifiṣura paṣipaarọ ajeji ati awọn ọja.
  43. American Economic Association (AEA) Data Portal - Awọn orisun fun wiwa data macroeconomic AMẸRIKA.
  44. Google Trends Data Portal - Awọn data aṣa Google le ṣee lo lati ṣawari oju ati itupalẹ data.
  45. Owo Times Market Data Portal jẹ orisun fun alaye imudojuiwọn lori awọn ọja inawo lati kakiri agbaye.
  46. Data.gov Portal - Ijọba AMẸRIKA ṣiṣi oju-ọna data (ogbin, ilera, oju-ọjọ, eto-ẹkọ, agbara, iṣuna, imọ-jinlẹ ati iwadii, ati bẹbẹ lọ).
  47. Portal Data: Ṣii data ijọba (India) ni India ká ìmọ ijoba data Syeed.
  48. Ounjẹ ayika Atlas Data Portal - ni data iwadi lori ounjẹ ni Amẹrika.
  49. Ilera Data Portal jẹ ọna abawọle ti Ẹka Ilera ti AMẸRIKA ati Awọn Iṣẹ Eda Eniyan.
  50. Awọn ile-iṣẹ fun Iṣakoso Arun ati Idena Data Portal - ni kan jakejado ibiti o ti ilera-jẹmọ data.
  51. London Datastore Portal - data nipa awọn eniyan aye ni London.
  52. Canada Government Ṣi Data Portal - ọna abawọle ti data ṣiṣi nipa awọn ara ilu Kanada (ogbin, aworan, orin, eto-ẹkọ, ijọba, ilera, ati bẹbẹ lọ)

Ka siwaju

orisun: www.habr.com

Fi ọrọìwòye kun