52 stòr-dàta airson pròiseactan trèanaidh

  1. Stòr-dàta Luchd-ceannach Mall - dàta luchd-tadhail stòr: id, gnè, aois, teachd a-steach, ìre caitheamh. (Roghainn tagraidh: Pròiseact Sgaradh Luchd-ceannach le Ionnsachadh Inneal)
  2. Iris Stòr-dàta - stòr-dàta airson luchd-tòiseachaidh, anns a bheil meudan sepals agus bileagan airson diofar fhlùraichean.
  3. Stòr-dàta MNIST - seata dàta de àireamhan làmh-sgrìobhte. 60 dealbh trèanaidh agus 000 dealbh deuchainn.
  4. Stòr-dàta Taigheadais Boston na stòr-dàta mòr-chòrdte airson aithneachadh pàtrain. Tha fiosrachadh ann mu thaighean ann am Boston: an àireamh de thaighean-còmhnaidh, prìsean màil, clàr-amais eucoir.
  5. Seata dàta lorg naidheachdan meallta - tha 7796 inntrig ann le comharran naidheachdan: fìor no ceàrr. (Roghainn tagraidh le còd stòr ann am Python: Pròiseact Python airson lorg naidheachdan meallta )
  6. Stòr-dàta càileachd fìon - tha fiosrachadh ann mu fhìon: clàran 4898 le 14 paramadairean.
  7. Dàta SOCR - Seata Dàta Àirde is Cuideam - deagh roghainn airson tòiseachadh. Tha 25 clàr ann mu àirde is cuideam dhaoine aois 000.

    52 stòr-dàta airson pròiseactan trèanaidh

    Chaidh an artaigil eadar-theangachadh le taic bho EDISON Software, a tha a’ coileanadh òrdughan bho Shìona a Deas “sàr-mhath”, a bharrachd air a’ leasachadh aplacaidean lìn agus làraich-lìn.

  8. Stòr-dàta Parkinson - Clàran 195 de dh’ euslaintich le galar Pharkinson, le paramadairean sgrùdaidh 25. Faodar a chleachdadh airson measadh tòiseachaidh air an eadar-dhealachadh eadar daoine tinn agus daoine fallain. (Roghainn tagraidh le còd stòr ann am Python: Pròiseact Ionnsachadh Inneal mu Lorg Galar Pharkinson)
  9. Stòr-dàta Titanic - anns a bheil fiosrachadh mu luchd-siubhail (aois, gnè, càirdean air bòrd, msaa) 891 anns an t-seata trèanaidh agus 418 anns an t-seata deuchainn.
  10. Seata-dàta Uber Pickups - fiosrachadh mu 4.5 millean turas air Uber ann an 2014 agus 14 millean ann an 2015. (Roghainn tagraidh le còd stòr ann an R: Pròiseact Mion-sgrùdadh Dàta Uber ann an R)
  11. Seata-dàta Chars74k - anns a bheil ìomhaighean de shamhlaidhean Breatannach is Chanada de 64 clas: 0-9, AZ, az. 7700 7.7k ìomhaighean nàdarra, 3400k làmh-sgrìobhte, 62000 clòthan air an co-chur le coimpiutair.
  12. Seata dàta lorg foill cairt creideas - a’ toirt a-steach fiosrachadh mu ghnothaichean chairtean creideas cuibhrichte. (Roghainn tagraidh leis an stòr: Pròiseact Ionnsachaidh Inneal Lorg Foill Cairt Creideis)
  13. Seata dàta rùn Chatbot - faidhle JSON anns a bheil diofar tagaichean: beannachdan, beannachd, ospadal_search, bùth-leigheadaireachd_search, msaa. Tha seata de theamplaidean freagairt ceist ann. (Roghainn tagraidh le còd stòr ann am Python: Pròiseact Chatbot ann am Python)
  14. Stòr-dàta Post-d Enron - anns a bheil leth mhillean litir bho 150 manaidsear Enron.
  15. Stòr-dàta Yelp - anns a bheil 1,2 millean moladh bho 1,6 millean neach-cleachdaidh mu 1,2 millean buidheann.
  16. Seata dàta cunnart - còrr air 200 clàr ceist is freagairt bhon gheama telebhisean mòr-chòrdte.
  17. Stòr-dàta Siostaman Molaidh - portal le cruinneachadh de stòran-dàta bho Oilthigh UCSD. Tha clàran ann de lèirmheasan air làraich mòr-chòrdte (Goodreads, Amazon). Fìor mhath airson siostaman molaidh a chruthachadh. (Roghainn tagraidh le còd stòr ann an R: Pròiseact siostam moladh film ann an R )
  18. Stòr-dàta spama UCI - stòr-dàta trèanaidh airson lorg spama. Tha 4601 litrichean ann le 57 paramadairean meata-dàta.
  19. Seata-dàta Flickr 30k - còrr air 30 ìomhaigh agus fo-thiotalan. (Seata-dàta Flickr 8k - 8000 dealbh. Pròiseact stòr Python: Pròiseact Python Gineadair Caption Image)
  20. Lèirmheasan IMDB - 25 lèirmheas film san t-seata trèanaidh agus 000 san t-seata deuchainn. (Roghainn tagraidh le còd stòr ann an R: Pròiseact Saidheans Dàta Mion-sgrùdadh Sentiment)
  21. Stòr-dàta MS COCO - 1,5 millean ìomhaigh le tagaichean.
  22. Stòr-dàta CIFAR-10 agus CIFAR-100 - Ann an CIFAR-10 tha 60,000 ìomhaigh bheag de 32 * 32 piogsail àireamhan 0-9. CIFAR-100 - fa leth, 0-100.
  23. GTSRB (slat-tomhais aithneachaidh soidhne trafaic Gearmailteach) Seata-dàta - 50 dealbh de 000 soidhnichean rathaid. (Roghainn tagraidh le còd stòr ann am Python: Pròiseact Python airson Aithneachadh Soidhnichean Trafaic)
  24. Stòr-dàta ImageNet - anns a bheil còrr air 100 abairtean agus timcheall air 000 ìomhaigh gach abairt.
  25. Seata dàta ìomhaighean histopathology broilleach - tha ìomhaighean de shamhlaichean aillse broilleach anns an stòr-dàta. (Roghainn tagraidh le còd stòr air Pròiseact Python Seòrsachadh aillse broilleach)
  26. Seata-dàta cityscapes - anns a bheil notaichean àrd-inbhe de shreathan bhidio de shràidean ann am bailtean-mòra eadar-dhealaichte.
  27. Stòr-dàta Kinetics - tha ceangal URL ann gu timcheall air 6,5 millean bhidio àrd-inbhe.
  28. Stòr-dàta MPII suidheachadh daonna - tha 25 ìomhaigh de dhaoine a’ seasamh le co-chomharran anns an stòr-dàta.
  29. Stòr-dàta 20BN-rudeigin-rudeigin v2 - seata de bhideothan àrd-inbhe a sheallas mar a bhios neach a’ coileanadh gnìomh sònraichte.
  30. Stòr-dàta Rud 365 - stòr-dàta de dhealbhan àrd-inbhe le bogsaichean crìche nithean.
  31. Stòr-dàta airson dealbhachadh dhealbhan - anns a bheil còrr air 1000 ìomhaigh leis na dealbhan geàrr-chunntas aca.
  32. Stòr-dàta CQ500 - tha 491 sganaidhean CT den cheann le 193 sliseagan anns an stòr-dàta.
  33. Stòr-dàta IMDB-Wiki - stòr-dàta le còrr air 5 millean ìomhaigh de dh’ aghaidhean air an comharrachadh le gnè agus aois. (Roghainn tagraidh le còd stòr air Pròiseact Python lorg Gnè is Aois)
  34. Youtube 8m stòr-dàta - Stòr-dàta bhidio le bileag anns a bheil 6,1 millean ID bhidio Youtube
  35. Stòr-dàta Urban Sound 8K - seata de dhàta fuaim bailteil (anns a bheil 8732 fuaim bailteil bho 10 clasaichean).
  36. Stòr-dàta LSUN - seata dàta de mhilleanan de dhealbhan dathte de sheallaidhean is nithean (timcheall air 59 millean ìomhaigh, 10 diofar roinnean seallaidh agus 20 diofar roinnean de stuthan).
  37. Seata-dàta RAVDESS - stòr-dàta lèir-chlaistinneach de chainnt tòcail. (Roghainn tagraidh le còd stòr air Pròiseact Python Aithneachadh Emotion Aithneachadh)
  38. Stòr-dàta Librispeech - tha 1000 uair a thìde de chainnt Beurla anns an stòr-dàta le sràcan eadar-dhealaichte.
  39. Seata-dàta Baidu Apolloscape - stòr-dàta airson leasachadh theicneòlasan fèin-dràibhidh.
  40. Portal dàta Quandl - tasgadh dàta eaconamach is ionmhais (tha susbaint an-asgaidh agus pàighte).
  41. Port dàta fosgailte Banca na Cruinne - fiosrachadh mu iasadan a chuir Banca na Cruinne a-mach gu dùthchannan fo leasachadh.
  42. Stòr-dàta IMF na portal maoin airgid eadar-nàiseanta a bhios a’ foillseachadh dàta air ionmhas eadar-nàiseanta, ìrean fiachan, tasgadh, cùl-stòran iomlaid cèin agus bathar.
  43. Port dàta Comann Eaconamach Ameireagaidh (AEA). - Goireas airson dàta macro-eaconamach na SA a sgrùdadh.
  44. Port dàta Google Trends - Faodar dàta gluasad Google a chleachdadh gus dàta a sgrùdadh agus a sgrùdadh gu fradharcach.
  45. Port dàta margaidh Financial Times na ghoireas airson fiosrachadh as ùire mu mhargaidhean ionmhais bho air feadh an t-saoghail.
  46. Portal Data.gov - portal dàta fosgailte riaghaltas na SA (àiteachas, slàinte, gnàth-shìde, foghlam, lùth, ionmhas, saidheans agus rannsachadh, msaa).
  47. Port dàta: Dàta fosgailte riaghaltais (Na h-Innseachan) is e àrd-ùrlar dàta riaghaltas fosgailte na h-Innseachan.
  48. Port dàta Atlas àrainneachd bìdh - anns a bheil dàta rannsachaidh air beathachadh anns na Stàitean Aonaichte.
  49. Port dàta slàinte na portal de Roinn Slàinte is Seirbheisean Daonna na SA.
  50. Port dàta Ionadan airson Smachd agus Bacadh Galar - tha raon farsaing de dhàta co-cheangailte ri slàinte ann.
  51. Portal Stòr-dàta Lunnainn - dàta mu bheatha dhaoine ann an Lunnainn.
  52. Port Dàta Fosgailte Riaghaltas Chanada - portal de dhàta fosgailte mu Chanèidianaich (àiteachas, ealain, ceòl, foghlam, riaghaltas, cùram slàinte, msaa.)

Leugh tuilleadh

Source: www.habr.com

Cuir beachd ann