52 done pou pwojè fòmasyon

  1. Ansanm done kliyan sant komèsyal yo - done vizitè magazen yo: id, sèks, laj, revni, evalyasyon depans. (Opsyon aplikasyon: Pwojè Segmantasyon Kliyan ak Machine Learning)
  2. Iris Dataset - yon seri done pou débutan, ki gen gwosè sepal ak petal pou plizyè flè.
  3. MNIST Dataset — yon seri done nimewo ekri alamen. 60 imaj fòmasyon ak 000 imaj tès.
  4. Boston Housing Dataset la se yon seri done popilè pou rekonesans modèl. Gen enfòmasyon sou kay nan Boston: kantite apatman, pri lokasyon, endèks krim.
  5. Ansanm done deteksyon fo nouvèl — gen 7796 antre ak mak nouvèl: vre oswa fo. (Opsyon aplikasyon ak kòd sous nan Python: Pwojè Piton Deteksyon Fo Nouvèl )
  6. Done kalite diven — gen enfòmasyon sou diven: 4898 dosye ak 14 paramèt.
  7. Done SOCR - Wotè ak pwa Dataset - yon bon opsyon pou kòmanse. Gen 25 dosye sou wotè ak pwa moun 000-zan.

    52 done pou pwojè fòmasyon

    Atik la te tradui ak sipò EDISON Software, ki ranpli lòd ki soti nan Sid Lachin "ekselan"Ak devlope aplikasyon entènèt ak sit entènèt.

  8. Parkinson Dataset — 195 dosye pasyan ki gen maladi Parkinson, ak 25 paramèt analiz. Èske yo ka itilize pou evalyasyon preliminè sou diferans ki genyen ant moun ki malad ak moun ki an sante. (Opsyon aplikasyon ak kòd sous nan Python: Pwojè Aprantisaj Machin sou Detekte Maladi Parkinson la)
  9. Titanic Dataset — gen enfòmasyon sou pasaje yo (laj, sèks, fanmi abò, elatriye) 891 nan seri fòmasyon an ak 418 nan seri tès la.
  10. Uber Pickups Dataset — enfòmasyon sou 4.5 milyon vwayaj sou Uber nan 2014 ak 14 milyon dola nan 2015. (Opsyon aplikasyon ak kòd sous nan R: Pwojè analiz done Uber nan R)
  11. Chars74k Dataset — gen imaj senbòl Britanik ak Kanadyen nan 64 klas: 0-9, AZ, az. 7700 7.7k imaj natirèl, 3400k ekri alamen, 62000 polis sentèz òdinatè.
  12. Kat kredi Fwòd Deteksyon Dataset — gen enfòmasyon sou tranzaksyon kat kredi konpwomèt. (Opsyon aplikasyon ak sous: Pwojè aprantisaj machin deteksyon fwod kat kredi)
  13. Chatbot Intents Dataset — yon fichye JSON ki gen plizyè tag: bonjou, orevwa, hospital_search, pharmacy_search, elatriye. Gen yon seri modèl kesyon-repons. (Opsyon aplikasyon ak kòd sous nan Python: Pwojè Chatbot nan Python)
  14. Enron Imèl Dataset — gen yon demi milyon lèt ki soti nan 150 manadjè Enron.
  15. Yelp Dataset la — gen 1,2 milyon rekòmandasyon ki soti nan 1,6 milyon itilizatè yo sou 1,2 milyon òganizasyon.
  16. Jeopardy Dataset — plis pase 200 anrejistreman kesyon ak repons ki soti nan jwèt popilè televizyon an.
  17. Sistèm Rekòmande Dataset — yon pòtal ak yon koleksyon done ki soti nan UCSD University. Gen dosye revizyon sou sit popilè (Goodreads, Amazon). Gwo pou kreye sistèm rekòmandasyon. (Opsyon aplikasyon ak kòd sous nan R: Pwojè sistèm rekòmandasyon fim nan R )
  18. UCI Spambase Dataset — yon seri done fòmasyon pou deteksyon spam. Gen 4601 lèt ak 57 paramèt metadata.
  19. Flickr 30k Dataset — plis pase 30 imaj ak tit. (Flickr 8k Dataset - 8000 imaj. Pwojè sous Python: Imaj Caption Jeneratè Python Pwojè)
  20. Revi IMDB — 25 revizyon fim nan seri fòmasyon an ak 000 nan seri tès la. (Opsyon aplikasyon ak kòd sous nan R: Pwojè syans done analiz santiman)
  21. MS COCO dataset — 1,5 milyon imaj make.
  22. CIFAR-10 ak CIFAR-100 done ansanm — CIFAR-10 gen 60,000 ti imaj 32 * 32 piksèl nimewo 0-9. CIFAR-100 - respektivman, 0-100.
  23. GTSRB (Alman rekonesans siy trafik referans) Dataset — 50 imaj 000 siy wout. (Opsyon aplikasyon ak kòd sous nan Python: Pwojè Python rekonesans siy trafik yo)
  24. ImageNet dataset — gen plis pase 100 fraz ak apeprè 000 imaj pou chak fraz.
  25. Tete Istopatoloji Imaj Dataset — Dataset la gen imaj echantiyon kansè nan tete. (Opsyon aplikasyon ak kòd sous sou Pwojè Python Klasifikasyon Kansè Tete)
  26. Cityscapes Dataset — gen bon jan kalite anotasyon nan sekans videyo nan lari nan diferan vil yo.
  27. Kinetics Dataset - gen yon lyen URL pou apeprè 6,5 milyon videyo ki gen kalite siperyè.
  28. MPII moun poze dataset — Dataset la gen 25 imaj nan poze moun ak anons jwenti.
  29. 20BN-yon bagay-yon bagay doneset v2 - yon seri videyo kalite siperyè ki montre kijan yon moun fè kèk aksyon.
  30. Objè 365 Dataset — yon seri done imaj kalite siperyè ak bwat delimitasyon objè yo.
  31. Foto trase dataset — gen plis pase 1000 imaj ak desen yo.
  32. CQ500 Dataset — Dataset la gen 491 analiz CT nan tèt la ak 193 tranch.
  33. IMDB-Wiki dataset — yon seri done ki gen plis pase 5 milyon imaj figi ki make pa sèks ak laj. (Opsyon aplikasyon ak kòd sous sou Pwojè Python Deteksyon Sèks ak Laj)
  34. Youtube 8M Dataset - Yon seri done videyo ki gen etikèt ki gen 6,1 milyon ID videyo Youtube
  35. Urban Sound 8K done ansanm — yon seri done son iben (gen 8732 son iben ki soti nan 10 klas).
  36. LSUN Dataset - yon seri done plizyè milyon imaj koulè sèn ak objè (apeprè 59 milyon imaj, 10 kategori sèn diferan ak 20 kategori objè diferan).
  37. RAVDESS Dataset — baz done odyovizyèl nan diskou emosyonèl. (Opsyon aplikasyon ak kòd sous sou Pwojè Python Rekonesans Emosyon Lapawòl)
  38. Librispeech Dataset — Dataset la gen 1000 èdtan lang angle ak aksan diferan.
  39. Baidu Apolloscape Dataset — yon seri done pou devlopman teknoloji oto-kondwi.
  40. Quandl Done Portal — depo done ekonomik ak finansye (gen kontni gratis ak peye).
  41. Bank Mondyal Open Data Portal — enfòmasyon sou prè Bank Mondyal bay peyi devlope yo.
  42. Fon Monetè Entènasyonal Done Portal se yon pòtal fon monetè entènasyonal ki pibliye done sou finans entènasyonal, to dèt, envestisman, rezèv echanj etranje ak machandiz yo.
  43. Asosyasyon Ekonomik Ameriken (AEA) Done Portal - Yon resous pou chèche done makroekonomik Etazini.
  44. Google Trends Done Portal - Done tandans Google yo ka itilize pou eksplore ak analize done vizyèlman.
  45. Financial Times Market Data Portal se yon resous pou enfòmasyon ajou sou mache finansye atravè mond lan.
  46. Data.gov Portal - Pòtal done louvri gouvènman ameriken an (agrikilti, sante, klima, edikasyon, enèji, finans, syans ak rechèch, elatriye).
  47. Pòtal Done: Done Gouvènman Louvri (Lend) se platfòm done gouvènman louvri peyi Zend.
  48. Manje anviwònman Atlas Done Portal — gen done rechèch sou nitrisyon nan peyi Etazini.
  49. Portal Done Sante se yon pòtal Depatman Sante ak Sèvis Imen Etazini.
  50. Sant pou Kontwòl ak Prevansyon Maladi Done Portal — gen yon pakèt done ki gen rapò ak sante.
  51. London Datastore Portal - done sou lavi moun nan Lond.
  52. Gouvènman Kanada Open Data Portal - yon pòtal done ouvè sou Kanadyen (agrikilti, atizay, mizik, edikasyon, gouvènman, swen sante, elatriye)

Li piplis

Sous: www.habr.com

Add nouvo kòmantè