52 xog-ururinta mashaariicda tababarka

  1. Xogta Macaamiisha Mall - xogta booqdayaasha dukaanka: id, lab iyo dhedig, da'da, dakhliga, qiimaynta kharashka. (Doorashada codsiga: Mashruuca Kala-qaybinta Macmiilka oo leh Barashada Mashiinka)
  2. Iris Dataset - xog-ururin loogu talagalay bilowgayaasha, oo ka kooban cabbirrada sepals iyo caleemaha ubaxyada kala duwan.
  3. Xogta MNIST - xog-ururinta nambarada gacanta lagu qoray. 60 sawiro tabobar ah iyo 000 sawir oo tijaabo ah.
  4. Xogta Guryaha Boston waa xog-ururinta caanka ah ee aqoonsiga qaabka Waxa ku jira macluumaadka ku saabsan guryaha Boston: tirada guryaha, qiimaha kirada, tusmada dembiyada.
  5. Xogta Ogaanshaha Wararka Been Abuur - ka kooban 7796 gelis oo leh calaamado wararka: run ama been. (Xulashada codsiga oo leh koodka isha ee Python: Mashruuca Python ee lagu ogaanayo wararka been abuurka ah )
  6. Xogta tayada khamriga - waxaa ku jira macluumaad ku saabsan khamriga: 4898 diiwaan oo leh 14 cabbir.
  7. Xogta SOCR - Heights and Cuss Dataset - doorasho wanaagsan oo lagu bilaabo. Waxa uu ka kooban yahay 25 diiwaanka dhererka iyo miisaanka dadka 000 jirka ah.

    52 xog-ururinta mashaariicda tababarka

    Maqaalka waxaa lagu turjumay iyadoo ay taageerayaan EDISON Software, kaas oo Oofiya amarada ka yimid Koonfurta Shiinaha "si aad u wanaagsan"Markaasay horumarisa codsiyada webka iyo mareegaha.

  8. Xogta Parkinson - 195 diiwaanka bukaannada qaba cudurka Parkinson, oo leh 25 cabbiro falanqayn. Waxa loo isticmaali karaa qiimayn horudhac ah oo lagu ogaanayo faraqa u dhexeeya dadka buka iyo dadka caafimaadka qaba. (Xulashada codsiga oo leh koodka isha ee Python: Mashruuca Barashada Mashiinka ee Ogaanshaha Cudurka Parkinson)
  9. Xogta Titanic - waxaa ku jira macluumaadka ku saabsan rakaabka (da'da, jinsiga, qaraabada saaran, iwm.) 891 ee shaxda tababarka iyo 418 ee tijaabada.
  10. Uber Pickups Dataset - macluumaad ku saabsan 4.5 milyan oo safar oo Uber ah 2014 iyo 14 milyan 2015. (Ikhtiyaarka codsiga oo leh koodka isha ee R: Mashruuca Falanqaynta Xogta Uber ee R)
  11. Chars74k Dataset - ka kooban sawirada calaamadaha Britishka iyo Kanadiyaanka ee 64 fasal: 0-9, A-Z, a-z. 7700 7.7k sawiro dabiici ah, 3400k oo gacan-ku-qoran, 62000 farood oo kombuyuutar ah oo la farsameeyey.
  12. Xogta Ogaanshaha Khayaanada Kaarka Kireynta - waxaa ku jira macluumaad ku saabsan wax kala iibsiga kaararka deynta la jabiyay. (Xulashada codsiga oo leh isha: Mashruuca Barashada Mashiinka Baadhitaanka Khayaanada Kaarka Kireynta)
  13. Chatbot Intents Dataset - faylka JSON oo ka kooban sumado kala duwan: salaanta, nabad gelyada, cisbitaalka_raadinta, farmashiyaha_search, iwm. Waxay ka kooban tahay qaab su'aal-jawaab ah oo kooban. (Xulashada codsiga oo leh koodka isha ee Python: Mashruuca Chatbot ee Python)
  14. Enron Email Dataset - waxay ka kooban tahay nus milyan xaraf oo ka yimid 150 maamulayaasha Enron.
  15. Xogta Yelp - ka kooban 1,2 milyan oo talooyin ah oo ka yimi 1,6 milyan isticmaale oo ku saabsan 1,2 milyan oo urur.
  16. Xogta Jeopardy - in ka badan 200 oo su'aalo iyo jawaabo laga duubay ciyaarta telefishinka ee caanka ah.
  17. Xogta Nidaamyada Taliyayaasha - portal leh ururinta xog-ururinta ee Jaamacadda UCSD. Waxa ku jira diiwaanada dib u eegista ee goobaha caanka ah (Goodreads, Amazon). Ku fiican abuurista nidaamyada la-talinta. (Ikhtiyaarka codsiga oo leh koodka isha ee R: Mashruuca Nidaamka Talo-bixinta Filimka ee R )
  18. UCI Spambase Xogta - xogta tababarka ee ogaanshaha spam. Waxa uu ka kooban yahay 4601 xaraf oo leh 57 cabbir xog badan.
  19. Flicker 30k Dataset - in ka badan 30 sawiro iyo qoraallo. (Flicker 8k Dataset - 8000 sawir. Mashruuca isha Python: Ciwaanka Sawirka Generator Python Project)
  20. dib u eegista IMDB - 25 filim oo dib u eegis ah oo ku jira goobta tababarka iyo 000 oo ku jira tijaabada tijaabada. (Ikhtiyaarka codsiga oo leh koodka isha ee R: Falanqaynta Dareenka Mashruuca Sayniska Xogta)
  21. Xogta MS COCO - 1,5 milyan oo sawirro la calaamadiyay.
  22. CIFAR-10 iyo CIFAR-100 xogta β€” CIFAR-10 waxa uu ka kooban yahay 60,000 sawiro yaryar oo ah 32*32 pixels tirooyinka 0-9. CIFAR-100 - siday u kala horreeyaan, 0-100.
  23. GTSRB (Beerka aqoonsiga calaamad taraafikada Jarmalka) Xogta - 50 oo sawir oo ah 000 calammo waddo ah. (Xulashada codsiga oo leh koodka isha ee Python: Calaamadaha Gaadiidka Aqoonsiga Mashruuca Python)
  24. Xogta ImageNet β€” ka kooban in ka badan 100 odhaahyo iyo ilaa 000 sawir weedhkiiba.
  25. Xogta Sawirada Histopathology ee Naasaha - xog-ururinta ayaa ka kooban sawirro shaybaarada kansarka naasaha. (Ikhtiyaarka codsiga oo leh koodka isha shiran Mashruuca Python Kala soocida Kansarka Naasaha)
  26. Xogta Muuqaalka Magaalada - waxaa ku jira tilmaamo tayo sare leh oo taxane muuqaal ah oo ku saabsan waddooyinka magaalooyinka kala duwan.
  27. Xogta Kinetics - wuxuu ka kooban yahay xiriiriye URL ilaa 6,5 milyan oo fiidiyowyo tayo sare leh.
  28. MPII xog-ururinta dadka - xog-ururinta waxa ay ka kooban tahay 25 oo sawir oo muuqaalo bini'aadmi ah oo ay la socdaan tilmaamo.
  29. 20BN-wax-wax dataset v2 - muuqaallo tayo sare leh oo muujinaya sida qofku u sameeyo ficillo.
  30. Shayga 365 Xogta - xog-ururinta sawirro tayo sare leh oo leh sanduuqyo xidhidh shayga.
  31. Xogta sawir-qaadista - waxay ka kooban yihiin in ka badan 1000 sawir oo leh sawiradooda dulucda.
  32. Xogta CQ500 - Xogta xogta waxay ka kooban tahay 491 CT scans oo madax ah oo leh 193 xabbo.
  33. IMDB-Wiki xogta - xog ururin leh in ka badan 5 milyan oo muuqaalo ah oo wejiyo ku suntan jinsiga iyo da'da. (Ikhtiyaarka codsiga oo leh koodka isha shiran Jinsiga & Da'da Ogaanshaha Mashruuca Python)
  34. Youtube 8M Dataset - Xog-ururin fiidiyoow ah oo calaamadeysan oo ka kooban 6,1 milyan oo fiidiyoow Youtube ah
  35. Xogta codka magaalada 8K - Xogta dhawaaqa magaalada oo la sameeyay (wuxuu ka kooban yahay 8732 dhawaaqa magaalada ee 10 fasal).
  36. Xogta LSUN - xog ururin malaayiin sawirro midab leh oo muuqaallo iyo shay ah (qiyaastii 59 milyan sawirro, 10 qaybood oo kala duwan iyo 20 qaybood oo kala duwan).
  37. Xogta RAVDESS - keydka maqalka ee hadalka dareenka. (Ikhtiyaarka codsiga oo leh koodka isha shiran Aqoonsiga Dareenka Hadalka Mashruuca Python)
  38. Xogta Hadalka Librispeech - xog-ururinta waxay ka kooban tahay 1000 saacadood oo hadal Ingiriis ah oo leh lahjado kala duwan.
  39. Xogta Baidu Apolloscape - xog-ururin loogu talagalay horumarinta tignoolajiyada iswada.
  40. Xariirka Xogta Quandl - kaydka xogta dhaqaalaha iyo dhaqaalaha (waxaa jira wax lacag ah oo lacag la'aan ah).
  41. Bangiga Adduunka oo Furay Xariirka Xogta - macluumaadka ku saabsan deymaha uu bangiga adduunku siiyo wadamada soo koraya.
  42. Xariirka Xogta IMF waa portal fund lacageed caalami ah oo daabaca xogta maaliyadda caalamiga ah, heerka deynta, maalgashiga, kaydka sarifka lacagaha qalaad iyo badeecadaha.
  43. Xariirka Xogta Ururka Dhaqaalaha Mareykanka (AEA). - Ilaha lagu baadho xogta dhaqaalaha sare ee Maraykanka.
  44. Xariirka Xogta Google Trends - Xogta isbeddelka Google waxaa loo isticmaali karaa si muuqaal ah oo loo baaro xogta.
  45. Xariirka Xogta Suuqa Maaliyadeed waa ilo lagu helo xogta ugu cusub ee suuqyada maaliyadeed ee aduunka.
  46. Xariirka Data.gov - Dawladda Maraykanku waxay furantay bogga xogta (beeraha, caafimaadka, cimilada, waxbarashada, tamarta, maaliyadda, sayniska iyo cilmi-baarista, iwm.).
  47. Xariirka Xogta: Furan xogta dawladda (Hindiya) waa madal xogta dawladda ee furan ee Hindiya.
  48. Deegaanka cuntada Atlas Data Portal - waxaa ku jira xog cilmi baaris oo ku saabsan nafaqada gudaha Mareykanka.
  49. Xariirka Xogta Caafimaadka waa marinka Waaxda Caafimaadka iyo Adeegyada Aadanaha ee Maraykanka.
  50. Xariirka Xogta ee Xarumaha Xakamaynta iyo Kahortagga Cudurrada - waxa ku jira xog badan oo la xidhiidha caafimaadka.
  51. Xariirka Kaydka Xogta ee London - xogta ku saabsan nolosha dadka ee London.
  52. Xariirka Xogta ee Dowladda Kanada Furan - portal of xogta furan ee Canadianka (beeraha, farshaxanka, music, waxbarashada, dawladda, daryeelka caafimaadka, iwm.)

Akhri wax dheeraad ah

Source: www.habr.com

Add a comment