52 datumaroj por trejnadprojektoj

  1. Datumaro de Klientoj de Butikcentro — datumoj de butikvizitantoj: identigilo, sekso, aĝo, enspezo, elspeza takso. (Opcio de aplikaĵo: Projekto pri Segmenta Kliento kun Maŝina Lernado)
  2. Irisa Datumaro — datumaro por komencantoj, enhavanta la grandecojn de sepaloj kaj petaloj por diversaj floroj.
  3. MNIST-Datumaro — datumaro de manskribitaj nombroj. 60 trejnaj bildoj kaj 000 testaj bildoj.
  4. The Boston Housing Dataset estas populara datumaro por padronrekono. Enhavas informojn pri domoj en Bostono: nombro da apartamentoj, luprezoj, krimindico.
  5. Datumaro pri Detektado de Fakaj Novaĵoj — enhavas 7796 enskribojn kun novaĵmarkoj: vera aŭ malvera. (Aplika opcio kun fontkodo en Python: Falsaj Novaĵoj Detektado Python Projekto )
  6. Vinkvalita datumaro — enhavas informojn pri vino: 4898 registroj kun 14 parametroj.
  7. SOCR data – Heights and Weights Dataset - bona elekto por komenci. Enhavas 25 notojn pri la alteco kaj pezo de 000-jaraĝaj homoj.

    52 datumaroj por trejnadprojektoj

    La artikolo estis tradukita kun la subteno de EDISON Software, kiu plenumas mendojn el Suda Ĉinio "bonege"Kaj disvolvas TTT-aplikaĵojn kaj retejojn.

  8. Parkinsona Datumaro - 195 registroj de pacientoj kun Parkinson-malsano, kun 25 analizaj parametroj. Povas esti uzata por antaŭtakso de la diferenco inter malsanuloj kaj sanaj homoj. (Aplika opcio kun fontkodo en Python: Maŝinlernado-Projekto pri Detektado de Parkinson-Malsano)
  9. Titanic Datumaro — enhavas informojn pri pasaĝeroj (aĝo, sekso, parencoj surŝipe, ktp.) 891 en la trejnaro kaj 418 en la testaro.
  10. Datumaro de Uber Pickups — informoj pri 4.5 milionoj da vojaĝoj ĉe Uber en 2014 kaj 14 milionoj en 2015. (Aplika opcio kun fontkodo en R: Projekto de Analizo de Datumoj de Uber en R)
  11. Chars74k Datumaro — enhavas bildojn de britaj kaj kanadaj simboloj de 64 klasoj: 0-9, AZ, az. 7700 7.7k naturaj bildoj, 3400k manskribitaj, 62000 komputilaj sintezitaj tiparoj.
  12. Kreditkarto Fraŭdo Detekto Datumoj — enhavas informojn pri transakcioj de kompromititaj kreditkartoj. (Aplika opcio kun fonto: Kreditkarta Fraŭdo-Detektado Maŝina Lernado-Projekto)
  13. Chatbot Intents Datumaro — JSON-dosiero, kiu enhavas diversajn etikedojn: salutojn, adiaŭon, hospital_serĉon, pharmacy_search, ktp. Enhavas aron da demando-respondaj ŝablonoj. (Aplika opcio kun fontkodo en Python: Chatbot-Projekto en Python)
  14. Enron Retpoŝta Datumaro — enhavas duonmilionon da leteroj de 150 Enron-manaĝeroj.
  15. La Yelp-Datumaro — enhavas 1,2 milionojn da rekomendoj de 1,6 milionoj da uzantoj ĉirkaŭ 1,2 milionoj da organizoj.
  16. Danĝera Datumaro - pli ol 200 demandaj kaj respondaj registradoj de la populara televida ludo.
  17. Rekomendinda Sistemo Datumaro - portalo kun kolekto de datumaroj de UCSD-Universitato. Enhavas notojn pri recenzoj pri popularaj retejoj (Goodreads, Amazon). Bonega por krei rekomendajn sistemojn. (Aplika opcio kun fontkodo en R: Filma Rekomenda Sistemo-Projekto en R )
  18. UCI-Spambaza Datumaro — trejna datumaro por detekto de spamado. Enhavas 4601 literojn kun 57 metadatumaj parametroj.
  19. Flickr 30k Datumaro - pli ol 30 bildoj kaj bildotekstoj. (Flickr 8k Datumaro — 8000 изображений. Проект с исходником на Python: Bildo Titolo Generatoro Python Projekto)
  20. Recenzoj de IMDB — 25 filmrecenzoj en la trejnaro kaj 000 en la testaro. (Aplika opcio kun fontkodo en R: Sentiment Analysis Data Science Project)
  21. MS COCO-datumserio — 1,5 milionoj da etikeditaj bildoj.
  22. CIFAR-10 kaj CIFAR-100-datumserio — CIFAR-10 enhavas 60,000 malgrandajn bildojn de 32*32 pikseloj numeroj 0-9. CIFAR-100 - respektive, 0-100.
  23. GTSRB (germana trafiksignaj rekonmarko) Datumararo — 50 000 bildoj de 43 vojsignoj. (Aplika opcio kun fontkodo en Python: Python-Projekto pri Rekono de Trafiksignoj)
  24. ImageNet-datumserio — enhavas pli ol 100 frazojn kaj ĉirkaŭ 000 bildojn per frazo.
  25. Mamaj Histopatologio Bildoj Datumoj — la datumaro enhavas bildojn de mamkancero-provaĵoj. (Aplika opcio kun fontkodo ŝaltita Mama Kancero Klasifiko Python Projekto)
  26. Datumaro pri Urbaj pejzaĝoj — enhavas altkvalitajn komentadojn de videosekvencoj de stratoj en malsamaj urboj.
  27. Kinetika datumaro - enhavas URL-ligilon al ĉirkaŭ 6,5 milionoj da altkvalitaj filmetoj.
  28. MPII homa pozo datumaro — la datumaro enhavas 25 bildojn de homaj pozoj kun komunaj komentarioj.
  29. 20BN-io-io-datumserio v2 - aro da altkvalitaj filmetoj, kiuj montras kiel homo faras iun agon.
  30. Objekto 365 Datumaro — datumaro de altkvalitaj bildoj kun objektaj limkestoj.
  31. Fotoskiza datumaro — enhavas pli ol 1000 bildojn kun siaj skizaj desegnaĵoj.
  32. CQ500-datumserio — la datumaro enhavas 491 CT-skanaĵojn de la kapo kun 193 tranĉaĵoj.
  33. IMDB-Vikia datumaro — datumaro kun pli ol 5 milionoj da bildoj de vizaĝoj markitaj laŭ sekso kaj aĝo. (Aplika opcio kun fontkodo ŝaltita Sekso kaj Aĝo-Detektado Python-Projekto)
  34. Youtube 8M Datumaro - Etikedita videodatumaro, kiu enhavas 6,1 milionojn da Youtube-video-identigiloj
  35. Urba Sono 8K datumaro — aro da urbaj sondatenoj (enhavas 8732 urbaj sonojn el 10 klasoj).
  36. LSUN-Datumserio - datumaro de milionoj da kolorbildoj de scenoj kaj objektoj (ĉirkaŭ 59 milionoj da bildoj, 10 malsamaj scenkategorioj kaj 20 malsamaj objektokategorioj).
  37. RAVDESS Datumaro — aŭdvida datumbazo de emocia parolado. (Aplika opcio kun fontkodo ŝaltita Speech Emotion Recognition Python Project)
  38. Librispeech Datumaro — la datumaro enhavas 1000 horojn da angla lingvo kun malsamaj supersignoj.
  39. Baidu Apolloscape Datumaro — datumaro por la evoluo de memveturaj teknologioj.
  40. Quandl Datuma Portalo — deponejo de ekonomiaj kaj financaj datumoj (estas senpaga kaj pagita enhavo).
  41. La Monda Banka Malferma Datuma Portalo — informoj pri pruntoj donitaj de la Monda Banko al evolulandoj.
  42. IMF Datuma Portalo estas portalo de internacia monfonduso, kiu publikigas datumojn pri internacia financo, ŝuldkurzoj, investo, valutrezervoj kaj varoj.
  43. Amerika Ekonomia Asocio (AEA) Datuma Portalo - Rimedo por serĉi usonajn makroekonomiajn datumojn.
  44. Portalo pri Datumoj de Google Trends - Google tendencaj datumoj povas esti uzataj por vide esplori kaj analizi datumojn.
  45. Financial Times Market Data Portal estas rimedo por ĝisdataj informoj pri financaj merkatoj el la tuta mondo.
  46. Data.gov Portalo - Portalo pri malfermaj datumoj de la usona registaro (agrikulturo, sano, klimato, edukado, energio, financo, scienco kaj esplorado, ktp.).
  47. Datuma Portalo: Malfermaj registaraj datumoj (Hindio) estas la malferma registara datuma platformo de Barato.
  48. Manĝmedio Atlas Data Portal — enhavas esplorajn datumojn pri nutrado en Usono.
  49. Portalo pri Sanaj Datumoj estas portalo de la Usona Sekcio pri Sano kaj Homaj Servoj.
  50. Centroj por Malsana Kontrolo kaj Preventado-Datumportalo - enhavas ampleksan gamon da sano-rilataj datumoj.
  51. Londona Datumvendeja Portalo - datumoj pri la vivo de homoj en Londono.
  52. Portalo pri Malferma Datumo de Kanado - portalo de malfermaj datumoj pri kanadanoj (agrikulturo, arto, muziko, edukado, registaro, sanservo, ktp.)

Legu pli

fonto: www.habr.com

Aldoni komenton