52 datastelle vir opleidingsprojekte

  1. Mall-kliënte-datastel - data van winkelbesoekers: ID, geslag, ouderdom, inkomste, bestedingsgradering. (Toepassingsopsie: Kliëntesegmenteringsprojek met masjienleer)
  2. Iris datastel — 'n datastel vir beginners, wat die groottes van kelkblare en blomblare vir verskeie blomme bevat.
  3. MNIST-datastel — 'n datastel van handgeskrewe nommers. 60 000 opleidingsbeelde en 10 000 toetsbeelde.
  4. Die Boston Housing Dataset is 'n gewilde datastel vir patroonherkenning. Bevat inligting oor huise in Boston: aantal woonstelle, huurpryse, misdaadindeks.
  5. Vals nuusopsporingsdatastel — bevat 7796 inskrywings met nuusmerke: waar of onwaar. (Toepassingsopsie met bronkode in Python: Fake News Detection Python Project )
  6. Wyn kwaliteit datastel — bevat inligting oor wyn: 4898 rekords met 14 parameters.
  7. SOCR-data – Hoogtes en gewigte-datastel - 'n goeie opsie om mee te begin. Bevat 25 000 rekords van die lengte en gewig van 18-jarige mense.

    52 datastelle vir opleidingsprojekte

    Die artikel is vertaal met die ondersteuning van EDISON Software, wat vervul bestellings uit Suid-China “uitstekend”En ontwikkel webtoepassings en webwerwe.

  8. Parkinson-datastel - 195 rekords van pasiënte met Parkinson se siekte, met 25 analise parameters. Kan gebruik word vir voorlopige assessering van die verskil tussen siek mense en gesonde mense. (Toepassingsopsie met bronkode in Python: Masjienleerprojek oor die opsporing van Parkinson se siekte)
  9. Titanic datastel — bevat inligting oor passasiers (ouderdom, geslag, familielede aan boord, ens.) 891 in die opleidingstel en 418 in die toetsstel.
  10. Uber-bakkies-datastel — inligting oor 4.5 miljoen reise op Uber in 2014 en 14 miljoen in 2015. (Toepassingsopsie met bronkode in R: Uber-data-analiseprojek in R)
  11. Chars74k-datastel - bevat beelde van Britse en Kanadese simbole van 64 klasse: 0-9, A-Z, a-z. 7700 7.7k natuurlike beelde, 3400k handgeskrewe, 62000 rekenaargesintetiseerde lettertipes.
  12. Kredietkaartbedrogopsporingdatastel - bevat inligting oor transaksies van gekompromitteerde kredietkaarte. (Toepassingsopsie met bron: Kredietkaartbedrogopsporingmasjienleerprojek)
  13. Chatbot-voornemens-datastel - 'n JSON-lêer wat verskeie etikette bevat: groete, totsiens, hospital_search, pharmacy_search, ens. Bevat 'n stel vraag-antwoord-sjablone. (Toepassingsopsie met bronkode in Python: Chatbot-projek in Python)
  14. Enron-e-posdatastel — bevat 'n halfmiljoen briewe van 150 Enron-bestuurders.
  15. Die Yelp-datastel - bevat 1,2 miljoen aanbevelings van 1,6 miljoen gebruikers ongeveer 1,2 miljoen organisasies.
  16. Gevaarlike datastel — meer as 200 000 vraag-en-antwoord-opnames van die gewilde televisiespeletjie.
  17. Beveel Stelsels Datastel aan - 'n portaal met 'n versameling datastelle van UCSD Universiteit. Bevat rekords van resensies op gewilde werwe (Goodreads, Amazon). Ideaal vir die skep van aanbevelingstelsels. (Toepassingsopsie met bronkode in R: Filmaanbevelingstelselprojek in R )
  18. UCI Spambase-datastel - 'n opleidingsdatastel vir die opsporing van strooipos. Bevat 4601 letters met 57 metadataparameters.
  19. Flickr 30k datastel - meer as 30 000 beelde en byskrifte. (Flickr 8k datastel - 8000 beelde. Python-bronprojek: Prentbyskrif Generator Python-projek)
  20. IMDB resensies — 25 000 fliekresensies in die opleidingstel en 25 000 in die toetsstel. (Toepassingsopsie met bronkode in R: Sentimentanalise Datawetenskapprojek)
  21. MS COCO datastel — 1,5 miljoen gemerkte beelde.
  22. CIFAR-10 en CIFAR-100 datastel — CIFAR-10 bevat 60,000 32 klein beelde van 32*0 pieksels nommers 9-100. CIFAR-0 - onderskeidelik, 100-XNUMX.
  23. GTSRB (Duitse verkeerstekenherkenning maatstaf) Datastel — 50 000 beelde van 43 padtekens. (Toepassingsopsie met bronkode in Python: Verkeerstekensherkenning Python-projek)
  24. ImageNet datastel - bevat meer as 100 000 frases en ongeveer 1000 XNUMX beelde per frase.
  25. Bors Histopatologie Beelde Datastel — die datastel bevat beelde van borskankermonsters. (Toepassingsopsie met bronkode aan Borskankerklassifikasie Python-projek)
  26. Cityscapes-datastel - bevat hoëgehalte-aantekeninge van videoreekse van strate in verskillende stede.
  27. Kinetika-datastel - bevat 'n URL-skakel na ongeveer 6,5 miljoen video's van hoë gehalte.
  28. MPII menslike pose datastel — die datastel bevat 25 000 beelde van menslike houdings met gesamentlike aantekeninge.
  29. 20BN-iets-iets-datastel v2 - 'n stel video's van hoë gehalte wat wys hoe 'n persoon een of ander aksie uitvoer.
  30. Voorwerp 365-datastel - 'n datastel van hoë-gehalte beelde met objekgrenskasies.
  31. Foto skets datastel - bevat meer as 1000 beelde met hul buitelyntekeninge.
  32. CQ500 datastel — die datastel bevat 491 CT-skanderings van die kop met 193 317 snye.
  33. IMDB-Wiki-datastel - 'n datastel met meer as 5 miljoen beelde van gesigte wat volgens geslag en ouderdom gemerk is. (Toepassingsopsie met bronkode aan Geslag- en Ouderdomsopsporing Python-projek)
  34. Youtube 8M-datastel - 'n Gemerkte videodatastel wat 6,1 miljoen YouTube-video-ID's bevat
  35. Urban Sound 8K-datastel — 'n stel stedelike klankdata (bevat 8732 stedelike klanke uit 10 klasse).
  36. LSUN-datastel - 'n datastel van miljoene kleurbeelde van tonele en voorwerpe (ongeveer 59 miljoen beelde, 10 verskillende toneelkategorieë en 20 verskillende voorwerpkategorieë).
  37. RAVDESS Datastel — oudiovisuele databasis van emosionele spraak. (Toepassingsopsie met bronkode aan Spraak Emosie Herkenning Python-projek)
  38. Librispeech-datastel — die datastel bevat 1000 uur Engelse spraak met verskillende aksente.
  39. Baidu Apolloscape-datastel — 'n datastel vir die ontwikkeling van selfbestuurtegnologieë.
  40. Quandl-dataportaal - bewaarplek van ekonomiese en finansiële data (daar is gratis en betaalde inhoud).
  41. Die Wêreldbank se oop dataportaal — inligting oor lenings wat deur die Wêreldbank aan ontwikkelende lande uitgereik is.
  42. IMF Data Portaal is 'n internasionale monetêre fondsportaal wat data oor internasionale finansies, skuldkoerse, beleggings, buitelandse valutareserwes en kommoditeite publiseer.
  43. Amerikaanse Ekonomiese Vereniging (AEA) Data Portaal - 'n Hulpbron om Amerikaanse makro-ekonomiese data te soek.
  44. Google Trends-dataportaal - Google-neigingsdata kan gebruik word om data visueel te verken en te ontleed.
  45. Financial Times Market Data Portal is 'n hulpbron vir bygewerkte inligting oor finansiële markte van regoor die wêreld.
  46. Data.gov-portaal - Amerikaanse regering se oop dataportaal (landbou, gesondheid, klimaat, onderwys, energie, finansies, wetenskap en navorsing, ens.).
  47. Dataportaal: Oop regeringsdata (Indië) is Indië se oop regering data platform.
  48. Voedselomgewing Atlas Data Portal - bevat navorsingsdata oor voeding in die Verenigde State.
  49. Gesondheidsdataportaal is 'n portaal van die Amerikaanse departement van gesondheid en menslike dienste.
  50. Sentrums vir Siektebeheer en Voorkoming Data Portaal - bevat 'n wye reeks gesondheidsverwante data.
  51. London Datastore-portaal - data oor mense se lewens in Londen.
  52. Kanada regering se oop dataportaal - 'n portaal van oop data oor Kanadese (landbou, kuns, musiek, onderwys, regering, gesondheidsorg, ens.)

Lees meer

Bron: will.com

Voeg 'n opmerking