Iris datastel — 'n datastel vir beginners, wat die groottes van kelkblare en blomblare vir verskeie blomme bevat.
MNIST-datastel — 'n datastel van handgeskrewe nommers. 60 000 opleidingsbeelde en 10 000 toetsbeelde.
Die Boston Housing Dataset is 'n gewilde datastel vir patroonherkenning. Bevat inligting oor huise in Boston: aantal woonstelle, huurpryse, misdaadindeks.
Chatbot-voornemens-datastel - 'n JSON-lêer wat verskeie etikette bevat: groete, totsiens, hospital_search, pharmacy_search, ens. Bevat 'n stel vraag-antwoord-sjablone. (Toepassingsopsie met bronkode in Python: Chatbot-projek in Python)
Enron-e-posdatastel — bevat 'n halfmiljoen briewe van 150 Enron-bestuurders.
Die Yelp-datastel - bevat 1,2 miljoen aanbevelings van 1,6 miljoen gebruikers ongeveer 1,2 miljoen organisasies.
Gevaarlike datastel — meer as 200 000 vraag-en-antwoord-opnames van die gewilde televisiespeletjie.
Beveel Stelsels Datastel aan - 'n portaal met 'n versameling datastelle van UCSD Universiteit. Bevat rekords van resensies op gewilde werwe (Goodreads, Amazon). Ideaal vir die skep van aanbevelingstelsels. (Toepassingsopsie met bronkode in R: Filmaanbevelingstelselprojek in R)
UCI Spambase-datastel - 'n opleidingsdatastel vir die opsporing van strooipos. Bevat 4601 letters met 57 metadataparameters.
Youtube 8M-datastel - 'n Gemerkte videodatastel wat 6,1 miljoen YouTube-video-ID's bevat
Urban Sound 8K-datastel — 'n stel stedelike klankdata (bevat 8732 stedelike klanke uit 10 klasse).
LSUN-datastel - 'n datastel van miljoene kleurbeelde van tonele en voorwerpe (ongeveer 59 miljoen beelde, 10 verskillende toneelkategorieë en 20 verskillende voorwerpkategorieë).
IMF Data Portaal is 'n internasionale monetêre fondsportaal wat data oor internasionale finansies, skuldkoerse, beleggings, buitelandse valutareserwes en kommoditeite publiseer.