Iris Dataset - in dataset foar begjinners, mei de grutte fan kelkblêden en petalen foar ferskate blommen.
MNIST Dataset - in dataset fan mei de hân skreaune nûmers. 60 trainingsôfbyldings en 000 testôfbyldings.
De Boston Housing Dataset is in populêre dataset foar patroanherkenning. Befettet ynformaasje oer huzen yn Boston: oantal apparteminten, hierprizen, kriminaliteitsyndeks.
Chars74k Dataset - befettet bylden fan Britske en Kanadeeske symboalen fan 64 klassen: 0-9, A-Z, a-z. 7700 7.7k natuerlike ôfbyldings, 3400k mei de hân skreaun, 62000 komputer syntetisearre lettertypen.
Chatbot Intents Dataset - in JSON-bestân dat ferskate tags befettet: groetnis, oant sjen, hospital_search, pharmacy_search, ensfh. Befettet in set fraach-antwurd-sjabloanen. (Applikaasje-opsje mei boarnekoade yn Python: Chatbot Project yn Python)
Enron Email Dataset - befettet in heal miljoen brieven fan 150 Enron-managers.
De Yelp-dataset - befettet 1,2 miljoen oanbefellings fan 1,6 miljoen brûkers oer 1,2 miljoen organisaasjes.
Jeopardy Dataset - mear dan 200 fraach-en-antwurd-opnames fan it populêre televyzjespul.
Recommender Systems Dataset - in portaal mei in samling datasets fan UCSD University. Befettet records fan resinsjes op populêre siden (Goodreads, Amazon). Geweldich foar it meitsjen fan oanbefellingssystemen. (Applikaasje-opsje mei boarnekoade yn R: Movie Recommendation System Project yn R)
UCI Spambase Dataset - in training dataset foar deteksje fan spam. Befettet 4601 letters mei 57 metadataparameters.
Youtube 8M Dataset - In markearre fideodataset dy't 6,1 miljoen YouTube-fideo-ID's befettet
Urban Sound 8K dataset - in set stedske lûdgegevens (befettet 8732 stedske lûden út 10 klassen).
LSUN Dataset - in dataset fan miljoenen kleurôfbyldings fan sênes en objekten (sawat 59 miljoen ôfbyldings, 10 ferskillende sênekategoryen en 20 ferskillende objektkategoryen).
IMF Data Portal is in ynternasjonaal monetêr fûnsportaal dat gegevens publisearret oer ynternasjonale finânsjes, skuldraten, ynvestearrings, bûtenlânske útwikselingsreserves en commodities.
Data.gov Portal - Open dataportaal fan 'e Amerikaanske regearing (lânbou, sûnens, klimaat, ûnderwiis, enerzjy, finânsjes, wittenskip en ûndersyk, ensfh.).