Iris Dataset — en datauppsättning för nybörjare, som innehåller storlekarna på foderblad och kronblad för olika blommor.
MNIST Dataset — en datauppsättning av handskrivna siffror. 60 000 träningsbilder och 10 000 testbilder.
Boston Housing Dataset är en populär datauppsättning för mönsterigenkänning. Innehåller information om hus i Boston: antal lägenheter, hyrespriser, brottsindex.
Chars74k Dataset — innehåller bilder av brittiska och kanadensiska symboler i 64 klasser: 0-9, AZ, az. 7700 7.7k naturliga bilder, 3400k handskrivna, 62000 datorsyntetiserade typsnitt.
Chatbot Intents Dataset — en JSON-fil som innehåller olika taggar: hälsningar, adjö, hospital_search, pharmacy_search, etc. Innehåller en uppsättning frågesvarsmallar. (Applikationsalternativ med källkod i Python: Chatbot-projekt i Python)
Yelp-datauppsättningen — innehåller 1,2 miljoner rekommendationer från 1,6 miljoner användare, cirka 1,2 miljoner organisationer.
Jeopardy Dataset — mer än 200 000 fråge-och-svar-inspelningar från det populära tv-spelet.
Rekommenderar systemdataset — en portal med en samling datauppsättningar från UCSD University. Innehåller register över recensioner på populära webbplatser (Goodreads, Amazon). Perfekt för att skapa rekommendatorsystem. (Applikationsalternativ med källkod i R: Filmrekommendationssystemprojekt i R)
UCI Spambase Dataset — en utbildningsdatauppsättning för att upptäcka skräppost. Innehåller 4601 bokstäver med 57 metadataparametrar.
Youtube 8M Dataset - En märkt videodatauppsättning som innehåller 6,1 miljoner YouTube-video-ID:n
Urban Sound 8K dataset — en uppsättning stadsljuddata (innehåller 8732 stadsljud från 10 klasser).
LSUN Dataset - en datauppsättning med miljontals färgbilder av scener och objekt (cirka 59 miljoner bilder, 10 olika scenkategorier och 20 olika objektkategorier).
IMFs dataportal är en internationell monetär fondsportal som publicerar data om internationell finans, skuldräntor, investeringar, valutareserver och råvaror.