Iris Datasett — et datasett for nybegynnere, som inneholder størrelsene på begerblader og kronblader for forskjellige blomster.
MNIST-datasett — et datasett med håndskrevne tall. 60 000 treningsbilder og 10 000 testbilder.
Boston Housing Dataset er et populært datasett for mønstergjenkjenning. Inneholder informasjon om hus i Boston: antall leiligheter, leiepriser, kriminalitetsindeks.
Chars74k Datasett — inneholder bilder av britiske og kanadiske symboler i 64 klasser: 0-9, AZ, az. 7700 7.7k naturlige bilder, 3400k håndskrevne, 62000 datamaskinsyntetiserte skrifter.
Chatbot Intents Datasett — en JSON-fil som inneholder forskjellige tagger: hilsener, farvel, sykehus_søk, apotek_søk osv. Inneholder et sett med spørsmål-svar-maler. (Applikasjonsalternativ med kildekode i Python: Chatbot-prosjekt i Python)
Yelp-datasettet — inneholder 1,2 millioner anbefalinger fra 1,6 millioner brukere rundt 1,2 millioner organisasjoner.
Jeopardy Datasett — mer enn 200 000 spørsmål-og-svar-opptak fra det populære TV-spillet.
Datasett for anbefalte systemer — en portal med en samling av datasett fra UCSD University. Inneholder registreringer av anmeldelser på populære nettsteder (Goodreads, Amazon). Flott for å lage anbefalingssystemer. (Applikasjonsalternativ med kildekode i R: Filmanbefalingssystemprosjekt i R)
UCI Spambase Datasett — et opplæringsdatasett for deteksjon av søppelpost. Inneholder 4601 bokstaver med 57 metadataparametere.
Youtube 8M-datasett - Et merket videodatasett som inneholder 6,1 millioner YouTube-video-IDer
Urban Sound 8K datasett — et sett med urbane lyddata (inneholder 8732 urbane lyder fra 10 klasser).
LSUN Datasett - et datasett med millioner av fargebilder av scener og objekter (ca. 59 millioner bilder, 10 forskjellige scenekategorier og 20 forskjellige objektkategorier).
IMFs dataportal er en internasjonal pengefondsportal som publiserer data om internasjonal finans, gjeldsrenter, investeringer, valutareserver og råvarer.