Pakinsini Dataset - Awọn igbasilẹ 195 ti awọn alaisan ti o ni arun Pakinsini, pẹlu awọn aye itupalẹ 25. Le ṣee lo fun iṣayẹwo akọkọ ti iyatọ laarin awọn eniyan aisan ati awọn eniyan ilera. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Iṣẹ Ẹkọ Ẹrọ lori Ṣiṣawari Arun Pakinsini)
Titanic Dataset - ni alaye nipa awọn ero (ọjọ ori, akọ-abo, awọn ibatan lori ọkọ, bbl) 891 ninu eto ikẹkọ ati 418 ninu eto idanwo.
Chars74k Dataset - ni awọn aworan ti British ati Canadian aami ti 64 kilasi: 0-9, AZ, az. 7700 7.7k adayeba images, 3400k afọwọkọ, 62000 kọmputa sise nkọwe.
Chatbot Intents Dataset - faili JSON kan ti o ni awọn aami oriṣiriṣi: ikini, o dabọ, iwadii ile-iwosan, wiwa ile elegbogi, ati bẹbẹ lọ. Ni akojọpọ awọn awoṣe idahun ibeere kan ni. (Aṣayan ohun elo pẹlu koodu orisun ni Python: Chatbot Project ni Python)
Enron Imeeli Dataset - ni idaji miliọnu awọn lẹta lati ọdọ awọn alakoso 150 Enron.
Eto data Yelp - ni awọn iṣeduro miliọnu 1,2 lati awọn olumulo miliọnu 1,6 nipa awọn ẹgbẹ miliọnu 1,2.
Jeopardy Dataset - diẹ sii ju awọn igbasilẹ ibeere ati idahun 200 lati ere tẹlifisiọnu olokiki.
Oluṣeto Systems Dataset - ọna abawọle pẹlu ikojọpọ ti awọn iwe data lati Ile-ẹkọ giga UCSD. Ni awọn igbasilẹ ti awọn atunwo lori awọn aaye olokiki (Goodreads, Amazon). Nla fun ṣiṣẹda awọn ọna ṣiṣe iṣeduro. (Aṣayan ohun elo pẹlu koodu orisun ni R: Eto Iṣeduro Fiimu ni R)
UCI Spambase Dataset - ipilẹ data ikẹkọ fun wiwa àwúrúju. Ni awọn lẹta 4601 pẹlu awọn paramita metadata 57 ninu.
Youtube 8M Dataset - Aami data fidio fidio ti o ni awọn ID fidio Youtube 6,1 milionu
Urban Sound 8K dataset - Eto ti data ohun ilu (ni awọn ohun ilu 8732 ni lati awọn kilasi 10).
LSUN data - data ti awọn miliọnu awọn aworan awọ ti awọn iwoye ati awọn nkan (nipa awọn aworan miliọnu 59, awọn ẹka iṣẹlẹ 10 oriṣiriṣi ati awọn ẹka ohun elo oriṣiriṣi 20).
IMF Data Portal jẹ ọna abawọle inawo inawo kariaye ti o ṣe atẹjade data lori inawo agbaye, awọn oṣuwọn gbese, idoko-owo, awọn ifiṣura paṣipaarọ ajeji ati awọn ọja.