Boston Praesent Dataset is a popular dataset for pattern recognition. Informationes de domibus in Boston continet: numerum conclavium, pretia rentalis, index criminis.
Chatbot Intentiones Dataset — fasciculus JSON qui varias continet tags: salve, vale, hospital_search, pharmacy_search, etc. Quaestionis responsum templates constituit. (Optio applicationis cum source codice in Pythone: Chatbot Project in Python)
Enron Email Dataset — Dimidium decies centena millia litterarum continet ab actoribus Enron CL.
In Yelp Dataset — continet 1,2 miliones commendationes ab 1,6 decies centena users circa 1,2 decies centena millia instituta.
Periculum Dataset - plusquam XX 200 quaestionibus et responsionibus e ludo populari televisificarum.
Suasor Systems Dataset - porta cum collectione dataset ab Universitate UCSD. Recensiones continet in locis popularibus (Goodreads, Amazon). Magna ad creandos systemata commendator. (Option application with source code in R: Movie Commendatio System Project in R)
UCI Spambase Dataset - disciplina dataset ad spam deprehendendi. 4601 continet epistolas cum 57 parametri metadatas.
Youtube 8M Dataset - A intitulatum video dataset quae continet 6,1 decies centena Youtube video IDs
Urban Sound 8K dataset — notitia soni urbana (8732 continet sonos urbanos e X generibus).
LSUN Dataset - dataset decies centena milia colorum imagines scaenarum et rerum (circiter 59 decies centena imagines, X genera scaenae et XX diversa genera).
IMF Data Portal Fiscus nummarius internationalis est portae quae notitias oeconomicas internationales, aes alienum, collocationem, subsidia et commoda commercii exterarum praedicat.
Data.gov Portal - US imperium aperta notitia portae (agriculturae, valetudinis, climatis, educationis, industriae, oeconomici, scientiae et inquisitionis, etc.).