Набір даних Iris - Датасет для новачків, що містить розміри чашолистків та пелюсток для різних квіток.
Набір даних MNIST - Датасет рукописних цифр. 60 000 тренувальних зображень та 10 000 тестових зображень.
The Boston Housing Dataset - популярний датасет для розпізнавання патернів. Містить інформацію про будинки у Бостоні: кількість квартир, вартість оренди, індекс злочинів.
Chars74k Dataset - Містить зображення Британських і Канадських символів 64 класів: 0-9, AZ, az. 7700 7.7k природних зображень, 3400k написаних від руки, 62000 синтезованих комп'ютером шрифтів.
Chatbot Intents Dataset - JSON-файл, який містить різні теги: greetings, goodbye, hospital_search, pharmacy_search і тд. Містить набір шаблонів запитання-відповідь. (Варіант застосування з вихідним кодом на Python: Chatbot Project in Python)
The Yelp Dataset - Містить 1,2 млн. рекомендацій від 1,6 млн. користувачів про 1,2 млн організацій.
Jeopardy Dataset — понад 200 000 записів «запитання-відповідь» із популярної телевізійної гри.
Recommender Systems Dataset - Портал з колекцією датасетів від університету UCSD. Містить записи про відгуки на популярних сайтах (Goodreads, Amazon). Відмінно підходить для створення рекомендаційних систем. (Варіант застосування із вихідником на R: Movie Recommendation System Project in R)
UCI Spambase Dataset - Датасет для тренування для виявлення спаму. Містить 4601 листів із 57 параметрами метаданих.
Youtube 8M Dataset - маркований набір даних відео, що містить 6,1 мільйона ідентифікаторів відео Youtube
Urban Sound 8K dataset - Набір міських звукових даних (містить 8732 міських звуку з 10 класів).
LSUN Dataset — набір даних із мільйонів кольорових зображень сцен та об'єктів (близько 59 мільйонів зображень, 10 різних категорій сцен та 20 різних категорій об'єктів).
Data.gov Portal - портал відкритих даних уряду США (сільське господарство, охорона здоров'я, клімат, освіта, енергетика, фінанси, наука та дослідження тощо).
Canada Government Open Data Portal — портал відкритих даних про канадців (сільське господарство, мистецтво, музика, освіта, уряд, охорона здоров'я тощо)