Σύνολο δεδομένων Iris — ένα σύνολο δεδομένων για αρχάριους, που περιέχει τα μεγέθη σέπαλων και πετάλων για διάφορα λουλούδια.
Σύνολο δεδομένων MNIST — ένα σύνολο δεδομένων χειρόγραφων αριθμών. 60 εικόνες προπόνησης και 000 δοκιμαστικές εικόνες.
The Boston Housing Dataset είναι ένα δημοφιλές σύνολο δεδομένων για την αναγνώριση προτύπων. Περιέχει πληροφορίες για σπίτια στη Βοστώνη: αριθμός διαμερισμάτων, τιμές ενοικίασης, δείκτης εγκληματικότητας.
Σύνολο δεδομένων Titanic — περιέχει πληροφορίες για τους επιβάτες (ηλικία, φύλο, συγγενείς επί του πλοίου, κ.λπ.) 891 στο σετ εκπαίδευσης και 418 στο σετ δοκιμών.
Σύνολο δεδομένων προθέσεων Chatbot — ένα αρχείο JSON που περιέχει διάφορες ετικέτες: χαιρετισμούς, αντίο, αναζήτηση νοσοκομείου, αναζήτηση φαρμακείου κ.λπ. Περιέχει ένα σύνολο προτύπων ερωτήσεων-απαντήσεων. (Επιλογή εφαρμογής με πηγαίο κώδικα στην Python: Έργο Chatbot σε Python)
Το σύνολο δεδομένων Yelp — περιέχει 1,2 εκατομμύρια συστάσεις από 1,6 εκατομμύρια χρήστες περίπου 1,2 εκατομμύρια οργανισμούς.
Σύνολο δεδομένων κινδύνου — περισσότερες από 200 ηχογραφήσεις με ερωτήσεις και απαντήσεις από το δημοφιλές τηλεοπτικό παιχνίδι.
Σύνολο δεδομένων Συστημάτων Προτάσεων — μια πύλη με μια συλλογή συνόλων δεδομένων από το Πανεπιστήμιο UCSD. Περιέχει αρχεία κριτικών σε δημοφιλείς ιστότοπους (Goodreads, Amazon). Εξαιρετικό για τη δημιουργία συστημάτων συστάσεων. (Επιλογή εφαρμογής με πηγαίο κώδικα σε R: Έργο συστήματος σύστασης ταινιών στο R)
Σύνολο δεδομένων UCI Spambase — ένα εκπαιδευτικό σύνολο δεδομένων για τον εντοπισμό ανεπιθύμητων μηνυμάτων. Περιέχει 4601 γράμματα με 57 παραμέτρους μεταδεδομένων.
Σύνολο δεδομένων Youtube 8M - Ένα σύνολο δεδομένων βίντεο με ετικέτα που περιέχει 6,1 εκατομμύρια αναγνωριστικά βίντεο YouTube
Δεδομένα Urban Sound 8K — ένα σύνολο δεδομένων αστικού ήχου (περιέχει 8732 αστικούς ήχους από 10 κατηγορίες).
Σύνολο δεδομένων LSUN - ένα σύνολο δεδομένων από εκατομμύρια έγχρωμες εικόνες σκηνών και αντικειμένων (περίπου 59 εκατομμύρια εικόνες, 10 διαφορετικές κατηγορίες σκηνών και 20 διαφορετικές κατηγορίες αντικειμένων).
Πύλη δεδομένων του ΔΝΤ είναι μια διεθνής πύλη νομισματικών ταμείων που δημοσιεύει δεδομένα για διεθνή χρηματοοικονομικά, επιτόκια χρέους, επενδύσεις, συναλλαγματικά αποθέματα και εμπορεύματα.