Irisa Datumaro — datumaro por komencantoj, enhavanta la grandecojn de sepaloj kaj petaloj por diversaj floroj.
MNIST-Datumaro — datumaro de manskribitaj nombroj. 60 trejnaj bildoj kaj 000 testaj bildoj.
The Boston Housing Dataset estas populara datumaro por padronrekono. Enhavas informojn pri domoj en Bostono: nombro da apartamentoj, luprezoj, krimindico.
Chatbot Intents Datumaro — JSON-dosiero, kiu enhavas diversajn etikedojn: salutojn, adiaŭon, hospital_serĉon, pharmacy_search, ktp. Enhavas aron da demando-respondaj ŝablonoj. (Aplika opcio kun fontkodo en Python: Chatbot-Projekto en Python)
La Yelp-Datumaro — enhavas 1,2 milionojn da rekomendoj de 1,6 milionoj da uzantoj ĉirkaŭ 1,2 milionoj da organizoj.
Danĝera Datumaro - pli ol 200 demandaj kaj respondaj registradoj de la populara televida ludo.
Rekomendinda Sistemo Datumaro - portalo kun kolekto de datumaroj de UCSD-Universitato. Enhavas notojn pri recenzoj pri popularaj retejoj (Goodreads, Amazon). Bonega por krei rekomendajn sistemojn. (Aplika opcio kun fontkodo en R: Filma Rekomenda Sistemo-Projekto en R)
UCI-Spambaza Datumaro — trejna datumaro por detekto de spamado. Enhavas 4601 literojn kun 57 metadatumaj parametroj.
Youtube 8M Datumaro - Etikedita videodatumaro, kiu enhavas 6,1 milionojn da Youtube-video-identigiloj
Urba Sono 8K datumaro — aro da urbaj sondatenoj (enhavas 8732 urbaj sonojn el 10 klasoj).
LSUN-Datumserio - datumaro de milionoj da kolorbildoj de scenoj kaj objektoj (ĉirkaŭ 59 milionoj da bildoj, 10 malsamaj scenkategorioj kaj 20 malsamaj objektokategorioj).
IMF Datuma Portalo estas portalo de internacia monfonduso, kiu publikigas datumojn pri internacia financo, ŝuldkurzoj, investo, valutrezervoj kaj varoj.
Data.gov Portalo - Portalo pri malfermaj datumoj de la usona registaro (agrikulturo, sano, klimato, edukado, energio, financo, scienco kaj esplorado, ktp.).