O'quv loyihalari uchun 52 ta ma'lumotlar to'plami

  1. Savdo markazi mijozlari ma'lumotlar to'plami - do'konga tashrif buyuruvchilarning ma'lumotlari: id, jins, yosh, daromad, xarajatlar reytingi. (Ilova opsiyasi: Machine Learning bilan mijozlarni segmentatsiyalash loyihasi)
  2. Iris ma'lumotlar to'plami — yangi boshlanuvchilar uchun turli xil gullar uchun sepals va gulbarglarning o'lchamlarini o'z ichiga olgan ma'lumotlar to'plami.
  3. MNIST ma'lumotlar to'plami - qo'lda yozilgan raqamlarning ma'lumotlar to'plami. 60 000 ta o'quv tasviri va 10 000 ta test tasviri.
  4. Boston uy-joy ma'lumotlar to'plami naqshni aniqlash uchun mashhur ma'lumotlar to'plamidir. Bostondagi uylar haqidagi ma'lumotlarni o'z ichiga oladi: kvartiralar soni, ijara narxlari, jinoyatlar indeksi.
  5. Soxta yangiliklarni aniqlash maʼlumotlar toʻplami — yangilik belgilari bilan 7796 ta yozuvni o'z ichiga oladi: rost yoki noto'g'ri. (Python-da manba kodi bilan dastur opsiyasi: Soxta yangiliklarni aniqlash Python loyihasi )
  6. Sharob sifati ma'lumotlar to'plami — vino haqidagi maʼlumotlarni oʻz ichiga oladi: 4898 parametrli 14 ta yozuv.
  7. SOCR ma'lumotlari - Balandlik va vazn ma'lumotlar to'plami - boshlash uchun yaxshi variant. 25 yoshli odamlarning bo'yi va vazni bo'yicha 000 18 ta yozuvni o'z ichiga oladi.

    O'quv loyihalari uchun 52 ta ma'lumotlar to'plami

    Maqola EDISON Software ko'magida tarjima qilingan Janubiy Xitoydan kelgan buyurtmalarni "a'lo" bajaradi, shuningdek veb-ilovalar va veb-saytlarni ishlab chiqadi.

  8. Parkinson ma'lumotlar to'plami - Parkinson kasalligi bilan og'rigan bemorlarning 195 ta yozuvi, 25 ta tahlil parametrlari. Kasal va sog'lom odamlar o'rtasidagi farqni dastlabki baholash uchun foydalanish mumkin. (Python-da manba kodi bilan dastur opsiyasi: Parkinson kasalligini aniqlash bo'yicha mashinani o'rganish loyihasi)
  9. Titanik ma'lumotlar to'plami — yo‘lovchilar to‘g‘risidagi ma’lumotlar (yoshi, jinsi, bortdagi qarindoshlari va boshqalar) o‘quv majmuasida 891 ta va test majmuasida 418 tasi mavjud.
  10. Uber Pickups ma'lumotlar to'plami — 4.5-yilda Uber’da 2014 million va 14-yilda 2015 million sayohat haqida ma’lumot. (R dagi manba kodi bilan dastur opsiyasi: R.dagi Uber ma'lumotlarini tahlil qilish loyihasi)
  11. Chars74k ma'lumotlar to'plami — 64 sinfdagi Britaniya va Kanada ramzlari tasvirlari mavjud: 0-9, A-Z, a-z. 7700 7.7 ming tabiiy tasvir, 3400 ming qo'lda yozilgan, 62000 kompyuter sintezlangan shrift.
  12. Kredit karta firibgarligini aniqlash ma'lumotlar to'plami — buzilgan kredit kartalari boʻyicha operatsiyalar toʻgʻrisidagi maʼlumotlarni oʻz ichiga oladi. (Manba bilan ilova opsiyasi: Kredit karta firibgarligini aniqlash mashinasini o'rganish loyihasi)
  13. Chatbot Intents ma'lumotlar to'plami — turli teglarni o'z ichiga olgan JSON fayli: salomlar, xayr, kasalxona_qidiruvi, dorixona_qidiruvi va boshqalar. Savol-javob shablonlari to'plamini o'z ichiga oladi. (Python-da manba kodi bilan dastur opsiyasi: Pythonda chatbot loyihasi)
  14. Enron elektron pochta ma'lumotlar to'plami — Enronning 150 nafar menejeridan kelgan yarim million xatni o‘z ichiga oladi.
  15. Yelp ma'lumotlar to'plami — 1,2 million foydalanuvchidan 1,6 millionga yaqin tashkilotning 1,2 million tavsiyasi mavjud.
  16. Xavfli ma'lumotlar to'plami — mashhur televizion oʻyindan 200 000 dan ortiq savol-javob yozuvlari.
  17. Tavsiya qiluvchi tizimlar ma'lumotlar to'plami — UCSD universiteti maʼlumotlar toʻplami toʻplamiga ega portal. Ommabop saytlardagi sharhlar yozuvlarini o'z ichiga oladi (Goodreads, Amazon). Tavsiya qiluvchi tizimlarni yaratish uchun juda yaxshi. (R dagi manba kodi bilan dastur opsiyasi: R.dagi filmni tavsiya qilish tizimi loyihasi )
  18. UCI Spambase ma'lumotlar to'plami - spamni aniqlash uchun o'quv ma'lumotlar to'plami. 4601 ta metadata parametrlari bilan 57 ta harfdan iborat.
  19. Flickr 30k ma'lumotlar to'plami — 30 ​​000 dan ortiq rasm va sarlavhalar. (Flickr 8k ma'lumotlar to'plami - 8000 ta rasm. Python manba loyihasi: Rasm sarlavhalari generatori Python loyihasi)
  20. IMDB sharhlari — Mashg‘ulotlar to‘plamida 25 000 film sharhi va test to‘plamida 25 000 ta. (R dagi manba kodi bilan dastur opsiyasi: His-tuyg'ularni tahlil qilish ma'lumotlar fanlari loyihasi)
  21. MS COCO ma'lumotlar to'plami — 1,5 million teglangan tasvirlar.
  22. CIFAR-10 va CIFAR-100 ma'lumotlar to'plami — CIFAR-10 60,000*32 pikselli 32 dan 0 gacha bo'lgan 9 100 ta kichik tasvirni o'z ichiga oladi. CIFAR-0 - mos ravishda 100-XNUMX.
  23. GTSRB (Germaniya yo'l belgilarini aniqlash benchmarki) ma'lumotlar to'plami — 50 ta yoʻl belgilarining 000 43 ta tasviri. (Python-da manba kodi bilan dastur opsiyasi: Yo'l belgilarini aniqlash Python loyihasi)
  24. ImageNet ma'lumotlar to'plami — har bir iborada 100 000 dan ortiq ibora va 1000 ga yaqin tasvir mavjud.
  25. Ko'krak gistopatologiyasi tasvirlari ma'lumotlar to'plami — maʼlumotlar toʻplamida koʻkrak saratoni namunalari tasvirlari mavjud. (Manba kodi yoqilgan ilova opsiyasi Ko'krak bezi saratoni tasnifi Python loyihasi)
  26. Cityscapes ma'lumotlar to'plami — turli shaharlardagi ko‘chalarning video ketma-ketligining yuqori sifatli annotatsiyalarini o‘z ichiga oladi.
  27. Kinetika ma'lumotlar to'plami - 6,5 millionga yaqin yuqori sifatli videolarga URL havolasini o'z ichiga oladi.
  28. MPII inson pozasi maʼlumotlar toʻplami — maʼlumotlar toʻplami qoʻshma izohlarga ega boʻlgan 25 000 ta odam pozalarini oʻz ichiga oladi.
  29. 20BN-bir narsa-bir narsa ma'lumotlar to'plami v2 - inson qandaydir harakatni qanday bajarishini ko'rsatadigan yuqori sifatli videolar to'plami.
  30. Ob'ekt 365 ma'lumotlar to'plami — ob'ektni chegaralovchi qutilari bo'lgan yuqori sifatli tasvirlarning ma'lumotlar to'plami.
  31. Surat eskiz maʼlumotlar toʻplami — kontur chizmalari bilan 1000 dan ortiq tasvirlarni o‘z ichiga oladi.
  32. CQ500 ma'lumotlar to'plami — maʼlumotlar toʻplamida boshning 491 ta kompyuter tomografiyasi, 193 317 ta boʻlak mavjud.
  33. IMDB-Wiki ma'lumotlar to'plami — jinsi va yoshi boʻyicha belgilangan yuzlarning 5 milliondan ortiq tasviridan iborat maʼlumotlar toʻplami. (Manba kodi yoqilgan ilova opsiyasi Jins va yoshni aniqlash Python loyihasi)
  34. Youtube 8M ma'lumotlar to'plami - 6,1 million Youtube video identifikatorini o'z ichiga olgan etiketli video ma'lumotlar to'plami
  35. Urban Sound 8K maʼlumotlar toʻplami — shahar tovush maʼlumotlari toʻplami (8732 sinfdan 10 ta shahar tovushini oʻz ichiga oladi).
  36. LSUN ma'lumotlar to'plami - millionlab sahnalar va ob'ektlarning rangli tasvirlarining ma'lumotlar to'plami (taxminan 59 million tasvir, 10 xil sahna toifalari va 20 xil ob'ekt toifalari).
  37. RAVDESS ma'lumotlar to'plami — emotsional nutqning audiovizual bazasi. (Manba kodi yoqilgan ilova opsiyasi Nutq hissiyotlarini aniqlash Python loyihasi)
  38. Librispeech ma'lumotlar to'plami — maʼlumotlar toʻplami turli urgʻu bilan 1000 soatlik inglizcha nutqni oʻz ichiga oladi.
  39. Baidu Apolloscape ma'lumotlar to'plami — oʻz-oʻzini boshqarish texnologiyalarini ishlab chiqish uchun maʼlumotlar toʻplami.
  40. Quandl ma'lumotlar portali — iqtisodiy va moliyaviy maʼlumotlar ombori (bepul va pullik kontent mavjud).
  41. Jahon bankining ochiq ma'lumotlar portali — Jahon banki tomonidan rivojlanayotgan mamlakatlarga berilgan kreditlar toʻgʻrisidagi maʼlumotlar.
  42. IMF ma'lumotlar portali xalqaro moliya, qarz stavkalari, investitsiyalar, valyuta zahiralari va tovarlarga oid ma'lumotlarni e'lon qiluvchi xalqaro valyuta fondi portali.
  43. Amerika iqtisodiy assotsiatsiyasi (AEA) ma'lumotlar portali - AQSh makroiqtisodiy ma'lumotlarini qidirish uchun resurs.
  44. Google Trends ma'lumotlar portali - Google trend ma'lumotlari ma'lumotlarni vizual ravishda o'rganish va tahlil qilish uchun ishlatilishi mumkin.
  45. Financial Times Market Data Portal butun dunyo bo'ylab moliyaviy bozorlar haqidagi so'nggi ma'lumotlar uchun resursdir.
  46. Data.gov portali - AQSH hukumatining ochiq maʼlumotlar portali (qishloq xoʻjaligi, sogʻliqni saqlash, iqlim, taʼlim, energetika, moliya, fan va tadqiqot va boshqalar).
  47. Maʼlumotlar portali: Ochiq hukumat maʼlumotlari (Hindiston) Hindistonning ochiq hukumat ma'lumotlar platformasi.
  48. Oziq-ovqat muhiti Atlas ma'lumotlar portali — Qo'shma Shtatlardagi ovqatlanish bo'yicha tadqiqot ma'lumotlarini o'z ichiga oladi.
  49. Sog'liqni saqlash ma'lumotlar portali AQSh Sog'liqni saqlash va inson xizmatlari departamentining portalidir.
  50. Kasalliklarni nazorat qilish va oldini olish markazlari ma'lumotlar portali - sog'liq bilan bog'liq keng ko'lamli ma'lumotlarni o'z ichiga oladi.
  51. London ma'lumotlar do'koni portali - Londondagi odamlar hayoti haqidagi ma'lumotlar.
  52. Kanada hukumati ochiq ma'lumotlar portali - kanadaliklar haqidagi ochiq ma'lumotlar portali (qishloq xo'jaligi, san'at, musiqa, ta'lim, hukumat, sog'liqni saqlash va boshqalar).

Ko'proq o'qish

Manba: www.habr.com

a Izoh qo'shish