52 set data kanggo proyek latihan

  1. Dataset Pelanggan Mall - data pengunjung toko: id, jenis kelamin, umur, penghasilan, rating belanja. (Pilihan aplikasi: Proyek Segmentasi Pelanggan kanthi Machine Learning)
  2. Iris Dataset - dataset kanggo pamula, ngemot ukuran sepals lan petals kanggo macem-macem kembang.
  3. Dataset MNIST - dataset saka nomer tulisan tangan. 60 gambar latihan lan 000 gambar tes.
  4. Dataset Perumahan Boston minangka dataset populer kanggo pangenalan pola. Ngemot informasi babagan omah ing Boston: jumlah apartemen, rega sewa, indeks kejahatan.
  5. Dataset Deteksi Warta Palsu - ngemot 7796 entri kanthi tandha warta: bener utawa salah. (Opsi aplikasi kanthi kode sumber ing Python: Proyek Python Deteksi Warta Palsu )
  6. Data kualitas anggur - ngandhut informasi bab anggur: 4898 cathetan karo 14 paramèter.
  7. Data SOCR - Dataset Dhuwur lan Bobot - pilihan apik kanggo miwiti karo. Ngandhut 25 cathetan babagan dhuwur lan bobote wong umur 000 taun.

    52 set data kanggo proyek latihan

    Artikel kasebut diterjemahake kanthi dhukungan saka EDISON Software, sing nepaki pesenan saka China Kidul "banget"Lan ngembangake aplikasi web lan situs web.

  8. Dataset Parkinson - 195 cathetan pasien karo penyakit Parkinson, kanthi 25 parameter analisis. Bisa digunakake kanggo pambiji prabΓ©dan antarane wong lara lan wong sehat. (Opsi aplikasi kanthi kode sumber ing Python: Proyek Pembelajaran Mesin babagan Ndeteksi Penyakit Parkinson)
  9. Titanic Dataset Kab - ngandhut informasi bab penumpang (umur, gender, sederek ing Papan, etc.) 891 ing pesawat latihan lan 418 ing pesawat test.
  10. Dataset Uber Pickups - informasi babagan 4.5 yuta lelungan ing Uber ing 2014 lan 14 yuta ing 2015. (Pilihan aplikasi kanthi kode sumber ing R: Proyek Analisis Data Uber ing R)
  11. Dataset Chars74k - ngemot gambar simbol Inggris lan Kanada saka 64 kelas: 0-9, A-Z, a-z. 7700 7.7k gambar alami, 3400k tulisan tangan, 62000 font sintesis komputer.
  12. Dataset Deteksi Penipuan Kartu Kredit - ngemot informasi babagan transaksi kertu kredit sing dikompromi. (Pilihan aplikasi kanthi sumber: Proyek Pembelajaran Mesin Deteksi Penipuan Kartu Kredit)
  13. Chatbot Intents Dataset - file JSON sing ngemot macem-macem tag: salam, pamit, hospital_search, pharmacy_search, lsp. Ngandhut sakumpulan template pitakonan-jawaban. (Opsi aplikasi kanthi kode sumber ing Python: Proyek Chatbot ing Python)
  14. Enron Email Dataset - ngemot setengah yuta layang saka 150 manager Enron.
  15. Dataset Yelp - ngemot 1,2 yuta rekomendasi saka 1,6 yuta pangguna babagan 1,2 yuta organisasi.
  16. Dataset Jeopardy - luwih saka 200 rekaman pitakonan lan jawaban saka game televisi populer.
  17. Rekomendasi Sistem Dataset - portal kanthi koleksi dataset saka Universitas UCSD. Ngandhut cathetan review ing situs populer (Goodreads, Amazon). Apik kanggo nggawe sistem rekomendasi. (Pilihan aplikasi kanthi kode sumber ing R: Proyek Sistem Rekomendasi Film ing R )
  18. UCI Spambase Dataset - dataset latihan kanggo deteksi spam. Ngandhut 4601 huruf kanthi 57 parameter metadata.
  19. Flickr 30k Dataset - luwih saka 30 gambar lan katrangan. (Flickr 8k Dataset - 8000 gambar. Proyek sumber Python: Gambar Caption Generator Proyek Python)
  20. ulasan IMDB - 25 review film ing set latihan lan 000 ing set test. (Pilihan aplikasi kanthi kode sumber ing R: Analisis Sentimen Proyek Ilmu Data)
  21. Data saka MS COCO - 1,5 yuta gambar sing diwenehi tag.
  22. CIFAR-10 lan CIFAR-100 dataset - CIFAR-10 ngandhut 60,000 gambar cilik 32 * 32 piksel nomer 0-9. CIFAR-100 - mungguh, 0-100.
  23. GTSRB (Pandapatan pangenalan tandha lalu lintas Jerman) Dataset - 50 gambar saka 000 tandha dalan. (Opsi aplikasi kanthi kode sumber ing Python: Proyek Python Pangenalan Rambu Lalu Lintas)
  24. Dataset ImageNet - ngemot luwih saka 100 frase lan udakara 000 gambar saben frase.
  25. Dataset Gambar Histopatologi Payudara - dataset ngemot gambar sampel kanker payudara. (Opsi aplikasi kanthi kode sumber aktif Proyek Python Klasifikasi Kanker Payudara)
  26. Dataset Cityscapes - ngemot anotasi kualitas video urutan dalan ing macem-macem kutha.
  27. Dataset kinetik - ngemot link URL menyang udakara 6,5 ​​yuta video kanthi kualitas dhuwur.
  28. Dataset pose manungsa MPII - dataset ngemot 25 gambar pose manungsa kanthi anotasi gabungan.
  29. 20BN-something-something dataset v2 - kumpulan video kualitas dhuwur sing nuduhake carane wong nindakake sawetara tumindak.
  30. Object 365 Dataset - kumpulan data gambar kanthi kualitas dhuwur kanthi kothak wates obyek.
  31. Data sketsa foto - ngemot luwih saka 1000 gambar kanthi gambar garis.
  32. Dataset CQ500 - dataset ngemot 491 CT scan sirah kanthi 193 irisan.
  33. IMDB-Wiki dataset - kumpulan data kanthi luwih saka 5 yuta gambar pasuryan sing ditandhani miturut jender lan umur. (Opsi aplikasi kanthi kode sumber aktif Proyek Python Deteksi Gender & Umur)
  34. Dataset Youtube 8M - Dataset video kanthi label sing ngemot 6,1 yuta ID video Youtube
  35. Dhaptar data Urban Sound 8K - sakumpulan data swara kutha (ngemot 8732 swara kutha saka 10 kelas).
  36. Dataset LSUN - kumpulan data mayuta-yuta gambar warna saka pemandangan lan obyek (udakara 59 yuta gambar, 10 kategori pemandangan sing beda lan 20 kategori obyek sing beda).
  37. Dataset RAVDESS - database audiovisual wicara emosi. (Opsi aplikasi kanthi kode sumber aktif Proyek Python Pangenalan Emosi Speech)
  38. Koleksi Data Librispeech - dataset ngemot 1000 jam pidato Inggris kanthi aksen sing beda.
  39. Dataset Baidu Apolloscape - dataset kanggo pangembangan teknologi nyopir dhewe.
  40. Portal Data Quandl - gudang data ekonomi lan finansial (ana konten gratis lan mbayar).
  41. Portal Data Terbuka Bank Dunia - informasi babagan silihan sing ditanggepi dening Bank Dunia menyang negara berkembang.
  42. Portal Data IMF minangka portal dana moneter internasional sing nerbitake data babagan keuangan internasional, tingkat utang, investasi, cadangan devisa lan komoditas.
  43. Portal Data American Economic Association (AEA). - Sumber daya kanggo nggoleki data makroekonomi AS.
  44. Portal Data Google Trends - Data tren Google bisa digunakake kanggo njelajah lan nganalisa data kanthi visual.
  45. Portal Data Pasar Financial Times minangka sumber kanggo informasi paling anyar babagan pasar finansial saka sak ndonya.
  46. Portal Data.gov - Pamrentah AS mbukak portal data (pertanian, kesehatan, iklim, pendidikan, energi, keuangan, ilmu pengetahuan lan riset, lsp).
  47. Portal Data: Open government data (India) yaiku platform data pamrentah India sing mbukak.
  48. Portal Data Atlas Lingkungan Pangan - ngemot data riset babagan nutrisi ing Amerika Serikat.
  49. Portal Data Kesehatan minangka portal Departemen Kesehatan lan Layanan Manungsa AS.
  50. Portal Data Pusat Kontrol lan Nyegah Penyakit - ngemot macem-macem data sing gegandhengan karo kesehatan.
  51. London Datastore Portal - data bab urip wong ing London.
  52. Portal Data Pambuka Pamrentah Kanada - portal data mbukak babagan Kanada (tetanèn, seni, musik, pendhidhikan, pamaréntahan, kesehatan, lsp.)

Waca liyane

Source: www.habr.com

Add a comment