52 個培訓項目資料集

  1. 商城顧客資料集 — 商店訪客資料:身分、性別、年齡、收入、消費評級。 (應用選項: 使用機器學習的客戶細分項目)
  2. 鳶尾花數據集 — 適合初學者的資料集,包含各種花朵的萼片和花瓣的大小。
  3. MNIST 數據集 — 手寫數字的資料集。 60 張訓練影像和 000 張測試影像。
  4. 波士頓住房資料集 是用於模式識別的流行資料集。 包含有關波士頓房屋的資訊:公寓數量、租金價格、犯罪指數。
  5. 假新聞檢測資料集 — 包含 7796 個帶有新聞標記的條目:真或假。 (帶有 Python 原始碼的應用程式選項: 假新聞檢測 Python 項目 )
  6. 葡萄酒品質數據集 — 包含葡萄酒的資訊:4898 筆記錄,14 個參數。
  7. SOCR 數據 – 身高和體重數據集 - 不錯的開始選擇。 包含25筆000歲青少年的身高體重記錄。

    52 個培訓項目資料集

    本文的翻譯得到了 EDISON Software 的支持, 「出色」地履行了華南地區的訂單開發網頁應用程式和網站.

  8. 帕金森資料集 — 195 筆帕金森氏症患者記錄,25 個分析參數。 可用於初步評估病人與健康人之間的差異。 (帶有 Python 原始碼的應用程式選項: 檢測帕金森氏症的機器學習項目)
  9. 泰坦尼克號數據集 — 包含乘客的資訊(年齡、性別、機上親屬等),訓練集中有 891 條,測試集中有 418 條。
  10. Uber 接送資料集 — 4.5 年 Uber 行程次數為 2014 萬次,14 年為 2015 萬次。 (帶有 R 原始碼的應用程式選項: R 中的 Uber 數據分析項目)
  11. Chars74k 資料集 — 包含 64 個類別的英國和加拿大符號圖像:0-9、AZ、az。 7700張7.7k自然圖像,3400k手寫,62000種電腦合成字體。
  12. 信用卡詐欺檢測資料集 — 包含受損信用卡交易的資訊。 (帶有來源的應用程式選項: 信用卡詐欺偵測機器學習項目)
  13. 聊天機器人意圖資料集 — 包含各種標籤的 JSON 檔案:問候語、再見、hospital_search、pharmacy_search 等。 包含一組問答模板。 (帶有 Python 原始碼的應用程式選項: Python 聊天機器人專案)
  14. 安然電子郵件資料集 — 包含 150 位安然公司經理的 XNUMX 萬封信。
  15. Yelp 資料集 — 包含約 1,2 萬個組織的 1,6 萬用戶的 1,2 萬個推薦。
  16. 危險資料集 — 超過 200 首來自流行電視遊戲的問答錄音。
  17. 推薦系​​統資料集 — 一個包含 UCSD 大學資料集的入口網站。 包含熱門網站(Goodreads、Amazon)上的評論記錄。 非常適合創建推薦系統。 (帶有 R 原始碼的應用程式選項: R 電影推薦系統項目 )
  18. UCI 垃圾郵件資料庫資料集 — 用於垃圾郵件偵測的訓練資料集。 包含 4601 個字母和 57 個元資料參數。
  19. Flickr 30k數據集 — 超過 30 張圖像和標題。 (Flickr 8k數據集 — 8000 張圖像。 Python來源專案: 圖像標題生成器 Python 項目)
  20. 網路電影資料庫評論 — 訓練集中有 25 則電影評論,測試集有 000 則電影評論。 (帶有 R 原始碼的應用程式選項: 情緒分析數據科學項目)
  21. MS COCO 數據集 — 1,5 萬張標記影像。
  22. CIFAR-10 和 CIFAR-100 資料集 — CIFAR-10包含60,000張32*32像素編號0-9的小圖像。 CIFAR-100 - 分別為 0-100。
  23. GTSRB(德國交通標誌識別基準)資料集 — 50 個路標的 000 張影像。 (帶有 Python 原始碼的應用程式選項: 交通標誌識別Python項目)
  24. ImageNet數據集 — 包含超過 100 個短語,每個短語約 000 張圖像。
  25. 乳房組織病理學影像資料集 — 資料集包含乳癌樣本的影像。 (帶有原始程式碼的應用程式選項 乳癌分類 Python 項目)
  26. 城市景觀數據集 — 包含不同城市街道影片序列的高品質註釋。
  27. 動力學數據集 - 包含約 6,5 萬個高品質影片的 URL 連結。
  28. MPII 人體姿勢資料集 — 此資料集包含 25 張帶有關節註釋的人體姿勢影像。
  29. 20BN-something-something 資料集 v2 - 一組高品質視頻,展示一個人如何執行某些操作。
  30. 物件 365 資料集 — 具有物件邊界框的高品質影像資料集。
  31. 照片素描資料集 — 包含 1000 多張影像及其輪廓圖。
  32. CQ500 資料集 — 此資料集包含 491 個頭部 CT 掃描,包含 193 個切片。
  33. IMDB-Wiki 資料集 — 包含超過 5 萬張按性別和年齡標記的臉部影像的資料集。 (帶有原始程式碼的應用程式選項 性別與年齡檢測 Python 項目)
  34. YouTube 8M 資料集 - 包含 6,1 萬個 Youtube 影片 ID 的標籤影片資料集
  35. Urban Sound 8K 資料集 — 一組城市聲音資料(包含 8732 個類別的 10 個城市聲音)。
  36. LSUN 資料集 - 數百萬張場景和物件的彩色影像的資料集(約 59 萬張影像,10 個不同的場景類別和 20 個不同的物件類別)。
  37. RAVDESS 資料集 — 情感言語的視聽資料庫。 (帶有原始程式碼的應用程式選項 語音情緒辨識Python項目)
  38. 圖書館語音資料集 — 此資料集包含 1000 小時不同口音的英語演講。
  39. 百度 Apolloscape 資料集 — 用於開發自動駕駛技術的資料集。
  40. Quandl 資料門戶 — 經濟和金融資料儲存庫(有免費和付費內容)。
  41. 世界銀行開放資料門戶 ——有關世界銀行發放貸款給發展中國家的資訊。
  42. 國際貨幣基金組織數據門戶 是一個國際貨幣基金組織入口網站,發布國際金融、債務利率、投資、外匯儲備和大宗商品資料。
  43. 美國經濟協會 (AEA) 資料門戶 - 用於搜尋美國宏觀經濟數據的資源。
  44. Google 趨勢資料入口網站 - 谷歌趨勢資料可用於直觀地探索和分析資料。
  45. 金融時報市場數據門戶 是全球金融市場最新資訊的資源。
  46. 數據政府入口網站 - 美國政府開放資料入口網站(農業、健康、氣候、教育、能源、金融、科學研究等)。
  47. 資料入口網站:開放政府資料(印度) 是印度的開放政府資料平台。
  48. 食品環境圖集資料門戶 — 內含美國營養研究資料。
  49. 健康數據門戶 是美國衛生與公眾服務部的入口網站。
  50. 疾病管制與預防中心資料門戶 - 包含廣泛的健康相關數據。
  51. 倫敦資料儲存門戶 - 有關倫敦人們生活的數據。
  52. 加拿大政府開放資料入口網站 - 有關加拿大人的開放資料入口網站(農業、藝術、音樂、教育、政府、醫療保健等)

閱讀更多

來源: www.habr.com

添加評論