商城顧客資料集 — 商店訪客資料:身分、性別、年齡、收入、消費評級。 (應用選項:使用機器學習的客戶細分項目 )鳶尾花數據集 — 適合初學者的資料集,包含各種花朵的萼片和花瓣的大小。MNIST 數據集 — 手寫數字的資料集。 60 張訓練影像和 000 張測試影像。波士頓住房資料集 是用於模式識別的流行資料集。 包含有關波士頓房屋的資訊:公寓數量、租金價格、犯罪指數。假新聞檢測資料集 — 包含 7796 個帶有新聞標記的條目:真或假。 (帶有 Python 原始碼的應用程式選項:假新聞檢測 Python 項目 )葡萄酒品質數據集 — 包含葡萄酒的資訊:4898 筆記錄,14 個參數。SOCR 數據 – 身高和體重數據集 - 不錯的開始選擇。 包含25筆000歲青少年的身高體重記錄。
本文的翻譯得到了 EDISON Software 的支持,「出色」地履行了華南地區的訂單 和開發網頁應用程式和網站 .帕金森資料集 — 195 筆帕金森氏症患者記錄,25 個分析參數。 可用於初步評估病人與健康人之間的差異。 (帶有 Python 原始碼的應用程式選項:檢測帕金森氏症的機器學習項目 )泰坦尼克號數據集 — 包含乘客的資訊(年齡、性別、機上親屬等),訓練集中有 891 條,測試集中有 418 條。Uber 接送資料集 — 4.5 年 Uber 行程次數為 2014 萬次,14 年為 2015 萬次。 (帶有 R 原始碼的應用程式選項:R 中的 Uber 數據分析項目 )Chars74k 資料集 — 包含 64 個類別的英國和加拿大符號圖像:0-9、AZ、az。 7700張7.7k自然圖像,3400k手寫,62000種電腦合成字體。信用卡詐欺檢測資料集 — 包含受損信用卡交易的資訊。 (帶有來源的應用程式選項:信用卡詐欺偵測機器學習項目 )聊天機器人意圖資料集 — 包含各種標籤的 JSON 檔案:問候語、再見、hospital_search、pharmacy_search 等。 包含一組問答模板。 (帶有 Python 原始碼的應用程式選項:Python 聊天機器人專案 )安然電子郵件資料集 — 包含 150 位安然公司經理的 XNUMX 萬封信。Yelp 資料集 — 包含約 1,2 萬個組織的 1,6 萬用戶的 1,2 萬個推薦。危險資料集 — 超過 200 首來自流行電視遊戲的問答錄音。推薦系統資料集 — 一個包含 UCSD 大學資料集的入口網站。 包含熱門網站(Goodreads、Amazon)上的評論記錄。 非常適合創建推薦系統。 (帶有 R 原始碼的應用程式選項:R 電影推薦系統項目 )UCI 垃圾郵件資料庫資料集 — 用於垃圾郵件偵測的訓練資料集。 包含 4601 個字母和 57 個元資料參數。Flickr 30k數據集 — 超過 30 張圖像和標題。 (Flickr 8k數據集 — 8000 張圖像。 Python來源專案:圖像標題生成器 Python 項目 )網路電影資料庫評論 — 訓練集中有 25 則電影評論,測試集有 000 則電影評論。 (帶有 R 原始碼的應用程式選項:情緒分析數據科學項目 )MS COCO 數據集 — 1,5 萬張標記影像。CIFAR-10 和 CIFAR-100 資料集 — CIFAR-10包含60,000張32*32像素編號0-9的小圖像。 CIFAR-100 - 分別為 0-100。GTSRB(德國交通標誌識別基準)資料集 — 50 個路標的 000 張影像。 (帶有 Python 原始碼的應用程式選項:交通標誌識別Python項目 )ImageNet數據集 — 包含超過 100 個短語,每個短語約 000 張圖像。乳房組織病理學影像資料集 — 資料集包含乳癌樣本的影像。 (帶有原始程式碼的應用程式選項乳癌分類 Python 項目 )城市景觀數據集 — 包含不同城市街道影片序列的高品質註釋。動力學數據集 - 包含約 6,5 萬個高品質影片的 URL 連結。MPII 人體姿勢資料集 — 此資料集包含 25 張帶有關節註釋的人體姿勢影像。20BN-something-something 資料集 v2 - 一組高品質視頻,展示一個人如何執行某些操作。物件 365 資料集 — 具有物件邊界框的高品質影像資料集。照片素描資料集 — 包含 1000 多張影像及其輪廓圖。CQ500 資料集 — 此資料集包含 491 個頭部 CT 掃描,包含 193 個切片。IMDB-Wiki 資料集 — 包含超過 5 萬張按性別和年齡標記的臉部影像的資料集。 (帶有原始程式碼的應用程式選項性別與年齡檢測 Python 項目 )YouTube 8M 資料集 - 包含 6,1 萬個 Youtube 影片 ID 的標籤影片資料集Urban Sound 8K 資料集 — 一組城市聲音資料(包含 8732 個類別的 10 個城市聲音)。LSUN 資料集 - 數百萬張場景和物件的彩色影像的資料集(約 59 萬張影像,10 個不同的場景類別和 20 個不同的物件類別)。RAVDESS 資料集 — 情感言語的視聽資料庫。 (帶有原始程式碼的應用程式選項語音情緒辨識Python項目 )圖書館語音資料集 — 此資料集包含 1000 小時不同口音的英語演講。百度 Apolloscape 資料集 — 用於開發自動駕駛技術的資料集。Quandl 資料門戶 — 經濟和金融資料儲存庫(有免費和付費內容)。世界銀行開放資料門戶 ——有關世界銀行發放貸款給發展中國家的資訊。國際貨幣基金組織數據門戶 是一個國際貨幣基金組織入口網站,發布國際金融、債務利率、投資、外匯儲備和大宗商品資料。美國經濟協會 (AEA) 資料門戶 - 用於搜尋美國宏觀經濟數據的資源。Google 趨勢資料入口網站 - 谷歌趨勢資料可用於直觀地探索和分析資料。金融時報市場數據門戶 是全球金融市場最新資訊的資源。數據政府入口網站 - 美國政府開放資料入口網站(農業、健康、氣候、教育、能源、金融、科學研究等)。資料入口網站:開放政府資料(印度) 是印度的開放政府資料平台。食品環境圖集資料門戶 — 內含美國營養研究資料。健康數據門戶 是美國衛生與公眾服務部的入口網站。疾病管制與預防中心資料門戶 - 包含廣泛的健康相關數據。倫敦資料儲存門戶 - 有關倫敦人們生活的數據。加拿大政府開放資料入口網站 - 有關加拿大人的開放資料入口網站(農業、藝術、音樂、教育、政府、醫療保健等)
閱讀更多
來源: www.habr.com