52 个训练项目数据集

  1. 商城顾客数据集 — 商店访客数据:身份、性别、年龄、收入、消费评级。 (应用选项: 使用机器学习的客户细分项目)
  2. 鸢尾花数据集 — 适合初学者的数据集,包含各种花朵的萼片和花瓣的大小。
  3. MNIST 数据集 — 手写数字的数据集。 60 张训练图像和 000 张测试图像。
  4. 波士顿住房数据集 是用于模式识别的流行数据集。 包含有关波士顿房屋的信息:公寓数量、租金价格、犯罪指数。
  5. 假新闻检测数据集 — 包含 7796 个带有新闻标记的条目:真或假。 (带有 Python 源代码的应用程序选项: 假新闻检测 Python 项目 )
  6. 葡萄酒品质数据集 — 包含有关葡萄酒的信息:4898 条记录,14 个参数。
  7. SOCR 数据 – 身高和体重数据集 - 一个不错的开始选择。 包含25条000岁青少年的身高和体重记录。

    52 个训练项目数据集

    这篇文章是在爱迪生软件的支持下翻译的,它 “出色”地履行了华南地区的订单开发网络应用程序和网站.

  8. 帕金森数据集 — 195 条帕金森病患者记录,25 个分析参数。 可用于初步评估病人与健康人之间的差异。 (带有 Python 源代码的应用程序选项: 检测帕金森病的机器学习项目)
  9. 泰坦尼克号数据集 — 包含有关乘客的信息(年龄、性别、机上亲属等),训练集中有 891 条,测试集中有 418 条。
  10. Uber 接送数据集 — 4.5 年 Uber 出行次数为 2014 万次,14 年为 2015 万次。 (带有 R 源代码的应用程序选项: R 中的 Uber 数据分析项目)
  11. Chars74k 数据集 — 包含 64 个类别的英国和加拿大符号图像:0-9、AZ、az。 7700张7.7k自然图像,3400k手写,62000种计算机合成字体。
  12. 信用卡欺诈检测数据集 — 包含有关受损信用卡交易的信息。 (带有源的应用程序选项: 信用卡欺诈检测机器学习项目)
  13. 聊天机器人意图数据集 — 包含各种标签的 JSON 文件:问候语、再见、hospital_search、pharmacy_search 等。 包含一组问答模板。 (带有 Python 源代码的应用程序选项: Python 聊天机器人项目)
  14. 安然电子邮件数据集 — 包含来自 150 位安然公司经理的 XNUMX 万封信。
  15. Yelp 数据集 — 包含来自约 1,2 万个组织的 1,6 万用户的 1,2 万条推荐。
  16. 危险数据集 — 来自流行电视游戏的超过 200 条问答录音。
  17. 推荐系统数据集 — 一个包含 UCSD 大学数据集的门户网站。 包含热门网站(Goodreads、Amazon)上的评论记录。 非常适合创建推荐系统。 (带有 R 源代码的应用程序选项: R 电影推荐系统项目 )
  18. UCI 垃圾邮件数据库数据集 — 用于垃圾邮件检测的训练数据集。 包含 4601 个字母和 57 个元数据参数。
  19. Flickr 30k数据集 — 超过 30 张图像和标题。 (Flickr 8k数据集 — 8000 张图像。 Python源项目: 图像标题生成器 Python 项目)
  20. 互联网电影数据库评论 — 训练集中有 25 条电影评论,测试集中有 000 条电影评论。 (带有 R 源代码的应用程序选项: 情感分析数据科学项目)
  21. MS COCO 数据集 — 1,5 万张标记图像。
  22. CIFAR-10 和 CIFAR-100 数据集 — CIFAR-10包含60,000张32*32像素编号0-9的小图像。 CIFAR-100 - 分别为 0-100。
  23. GTSRB(德国交通标志识别基准)数据集 — 50 个路标的 000 张图像。 (带有 Python 源代码的应用程序选项: 交通标志识别Python项目)
  24. ImageNet数据集 — 包含超过 100 个短语,每个短语约 000 张图像。
  25. 乳腺组织病理学图像数据集 — 数据集包含乳腺癌样本的图像。 (带有源代码的应用程序选项 乳腺癌分类 Python 项目)
  26. 城市景观数据集 — 包含不同城市街道视频序列的高质量注释。
  27. 动力学数据集 - 包含约 6,5 万个高质量视频的 URL 链接。
  28. MPII 人体姿势数据集 — 该数据集包含 25 张带有关节注释的人体姿势图像。
  29. 20BN-something-something 数据集 v2 - 一组高质量视频,展示一个人如何执行某些操作。
  30. 对象 365 数据集 — 带有对象边界框的高质量图像数据集。
  31. 照片素描数据集 — 包含 1000 多张图像及其轮廓图。
  32. CQ500 数据集 — 该数据集包含 491 个头部 CT 扫描,包含 193 个切片。
  33. IMDB-Wiki 数据集 — 包含超过 5 万张按性别和年龄标记的面部图像的数据集。 (带有源代码的应用程序选项 性别和年龄检测 Python 项目)
  34. YouTube 8M 数据集 - 包含 6,1 万个 Youtube 视频 ID 的带标签视频数据集
  35. Urban Sound 8K 数据集 — 一组城市声音数据(包含 8732 个类别的 10 个城市声音)。
  36. LSUN 数据集 - 数百万张场景和物体的彩色图像的数据集(约 59 万张图像,10 个不同的场景类别和 20 个不同的物体类别)。
  37. RAVDESS 数据集 — 情感言语的视听数据库。 (带有源代码的应用程序选项 语音情感识别Python项目)
  38. 图书馆语音数据集 — 该数据集包含 1000 小时不同口音的英语演讲。
  39. 百度 Apolloscape 数据集 — 用于开发自动驾驶技术的数据集。
  40. Quandl 数据门户 — 经济和金融数据存储库(有免费和付费内容)。
  41. 世界银行开放数据门户 ——有关世界银行向发展中国家发放贷款的信息。
  42. 国际货币基金组织数据门户 是一个国际货币基金组织门户网站,发布国际金融、债务利率、投资、外汇储备和大宗商品数据。
  43. 美国经济协会 (AEA) 数据门户 - 用于搜索美国宏观经济数据的资源。
  44. Google 趋势数据门户 - 谷歌趋势数据可用于直观地探索和分析数据。
  45. 金融时报市场数据门户 是全球金融市场最新信息的资源。
  46. 数据政府门户网站 - 美国政府开放数据门户(农业、健康、气候、教育、能源、金融、科学研究等)。
  47. 数据门户:开放政府数据(印度) 是印度的开放政府数据平台。
  48. 食品环境图集数据门户 — 包含美国营养研究数据。
  49. 健康数据门户 是美国卫生与公众服务部的门户网站。
  50. 疾病控制和预防中心数据门户 - 包含广泛的健康相关数据。
  51. 伦敦数据存储门户 - 有关伦敦人们生活的数据。
  52. 加拿大政府开放数据门户 - 有关加拿大人的开放数据门户(农业、艺术、音乐、教育、政府、医疗保健等)

阅读更多

来源: habr.com

添加评论