56 个开源 Python 项目

56 个开源 Python 项目

1.烧瓶

它是一个用Python编写的微框架。 它没有表单验证,也没有数据库抽象层,但允许您使用第三方库来实现常见功能。 这就是为什么它是一个微框架。 Flask 旨在使创建应用程序变得简单、快速,同时还具有可扩展性和轻量级。 它基于 Werkzeug 和 Jinja2 项目。 您可以在 DataFlair 的最新文章中阅读更多相关信息 蟒蛇烧瓶.

2.凯拉斯

Keras 是一个用 Python 编写的开源神经网络库。 它具有用户友好性、模块化和可扩展性,可以在 TensorFlow、Theano、PlaidML 或 Microsoft Cognitive Toolkit (CNTK) 之上运行。 Keras 拥有一切:模板、目标和传递函数、优化器等等。 它还支持卷积和循环神经网络。

致力于基于 Keras 的最新开源项目 - 乳腺癌的分类.

56 个开源 Python 项目

这篇文章是在爱迪生软件的支持下翻译的,它 开发 Vivaldi 文档存储诊断系统投资初创企业.

3.SpaCy

它是一个开源软件库,处理 自然语言处理(NLP) 并用 Python 和 Cython 编写。 虽然NLTK更适合教学和研究目的,但spaCy的工作是提供用于生产的软件。 此外,Thinc 是 spaCy 的机器学习库,提供用于词性标记、依存解析和命名实体识别的 CNN 模型。

4.哨兵

Sentry 提供托管的开源错误监控,以便您可以实时检测和分类错误。 只需安装适合您的语言或框架的 SDK 即可开始。 它允许您捕获未处理的异常、检查堆栈跟踪、分析每个问题的影响、跨项目跟踪错误、分配问题等等。 使用 Sentry 意味着更少的错误和更多的代码交付。

5.OpenCV

OpenCV 是一个开源计算机视觉和机器学习库。 该库拥有超过 2500 个针对计算机视觉任务的优化算法,例如对象检测和识别、各类人类活动的分类、相机运动跟踪、创建 XNUMXD 对象模型、图像拼接以获得高分辨率图像以及许多其他任务。 该库适用于多种语言,例如Python、C++、Java等。

Github 星数:39585

您已经参与过任何 OpenCV 项目吗? 这是一个 - 性别和年龄确定项目

6. 尼勒恩

这是一个用于快速轻松地对神经影像数据实施统计学习的模块。 它允许您使用 scikit-learn 进行多元统计,以进行预测建模、分类、解码和连接分析。 Nilearn 是 NiPy 生态系统的一部分,该生态系统是一个致力于使用 Python 分析神经影像数据的社区。

每颗星数 Github上:549

7.scikit学习

Scikit-learn 是另一个开源 Python 项目。 这是一个非常著名的Python机器学习库。 SciPy 通常与 NumPy 和 SciPy 一起使用,提供分类、回归和聚类 - 它支持 SVM(支持向量机)、随机森林、梯度加速、k-means 和 DBSCAN。 该库是用 Python 和 Cython 编写的。

Github 星数:37,144

8. 火炬

PyTorch 是另一个用 Python 编写并针对 Python 的开源机器学习库。 它基于 Torch 库,非常适合计算机视觉和自然语言处理 (NLP) 等领域。 它还有一个 C++ 前端。

在许多其他功能中,PyTorch 提供了两个高级功能:

  • 高度 GPU 加速的张量计算
  • 深度神经网络

Github 上的星星数量:31

9. 图书馆

Librosa 是用于音乐和音频分析的最佳 Python 库之一。 它包含用于从音乐中获取信息的必要组件。 该库文档齐全,包含多个教程和示例,可以让您的任务更轻松。

Github 星数:3107

开源 Python 项目和 Librosa 的实现 - 语音情感识别.

10. 根西姆

Gensim 是一个 Python 库,用于大型公司的主题建模、文档索引和相似性搜索。 它针对的是 NLP 和信息检索社区。 Gensim 是“生成类似”的缩写。 此前,他创建了一个与本文类似的文章简短列表。 Gensim 清晰、高效且可扩展。 Gensim 提供了一种从纯文本进行无监督语义建模的高效且简单的实现。

Github 上的星星数量:9

11. 姜戈

Django的 是一个高级Python框架,鼓励快速开发并信奉DRY(不要重复自己)原则。 它是一个非常强大且使用最广泛的Python框架。 它基于 MTV(模型-模板-视图)模式。

Github 上的星星数量:44

12.人脸识别

人脸识别是 GitHub 上的热门项目。 它使用 Python/命令行轻松识别和操作面部,并使用世界上最简单的面部识别库来执行此操作。 它使用 dlib 和深度学习来检测人脸,在 Wild 基准测试中准确率达到 99,38%。

Github 星数:28,267

13.饼干切割机

Cookiecutter 是一个命令行实用程序,可用于从模板(cookiecutter)创建项目。 一个示例是从批处理项目模板创建批处理项目。 这些是跨平台模板,项目模板可以采用任何语言或标记格式,例如 Python、JavaScript、HTML、Ruby、CoffeeScript、RST 和 Markdown。 它还允许您在同一个项目模板中使用多种语言。

Github 上的星星数量:10

14.熊猫

Pandas 是一个 Python 数据分析和操作库,提供标记数据结构和统计函数。

Github 星数:21,404

Python开源项目尝试Pandas - 帕金森病的检测

15. 皮彭女

Pipenv 承诺成为一款可立即投入生产的工具,旨在将所有打包领域的精华带入 Python 世界。 它的终端具有漂亮的颜色,并将 Pipfile、pip 和 virtualenv 组合到一个命令中。 它会自动为您的项目创建和管理虚拟环境,并为用户提供自定义工作环境的简单方法。

Github 星数:18,322

16. 简单币

它是用 Python 构建的加密货币的区块链实现,但它简单、不安全且不完整。 SimpleCoin 不适用于生产用途。 SimpleCoin 不用于生产用途,而是用于教育目的,只是为了使工作区块链易于访问和更简单。 它允许您保存挖掘的哈希值并将其兑换为任何支持的货币。
Github 星数:1343

17. 派雷

它是一个用普通 Python 编写的 3D 渲染库。 它用 Python 和动画渲染 2D、3D、高维对象和场景。 它让我们进入了创造视频、视频游戏、物理模拟甚至美丽图片的领域。 对此的要求:PIL、numpy 和 scipy。

Github 星数:451

18. 微Python

MicroPython 是用于微控制器的 Python。 它是 Python3 的高效实现,附带 Python 标准库中的许多包,并针对在微控制器和受限环境中运行进行了优化。 Pyboard 是一个小型电子板,在裸机上运行 MicroPython,因此可以控制各种电子项目。

每颗星数 Github上:9,197

19.基维

Kivy 是一个 Python 库,用于开发具有自然用户界面 (NUI) 的移动和其他多点触控应用程序。 它有一个图形库、几个小部件选项、用于创建您自己的小部件的 Kv 中间语言、对鼠标、键盘、TUIO 和多点触摸事件的支持。 它是一个开源库,用于通过创新的用户界面快速开发应用程序。 它是跨平台的、业务友好的并且是 GPU 加速的。

Github 上的星星数量:9

20。 短跑

Dash by Plotly 是一个 Web 应用程序框架。 它构建在 Flask、Plotly.js、React 和 React.js 之上,允许我们使用 Python 构建仪表板。 它大规模支持 Python 和 R 模型。 Dash 允许您在没有 DevOps、JavaScript、CSS 或 CronJobs 的情况下构建、测试、部署和报告。 Dash 功能强大、可定制、轻量且易于管理。 它也是开源的。

Github 星数:9,883

21。 品红

Magenta 是一个开源研究项目,专注于将机器学习作为创意过程中的工具。 它允许您使用机器学习来创作音乐和艺术。 Magenta 是一个基于 TensorFlow 的 Python 库,具有处理原始数据的实用程序,用它来训练机器模型和创建新内容。

22.R-CNN掩码

这是 R-CNNN mask 在 Python 3、TensorFlow 和 Keras 中的实现。 该模型采用栅格中的每个对象实例并为其创建边界框和分割掩模。 它使用特征金字塔网络 (FPN) 和 ResNet101 主干网。 该代码很容易扩展。 该项目还提供了客户捕获的重建 3D 空间的 Matterport3D 数据集......
Github 上的星星数量:14

23.TensorFlow模型

这是一个存储库,其中包含在 TensorFlow 中实现的各种模型 - 官方模型和研究模型。 它还具有示例和教程。 官方模型使用高级 TensorFlow API。 研究模型是由研究人员在 TensorFlow 中实现的模型,以获得他们的支持或问题支持和查询。

Github 上的星星数量:57

24. 斯纳利加斯特

Snallygaster 是一种用项目板来组织问题的方法。 得益于此,您可以在 GitHub 上自定义您的项目管理面板,优化和自动化您的工作流程。 它允许您对任务进行排序、安排项目、自动化工作流程、跟踪进度、共享状态并最终完成。 Snallygaster 可以扫描 HTTP 服务器上的秘密文件 - 它会查找 Web 服务器上可用的、不应公开访问且可能会带来安全风险的文件。

Github 上的星星数量:1

25.统计模型

Python包,它补充了 scipy 的统计计算功能,包括描述性统计以及统计模型的估计和推理。 它具有用于此目的的类和函数。 它还允许我们对统计数据进行统计测试和研究。
Github 上的星星数量:4

26. 什么瓦夫

这是一种高级防火墙检测工具,我们可以用它来了解 Web 应用程序防火墙是否存在。 它检测 Web 应用程序中的防火墙,并尝试在指定目标上发现一种或多种解决方法。

Github 星数:1300

27.链接器

链纳 — 它是一个深度学习框架面向灵活性。 它基于 Python,并提供基于按运行定义的方法的差异化 API。 Chainer 还提供高级面向对象的 API,用于构建和训练神经网络。 它是一个强大、灵活且直观的神经网络框架。
Github 星数:5,054

28. 反弹

Rebound 是一个命令行工具。 当您收到编译器错误时,它会立即从堆栈溢出中检索结果。 要使用它,您可以使用反弹命令来执行您的文件。 它是 50 年 2018 个最受欢迎的开源 Python 项目之一。 此外,它需要 Python 3.0 或更高版本。 支持的文件类型:Python、Node.js、Ruby、Golang 和 Java。

Github 星数:2913

29. 探测器

Detectron 执行现代目标检测(还实现 R-CNN 掩模)。 它是用 Python 编写并在 Caffe2 深度学习平台上运行的 Facebook AI Research (FAIR) 软件。 Detectron 的目标是为目标检测研究提供高质量、高性能的代码库。 它非常灵活,并实现了以下算法 - R-CNN mask、RetinaNet、faster R-CNN、RPN、fast R-CNN、R-FCN。

Github 上的星星数量:21

30. 蟒蛇火

这是一个用于从(任何)Python 对象自动生成 CLI(命令行界面)的库。 它还允许您开发和调试代码,以及检查现有代码或将其他人的代码转换为 CLI。 Python Fire 使得 Bash 和 Python 之间的迁移变得容易,也使得 REPL 的使用变得更加容易。
Github 上的星星数量:15

31.Pylearn2

Pylearn2 是一个主要构建在 Theano 之上的机器学习库。 其目标是让机器学习研究变得更加容易。 允许您编写新的算法和模型。
Github 星数:2681

32.Matplotlib

Matplotlib 是一个 Python 2D 绘图库 - 它生成不同格式的高质量出版物。

Github 星数:10,072

33.茶野

Theano 是一个用于操作数学和矩阵表达式的库。 它也是一个优化编译器。 Theano 使用 NumPy的用于表达计算并将其编译以在 CPU 或 GPU 架构上运行的类似语法。 它是一个用 Python 和 CUDA 编写的开源 Python 机器学习库,可在 Linux、macOS 和 Windows 上运行。

每颗星数 Github上:8,922

34. 多重差异

Multidiff 旨在使面向机器的数据更易于理解。 它通过对相应对象进行差异然后显示它们来帮助您查看大量对象之间的差异。 这种可视化使我们能够寻找专有协议或不常见文件格式中的模式。 它还主要用于逆向工程和二进制数据分析。

Github 星数:262

35. 索姆茶匙

该项目是关于使用自组织映射来解决旅行商问题。 使用 SOM,我们找到 TSP 问题的次优解决方案,并为此使用 .tsp 格式。 TSP 是一个 NP 完全问题,随着城市数量的增加,解决起来越来越困难。

Github 星数:950

36。 光子

Photon 是一款专为开源情报 (OSINT) 设计的速度极快的网络扫描仪。 它可以检索 URL、带参数的 URL、Intel 信息、文件、密钥、JavaScript 文件、正则表达式匹配和子域。 然后可以将提取的信息以 json 格式保存并导出。 Photon 灵活且巧妙。 您还可以向其中添加一些插件。

Github 星数:5714

37. 社交映射器

Social Mapper 是一种社交媒体映射工具,可使用面部识别来关联个人资料。 它在各种网站上大规模地这样做。 Social Mapper 可自动在社交媒体上搜索姓名和照片,然后尝试精确定位某人的存在并对其进行分组。 然后它会生成一份报告供人工审核。 这在安全行业(例如网络钓鱼)很有用。 它支持LinkedIn、Facebook、Twitter、Google Plus、Instagram、VKontakte、微博和豆瓣平台。

Github 星数:2,396

38. 卡米洛特

Camelot 是一个 Python 库,可帮助您从 PDF 文件中提取表格。 它适用于文本 PDF 文件,但不适用于扫描文档。 这里每个表都是一个 pandas DataFrame。 此外,您还可以将表导出为 .json、.xls、.html 或 .sqlite。

Github 星数:2415

39. 阅读器

这是一个用于阅读电子书的Qt阅读器。 它支持 .pdf、.epub、.djvu、.fb2、.mobi、.azw/.azw3/.azw4、.cbr/.cbz 和 .md 文件格式。 Lector 有一个主窗口、一个表格视图、一个书籍视图、一个无干扰视图、注释支持、一个漫画视图和一个设置窗口。 它还支持书签、个人资料浏览、元数据编辑器和内置字典。

Github 星数:835

40.m00dbot

这是一个用于自我测试抑郁和焦虑的 Telegram 机器人。

Github 星数:145

41. 马尼姆

它是一个用于解释数学视频的动画引擎,可用于以编程方式创建精确的动画。 他为此使用Python。

Github 上的星星数量:13

42. 抖音机器人

用 Python 编写的机器人,用于类似 Tinder 的应用程序。 来自中国的开发商。

Github 星数:5,959

43.XS罢工

这是一个跨站脚本检测包,带有四个手写解析器。 它还具有智能有效负载生成器、强大的模糊引擎和令人难以置信的快速搜索引擎。 XSStrike 不是像所有其他工具一样注入有效负载并测试其工作情况,而是使用多个解析器识别响应,然后处理有效负载,这保证了使用集成到模糊引擎中的上下文分析来工作。

Github 星数:7050

44.Python机器人

该项目是 Python 机器人算法以及自主导航算法的代码集合。

Github 星数:6,746

45.谷歌图片下载

Google Images Download 是一个命令行 Python 程序,可以在 Google Images 中搜索关键字并为您获取图像。 如果您只需要为每个关键字上传最多 100 张图像,那么这是一个没有依赖项的小程序。

Github 星数:5749

46.陷阱

允许您实时监控和执行智能社会工程攻击。 这有助于揭示大型互联网公司如何在用户不知情的情况下获取敏感信息并控制用户。 Trape 还可以帮助追踪网络犯罪分子。

Github 星数:4256

47. 克松什

Xonsh 是一种基于 Python 的跨平台 Unix 命令行和 shell 语言。 这是 Python 3.5+ 的超集,带有额外的 shell 原语,如 Bash 和 IPython 中的原语。 Xonsh 运行在 Linux、Max OS X、Windows 和其他主要系统上。

Github 星数:3426

48. CLI 的 GIF

它需要 GIF 或短视频或查询,并使用 Tenor GIF API 将其转换为 ASCII 动画图形。 它使用 ANSI 转义序列来实现动画和颜色。

Github 星数:2,547

49.卡通化

画画 这是一款可以画漫画的宝丽来相机。 它使用神经网络进行对象识别、Google Quickdraw 数据集、热敏打印机和 Raspberry Pi。 快点,画画! 是一款 Google 游戏,要求玩家画出一个物体/想法的图片,然后在 20 秒内尝试猜测它代表什么。

Github 星数:1760

50.祖利普

Zulip 是一款群聊应用程序,可以实时运行,并且可以通过多线程对话提高工作效率。 许多财富 500 强公司和开源项目使用它进行实时聊天,每天可以处理数千条消息。

Github 星数:10,432

51.YouTube-dl

它是一个命令行程序,可以从 YouTube 和其他一些网站下载视频。 它不依赖于特定平台。

Github 上的星星数量:55

52. 可靠

它是一个简单的 IT 自动化系统,可以处理以下功能:配置管理、应用程序部署、云配置、临时任务、网络自动化和多站点编排。

Github 星数:39,443

53.HTTPie

HTTPie 是一个命令行 HTTP 客户端。 这使得 CLI 更容易与 Web 服务交互。 对于 http 命令,它允许我们使用简单的语法发送任意 HTTP 请求,并接收彩色输出。 我们可以用它来测试、调试以及与 HTTP 服务器交互。

Github 上的星星数量:43

54.龙卷风网络服务器

它是一个 Web 框架,Python 的异步网络库。 它使用非阻塞网络 I/O 来扩展到数千个开放连接。 这使得它成为长请求和 WebSocket 的不错选择。

Github 上的星星数量:18

55.要求

Requests 是一个可以轻松发送 HTTP/1.1 请求的库。 您不必手动向 URL 添加参数或对 PUT 和 POST 数据进行编码。
Github 上的星星数量:40

56.刮擦

Scrapy 是一个快速、高级的网络爬行框架 - 您可以使用它来爬取网站以提取结构化数据。 您还可以将其用于数据分析、监控和自动化测试。

Github 星数:34,493

来源: habr.com

添加评论