GitHub 实现了一个机器学习系统来搜索代码中的漏洞

GitHub 宣布在其代码扫描服务中添加实验性机器学习系统,以识别代码中常见的漏洞类型。 在测试阶段,新功能目前仅适用于具有 JavaScript 和 TypeScript 代码的存储库。 值得注意的是,机器学习系统的使用使得显着扩大已识别问题的范围成为可能,在分析时,系统不再局限于检查标准模板,并且不依赖于众所周知的框架。 在新系统发现的问题中,提到了导致跨站脚本(XSS)、文件路径失真(例如,通过“/..”指示)、SQL和NoSQL查询替换的错误。

代码扫描服务允许您通过扫描每个“git Push”操作以查找潜在问题,从而在开发的早期阶段识别漏洞。 结果直接附加到拉取请求中。 此前,检查是使用CodeQL引擎进行的,该引擎会分析具有易受攻击代码典型示例的模板(CodeQL允许您创建易受攻击的代码模板来识别其他项目代码中是否存在类似漏洞)。 使用机器学习的新引擎可以识别以前未知的漏洞,因为它不依赖于枚举描述特定漏洞的代码模板。 与基于 CodeQL 的检查相比,此功能的代价是误报数量增加。

来源: opennet.ru

添加评论