Claude Opus 4.6 AI 模型已識別出 500 多個以前未知的漏洞。

Anthropic公司宣布其Claude Opus 4.6人工智慧模型擴展了漏洞檢測功能,並分享了一項實驗結果,該實驗在多個開源專案的最新版本中識別出500多個此前未知的(零日)漏洞。這項研究重點關注記憶體問題引起的漏洞,因為這類漏洞更容易驗證。所有識別出的漏洞都被評為高風險等級。每個漏洞都經過Anthropic員工或外部安全研究人員的人工審核和確認。

為了分析漏洞,我們使用了幾個流行開源專案的程式碼庫,這些程式碼庫長期以來一直使用 OSS-Fuzz 服務進行持續的模糊測試。與產生所有可能輸入資料隨機組合的模糊測試不同,人工智慧模型嘗試分析程式碼,並考慮過去的修復情況來識別類似的未解決錯誤,突出顯示問題模式,並邏輯地推斷哪些輸入資料可能會破壞程式的執行。

實驗過程中發現的漏洞資訊已開始與維護者分享,我們正與他們合作審批修補程式。為了協助維護者進行人工審核,我們開發了針對已發現問題的修補程式。例如,GhostScript、OpenSC 和 CGI​​F 中存在三個漏洞,截至本文發佈時,這些漏洞已由維護者修復。

用於識別問題的配置與傳統的自動化漏洞掃描系統不同——Claude Opus 4.6 模型獲得了存取權限。 虛擬機除了待分析的程式碼外,該模型還使用了標準的開發工具(例如 coreutils、Python 等)以及用於偵錯和漏洞分析的實用程式(包括模糊測試工具)。模型並未被告知如何使用這些工具,也沒有獲得任何關於漏洞檢測方法的具體資訊。模型只是被賦予了一項任務,並被允許獨立思考如何最佳地利用現有工具。

在尋找 GhostScript 漏洞時,AI 模型最初嘗試模糊測試,但失敗後轉而進行程式碼分析。程式碼分析也失敗了,因此模型開始檢查 Git 提交歷史,並在其中一個提交中發現了關於緩衝區邊界檢查的提及。分析提交後,模型確定該修復在處理字體時添加了一個缺少的緩衝區邊界檢查。

該模型隨後識別出修復前的程式碼,並嘗試在剩餘未修復的程式碼中尋找類似使用問題函數的模式。最終,在 gdevpsfx.c 檔案中偵測到對 gs_type1_blend 函數的調用,但未進行值驗證檢查。最後,該模型識別出導致程式崩潰的檔案內容,原因是資料被寫入到已分配緩衝區之外的記憶體區域。

在 CGIF 中,AI 模型依賴於這樣一個事實:在解壓縮 GIF 檔案時,該庫假定壓縮後的資料大小始終小於解壓縮後的資料大小。漏洞搜尋的重點在於識別 LZW 壓縮後的資料大於解壓縮後的資料的條件。研究人員發現了這些條件,並且 AI 模型能夠產生一個 GIT 文件,該文件的處理會導致緩衝區溢位。在 OpenSC 中,該問題是透過分析程式碼中潛在危險的 strrchr 和 strcat 函數的使用情況而發現的。

值得注意的是,語言模型已經發展到能夠識別先前未知漏洞的水平,並且很快就會在漏洞搜尋的速度和規模上超越安全專家。預計隨著已識別漏洞數量的不斷增長,現有的漏洞揭露流程將需要進行改革,因為目前90天的修補期限將遠遠不夠。

來源: opennet.ru

為具有 DDoS 保護、VPS VDS 服務器的站點購買可靠的主機 🔥 購買具備 DDoS 防護的可靠網站寄存服務,包括 VPS 和 VDS 伺服器 | ProHoster