人工智慧發現漏洞的速度已經超過了修復漏洞的速度。

By: blockbeats|2026/03/30 18:00:01

三月二十七日，Anthropic的一個未受保護的數據快取洩漏了約三千份內部文件。一篇部落格草稿透露了即將推出的新模型「Mythos」，Anthropic將其自評為「在網路安全能力方面遠超任何人工智慧模型」。同日，CrowdStrike和Okta的股價均暴跌七%，而Palo Alto Networks的股價則下跌六%。

市場之所以恐慌，並不是因為出現了更強大的機型。這是因為該模型的創作者指出，其在攻擊方面的進展已經超過了防守方能夠跟上的速度。

人工智慧在網路安全領域的領先指數

根據學術基準測試平台CAIBench的測試結果，在模擬真實攻防環境的Cybench測試中，Claude Sonnet的成功率達到了46%。排名第二的GPT-5為28%，谷歌的Gemini 2.5 Pro僅達到18%，而開源模型qwen3-32B則更低，僅為10%。

人工智慧發現漏洞的速度已經超過了修復漏洞的速度。

雖然46%這個數字看似不高，但這卻是複雜滲透任務的成功率，其中包含漏洞發現、構建利用鏈以及權限提升等步驟。在一項更基礎的基準測試中，克勞德的成功率已達到75%，接近其上限。

區別不在於誰稍微好一點，而在於程度上的差異。Claude的綜合攻防能力是GPT-5的1.6倍，是Gemini的2.5倍。在網路安全的這一維度中，各模型能力分布的狀況並非呈階梯狀，而是存在巨大差距。

六個月內翻一番

更值得分析的不是水平間距，而是垂直速度。

根據Anthropic的官方數據，2025年二月發布的Sonnet 3.7在Cybench測試中（十次嘗試）取得了35.9%的成功率。同年下半年，Sonnet 4.5的市場份額達到76.5%。Anthropic研究團隊得出的結論是：在6個月內，成功率翻了一番。

這個速度意味著什麼？在實際場景的對比中：今年三月，我們使用Claude Opus 4.6對Firefox代碼庫進行了審核。據InfoQ報導，兩週內共發現了22個安全漏洞，其中14個屬於高風險漏洞。儘管經過多年的人工審計和數百萬小時的CPU模糊測試，這些漏洞仍未被發現。Anthropic的安全團隊此前披露，Claude在多個生產級開源項目中發現了500多個高風險漏洞，其中一些漏洞已存在數十年之久。

而傳統滲透測試的行業標準周期為2至3週，這還只是針對一個應用程序的情況。根據威瑞森（Verizon）《2025年數據洩露調查報告》，從關鍵漏洞公開披露到遭到攻擊者大規模利用的中位數時間為5天，而發布補丁所需的中位數時間為32至38天。

人工智慧發現漏洞的速度正在呈指數級增長，而人類修復漏洞的速度卻只是線性增長。時間差就是攻擊窗口。

在洩露的Mythos草案中，Anthropic寫道，該模型「預示著新一波模型的到來，這些模型能夠以遠超防禦者應對能力的方式利用漏洞。」根據已知的性能曲線來看，這絕非誇大其詞。

發布越快，警告越緊急。

如果將Anthropic過去三年的行動按時間順序排列，您會發現一個明顯的規律：每當推出更強大的模型，緊接著就會採取更高級別的安全應對措施。

2023年七月，白宮簽署了一項自願承諾，隨後於同年九月發布了首份《負責任擴展政策》（RSP v1.0）。2024年十月，RSP升級至2.0版，新增了針對生化武器能力的閾值。2025年十一月，Anthropic披露了GTG-1002事件。一個由中國支持的威脅組織利用「克勞德代碼」（Claude Code）對約30家機構發動了攻擊，在整個行動過程中，80%至90%的戰術行動均由人工智慧獨立執行。這是有紀錄以來首次由人工智慧策劃的大規模跨組織間諜活動。

2026年二月，RSP更新至3.0版，並同步發布了Claude Code Security。同月，五角大樓將Anthropic列為「供應鏈風險」，原因是Anthropic拒絕撤銷合約中禁止大規模監控和完全自主武器的條款。一個月後，Mythos的洩露文件顯示，Anthropic在草案中承認，該模型帶來了「前所未有的網絡安全風險」。