人工智慧發現漏洞的速度已經超過了修復漏洞的速度。

By: blockbeats|2026/03/30 18:00:01
0
分享
copy

三月二十七日,Anthropic的一個未受保護的數據快取洩漏了約三千份內部文件。一篇部落格草稿透露了即將推出的新模型「Mythos」,Anthropic將其自評為「在網路安全能力方面遠超任何人工智慧模型」。同日,CrowdStrike和Okta的股價均暴跌七%,而Palo Alto Networks的股價則下跌六%。

市場之所以恐慌,並不是因為出現了更強大的機型。這是因為該模型的創作者指出,其在攻擊方面的進展已經超過了防守方能夠跟上的速度。

人工智慧在網路安全領域的領先指數

根據學術基準測試平台CAIBench的測試結果,在模擬真實攻防環境的Cybench測試中,Claude Sonnet的成功率達到了46%。排名第二的GPT-5為28%,谷歌的Gemini 2.5 Pro僅達到18%,而開源模型qwen3-32B則更低,僅為10%。

人工智慧發現漏洞的速度已經超過了修復漏洞的速度。

雖然46%這個數字看似不高,但這卻是複雜滲透任務的成功率,其中包含漏洞發現、構建利用鏈以及權限提升等步驟。在一項更基礎的基準測試中,克勞德的成功率已達到75%,接近其上限。

區別不在於誰稍微好一點,而在於程度上的差異。Claude的綜合攻防能力是GPT-5的1.6倍,是Gemini的2.5倍。在網路安全的這一維度中,各模型能力分布的狀況並非呈階梯狀,而是存在巨大差距。

六個月內翻一番

更值得分析的不是水平間距,而是垂直速度。

根據Anthropic的官方數據,2025年二月發布的Sonnet 3.7在Cybench測試中(十次嘗試)取得了35.9%的成功率。同年下半年,Sonnet 4.5的市場份額達到76.5%。Anthropic研究團隊得出的結論是:在6個月內,成功率翻了一番。

這個速度意味著什麼?在實際場景的對比中:今年三月,我們使用Claude Opus 4.6對Firefox代碼庫進行了審核。據InfoQ報導,兩週內共發現了22個安全漏洞,其中14個屬於高風險漏洞。儘管經過多年的人工審計和數百萬小時的CPU模糊測試,這些漏洞仍未被發現。Anthropic的安全團隊此前披露,Claude在多個生產級開源項目中發現了500多個高風險漏洞,其中一些漏洞已存在數十年之久。

而傳統滲透測試的行業標準周期為2至3週,這還只是針對一個應用程序的情況。根據威瑞森(Verizon)《2025年數據洩露調查報告》,從關鍵漏洞公開披露到遭到攻擊者大規模利用的中位數時間為5天,而發布補丁所需的中位數時間為32至38天。

人工智慧發現漏洞的速度正在呈指數級增長,而人類修復漏洞的速度卻只是線性增長。時間差就是攻擊窗口。

在洩露的Mythos草案中,Anthropic寫道,該模型「預示著新一波模型的到來,這些模型能夠以遠超防禦者應對能力的方式利用漏洞。」根據已知的性能曲線來看,這絕非誇大其詞。

發布越快,警告越緊急。

如果將Anthropic過去三年的行動按時間順序排列,您會發現一個明顯的規律:每當推出更強大的模型,緊接著就會採取更高級別的安全應對措施。

2023年七月,白宮簽署了一項自願承諾,隨後於同年九月發布了首份《負責任擴展政策》(RSP v1.0)。2024年十月,RSP升級至2.0版,新增了針對生化武器能力的閾值。2025年十一月,Anthropic披露了GTG-1002事件。一個由中國支持的威脅組織利用「克勞德代碼」(Claude Code)對約30家機構發動了攻擊,在整個行動過程中,80%至90%的戰術行動均由人工智慧獨立執行。這是有紀錄以來首次由人工智慧策劃的大規模跨組織間諜活動。

2026年二月,RSP更新至3.0版,並同步發布了Claude Code Security。同月,五角大樓將Anthropic列為「供應鏈風險」,原因是Anthropic拒絕撤銷合約中禁止大規模監控和完全自主武器的條款。一個月後,Mythos的洩露文件顯示,Anthropic在草案中承認,該模型帶來了「前所未有的網絡安全風險」。

能力發布的步伐正在加速。從Claude 1到Claude 3相隔一年,而從Opus 4.5到Opus 4.6則不到三個月。安全應對措施也在加速,但它們總是被動應對:安全漏洞首先被利用,安全策略補丁隨後才跟上。三月27日網絡安全類股票的集體下跌,正是市場對這一時間差的定價。

今年早些時候,Dark Reading的一項調查顯示,48%的網絡安全專業人士認為,基於人工智能的代理將是2026年的首要攻擊途徑。兩年前,這個選項幾乎不在考慮之列。

Anthropic的Mythos發布策略包括向防禦型組織提供早期訪問權限,「賦予他們先發優勢」。這一表述本身就承認了攻防雙方的不對等。如果防守方不需要先發優勢,那就意味著進攻方尚未逼近門前。

-- 價格

--

猜你喜歡

熱門幣種

最新加密貨幣要聞

閱讀更多