Polymarket 套利聖經：真正的差距在數學基礎設施

By: rootdata|2026/03/11 14:13:43

原文標題：The Math Needed for Trading on Polymarket (Complete Roadmap)

原文作者：Roan，加密分析師

原文編譯：MrRyanChi

在創立 @insidersdotbot 的過程中，我跟不少高頻做市團隊和套利團隊深有過深度的交流，其中，最大的一个需求，就是怎麼做套利策略。

我們的用戶，朋友，合作夥伴，都在探索著 Polymarket 套利這一條複雜且多維度的交易路線。如果你是一個推特的活躍用戶，那麼我相信你也曾經刷到過「我通過 XX 套利策略，從預測市場上賺了多少錢」這樣的推文。

然而，大部分文章都過度簡化了套利的底層邏輯，讓套利變成了「我上我也行」，「用 Clawdbot 就能解決」的交易模式，而並沒有去詳細解釋怎樣系統性地去理解並開發屬於自己的套利系統。

如果你想理解 Polymarket 上的套利工具是怎麼賺到錢，這篇文章，是我目前看到的最完整的解讀。

由於英文原文有很多過於技術性，需要進行進一步研究的部分，我幫大家進行了重構和補充，方便大家只需要這一篇文章，不需要停下來查資料，就可以理解全部重點內容。

Polymarket 套利並不是簡單的數學問題

你在 Polymarket 上看到一個市場：

YES 價格 $0.62，NO 價格 $0.33。

你心想：0.62 + 0.33 = 0.95，不到 1 塊錢，有套利空間！同時買 YES 和 NO，花 $0.95，無論結果如何都能拿回 $1.00，淨賺 $0.05。

你是對的。

但問題是------當你還在手動算這道加法題的時候，量化系統已經在做一件完全不同的事。

它們在同時掃描 17,218 個條件，跨越 2^63 種可能的結果組合，在毫秒級別內找到所有定價矛盾。等你下完兩筆訂單，價差已經消失了。系統早就在幾十個相關市場裡找到了同樣的漏洞，算好了考慮訂單簿深度和手續費之後的最優倉位大小，並行執行了所有交易，然後把資金轉向了下一個機會。[1]

差距不只是速度。是數學基礎設施。

第一章：為什麼「加法」不夠用------邊際多面體問題

單一市場謬誤

先看一個簡單的例子。

市場 A：「特朗普會贏下賓夕法尼亞的選舉嗎？」
- YES 價格 $0.48，NO 價格 $0.52。加起來正好 $1.00。
- 看起來完美，沒有套利空間，對吧？

錯。

加一個市場，問題就來了

再看市場 B：「共和黨會在賓夕法尼亞超越對手 5 個百分點以上嗎？」

YES 價格 $0.32，NO 價格 $0.68。加起來也是 $1.00。

兩個市場各自都「正常」。但這裡有一個邏輯依賴關係：

美國總統大選不是全國一起數票，而是按州計票。每個州是一個獨立的「戰場」，誰在這個州拿到更多選票，誰就贏走這個州所有的選舉人票（贏者通吃）。特朗普是共和黨候選人。所以「共和黨在賓夕法尼亞贏」和「特朗普在賓夕法尼亞贏」------是同一件事。如果共和黨贏了對手 5 個百分點以上，那不僅意味著特朗普贏了賓夕法尼亞，而且贏得很大。

換句話說，市場 B 的 YES（共和黨大勝）是市場 A 的 YES（特朗普獲勝）的一個子集------大勝一定意味著獲勝，但獲勝不一定意味著大勝。

而這種邏輯依賴，就創造了套利機會。

這就像是你在賭兩件事------「明天會下雨嗎」和「明天會有雷暴嗎」。

如果有雷暴，那一定在下雨（雷暴是下雨的子集）。所以「雷暴 YES」的價格不可能比「下雨 YES」的價格高。如果市場定價違反了這個邏輯，你就可以同時買低賣高，賺到「無風險利潤」，這就是套利。

指數爆炸：為什麼暴力搜索行不通

對於任何有 n 個條件的市場，理論上有 2^n 種可能的價格組合。

聽起來還行？來看一個真實案例。

2010 年 NCAA 錦標賽市場 [2]：63 場比賽，每場有贏/輸兩種結果。可能的結果組合數是 2^{63} = 9,223,372,036,854,775,808------超過 9 百億億種。市場上有 5000 多個盘口。

2^{63} 這個數字有多大？如果你每秒檢查 10 億種組合，需要大約 292 年 才能全部檢查完。這就是為什麼「暴力搜索」在這裡完全行不通。逐一檢查每種組合？計算上不可能。

再看 2024 年美國大選。研究團隊發現了 1,576 對可能存在依賴關係的市場對。如果每對市場各有 10 個條件，那每對需要檢查 2^{20} = 1,048,576 種組合。乘以 1,576 對。你的筆記本電腦算完的時候，選舉結果早就出來了。

整數規劃：用約束代替枚舉

量化系統的解決方案不是「更快地枚舉」，而是根本不枚舉。

它們用整數規劃（Integer Programming）來描述「哪些結果是合法的」。

來看一個真實例子。Duke 對 Cornell 的比賽市場：每支球隊有 7 個盘口（0 到 6 場勝利），總共 14 個條件，2^{14} = 16,384 種可能組合。

但有一個約束：它們不可能都贏 5 場以上，因為那樣它們會在半決賽相遇（只有一個能晉級）。

整數規劃怎麼處理？三條約束就夠了：

約束一：Duke 的 7 個盘口裡，恰好有一個為真（Duke 只能有一個最終勝場數）。
約束二：Cornell 的 7 個盘口裡，恰好有一個為真。
約束三：Duke 贏 5 場 + Duke 贏 6 場 + Cornell 贏 5 場 + Cornell 贏 6 場小於等於 1（它們不能同時贏那麼多）。

三條線性約束，替代了 16,384 次暴力檢查。

暴力搜索 vs 整數規劃

換言之，暴力搜索就像是把字典裡的每個單詞都讀一遍來找一個詞。整數規劃就像是直接翻到那個字母開頭的頁面。你不需要檢查所有可能性，你只需要描述「合法答案長什麼樣」，然後讓算法去找違反規則的定價。

真實數據：41% 的市場存在套利 [2]

原文中提到，研究團隊分析了 2024 年 4 月到 2025 年 4 月的數據：

檢查了 17,218 個條件
其中 7,051 個條件存在單一市場套利（佔 41%）
中位數定價偏差：$0.60（應該是 $1.00）
13 對確認的跨市場可利用套利

中位數偏差 $0.60 意味著市場經常性地偏離 40%。這不是「接近有效」，這是「大規模可利用」。

第二章：Bregman 投影------怎麼算出最優套利交易

發現套利是一個問題。算出最優的套利交易是另一個問題。

你不能簡單地「取個平均」或者「微調一下價格」。你需要把當前的市場狀態投影到無套利的合法空間上，同時保留價格裡的信息結構。

為什麼「直線距離」不行

最直覺的想法是：找到離當前價格最近的「合法價格」，然後交易差價。

用數學語言說，就是最小化歐幾里得距離：$||\mu - \theta||^2$

但這有一個致命問題：它把所有價格變動當成一樣的。

從 $0.50 漲到 $0.60，和從 $0.05 漲到 $0.15，都是漲了 10 美分。但它們的信息含量完全不同。

為什麼？因為價格代表的是隱含概率。從 50% 變到 60%，是一個溫和的觀點調整。從 5% 變到 15%，是一個巨大的信念翻轉------一個幾乎不可能的事件突然變成了「有點可能」。

想像你在稱體重。從 70 公斤變到 80 公斤，你會說「胖了一點」。但從 30 公斤變到 40 公斤（如果你是成年人），那就是「從瀕死變成了嚴重營養不良」。同樣是 10 公斤的變化，意義完全不同。價格也是一樣------越接近 0 或 1 的價格變動，信息量越大。

Bregman 散度：正確的「距離」

Polymarket 的做市商使用的是 LMSR（對數市場評分規則）[4]，價格本質上代表概率分佈。

在這種結構下，正確的距離度量不是歐幾里得距離，而是 Bregman 散度。[5]

對於 LMSR，Bregman 散度就變成了 KL 散度（Kullback-Leibler 散度)[6]------一個衡量兩個概率分佈之間「信息論距離」的指標。

你不需要記住公式。你只需要理解一件事：

KL 散度會自動給「極端價格附近的變動」更高的權重。從 $0.05 到 $0.15 的變動，在 KL 散度下比從 $0.50 到 $0.60 的變動「更遠」。這正好符合我們的直覺------極端價格的變動意味著更大的信息衝擊。

一個比較好的例子，就是上次 @zachxbt 的預測市場中，Axiom 在最後關頭反超 Meteora，也是以極端價格變動，作為一切變化的。

Bregman 投影 vs 歐幾里得投影

套利利潤 = Bregman 投影的距離

這是原文作者參考整篇論文最核心的結論之一：

任何交易能獲得的最大保證利潤，等於當前市場狀態到無套利空間的 Bregman 投影距離。

換句話說：市場價格偏離「合法空間」越遠，能賺的錢越多。而 Bregman 投影會告訴你：

該買賣什麼（投影方向告訴你交易方向）
該買賣多少（考慮訂單簿深度）
能賺多少（投影距離就是最大利潤）

排名第一的套利者一年賺了 $2,009,631.76。[2]他的策略就是比所有人更快、更準地解這道優化題。

邊際多面體與套利

打個比方來說，想像你站在一座山上，山腳下有一條河（無套利空間）。你現在的位置（當前市場價格）離河有一段距離。

Bregman 投影就是幫你找到「從你的位置到河邊的最短路徑」------但不是直線距離，而是考慮了地形（市場結構）之後的最短路徑。這條路徑的長度，就是你能賺到的最大利潤。

第三章：Frank-Wolfe 算法------讓理論變成可執行的代碼

好，現在你知道了：要算最優套利，就要做 Bregman 投影。

但問題是------直接計算 Bregman 投影是不可行的。

為什麼？因為無套利空間（邊際多面體 M）有指數級多的頂點。標準的凸優化方法需要訪問完整的約束集，也就是枚舉每一個合法結果。我們剛才說了，這在規模化場景下是不可能的。

Frank-Wolfe 的核心思想

Frank-Wolfe 算法 [7] 的天才之處在於：它不試圖一次性搞定整個問題，而是一步一步逼近答案。

它的工作方式是這樣的：

第一步：從一個小的已知合法結果集合開始。
第二步：在這個小集合上做優化，找到當前最優解。
第三步：用整數規劃找到一個新的合法結果，加入集合。
第四步：檢查是否足夠接近最優解。如果不夠，回到第二步。

每一輪迭代，集合只增加一個頂點。即使跑了 100 輪，你也只需要追蹤 100 個頂點------而不是 2^{63} 個。

Frank-Wolfe 迭代過程

想像你在一個巨大的迷宮裡找出口。

暴力方法是把每條路都走一遍。Frank-Wolfe 的方法是：先隨便走一條路，然後在每個岔路口問一個「向導」（整數規劃求解器）：「從這裡開始，哪個方向最可能通向出口？」然後朝那個方向走一步。你不需要探索整個迷宮，只需要在每個關鍵節點做出正確的選擇。

整數規劃求解器：每一步的「向導」

Frank-Wolfe 的每一輪迭代都需要解一個整數線性規劃問題。這在理論上是 NP 困難的（也就是「沒有已知的快速通用算法」）。

但現代求解器，比如 Gurobi[8]，對於結構良好的問題可以高效求解。

研究團隊用的是 Gurobi 5.5。實際求解時間：

早期迭代（少量比賽已結束）：不到 1 秒
中期（30-40 場比賽已結束）：10-30 秒
後期（50+ 場比賽已結束）：不到 5 秒

為什麼後期反而更快？因為隨著比賽結果確定，可行解空間在縮小。變量更少，約束更緊，求解更快。

梯度爆炸問題和 Barrier Frank-Wolfe

標準的 Frank-Wolfe 有一個技術問題：當價格接近 0 的時候，LMSR 的梯度會趨向負無窮。這會導致算法不穩定。

解決方案是 Barrier Frank-Wolfe ：不在完整的多面體 M 上優化，而是在一個稍微「收縮」的版本 M 上優化。收縮參數 ε 會隨著迭代自適應地減小------開始時離邊界遠一點（穩定），後來逐漸逼近真實邊界（精確）。

研究表明，實際操作中 50 到 150 輪迭代就足夠收斂。

真實表現

論文裡有一個關鍵發現 [2]：

在 NCAA 錦標賽的前 16 場比賽中，Frank-Wolfe 做市商（FWMM）和簡單的線性約束做市商（LCMM）表現差不多------因為整數規劃求解器還太慢。

但在 45 場比賽結束後，第一次成功的 30 分鐘投影完成了。

從那以後，FWMM 在盘口定價上比 LCMM 好了 38%。

轉折點就是：當結果空間縮小到整數規劃能在交易時間窗口內完成求解的時候。

FWMM 就像一個學生，考試前半段還在熱身，但一旦進入狀態，就開始碾壓。LCMM 是那個一直穩定發揮但天花板有限的學生。關鍵區別是：FWMM 有更強的「武器」（Bregman 投影），只是需要時間來「裝彈」（等求解器跑完）。

第四章：執行------為什麼算出來了還可能虧錢

你檢測到了套利。你用 Bregman 投影算出了最優交易。

現在你需要執行。

這是大多數策略失敗的地方。

非原子執行問題

Polymarket 使用的是 CLOB（中央限價訂單簿）[9]。跟去中心化交易所不同，CLOB 上的交易是順序執行的------你不能保證所有訂單同時成交。

你的套利計劃：

買 YES，價格 $0.30。買 NO，價格 $0.30。總成本 $0.60。無論結果如何，回收 $1.00。利潤 $0.40。

現實：

提交 YES 訂單成交價 $0.30 ✓
你的訂單改變了市場價格。
提交 NO 訂單成交價 $0.78 ✗
總成本：$1.08。回收：$1.00。實際結果：虧 $0.08。

一條腿成交了，另一條沒有。你暴露了。

這就是為什麼論文只統計利潤空間超過 $0.05 的機會。更小的價差會被執行風險吃掉。

非原子執行風險

VWAP：真實的成交價格

不要假設你能以報價成交。要計算成交量加權平均價格（VWAP）[10]。

研究團隊的方法是：對 Polygon 鏈上的每個區塊（大約 2 秒），計算該區塊內所有 YES 交易的 VWAP 和所有 NO 交易的 VWAP。如果 |VWAP_yes + VWAP_no - 1.0| > 0.02，就記錄為一次套利機會 [2]。

VWAP 就是「你實際付的平均價格」。如果你想買 10,000 個代幣，但訂單簿上 $0.30 只有 2,000 個，$0.32 有 3,000 個，$0.35 有 5,000 個------你的 VWAP 就是 $(2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = 0.326。比你看到的「最優價格」$0.30 貴了不少。

流動性約束：能賺多少取決於訂單簿深度

即使價格確實有偏差，你能賺到的利潤也受限於可用流動性。

真實例子 [2]：

市場顯示套利：YES 價格之和 = $0.85。潛在利潤：每美元 $0.15。但這些價格上的訂單簿深度只有 $234。最大可提取利潤：$234 × 0.15 = $35.10。

對於跨市場套利，你需要在所有倉位上同時有流動性。最小的那個決定了你的上限。

這也是為什麼，在現有量化平台中，展現出訂單價格對成交價格對影響至關重要。

第五章：完整系統------實際部署了什麼

理論是乾淨的。生產環境是混亂的。

這是一個真正能跑的套利系統長什麼樣 [2]。

數據管道

實時數據：WebSocket 連接 Polymarket 上的 API [9]，接收訂單簿更新（價格/數量變化）、成交推送、市场创建/結算事件。
歷史數據：通過 Alchemy Polygon 節點 API 查詢合約事件------OrderFilled（交易執行）、PositionSplit（新代幣鑄造）、PositionsMerge（代幣銷毀）。

研究團隊分析了 8600 萬筆交易 [2]。這個量級需要基礎設施，不是腳本能搞定的。

目前也有計劃開源高速交易 API，如果有計劃使用類似的交易模型，希望能夠第一時間體驗 API，也可以隨時 DM 我。

依賴關係檢測層

對於 305 個美國大選市場，有 46,360 對可能的組合需要檢查。手動分析不可能。

研究團隊用了一个聪明的方法：用 DeepSeek-R1-Distill-Qwen-32B 大語言模型來做初篩。

輸入：兩個市場的條件描述。
輸出：合法結果組合的 JSON。

然後做三層驗證：每個市場是否恰好有一個條件為真？合法組合數是否少於 $n \times m$（存在依賴）？依賴子集是否滿足套利條件？

結果：40,057 對獨立（無套利）1,576 對有依賴（潛在套利）374 對滿足嚴格條件 13 對經人工驗證可利用 [2]。

LLM 在複雜多條件市場上的準確率是 81.45%。足夠用來做初篩，但執行前需要人工驗證。

三層優化引擎

第一層：簡單線性約束（LCMM）。快速檢查基本規則------「概率之和等於 1」、「如果 A 蕴含 B，那 P(A) 不能超過 P(B)」。毫秒級完成，去除明顯的定價錯誤。
第二層：整數規劃投影（Frank-Wolfe + Gurobi） 。這是核心。參數：Alpha = 0.9（提取至少 90% 的可用套利），初始 $\epsilon$ = 0.1（10% 收縮），收斂閾值 = 1e-6，時間限制 = 30 分鐘。典型迭代次數：50-150 次。每次迭代求解時間：1-30 秒。
第三層：執行驗證。在提交訂單之前，模擬當前訂單簿上的成交。檢查：流動性是否充足？預期滑點是多少？扣除滑點後的保證利潤是多少？利潤是否超過最低門檻（$0.05）？只有全部通過才執行。

倉位管理：改良版 Kelly 公式

標準的 Kelly 公式 [11] 告訴你該把多少比例的資金投入一筆交易。但在套利場景下，需要加入執行風險的調整：
f = (b×p - q) / b × √p

其中 b 是套利利潤百分比，p 是完全執行的概率（根據訂單簿深度估算），q = 1 - p。

上限：訂單簿深度的 50%。超過這個比例，你的訂單本身就會大幅移動市場。

最終結果

2024 年 4 月到 2025 年 4 月，總提取利潤：

單一條件套利：低買兩邊 $5,899,287 + 高賣兩邊 $4,682,075 = $10,581,362
市場再平衡：低買所有 YES $11,092,286 + 高賣所有 YES $612,189 + 買所有 NO $17,307,114 = $29,011,589
跨市場組合套利：$95,634

總計：$39,688,585

前 10 名套利者拿走了 $8,127,849（總額的 20.5%）。排名第一的套利者：$2,009,632，來自 4,049 筆交易，平均每筆 $496[2]。

不是彩票。不是運氣。是數學精度的系統化執行。