2026年,普通人如何開始量化交易?

By: blockbeats|2026/04/02 18:00:23
0
分享
copy
原文標題:如果我明天不得不從頭開始成為量化交易員
原文作者:gemchanger、coldvision 創始人
翻譯、註釋:MrRyanChi、insiders.bot

在 2026 年,量化交易是每位交易員的基本技能

上週,我應邀參加了香港大學人工智能與管理協會(@camo_hku)的活動,分享了關於智能代理時代的賺錢方法。整個活動中,我最大的收穫是一件事,那就是:

人工智能時代 = 技術普惠時代

過去,量化交易是少數機構的專利。而現在,無數工作室甚至個人都參與制定量化交易策略並從中獲利。換句話說,如果你還不了解量化的本質,那麼你將在市場上處於極大劣勢。

在 OpenClaw 盛行的今天,任何人都可以通過量化賺錢。但這需要兩個前提條件。

首先,是基礎設施,這正是我們在 @insidersdotbot 通過打造智能代理和原生算法交易平台、數據庫和技能所努力實現的。正式版基於智能代理的回測功能也將成為這個生態系統的一部分。

其次,作為個人最重要的是架構能力和策略設計能力。策略並不需要 100% 準確,但一定要獨特、精巧,能抓住他人意識不到的大機遇。

只要你擁有專屬於自己的策略和強大的基礎設施,加上 Vibe Coding 的支持,你就離財務自由不遠了。

而在學習策略與架構方面,@gemchange_ltd 的這篇原文是我目前看到的、最完整的一份「量化交易知識地圖」。它以預測市場為核心,將成為頂尖量化交易員所需的每個拼圖按照正確的學習順序一次性闡述清楚。

相信看完它,就算是小白,你也能了解如何開始量化交易,以及如何設計屬於你的策略。

如果你是預測市場交易員,那這就是你必讀的文章。

如果你是其他資產的交易者,這篇文章的很多思路都是通用的,相信你也能受用無窮。

原文非常硬核且學術。為了讓任何剛接觸 Polymarket、甚至沒有任何數學背景的用戶也能看懂,我進行了大量的改寫和補充。我假設你對複雜的數學一無所知,為你增加了 20 張全中文的圖解,並用最接地气的大白話、通俗的類比和實際的例子,幫你拆解每一個概念。

如果你想在預測市場裡長期賺錢,而不是當一個賭徒,這篇文章就是你的起點。

對了,這篇文章在結構上針對 Agent 進行了優化。就好像 insiders.bot 平臺對真人和 AI 交易員都進行了優化一樣。所以,歡迎大家把這篇文章餵給你的 OpenClaw,Manus,Claude,或者任何一個 AI,然後立刻開始建立你的量化模型。

2026年,普通人如何開始量化交易?

序言:你是在交易,還是在賭博?

先問你一個問題。

你在 Polymarket 上看到一個合約,「特朗普贏得大選」的 YES 價格是 $0.52。你覺得他贏的概率更高,於是花了 $520 買了 1000 股 YES。

你覺得你在做交易。但實際上,你只是在賭博。因為你沒有回答過這些問題:

* 你的 52% 是怎麼算出來的?

* 你的信息來源比市場上的其他參與者更好嗎?

* 如果明天出了一條新聞,你的概率估計應該怎麼更新?

* 你應該買多少倉位,才能在「萬一猜錯」的情況下不爆倉?

這些問題,不是靠「感覺」能回答的。它們需要數學。

2025年,頂級量化公司(Jane Street、Citadel、HRT)的新入行量化交易員的年薪介於30萬美元至50萬美元之間。人工智慧和機器學習在金融招聘領域同比增長了88%。這不是因為這些公司喜歡數學家,而是因為數學確實能夠通過更準確的估值模型賺錢。

而 Polymarket 恰好是一個將所有量化金融的核心概念完美融合在一起的交易市場:概率論、資訊論、凸優化、整數規劃,全部派得上用場。

第一章:概率,不確定世界的唯一語言

大多數人對量化交易存在一個巨大的誤解。他們認為量化交易就是「選股」,是對某個事件有獨到見解。

實際上根本不是。

量化交易的本質 = 純數學。

更具體地說,你在尋找的是:

* 統計學上的相關性

* 定價的低效

* 結構性的優勢。

這些優勢之所以存在,是因為市場是一個由人類構成的複雜系統,而人類總是會犯系統性錯誤。

在量化金融的世界中,所有問題最終都可以簡化為一個問題:賠率是多少,以及這個賠率對我來說有多大的優勢?

因此首先,你需要深刻理解「概率」的本質。

-- 價格

--

條件思維:告別絕對的對與錯

普通人思考問題時,喜歡使用絕對的對與錯。一件事要麼發生,要麼不發生。

但量化交易員的思維方式是條件式的。

他們會問:在已知某些信息的情況下,這件事發生的可能性有多大?

「已知某些信息時的概率」就是條件概率。

簡單來說:當你獲得了一個新線索,原本的概率會如何變化?

聽起來有點複雜?我們來看一個 Polymarket 上的實際例子。

假設你在交易一個「某某代幣今天是否會漲」的合約。歷史數據顯示,這個代幣每天上漲的概率是 60%。這就是基礎概率(Base Rate)。但是,如果今天該代幣的交易量超過了歷史平均水平,它上漲的概率會變成 75%。

那個 75% 的條件概率,才是真正的「信號」。而那個孤立的 60%,只是充滿噪音的背景數據。

再舉一個更直觀的例子。下雨的概率是 30%。但如果天上已經烏雲密布了呢?下雨的概率可能變成 85%。「烏雲密布」就是你的條件信息,它讓你的概率估計從 30% 跳到了 85%。這就是條件概率的本質。

貝葉斯定理:如何實時更新你的信念

貝葉斯定理是量化交易的靈魂。它回答的問題是:當你獲得了新的數據,你應該如何更新你原有的信念?

它的公式是這樣的:

P(A|B) = P(A∩B) / P(B)

* P(A|B) :已知 B 發生了,A 發生的概率

* P(A∩B):A 和 B 同時發生的概率

* P(B):B 發生的概率

貝葉斯定理的邏輯本質上是這樣的:

* 你心裡先有一個預估(比如:我覺得這件事有 50% 的概率發生)。

* 突然,你看到了一個新證據(比如:出了一條利好新聞)。

* 你問自己兩個問題:如果這件事真的會發生,出這條新聞的可能性有多大?如果這件事根本不會發生,出這條新聞的可能性又有多大?

* 根據這兩個問題的答案,你調整你心裡的預估(比如:從 50% 調高到 58%)。

我們用一個 Polymarket 的場景來理解。

你的模型計算出,某個盤口的合理價格應該是 $0.50(也就是你認為這件事發生的機率是 50%)。這是你的先驗信念。

突然,一條突發新聞出來了。經濟數據比預期好 3%。

通過貝葉斯公式,你可以精確計算出你的新信念。假設算出來是 58%。那你的新合理價格就是 $0.58。

在市場上,誰能最快、最準確地完成這種機率更新,誰就能賺走大部分的錢。這就是為什麼量化團隊要花幾百萬美元去建低延遲的系統。不是因為他們喜歡快,是因為快 0.1 秒就意味著多賺幾萬美元。

如果你想打好基礎,去讀一讀哈佛大學免費的《Introduction to Probability》(概率論導論),前 6 章就夠了。然後試著用 Python 寫個程式,模擬拋 10,000 次硬幣,親眼看看大數定律是怎麼運作的。

期望值與方差:你最好的兩個朋友

在交易中,有兩個數字比什麼都重要。

期望值(Expected Value, EV),你的確信度。

如果一筆交易的期望值是正的,意味著只要你重複做足夠多次,長期來看你一定會賺錢。

方差(Variance),你的風險。

它告訴你,在到達那個賺錢的「長期」之前,你會經歷多大的上下顛簸。

舉個例子。假設你有一個策略,每筆交易的期望收益是 $2,但標準差是 $50。這意味著雖然你「平均」每筆賺 $2,但單筆交易的結果可能在虧 $100 到賺 $100 之間劇烈波動。如果你的本金只有 $200,你可能在「長期」到來之前,就已經連虧三把爆倉出局了。

凱利公式:科學地決定下注大小

既然知道了期望值和方差,那面对一个好機會,我到底該買多少?全倉梭哈嗎?

絕對不行。這裡我們需要引入凱利公式(Kelly Criterion)。

凱利公式專門用來告訴你:在給定的勝率和賠率下,你應該把總資金的百分之幾押進去,才能讓你的錢滾雪球滾得最快,同時又不會破產。

如果算出來是 20%,意味著你最多只能拿總資金的 20% 去下注。

在實戰中,因為我們對勝率的估計往往有誤差(你以為你有 60% 的勝率,其實可能只有 55%),頂尖的寬客通常會使用「半凱利」(Half Kelly),也就是只下注凱利公式計算結果的一半。這能大幅降低資金的上下顛簸,同時保留大部分的賺錢速度。

第一章課後作業(每天 2 小時,約 3-4 週完成):

1. 閱讀:閱讀 Blitzstein & Hwang 合著的《概率論導論》(哈佛提供免費 PDF 版本,鏈接:http://probabilitybook.net[[1」(https://stat110.hsites.harvard.edu/))

2. 編程練習 1:模擬 10,000 次拋硬幣,用圖表直觀驗證「大數定律」。

3. 編程練習 2:實現一個貝葉斯更新器:輸入先驗概率和似然函數,輸出後驗概率。

第二章:統計學 = 你的噪音探測器

當你學會了概率的語言,下一步就是學會「傾聽數據」。

這就是統計學。

統計學教給我們的第一課就是:絕大多數看起來像「信號」的東西,其實都是噪音。

假設檢驗與多重比較陷阱

假設你寫了一個交易機器人,回測數據顯示它每年能賺 15%。這是真的嗎,還是只是運氣好?

這時候你需要算一個 p 值(p-value):如果這個策略其實是個垃圾(純靠蒙),它能碰巧跑出 15% 收益的概率有多大?統計學就能告訴你,這個概率有多小(比如小於 5%)。

但是,這裡有一個巨大的陷阱,叫做多重比較問題(Multiple Comparisons Problem)。

想象一下,你讓 1,000 只猴子各扔 100 次飛鏢。純粹靠運氣,總有幾隻猴子能連續命中紅心,看起來簡直就是「飛鏢大師」。但你不會因此就僱傭它們當投資經理,對吧?

寫交易策略也是一樣。如果你用電腦自動生成了 1,000 個瞎蒙的策略去跑歷史數據,純靠運氣,也會有大約 50 個策略看起來能賺大錢。

每一個剛剛入行的新手,都會嚴重高估自己發現的「有效策略」。我可以負責任地告訴你,你寫出的前 10 個策略,絕對都是那幾隻運氣好的猴子。

解決辦法是什麼?你需要用邦費羅尼校正(Bonferroni correction)來提高你的顯著性門檻,或者使用錯誤發現率(FDR)控制。簡單來說,就是如果你測試了 100 個策略,你的顯著性門檻就不再是 0.05,而是 0.05/100 = 0.0005。這樣才能過濾掉運氣帶來的假信號。

回歸分析:拆解你的收益來源

線性回歸是金融界的主力工具。在量化交易中,你會把你的策略收益,跟大盤的漲跌放在一起對比。

這裡的截距項 α(Alpha),就是你的超額收益。它是那些不能被大盤漲跌解釋的、純靠你個人技術賺到的錢。

舉個例子。假設你的策略今年賺了 20%。但如果整個市場閉着眼睛買都能漲 18%,那你的技術得分(Alpha)其實只有 2%。

更慘的是,如果你的策略只是在「追漲殺跌」,那在剔除了大盤波動之後,你的 Alpha 可能變成了零甚至是負數。這說明你的所謂「交易優勢」,只不過是伪裝起來的隨波逐流罷了。

在金融数据中,这裡還有一個特別需要注意的問題:資料之間往往存在自相關性(今天的價格跟昨天有關)和異方差性(波動率不是恆定的)。所以你需要用 Newey-West 標準誤差來修正你的迴歸結果,否則你的統計檢定會給出過於樂觀的結論。

最大似然估計(MLE):反向推理的藝術

當你聽到一家頂級機構的寬客說他們在「校準」一個模型時,他們幾乎永遠是在說一件事:最大似然估計(MLE)。

MLE 的原理其實很好懂,它就是一種「反向推理」。

打個比方。你在路邊看到一個直徑 2 公尺的水坑。你想知道昨晚下了多大的雨。你有一個「降雨模型」,告訴你不同降雨量會產生多大的水坑。

MLE 做的事情就是反過來推:既然我已經看到了一個 2 公尺的水坑,那麼在所有可能的降雨量中,哪一個降雨量最有可能造出這麼大的水坑?

無論是給波動率擬合一個 GARCH 模型,還是根據市場報價校準期權定價,MLE 都是核心工具。

在交易中也是一樣。你看到了市場上期權的價格(水坑),你想反推市場對未來波動的預期(降雨量)。MLE 就是幫你找到那個「最能解釋當前價格」的隱藏參數。

作為一個聯繫,可以試著下載一些真實的資產價格資料(比如用 Python 的 yfinance 庫)。測試一下它們是否符合正態分佈。

劇透:絕對不符合。現實世界充滿了肥尾效應(Fat Tails),也就是極端事件發生的頻率遠遠高於正態分佈的預測。試著用 MLE 去擬合一個 t-分佈,看看真實的風險到底長什麼樣。

第二章課後作業(約 4-5 週完成):

1. 閱讀:閱讀 Wasserman 的《All of Statistics(統計學精要)》第 1 至第 13 章。(CMU 公開 PDF 版本:https://www.stat.cmu.edu/~brian/valerie/617-2022/0%20-%20books/2004%20-%20wasserman%20-%20all%20of%20statistics.pdf)

2. 程式設計練習 1:使用 yfinance 下載真實的股票收益率數據,對其進行正態性檢驗(劇透:很可能會被拒絕,說明收益率並不服從正態分佈)。然後使用最大概似估計(MLE)擬合一個 t 分佈,比較兩者的差異。

3. 程式設計練習 2:使用 statsmodels 庫,對一個股票組合運行 Fama-French 三因子迴歸。

4. 程式設計練習 3:實現一個置換檢驗(Permutation Test):將日期隨機打亂 10,000 次,比較打亂後的表現與實際表現的差異。

第三章:線性代數,量化世界的底層引擎

很多人覺得線性代數很無聊,就是一堆矩陣運算。但它其實是運行整個量化世界的機器。投資組合構建、主成分分析(PCA)、神經網路、協方差估計、因子模型,全都要靠它。

甚至,有江湖傳聞,年華 30%,真正打敗巴菲特的大獎章基金,就是以通過基於線性代數的馬爾可夫模型作為底層的。

如果你不能流利地使用矩陣來思考,你就不可能成為一名寬客。

協方差矩陣:理解資產的聯動

一個協方差矩陣 Σ(Sigma)捕捉了每一個資產相對於其他所有資產是如何移動的。

如果你在看 500 個市場,這個矩陣就是 500×500 的大小,包含 125,250 個獨特的條目。每一個條目都在告訴你:「當資產 A 漲的時候,資產 B 傾向於漲還是跌,漲跌的幅度有多大。」

而整個投資組合的變異,可以坍縮成一個極其優雅的數學表達式:

σ²_p = w^T Σ w

* w 是你的持有權重向量

* Σ 是協方差矩陣

這個二次型公式,是馬科維茨(Markowitz)投資組合理論的核心,是風險管理的核心,是一切的核心。

換言之,如果你同時在多個相關的盤口交易(比如「特朗普贏得大選」和「共和黨贏得參議院」),你的總風險不是簡單地把每個市場的風險加起來。你需要考慮它們之間的相關性。而協方差矩陣,就是幫你做這件事的工具。

特徵分解與 PCA:找到隱藏的驅動力

當你第一次使用特徵分解(Eigendecomposition)進行主成分分析(PCA)時,你看待世界的方式都會改變。

主成分分析可以用這樣一個類比來解釋:假設你要描述一個人的體型,你可以記錄他的身高、體重、臂長、腿長、肩寬等幾十個數據。但其實,這些數據很多都是聯動的(個子高的人通常腿也長)。PCA 的作用,就是把這幾十個繁雜的數據,濃縮成幾個核心的「隱藏標籤」,比如:「整體塊頭大小」和「胖瘦程度」。

在金融市場裡也是一樣。如果你觀察 500 個代幣的漲跌,你會發現,僅僅是前 5 個「隱藏標籤」(特徵向量),就能解釋整個市場 70% 的波動。剩下的所有東西,基本上都是噪音。

你不需要理解 500 個代幣各自在做什麼。你只需要理解這 5 個「隱藏的驅動力」(比如:大盤整體情緒、利率變化、特定賽道熱度等)。這就是降維的魔力。

如果有足夠的時間,建議去看看 MIT 的 Gilbert Strang 教授的線性代數公開課。然後用 Python 對標普 500 的收益率做一次 PCA 分解,親眼看看前幾個主成分是什麼。

你會發現,第一個主成分幾乎等於「整個市場的漲跌」。

第三章課後作業(約 4-6 週完成):

1. 觀看視頻: 看完 Gilbert Strang 的 MIT 18.06 線性代數全部課程視頻,一節都不能跳。(MIT OpenCourseWare 免費觀看:https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/video_galleries/video-lectures/)

2. 閱讀:閱讀 Strang 的《Introduction to Linear Algebra(線性代數導論)》,做書中的習題。(教材官網:https://math.mit.edu/~gs/linearalgebra/)

3. 編程練習 1:對標普 500 的收益率數據做 PCA(主成分分析)分解,畫出特徵值譜(即每個主成分解釋了多少方差),找出前 3 個最重要的主成分。

4. 編程練習 2:從零開始實現 Markowitz 均值-方差優化。

第四章:微積分與優化,捕捉變化的語言

微積分是關於「變化」的語言。在金融市場裡,一切都在變:價格、波動率、相關性,整個概率分佈都在以秒為單位發生偏移。

微積分就是用來描述和利用這些變化的。

導數與泰勒展開:用簡單逼近複雜

導數(Derivatives,這裡說的是數學上的導數,不是金融衍生品)出現在每一個神經網路的反向傳播中,也出現在每一個期權「希臘字母」(Greeks)的計算中。

在量化交易中,我們經常使用泰勒展開(Taylor expansion)來進行近似計算。而導數本質上,便是為泰勒展開提供了必要的輸入。

泰勒展開的意思就是,通過對一個多項式的微調,來模擬任何一個複雜的函數,從而對 x(關鍵因素)與 y(資產價格)之間的關係進行建模。

假設你要畫一條非常複雜的彎曲曲線,但你手裡只有直尺。怎麼辦?

第一步,你用一條直線去貼合曲線的某一點(這叫一階近似,在期權裡叫 Delta)。在這一點附近,直線和曲線差不多。

第二步,如果你想貼合得更好,你可以把直線稍微掰彎一點,變成一個抛物線(這叫二階近似,在期權裡叫 Gamma)。

你掰彎的次數越多,你畫出的線就越貼近那條複雜的曲線。

在交易中,期权的價格變化是一個極其複雜的公式。我們算不過來,所以就用泰勒展開,把它拆解成幾個簡單的部分:

價格方向的影響(Delta)+ 價格彎曲程度的影響(Gamma)+ 時間流逝的影響(Theta)+ 波動率變化的影響(Vega)。

凸優化:尋找最優解

在量化金融中,幾乎所有的「最優化」問題都可以表述為凸優化(Convex Optimization)問題。比如:在給定風險預算的情況下,怎麼分配資金才能讓收益最大化?

想象你被蒙上眼睛放在一個山谷裡,要求你走到谷底(最優解)。

* 如果這個山谷坑坑洼洼,你可能會走到一個半山腰的坑裡出不來(局部最優)。

* 但如果這是一個「碗」狀的完美山谷,你只需要一直順著下坡的方向走(梯度下降),你閉着眼睛都一定能走到最底部的那個唯一最低點(全局最優解)。

只要你能把金融問題寫成一個「碗」狀的數學公式,電腦就能瞬間幫你找到最完美的答案。這就是凸優化為你做的事情。原文作者提到,斯坦福大學的 Boyd 和 Vandenberghe 寫了一本免費的教材《Convex Optimization》,是這個領域的聖經。Python 的 cvxpy 庫可以讓你用幾行代碼就解決複雜的優化問題。

這裡也順手推薦一波 Andrew Ng 的 AI 課程,前幾期就會提到梯度下降和局部最優/全劇最優。方便大家更好理解凸優化的必要性。連結:https://www.youtube.com/watch?v=JPcx9qHzzgk

第四章課後作業(約 4-5 週完成):

1. 閱讀:閱讀 Boyd & Vandenberghe 的《Convex Optimization(凸優化)》第 1 至第 5 章。(斯坦福提供免費 PDF 版本:https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf,書籍主頁:https://stanford.edu/~boyd/cvxbook/)

2. 程式設計練習 1:從零開始實現梯度下降算法,用它來求 Rosenbrock 函數的最小值。(Rosenbrock 函數是優化領域最經典的測試函數之一,看起來簡單但實際上很難優化,非常考驗算法性能。)

3. 程式設計練習 2:用 cvxpy 求解一個投資組合優化問題,並加入交易成本约束。

第五章:隨機微積分,從數據科學家到真正寬客的蛻變

在學會隨機微積分之前,你只是一個「喜歡金融的數據科學家」。學會了它之後,你才是一個真正的寬客。

這是你學習如何在連續時間中對隨機性進行建模的地方。在這裡,你將從第一性原理推導出著名的 Black-Scholes 方程,並真正理解為什麼價值萬億美元的衍生品市場會以現在的這種方式運轉。

*注 5.1:想要更好地了解 Black-Scholes 方程以及其含義,可以參考上一篇「Polymarket 做市聖經」。鏈接:https://x.com/MrRyanChi/status/2033466480067747844

*注 5.2:為什麼隨機微積分(Itô calculus)和普通的微積分不一樣?正是因為在隨機過程中,二階泰勒項不會消失。在普通微積分裡,當時間間隔趨近於零時,二階項可以忽略不計。但在隨機過程中,由於布朗運動的特殊性質,(dW)² = dt,二階項變成了一階的量級,不能忽略。詳情見下文。

布朗運動:純粹隨機性的數學表達

布朗運動(也叫維納過程,W_t)是一個連續時間的隨機遊走。

想象一個醉漢在廣場上走路。他每走一步,方向都是完全隨機的。他走出的那條歪歪扭扭、毫無規律的軌跡,就是布朗運動。股票價格的跳動,在數學上就被看作是這種醉漢的步伐。

布朗運動的例子還有很多,比如科學上,空氣粒子的運動也是隨機的布朗運動。

這裡有一個決定一切的洞察:在布朗運動中,時間的流逝和距離的平方是等價的(即 (dW)² = dt)。正是因為這個性質,隨機微積分才跟普通微積分不一樣。

伊托引理:隨機世界的鏈式法則

股票價格通常用幾何布朗運動(GBM)來建模:

dS_t = μS_t dt + σS_t dW_t

翻譯:價格的變化 = 預期收益率帶來的趨勢 + 波動率帶來的隨機震盪

而伊托引理(Itô's Lemma),就是隨機世界裡的鏈式法則。

* 在普通的微積分裡(比如計算一輛平穩行駛的汽車的軌跡),你只需要考慮速度(一階導數)。

* 但在隨機微積分裡(比如計算一輛在極其顛簸的爛路上行駛的汽車軌跡),因為路面本身的顛簸(波動率)實在太劇烈了,這種顛簸會實質性地改變汽車的軌跡。

所以,伊托引理告訴我們:在計算隨機變化時,你不能只看方向(一階項),你必須把「顛簸程度」(二階項)也加進公式裡。如果不加,你算出來的價格就是錯的。

Black-Scholes 與風險中性定價

當你把伊托引理應用到一個期權價格上,並且構建一個對沖投資組合時,奇蹟發生了。

在推導出的 Black-Scholes 方程中,代表「預期漲跌」的那個變量,竟然在公式裡互相抵消,凭空消失了!

這意味著什麼?這意味著期權的價格,根本不依賴於你對這只股票未來是漲是跌的預期。

也就是說,假設你在買一個看漲期權。你以為期權越貴,是因为大家越看漲。錯!在完美的數學模型下,期權的價格只跟一個東西有關:這只股票未來的波動有多劇烈。至於它是劇烈地上漲還是劇烈地下跌,根本不重要。

當你第一次真正理解這個概念時,那種感覺是極其震撼的。它解釋了為什麼一個極度看漲的交易員和一個極度看跌的交易員,可以在同一個期權價格上愉快地達成交易。因為他們交易的根本不是方向,而是波動率。

希臘字母(The Greeks):拆解風險的維度

有了 Black-Scholes 定價模型,風險就可以被精確拆解成幾個獨立的維度。這些維度用希臘字母命名,所以叫做 Greeks:

* Delta (Δ) - 價格敏感度:標的資產變動 $1,選擇權價格變動多少。它直接告訴你需要買多少現貨來對沖風險。

* Gamma (Γ) - 彎曲程度:Delta 的變化速度。它告訴你需要多頻繁地調整你的對沖位置。在事件機率接近 50% 時,Gamma 最大,風險也最高。

* Theta (Θ) - 時間衰減:每過一天,選擇權損失多少價值。你可以把它理解為持有選擇權每天需要交的「租金」。

* Vega (V) - 波動率敏感度:波動率變化 1%,選擇權價格變多少。這是大多數華爾街衍生品交易臺真正賺錢(或虧錢)的地方。

* Rho (ρ) - 利率敏感度:利率變化對價格的影響。通常影響較小,可以忽略。

第五章課後作業(約 6-8 週完成):

1. 閱讀:閱讀 Shreve 的《Stochastic Calculus for Finance II(金融隨機分析 II:連續時間模型)》,這是該領域公認的金標準教材。(PDF 版本:https://cms.dm.uba.ar/academico/materias/2docuat2016/analisis_cuantitativo_en_finanzas/Steve_ShreveStochastic_Calculus_for_Finane_II.pdf)

2. 備選教材:如果覺得 Shreve 太難啃,可以改讀 Arguin 的《A First Course in Stochastic Calculus(隨機微積分入門)》,這本書更新、更易讀。(AMS 官方頁面:https://bookstore.ams.org/amstext-53/)

3. 推導練習 1:對 f(S) = ln(S) 應用伊藤引理(Itô's Lemma),其中 S 服從幾何布朗運動(GBM)。推導出那個關鍵的 −σ²/2 修正項。(這個修正項是理解對數收益率和連續複利之間關係的核心。)

4. 推導練習 2:從 Delta 對沖論證出發,完整推導出 Black-Scholes 偏微分方程。

6. 編程練習:從零實現 Black-Scholes 公式定價,再用蒙特卡洛模擬定價,比較兩者結果,驗證蒙特卡洛隨模擬次數增加而收斂到解析解。

第六章:Polymarket 與 LMSR,預測市場的數學引擎

現在,讓我們把所有的數學武器,帶回到當今世界上最有趣的交易市場:Polymarket。

Polymarket 背後的數學,完美地連接了這篇文章裡提到的所有東西:概率論、信息論、凸優化和整數規劃。

LMSR = 神經網路的 Softmax

在早期的預測市場中,自動做市商(AMM)通常使用一種叫做 LMSR(Logarithmic Market Scoring Rule)的機制。這是由經濟學家 Robin Hanson 發明的。

它的成本函數是:C(q) = b · ln(Σ e^(q_i/b))其中:

* q_i 是某個結果的未平倉份額

* b 是流動性參數(b 越大,市場越「厚」,價格越難被大單推動)。

根據這個成本函數,我們可以算出任何一個結果 i 對應的盤口價格:

p_i = e^(q_i/b) / Σ_j e^(q_j/b)

如果你懂一點機器學習,看到 LMSR 的價格計算公式,你會立刻驚呼:這不就是 Softmax 函數嗎!

什麼是 Softmax?假設你有三個蘋果,分別重 100 克、50 克、20 克。你想把它們的重量轉換成「百分比機率」。Softmax 就是一個「機率轉換器」。它不僅能把這些數字變成加起來等於 100% 的機率,而且它會放大差異。稍微重一點的蘋果,會分到大得多的機率份額。

驅動預測市場定價的公式,和驅動每一個人工智能(比如 ChatGPT)預測下一個詞的公式,在數學上是完全等價的。這不是巧合。兩者的底層邏輯都是一樣的:把一組雜亂的數字,優雅地轉化為一個合法的機率分佈。

這個機制保證了幾個極其優雅的特性。

* 所有可能結果的價格加起來永遠等於 1,完美符合機率公理。價格永遠在 0 和 1 之間。

* 它可以提供無限的流動性(永遠有人跟你交易)。

* 做市商的最大潛在虧損被嚴格限制在 b × ln(n) 之內,其中,n = 可能結果的數量。

Polymarket 的 CLOB 機制:從理論到實戰

值得注意的是,雖然 LMSR 是預測市場 AMM 的經典理論基礎,但如今的 Polymarket 已經進化到了使用 CLOB(中央限價訂單簿)機制。

詳情可以看我去年十月的這一篇文章:https://x.com/MrRyanChi/status/1977932511775760517

在 CLOB 模式下,價格不再由一個固定的數學公式強制計算得出,而是完全由市場上的買方和賣方通過掛單(Bids 和 Asks)博弈產生。這就像傳統的股票交易平台或 Binance 的合約市場一樣。

為什麼這很重要?因為在 CLOB 機制下,做市商的角色發生了翻天覆地的變化。

LMSR (傳統 AMM) 與 CLOB (Polymarket 當前) 的核心區別:

* 价格形成:LMSR 由數學公式自動計算;CLOB 由買賣雙方掛單博弈產生。

* 流動性來源:LMSR 由系統資金池自動提供;CLOB 必須由做市商主動掛單提供。

* 做市商角色:在 LMSR 中不需要專業的做市商;但在 CLOB 中,做市商是市場的生命線。

* 價差控制:LMSR 的買賣價差由系統參數決定;CLOB 的價差由做市商之間的內卷競爭決定。

* 對沖需求:在 CLOB 模式下,做市商面臨極高的單邊敞口風險,必須進行極其複雜的跨市場對沖。

用更簡單的話說,在 LMSR 模式下,AMM 自動提供流動性,你只需要跟公式交易。但在 CLOB 模式下,流動性完全由做市商提供。你需要自己去計算合理的概率(使用前面提到的貝葉斯更新和統計模型),然後圍繞這個概率去掛出買單和賣單,賺取買賣價差。

如果你在 Polymarket 上算錯了概率,或者沒有正確對沖相關性風險,你掛出的單子就會被更聰明的量化資金瞬間吃掉,當成韭菜收割。

第七章:寬客的職業版圖與工具箱

如果你想把這套體系變成你的職業,或者組建自己的量化團隊,你需要了解這個行業的生態。

四大核心角色

* 量化研究員(Quant Researcher):在海量數據中尋找模式、構建預測模型的人。他們需要極高的數學和統計學天賦。在 Polymarket 的語境下,他們負責構建概率模型,判斷一個合約的「合理價格」到底是多少。

* 量化開發工程師(Quant Developer):構建基礎設施的人。他們需要精通 C++、Rust 或 Python,打造低延遲的交易系統。在 Polymarket 的語境下,他們負責構建與 API 對接的交易引擎,確保訂單能在毫秒級別內提交和執行。

* 量化交易员(Quant Trader):管理資金、控制風險、做即時決策的人。他們的收入變動最大。在 Polymarket 上,他們就是那些在多個市場同時做市、即時調整價差和倉位的人。

* 風險寬客(Risk Quant):團隊的守護者。他們負責模型驗證、計算極端情況下的最大虧損(VaR)和壓力測試。

頂級機構的薪資水平

* 頂級公司(如 Jane Street, Citadel, HRT):入門級新人年薪在 $300K 到 $500K 以上;資深員工年薪 $1M 到 $3M 以上;明星交易員可以拿到 $3M 到 $30M 以上。

* 中上游公司(如 Two Sigma, DE Shaw):新人年薪 $250K 到 $350K;資深員工 $575K 到 $1.2M。

*注:Jane Street 在 2025 年上半年的平均員工薪酬高達 $140 萬/年。

推薦閱讀清單(按學習順序)

* 概率與統計 - Blitzstein & Hwang《Introduction to Probability》:條件概率、貝氏、分佈

* 統計學進階 - Wasserman《All of Statistics》:假設檢驗、回歸、MLE

* 線性代數 - Strang《Introduction to Linear Algebra》:矩陣、特徵值、PCA

* 優化理論 - Boyd & Vandenberghe《Convex Optimization》:凸優化理論與實踐

* 隨機微積分 - Shreve《Stochastic Calculus for Finance II》:布朗運動、伊藤引理、BS 模型

* 量化金融 - Hull《選擇權、期貨及其他衍生性金融商品》:衍生性金融商品定價全景

* 實戰策略 - Ernest Chan《量化交易》:從回測到實戰的躲坑指南

結語:我希望我早點知道的三個道理

在文章的最後,原作者分享了三個極其深刻的洞察。這也是我想送給所有 Polymarket 交易者的建議。

1. 估計誤差才是你真正的敵人

很多人喜歡用全倉凱利公式,或者無約束的馬科維茨優化,或者塞滿了幾百個特徵的機器學習模型。它們最終都會因為同一個原因失敗:對充滿噪音的歷史數據進行了過度擬合。

數學在參數完美的情況下是完美的。但現實中,你永遠得不到完美的參數。理論與實踐之間的鴻溝,永遠是估計誤差。

最頂級的寬客,不是那些用最複雜模型的人,而是那些對誤差保持敬畏的人。他們會主動縮小倉位(用半凱利而不是全凱利),主動簡化模型(用 3 個核心特徵而不是 30 個),主動加入約束條件。

2. 工具已經民主化了,但「確信度」沒有

今天,任何人都可以免費下載 PyTorch。任何人都可以接入 Polymarket 的 API。技術是必要條件,但不再是充分條件。

真正的交易優勢(Edge),存在於獨特的數據、獨特的模型,或者獨特的執行能力中。不是比別人多裝了幾個 Python 庫。

這也是為什麼我們把 @insidersdotbot 的更新推遲了整整一個月,來優先完善我們的聰明錢庫,以及更好的 PNL 計算算法(比如比官方更準確的 Split 收益計算模式)。因為獨特的數據和模型,真的能夠幫你賺更多的錢,或者轉虧為盈。

在 Polymarket 上,這意味著什麼?

意味著你需要找到別人沒有的資訊來源(比如某個小眾領域的專家網絡),或者構建別人沒有的模型(比如一個能實時處理多市場相關性的定價引擎),或者擁有別人沒有的執行能力(比如一個能在 10 毫秒內完成跨市場對沖的交易系統)。

3. 數學才是真正的護城河

AI 可以幫你寫程式碼,甚至可以建議交易策略。但是,能夠推導出為什麼伊托引理多了一項,能夠證明在風險中性測度下折現價格是鞛(Martingale),能夠判斷在一個組合市場中凸鬆弛(Convex relaxation)何時是緊的。

這種深厚的數學直覺,才是區分「創造優勢的寬客」和「借用優勢的寬客」的根本分水嶺。而借來的優勢,遲早是會過期的。

預測市場正在經歷傳統期權市場在 1973 年經歷過的變革。那些能夠率先把嚴謹的數學模型、波動率定價和複雜的套利算法引入這個市場的人,將會拿走最大的紅利。

停止靠直覺下注吧。去學概率,去寫程式碼,去構建你的數學護城河。

完整工具箱

Python 技術棧

數據處理:pandas、polars(Polars 在處理大數據集時比 pandas 快 10 到 50 倍)

數值計算:numpy、scipy

機器學習(表格數據方向):xgboost、lightgbm、catboost

機器學習(深度學習方向):pytorch

優化求解:cvxpy

衍生品定價:QuantLib(工業級別的庫,底層是 C++ 寫的,性能很強)

統計分析:statsmodels

回測框架:NautilusTrader

回測框架(更簡單易上手的選擇):backtrader、vectorbt(適合入門)

量化研究平台:Microsoft Qlib(GitHub 上超過 17000 顆星,偏 AI 方向)

強化學習交易:FinRL(GitHub 上超過 10000 顆星)

C++ 和 Rust

C++ 常用庫:QuantLib、Eigen、Boost

Rust 方面:RustQuant 可以用來做期權定價,NautilusTrader 採用的是 Rust + Python 混合架構(底層核心用 Rust 保證速度,上層用 Python API 方便做研究)。

數據源

免費的:yfinance、Finnhub(每分鐘 60 次請求限制)、Alpha Vantage

中等價位的:Polygon.io(每月 199 美元,延遲低於 20 毫秒)、Tiingo

企業級的:Bloomberg Terminal(彭博終端,大約每年 32000 美元)、Refinitiv、FactSet

區塊鏈數據:Alchemy(有免費套餐,支持歷史存檔數據訪問)

除此之外,@insidersdotbot 即將開源 API。將會包含現成的聰明錢數據庫與交易功能。歡迎點擊小鈴鐺 Stay Tuned。

求解器

Gurobi:速度最快的商用混合整數規劃求解器,學生和學術用戶可以申請免費許可證。做組合套利類問題离不开它。

Google OR-Tools:免費求解器裡面最強的。

PuLP / Pyomo:Python 建模接口,用來方便地定義和調用各種求解器。

參考資料
[1] gemchanger(2025)。如果我明天不得不重新开始成为量化交易员的话。X。
https://x.com/gemchange_ltd/status/2028904166895112617
[2] Blitzstein, J. K.,&Hwang,J。(2014)。概率论导论。CRC出版社。
https://projects.iq.harvard.edu/stat110
[3] Markowitz,H。(1952)。投资组合选择。金融杂志。
[4] Strang, G. 麻省理工学院18.06 线性代数。麻省理工公开课。
https://ocw.mit.edu/courses/18-06-linear-algebra-spring-2010/
[5] Boyd, S.&Vandenberghe,L.(2004)。凸优化。剑桥大学出版社。
https://web.stanford.edu/~boyd/cvxbook/
[6] Hanson,R。(2003)。模块化组合信息聚合的对数市场记分规则。
[7] Polymarket文档。CLOB概述和API。
https://docs.polymarket.com/trading/overview
[8] Black,F.,&Scholes,M。(1973)。期权定价与公司债务。政治经济学杂志。
[9] Shreve,S.(2004)。金融随机微积分 II:连续时间模型。斯普林格。

原文連結

猜你喜歡

熱門幣種

最新加密貨幣要聞

閱讀更多