2026年4月7日 投资随想

该押多少?

Kelly Criterion与长期复合增长的数学

从"选什么"到"押多少"

第一篇,Markowitz 教你怎么分散——用效用函数和有效前沿找到最优组合。第二篇,Kahneman 告诉你会在哪里犯错——损失厌恶、参考点锚定、概率权重扭曲。

但还有一个问题,这两个框架都没有回答:

当你确信一个机会很好的时候,该拿多少钱去投?

10%?30%?全仓?这不是一个随便拍脑袋的问题。押太少,浪费了你的判断优势;押太多,一次失误就可能让你永远出局。有一个公式可以算出精确答案——而用这个公式最好的人,叫巴菲特。

巴菲特不分散

打开 Berkshire Hathaway 的13F持仓报告,你会看到一个和教科书完全相反的画面:Apple 一只股票占公开持仓约 45%,前5大持仓合计超过 75%

这不是老年人的任性。早在1960年代管理合伙企业时,巴菲特就是这么干的:1988年买可口可乐,投入了 Berkshire 约三分之一的仓位;更早之前投资美国运通,占了合伙企业净值的 40%

Charlie Munger 说得更直接:

"当世界给予你机会的时候,聪明的投资者会出重手。当他们具有极大赢面时,他们会下大注。其余的时间里,他们做的仅仅是等待。就是这么简单。"

而巴菲特自己也说过:"当天上掉金子的时候,记得要用桶去接,而不要用顶针。"

等待,然后集中出击。这听起来像直觉,但背后有严格的数学。这个数学的起源,是1956年贝尔实验室的一篇论文。

从电话线到赌场到华尔街

1956年,贝尔实验室的物理学家 John Kelly Jr. 发表了一篇论文:"A New Interpretation of Information Rate"。他研究的是一个通信工程问题——如何在有噪声的信道中最大化信息传输速率。

论文的数学结论可以翻译成一句话:如果你知道一个有利赌局的胜率和赔率,存在一个最优的下注比例,能让你的财富长期增长率最大化。

信息论之父 Claude Shannon 看到了这篇论文,立刻意识到它在赌博中的应用价值。但真正把它从理论变成实践的人,是 MIT 数学教授 Ed Thorp。

Thorp 先用 Kelly 公式在拉斯维加斯的21点牌桌上赢了钱,写了一本畅销书《Beat the Dealer》。然后他把同样的数学搬到了华尔街,创办了 Princeton Newport Partners 对冲基金——在近20年的运营中,年化收益率约 20%,几乎没有亏损的年份。

更有意思的是:Thorp 后来研究了巴菲特的持仓和回报率,得出一个结论——巴菲特在直觉上一直在做 Kelly 策略。高确信度的时候重仓,不确定的时候不动。数学上的最优策略,和投资史上最成功的实践者,指向了同一个方向。

核心公式:该押多少

赌博版:建立直觉

先看最简单的情形:一个赌局,要么赢要么输,没有中间状态。

f* = (bp − q) / b f* = 最优下注比例,b = 赔率,p = 胜率,q = 1 − p

拆开看:

这个公式的直觉可以进一步简化为:

f* = edge / odds 最优仓位 = 你的优势 / 赔率

其中 edge = bp − q,就是你的期望优势。如果 edge ≤ 0(没有优势),f* ≤ 0——Kelly 说:别下注。

投资版:关键修正

但赌博版有一个问题:它假设你要么赢到 b 倍,要么输光全部下注。股票不是这样的——你不会一下子亏光,通常是亏一部分。

CFA Institute 的 Alon Bochman 指出,把赌博版公式直接套到股票上是一个广泛流传的错误。正确的投资版公式应该是:

K% = W / A − (1 − W) / B W = 胜率,A = 亏损幅度,B = 盈利幅度

区别在哪?赌博版只关心赔率比,投资版用 A(亏损幅度)单独出现在分母中,直接控制了下行风险的权重。亏损幅度越大,公式给出的仓位越小。这和价值投资的核心理念——"安全边际"——是完全一致的。

几何增长率:为什么是这个公式

Kelly 公式不是拍脑袋想出来的。它是 最大化长期财富几何增长率 E[ln(W)] 的数学解。

这里有一个关键区别:算术平均和几何平均。

Cook & Bynum 用了一个绝妙的比喻——命运转盘

想象一个转盘,24个格子。23格写着"赢 $100",1格写着"破产,归零"。

如果你只转一次,算术平均是对的——你有96%的概率赚$100。但如果你要反复转很多次,把所有结果连乘起来(这就是复利的本质),那一个"破产"格子就会在某一天出现,把你之前所有的累积收益一次归零。

投资是一个需要反复下注的长期游戏。你不是玩一把就走,你的每一次决策的结果会复合叠加。在这种情况下,最大化算术期望(Markowitz 的 E(r))不如最大化几何增长率(Kelly 的 E[ln(W)])。Kelly 公式给出的 f*,恰好就是让几何增长率最大的那个下注比例。

图1:不同下注比例的长期财富增长路径 — Kelly最优(f*)增长最快,过度下注(2f*)最终走向破产

上图模拟了同一个有利赌局(胜率60%,赔率2:1)下,三种不同下注比例的长期财富路径。蓝色线是 Kelly 最优比例(f* = 20%),增长最快且稳定。灰色线太保守(f*/3),增长缓慢但安全。红色线过度下注(2f*),短期看涨得更猛,但最终一次大亏就把前面的收益全部吞噬。

一个完整的演算

假设你分析了一只股票,得出以下判断:

赌博版

赔率 b = 盈利/亏损 = 40% / 20% = 2

f* = (2 × 0.6 − 0.4) / 2 = 0.8 / 2 = 40%

Kelly 说你应该投入总资金的 40%。

投资版

W = 0.6,B = 0.4(盈利幅度),A = 0.2(亏损幅度)

K% = 0.6 / 0.2 − 0.4 / 0.4 = 3.0 − 1.0 = 200%

投资版给出 200%——意味着满仓加一倍杠杆。因为亏损幅度只有20%(不是全亏),公式认为下行有限,可以更激进。

两个版本的差距很大:40% vs 200%。区别在于赌博版假设输了亏光全部下注,投资版知道你只会亏20%。投资版对下行幅度更敏感——如果把"跌20%"改成"跌40%",K%会从200%骤降到50%。

但无论哪个版本,都有一个共同的问题:这些数字的前提是你的判断(60%胜率、40%涨幅、20%跌幅)完全准确。现实中,这是不可能的。

图2:Kelly最优仓位随胜率和赔率的变化 — 灰色区域为"不下注"区域(无优势)

为什么不能用 Full Kelly

理论上,Full Kelly 是最优的——它最大化长期几何增长率。但实战中,几乎没有人用 Full Kelly。原因有三:

第一,你的输入参数不准。Kelly 公式需要精确的胜率和赔率。但你估计的"60%概率涨40%",误差可能有多大?如果真实胜率是50%而不是60%,最优仓位会大幅缩水。更糟糕的是,如果你把一个没有 edge 的机会误判为有 edge,Full Kelly 会让你在错误的方向上下重注。

第二,波动大到无法忍受。Full Kelly 策略的最大回撤可以达到 50%80%。数学上你知道长期会赢回来,但当账户腰斩的时候,你的心理能不能撑住是另一回事——上一篇讲的 λ = 2.25 会让这种痛苦翻倍。

第三,存在一个关键的不对称性。Cook & Bynum 指出:高估你的 edge 会导致破产,低估你的 edge 只会让你少赚一点。这个不对称性意味着保守永远比激进安全得多。

Fractional Kelly:打个折

解决方案很简单:不要用 100% Kelly,用一个折扣比例。业界最常用的是 Half Kelly(f*/2)

Half Kelly 的性价比极高:

25% 的回报换 50% 的安稳,对大多数人来说是一笔好生意。

更保守的投资者可以用 Quarter Kelly(f*/4):回报率再降一些,但几乎不可能被波动打出局。

图3:Full Kelly vs Half Kelly vs Quarter Kelly — 增长率与最大回撤的权衡

上图对比了三种策略在相同赌局中的表现。Full Kelly 增长最快但中间经历过接近 50% 的回撤;Half Kelly 增长稍慢但曲线平滑得多;Quarter Kelly 最稳但长期收益明显落后。

这里有一个精妙的联系:Fractional Kelly 本质上是对 Kahneman 所揭示的认知偏差的数学回应。前景理论告诉我们,人对概率的判断是歪的(小概率高估、大概率低估),对自己能力的评估也天然过度自信。既然你的输入参数一定有偏差,那在公式输出上打个折,就是最理性的做法。

巴菲特的 Kelly 思维

现在回到文章开头的问题:巴菲特为什么敢把40%的钱放在一只股票上?

因为他在做 Kelly 策略——虽然他可能从没用过这个公式。

Kelly 的核心逻辑是:确信度决定仓位大小。你对一个判断越有把握(p越高、edge越大),就应该下越重的注。巴菲特投美国运通、可口可乐、苹果的时候,他对这些公司的业务理解已经深到了"能力圈"的核心——在他的判断框架里,p 和 b 的估计误差很小,所以 Kelly 给出的 f* 很大。

Ed Thorp 在他的回忆录 《A Man for All Markets》 中分析过巴菲特的回报率和持仓集中度,得出的结论是:巴菲特的投资行为与 Kelly 最优策略高度吻合。

但注意一个细节:巴菲特从不用杠杆。

上面的投资版公式对那只"60%涨40%、40%跌20%"的股票给出了200%的仓位——意味着需要加杠杆。巴菲特不这么干。他的仓位虽然集中,但从不超过100%。这说明他直觉上在做 Fractional Kelly——虽然公式说可以更激进,但他选择留有余地。

还记得命运转盘吗?杠杆就是给转盘加了一个"破产"格子。一旦加上去,不管你之前赢了多少,都可能在某一天归零。巴菲特理解这一点,所以他的"第一条规则"是"永远不要亏钱"——翻译成数学语言就是:永远不要让几何增长率的期望变成负数。

Mohnish Pabrai 把巴菲特和 Munger 的策略总结为三个词:"Few bets, big bets, infrequent bets"——少量下注、重仓下注、不频繁下注。这恰好就是 Kelly 策略在投资领域的自然表达。

图4:确信度与仓位 — Kelly逻辑:确信度越高,仓位越重

Kelly 的局限

Kelly 公式好用,但不是万能的。用之前要知道它的边界:

三个框架,一张完整的地图

回顾整个系列。三篇文章,三个框架,回答了投资决策中三个不同层面的问题:

框架 回答的问题 核心工具
Markowitz 怎么分散? 有效前沿、效用函数 U = E(r) − ½Aσ²
Kahneman 会在哪犯错? S型价值函数、λ = 2.25
Kelly 该押多少? f* = edge / odds

这三个框架不是互相替代的,它们是同一个体系的不同层面:

有意思的是,这三个框架在数学上也有联系。学术研究表明,Kelly 组合位于 Markowitz 的有效前沿之上——它不是脱离均值-方差框架的另一套东西,而是在同一个框架内选择了一个特定的、最大化几何增长率的点。

三个诺贝尔奖(Markowitz 1990、Kahneman 2002)加上一个从赌场走出来的数学公式,拼成了一张投资决策的完整地图。

回到最开始的场景:同一只股票,三个人看到三种风险。现在你有了完整的工具箱——你知道怎么衡量风险,知道自己会在哪里犯错,也知道在确信的时候该押多少。

剩下的,就是去找你的 edge。

分享