该押多少？从Kelly Criterion到巴菲特的集中投资

从"选什么"到"押多少"

第一篇，Markowitz 教你怎么分散——用效用函数和有效前沿找到最优组合。第二篇，Kahneman 告诉你会在哪里犯错——损失厌恶、参考点锚定、概率权重扭曲。

但还有一个问题，这两个框架都没有回答：

当你确信一个机会很好的时候，该拿多少钱去投？

10%？30%？全仓？这不是一个随便拍脑袋的问题。押太少，浪费了你的判断优势；押太多，一次失误就可能让你永远出局。有一个公式可以算出精确答案——而用这个公式最好的人，叫巴菲特。

巴菲特不分散

打开 Berkshire Hathaway 的13F持仓报告，你会看到一个和教科书完全相反的画面：Apple 一只股票占公开持仓约 45%，前5大持仓合计超过 75%。

这不是老年人的任性。早在1960年代管理合伙企业时，巴菲特就是这么干的：1988年买可口可乐，投入了 Berkshire 约三分之一的仓位；更早之前投资美国运通，占了合伙企业净值的 40%。

Charlie Munger 说得更直接：

"当世界给予你机会的时候，聪明的投资者会出重手。当他们具有极大赢面时，他们会下大注。其余的时间里，他们做的仅仅是等待。就是这么简单。"

而巴菲特自己也说过："当天上掉金子的时候，记得要用桶去接，而不要用顶针。"

等待，然后集中出击。这听起来像直觉，但背后有严格的数学。这个数学的起源，是1956年贝尔实验室的一篇论文。

从电话线到赌场到华尔街

1956年，贝尔实验室的物理学家 John Kelly Jr. 发表了一篇论文："A New Interpretation of Information Rate"。他研究的是一个通信工程问题——如何在有噪声的信道中最大化信息传输速率。

论文的数学结论可以翻译成一句话：如果你知道一个有利赌局的胜率和赔率，存在一个最优的下注比例，能让你的财富长期增长率最大化。

信息论之父 Claude Shannon 看到了这篇论文，立刻意识到它在赌博中的应用价值。但真正把它从理论变成实践的人，是 MIT 数学教授 Ed Thorp。

Thorp 先用 Kelly 公式在拉斯维加斯的21点牌桌上赢了钱，写了一本畅销书《Beat the Dealer》。然后他把同样的数学搬到了华尔街，创办了 Princeton Newport Partners 对冲基金——在近20年的运营中，年化收益率约 20%，几乎没有亏损的年份。

更有意思的是：Thorp 后来研究了巴菲特的持仓和回报率，得出一个结论——巴菲特在直觉上一直在做 Kelly 策略。高确信度的时候重仓，不确定的时候不动。数学上的最优策略，和投资史上最成功的实践者，指向了同一个方向。

核心公式：该押多少

赌博版：建立直觉

先看最简单的情形：一个赌局，要么赢要么输，没有中间状态。

f* = (bp − q) / b f* = 最优下注比例，b = 赔率，p = 胜率，q = 1 − p

拆开看：

f* —— 你应该拿总资金的多少比例去下注。
b —— 赔率（盈亏比）。赢了能赚多少倍。比如 b=2 意味着赢了赚2块，输了亏1块。
p —— 你赢的概率。
q = 1 − p —— 你输的概率。

这个公式的直觉可以进一步简化为：

f* = edge / odds 最优仓位 = 你的优势 / 赔率

其中 edge = bp − q，就是你的期望优势。如果 edge ≤ 0（没有优势），f* ≤ 0——Kelly 说：别下注。

投资版：关键修正

但赌博版有一个问题：它假设你要么赢到 b 倍，要么输光全部下注。股票不是这样的——你不会一下子亏光，通常是亏一部分。

CFA Institute 的 Alon Bochman 指出，把赌博版公式直接套到股票上是一个广泛流传的错误。正确的投资版公式应该是：

K% = W / A − (1 − W) / B W = 胜率，A = 亏损幅度，B = 盈利幅度

区别在哪？赌博版只关心赔率比，投资版用 A（亏损幅度）单独出现在分母中，直接控制了下行风险的权重。亏损幅度越大，公式给出的仓位越小。这和价值投资的核心理念——"安全边际"——是完全一致的。

几何增长率：为什么是这个公式

Kelly 公式不是拍脑袋想出来的。它是 最大化长期财富几何增长率 E[ln(W)] 的数学解。

这里有一个关键区别：算术平均和几何平均。

Cook & Bynum 用了一个绝妙的比喻——命运转盘：

想象一个转盘，24个格子。23格写着"赢 $100"，1格写着"破产，归零"。

算术平均：(23 × $100 + 1 × $0) / 24 = $96。看起来很好，接近$100。
几何平均：$100²³ × $0¹ 的24次方根 = $0。因为有一个零，乘积永远是零。

如果你只转一次，算术平均是对的——你有96%的概率赚$100。但如果你要反复转很多次，把所有结果连乘起来（这就是复利的本质），那一个"破产"格子就会在某一天出现，把你之前所有的累积收益一次归零。

投资是一个需要反复下注的长期游戏。你不是玩一把就走，你的每一次决策的结果会复合叠加。在这种情况下，最大化算术期望（Markowitz 的 E(r)）不如最大化几何增长率（Kelly 的 E[ln(W)]）。Kelly 公式给出的 f*，恰好就是让几何增长率最大的那个下注比例。

图1：不同下注比例的长期财富增长路径 — Kelly最优(f*)增长最快，过度下注(2f*)最终走向破产

上图模拟了同一个有利赌局（胜率60%，赔率2:1）下，三种不同下注比例的长期财富路径。蓝色线是 Kelly 最优比例（f* = 20%），增长最快且稳定。灰色线太保守（f*/3），增长缓慢但安全。红色线过度下注（2f*），短期看涨得更猛，但最终一次大亏就把前面的收益全部吞噬。

一个完整的演算

假设你分析了一只股票，得出以下判断：

60% 的概率在未来一年涨 40%
40% 的概率在未来一年跌 20%

赌博版

赔率 b = 盈利/亏损 = 40% / 20% = 2

f* = (2 × 0.6 − 0.4) / 2 = 0.8 / 2 = 40%

Kelly 说你应该投入总资金的 40%。

投资版

W = 0.6，B = 0.4（盈利幅度），A = 0.2（亏损幅度）

K% = 0.6 / 0.2 − 0.4 / 0.4 = 3.0 − 1.0 = 200%

投资版给出 200%——意味着满仓加一倍杠杆。因为亏损幅度只有20%（不是全亏），公式认为下行有限，可以更激进。

两个版本的差距很大：40% vs 200%。区别在于赌博版假设输了亏光全部下注，投资版知道你只会亏20%。投资版对下行幅度更敏感——如果把"跌20%"改成"跌40%"，K%会从200%骤降到50%。

但无论哪个版本，都有一个共同的问题：这些数字的前提是你的判断（60%胜率、40%涨幅、20%跌幅）完全准确。现实中，这是不可能的。

图2：Kelly最优仓位随胜率和赔率的变化 — 灰色区域为"不下注"区域（无优势）

为什么不能用 Full Kelly

理论上，Full Kelly 是最优的——它最大化长期几何增长率。但实战中，几乎没有人用 Full Kelly。原因有三：

第一，你的输入参数不准。Kelly 公式需要精确的胜率和赔率。但你估计的"60%概率涨40%"，误差可能有多大？如果真实胜率是50%而不是60%，最优仓位会大幅缩水。更糟糕的是，如果你把一个没有 edge 的机会误判为有 edge，Full Kelly 会让你在错误的方向上下重注。

第二，波动大到无法忍受。Full Kelly 策略的最大回撤可以达到 50% 到 80%。数学上你知道长期会赢回来，但当账户腰斩的时候，你的心理能不能撑住是另一回事——上一篇讲的 λ = 2.25 会让这种痛苦翻倍。

第三，存在一个关键的不对称性。Cook & Bynum 指出：高估你的 edge 会导致破产，低估你的 edge 只会让你少赚一点。这个不对称性意味着保守永远比激进安全得多。

Fractional Kelly：打个折

解决方案很简单：不要用 100% Kelly，用一个折扣比例。业界最常用的是 Half Kelly（f*/2）。

Half Kelly 的性价比极高：

你牺牲了约 25% 的长期回报率
但换来了波动率降低约 50%

用 25% 的回报换 50% 的安稳，对大多数人来说是一笔好生意。

更保守的投资者可以用 Quarter Kelly（f*/4）：回报率再降一些，但几乎不可能被波动打出局。

图3：Full Kelly vs Half Kelly vs Quarter Kelly — 增长率与最大回撤的权衡

上图对比了三种策略在相同赌局中的表现。Full Kelly 增长最快但中间经历过接近 50% 的回撤；Half Kelly 增长稍慢但曲线平滑得多；Quarter Kelly 最稳但长期收益明显落后。

这里有一个精妙的联系：Fractional Kelly 本质上是对 Kahneman 所揭示的认知偏差的数学回应。前景理论告诉我们，人对概率的判断是歪的（小概率高估、大概率低估），对自己能力的评估也天然过度自信。既然你的输入参数一定有偏差，那在公式输出上打个折，就是最理性的做法。

巴菲特的 Kelly 思维

现在回到文章开头的问题：巴菲特为什么敢把40%的钱放在一只股票上？

因为他在做 Kelly 策略——虽然他可能从没用过这个公式。

Kelly 的核心逻辑是：确信度决定仓位大小。你对一个判断越有把握（p越高、edge越大），就应该下越重的注。巴菲特投美国运通、可口可乐、苹果的时候，他对这些公司的业务理解已经深到了"能力圈"的核心——在他的判断框架里，p 和 b 的估计误差很小，所以 Kelly 给出的 f* 很大。

Ed Thorp 在他的回忆录《A Man for All Markets》中分析过巴菲特的回报率和持仓集中度，得出的结论是：巴菲特的投资行为与 Kelly 最优策略高度吻合。

但注意一个细节：巴菲特从不用杠杆。

上面的投资版公式对那只"60%涨40%、40%跌20%"的股票给出了200%的仓位——意味着需要加杠杆。巴菲特不这么干。他的仓位虽然集中，但从不超过100%。这说明他直觉上在做 Fractional Kelly——虽然公式说可以更激进，但他选择留有余地。

还记得命运转盘吗？杠杆就是给转盘加了一个"破产"格子。一旦加上去，不管你之前赢了多少，都可能在某一天归零。巴菲特理解这一点，所以他的"第一条规则"是"永远不要亏钱"——翻译成数学语言就是：永远不要让几何增长率的期望变成负数。

Mohnish Pabrai 把巴菲特和 Munger 的策略总结为三个词："Few bets, big bets, infrequent bets"——少量下注、重仓下注、不频繁下注。这恰好就是 Kelly 策略在投资领域的自然表达。

图4：确信度与仓位 — Kelly逻辑：确信度越高，仓位越重

Kelly 的局限

Kelly 公式好用，但不是万能的。用之前要知道它的边界：

输入敏感。胜率 p 和赔率 b 估错10%，f* 可能差一倍。公式的精度完全取决于你输入参数的精度——而你的参数永远是主观估计。
假设可重复。Kelly 的数学推导基于"大量重复下注"的场景。但投资决策往往是少数几次关键选择，样本量远远不够让大数定律发挥作用。
忽略现实约束。流动性、交易成本、资金的时间需求、多个标的之间的相关性——这些在公式里都不存在，但在你的账户里都真实存在。
真正的难题不是公式。公式的数学很简单，f* = edge / odds。但"你的 edge 到底是多少"这个问题，是整个投资领域最难回答的问题。公式不能帮你找到 edge，它只能帮你在确认 edge 存在之后决定押多少。

三个框架，一张完整的地图

回顾整个系列。三篇文章，三个框架，回答了投资决策中三个不同层面的问题：

框架	回答的问题	核心工具
Markowitz	怎么分散？	有效前沿、效用函数 U = E(r) − ½Aσ²
Kahneman	会在哪犯错？	S型价值函数、λ = 2.25
Kelly	该押多少？	f* = edge / odds

这三个框架不是互相替代的，它们是同一个体系的不同层面：

Markowitz 给出了组合优化的理性框架——在给定风险偏好下，如何分配资金到不同资产上。
Kahneman 揭示了人在执行理性策略时会系统性地偏离——锚定效应、损失厌恶、概率扭曲。
Kelly 回答了一个更具体的问题：在你确认了一个有优势的机会之后，最优的下注比例是多少。而 Fractional Kelly——在公式输出上打折——正是对 Kahneman 所揭示的认知偏差的数学回应。

有意思的是，这三个框架在数学上也有联系。学术研究表明，Kelly 组合位于 Markowitz 的有效前沿之上——它不是脱离均值-方差框架的另一套东西，而是在同一个框架内选择了一个特定的、最大化几何增长率的点。

三个诺贝尔奖（Markowitz 1990、Kahneman 2002）加上一个从赌场走出来的数学公式，拼成了一张投资决策的完整地图。

回到最开始的场景：同一只股票，三个人看到三种风险。现在你有了完整的工具箱——你知道怎么衡量风险，知道自己会在哪里犯错，也知道在确信的时候该押多少。

剩下的，就是去找你的 edge。