从"选什么"到"押多少"
第一篇,Markowitz 教你怎么分散——用效用函数和有效前沿找到最优组合。第二篇,Kahneman 告诉你会在哪里犯错——损失厌恶、参考点锚定、概率权重扭曲。
但还有一个问题,这两个框架都没有回答:
当你确信一个机会很好的时候,该拿多少钱去投?
10%?30%?全仓?这不是一个随便拍脑袋的问题。押太少,浪费了你的判断优势;押太多,一次失误就可能让你永远出局。有一个公式可以算出精确答案——而用这个公式最好的人,叫巴菲特。
巴菲特不分散
打开 Berkshire Hathaway 的13F持仓报告,你会看到一个和教科书完全相反的画面:Apple 一只股票占公开持仓约 45%,前5大持仓合计超过 75%。
这不是老年人的任性。早在1960年代管理合伙企业时,巴菲特就是这么干的:1988年买可口可乐,投入了 Berkshire 约三分之一的仓位;更早之前投资美国运通,占了合伙企业净值的 40%。
Charlie Munger 说得更直接:
"当世界给予你机会的时候,聪明的投资者会出重手。当他们具有极大赢面时,他们会下大注。其余的时间里,他们做的仅仅是等待。就是这么简单。"
而巴菲特自己也说过:"当天上掉金子的时候,记得要用桶去接,而不要用顶针。"
等待,然后集中出击。这听起来像直觉,但背后有严格的数学。这个数学的起源,是1956年贝尔实验室的一篇论文。
从电话线到赌场到华尔街
1956年,贝尔实验室的物理学家 John Kelly Jr. 发表了一篇论文:"A New Interpretation of Information Rate"。他研究的是一个通信工程问题——如何在有噪声的信道中最大化信息传输速率。
论文的数学结论可以翻译成一句话:如果你知道一个有利赌局的胜率和赔率,存在一个最优的下注比例,能让你的财富长期增长率最大化。
信息论之父 Claude Shannon 看到了这篇论文,立刻意识到它在赌博中的应用价值。但真正把它从理论变成实践的人,是 MIT 数学教授 Ed Thorp。
Thorp 先用 Kelly 公式在拉斯维加斯的21点牌桌上赢了钱,写了一本畅销书《Beat the Dealer》。然后他把同样的数学搬到了华尔街,创办了 Princeton Newport Partners 对冲基金——在近20年的运营中,年化收益率约 20%,几乎没有亏损的年份。
更有意思的是:Thorp 后来研究了巴菲特的持仓和回报率,得出一个结论——巴菲特在直觉上一直在做 Kelly 策略。高确信度的时候重仓,不确定的时候不动。数学上的最优策略,和投资史上最成功的实践者,指向了同一个方向。
核心公式:该押多少
赌博版:建立直觉
先看最简单的情形:一个赌局,要么赢要么输,没有中间状态。
拆开看:
- f* —— 你应该拿总资金的多少比例去下注。
- b —— 赔率(盈亏比)。赢了能赚多少倍。比如 b=2 意味着赢了赚2块,输了亏1块。
- p —— 你赢的概率。
- q = 1 − p —— 你输的概率。
这个公式的直觉可以进一步简化为:
其中 edge = bp − q,就是你的期望优势。如果 edge ≤ 0(没有优势),f* ≤ 0——Kelly 说:别下注。
投资版:关键修正
但赌博版有一个问题:它假设你要么赢到 b 倍,要么输光全部下注。股票不是这样的——你不会一下子亏光,通常是亏一部分。
CFA Institute 的 Alon Bochman 指出,把赌博版公式直接套到股票上是一个广泛流传的错误。正确的投资版公式应该是:
区别在哪?赌博版只关心赔率比,投资版用 A(亏损幅度)单独出现在分母中,直接控制了下行风险的权重。亏损幅度越大,公式给出的仓位越小。这和价值投资的核心理念——"安全边际"——是完全一致的。
几何增长率:为什么是这个公式
Kelly 公式不是拍脑袋想出来的。它是 最大化长期财富几何增长率 E[ln(W)] 的数学解。
这里有一个关键区别:算术平均和几何平均。
Cook & Bynum 用了一个绝妙的比喻——命运转盘:
想象一个转盘,24个格子。23格写着"赢 $100",1格写着"破产,归零"。
- 算术平均:(23 × $100 + 1 × $0) / 24 = $96。看起来很好,接近$100。
- 几何平均:$100²³ × $0¹ 的24次方根 = $0。因为有一个零,乘积永远是零。
如果你只转一次,算术平均是对的——你有96%的概率赚$100。但如果你要反复转很多次,把所有结果连乘起来(这就是复利的本质),那一个"破产"格子就会在某一天出现,把你之前所有的累积收益一次归零。
投资是一个需要反复下注的长期游戏。你不是玩一把就走,你的每一次决策的结果会复合叠加。在这种情况下,最大化算术期望(Markowitz 的 E(r))不如最大化几何增长率(Kelly 的 E[ln(W)])。Kelly 公式给出的 f*,恰好就是让几何增长率最大的那个下注比例。
图1:不同下注比例的长期财富增长路径 — Kelly最优(f*)增长最快,过度下注(2f*)最终走向破产
上图模拟了同一个有利赌局(胜率60%,赔率2:1)下,三种不同下注比例的长期财富路径。蓝色线是 Kelly 最优比例(f* = 20%),增长最快且稳定。灰色线太保守(f*/3),增长缓慢但安全。红色线过度下注(2f*),短期看涨得更猛,但最终一次大亏就把前面的收益全部吞噬。
一个完整的演算
假设你分析了一只股票,得出以下判断:
- 60% 的概率在未来一年涨 40%
- 40% 的概率在未来一年跌 20%
赌博版
赔率 b = 盈利/亏损 = 40% / 20% = 2
f* = (2 × 0.6 − 0.4) / 2 = 0.8 / 2 = 40%
Kelly 说你应该投入总资金的 40%。
投资版
W = 0.6,B = 0.4(盈利幅度),A = 0.2(亏损幅度)
K% = 0.6 / 0.2 − 0.4 / 0.4 = 3.0 − 1.0 = 200%
投资版给出 200%——意味着满仓加一倍杠杆。因为亏损幅度只有20%(不是全亏),公式认为下行有限,可以更激进。
两个版本的差距很大:40% vs 200%。区别在于赌博版假设输了亏光全部下注,投资版知道你只会亏20%。投资版对下行幅度更敏感——如果把"跌20%"改成"跌40%",K%会从200%骤降到50%。
但无论哪个版本,都有一个共同的问题:这些数字的前提是你的判断(60%胜率、40%涨幅、20%跌幅)完全准确。现实中,这是不可能的。
图2:Kelly最优仓位随胜率和赔率的变化 — 灰色区域为"不下注"区域(无优势)
为什么不能用 Full Kelly
理论上,Full Kelly 是最优的——它最大化长期几何增长率。但实战中,几乎没有人用 Full Kelly。原因有三:
第一,你的输入参数不准。Kelly 公式需要精确的胜率和赔率。但你估计的"60%概率涨40%",误差可能有多大?如果真实胜率是50%而不是60%,最优仓位会大幅缩水。更糟糕的是,如果你把一个没有 edge 的机会误判为有 edge,Full Kelly 会让你在错误的方向上下重注。
第二,波动大到无法忍受。Full Kelly 策略的最大回撤可以达到 50% 到 80%。数学上你知道长期会赢回来,但当账户腰斩的时候,你的心理能不能撑住是另一回事——上一篇讲的 λ = 2.25 会让这种痛苦翻倍。
第三,存在一个关键的不对称性。Cook & Bynum 指出:高估你的 edge 会导致破产,低估你的 edge 只会让你少赚一点。这个不对称性意味着保守永远比激进安全得多。
Fractional Kelly:打个折
解决方案很简单:不要用 100% Kelly,用一个折扣比例。业界最常用的是 Half Kelly(f*/2)。
Half Kelly 的性价比极高:
- 你牺牲了约 25% 的长期回报率
- 但换来了波动率降低约 50%
用 25% 的回报换 50% 的安稳,对大多数人来说是一笔好生意。
更保守的投资者可以用 Quarter Kelly(f*/4):回报率再降一些,但几乎不可能被波动打出局。
图3:Full Kelly vs Half Kelly vs Quarter Kelly — 增长率与最大回撤的权衡
上图对比了三种策略在相同赌局中的表现。Full Kelly 增长最快但中间经历过接近 50% 的回撤;Half Kelly 增长稍慢但曲线平滑得多;Quarter Kelly 最稳但长期收益明显落后。
这里有一个精妙的联系:Fractional Kelly 本质上是对 Kahneman 所揭示的认知偏差的数学回应。前景理论告诉我们,人对概率的判断是歪的(小概率高估、大概率低估),对自己能力的评估也天然过度自信。既然你的输入参数一定有偏差,那在公式输出上打个折,就是最理性的做法。
巴菲特的 Kelly 思维
现在回到文章开头的问题:巴菲特为什么敢把40%的钱放在一只股票上?
因为他在做 Kelly 策略——虽然他可能从没用过这个公式。
Kelly 的核心逻辑是:确信度决定仓位大小。你对一个判断越有把握(p越高、edge越大),就应该下越重的注。巴菲特投美国运通、可口可乐、苹果的时候,他对这些公司的业务理解已经深到了"能力圈"的核心——在他的判断框架里,p 和 b 的估计误差很小,所以 Kelly 给出的 f* 很大。
Ed Thorp 在他的回忆录 《A Man for All Markets》 中分析过巴菲特的回报率和持仓集中度,得出的结论是:巴菲特的投资行为与 Kelly 最优策略高度吻合。
但注意一个细节:巴菲特从不用杠杆。
上面的投资版公式对那只"60%涨40%、40%跌20%"的股票给出了200%的仓位——意味着需要加杠杆。巴菲特不这么干。他的仓位虽然集中,但从不超过100%。这说明他直觉上在做 Fractional Kelly——虽然公式说可以更激进,但他选择留有余地。
还记得命运转盘吗?杠杆就是给转盘加了一个"破产"格子。一旦加上去,不管你之前赢了多少,都可能在某一天归零。巴菲特理解这一点,所以他的"第一条规则"是"永远不要亏钱"——翻译成数学语言就是:永远不要让几何增长率的期望变成负数。
Mohnish Pabrai 把巴菲特和 Munger 的策略总结为三个词:"Few bets, big bets, infrequent bets"——少量下注、重仓下注、不频繁下注。这恰好就是 Kelly 策略在投资领域的自然表达。
图4:确信度与仓位 — Kelly逻辑:确信度越高,仓位越重
Kelly 的局限
Kelly 公式好用,但不是万能的。用之前要知道它的边界:
- 输入敏感。胜率 p 和赔率 b 估错10%,f* 可能差一倍。公式的精度完全取决于你输入参数的精度——而你的参数永远是主观估计。
- 假设可重复。Kelly 的数学推导基于"大量重复下注"的场景。但投资决策往往是少数几次关键选择,样本量远远不够让大数定律发挥作用。
- 忽略现实约束。流动性、交易成本、资金的时间需求、多个标的之间的相关性——这些在公式里都不存在,但在你的账户里都真实存在。
- 真正的难题不是公式。公式的数学很简单,f* = edge / odds。但"你的 edge 到底是多少"这个问题,是整个投资领域最难回答的问题。公式不能帮你找到 edge,它只能帮你在确认 edge 存在之后决定押多少。
三个框架,一张完整的地图
回顾整个系列。三篇文章,三个框架,回答了投资决策中三个不同层面的问题:
| 框架 | 回答的问题 | 核心工具 |
|---|---|---|
| Markowitz | 怎么分散? | 有效前沿、效用函数 U = E(r) − ½Aσ² |
| Kahneman | 会在哪犯错? | S型价值函数、λ = 2.25 |
| Kelly | 该押多少? | f* = edge / odds |
这三个框架不是互相替代的,它们是同一个体系的不同层面:
- Markowitz 给出了组合优化的理性框架——在给定风险偏好下,如何分配资金到不同资产上。
- Kahneman 揭示了人在执行理性策略时会系统性地偏离——锚定效应、损失厌恶、概率扭曲。
- Kelly 回答了一个更具体的问题:在你确认了一个有优势的机会之后,最优的下注比例是多少。而 Fractional Kelly——在公式输出上打折——正是对 Kahneman 所揭示的认知偏差的数学回应。
有意思的是,这三个框架在数学上也有联系。学术研究表明,Kelly 组合位于 Markowitz 的有效前沿之上——它不是脱离均值-方差框架的另一套东西,而是在同一个框架内选择了一个特定的、最大化几何增长率的点。
三个诺贝尔奖(Markowitz 1990、Kahneman 2002)加上一个从赌场走出来的数学公式,拼成了一张投资决策的完整地图。
回到最开始的场景:同一只股票,三个人看到三种风险。现在你有了完整的工具箱——你知道怎么衡量风险,知道自己会在哪里犯错,也知道在确信的时候该押多少。
剩下的,就是去找你的 edge。