量化交易系列(四):多因子模型——华尔街印钱机器的核心秘密
量化交易系列(四):多因子模型——华尔街印钱机器的核心秘密
导语
如果有一个模型,全球管理着超过 30 万亿美元的资金都在使用它的某种变体——你会不会想搞明白它是什么?
这就是多因子模型(Multi-Factor Model)。
前三篇我们讲了 Alpha 的来源、经典策略和风险管理。这一篇把它们统一到一个框架里——多因子模型。不涉及编程,只讲核心思想。
一、什么是"因子"?
假设你今年赚了 25%,市场涨了 10%。这 15% 的超额收益怎么来的?
深入分析可能发现:你持有的大多是小盘股(今年小盘跑赢大盘 8%)和低估值股票(今年价值跑赢成长 5%)。剩下的 2% 才是真正的"选股能力"。
"小盘"和"低估值"就是两个因子——系统性地驱动一类资产收益的底层力量。关键词是"系统性":跨市场、跨时间、持续存在。
二、因子模型的学术演进
CAPM 单因子(1964)
Sharpe 的资本资产定价模型:任何资产的预期收益完全由市场因子决定。β 衡量对市场涨跌的敏感度,β 越高预期收益越高。
Fama-French 三因子(1993)
Fama 和 French 发现 CAPM 解释不了两个异象:小公司长期跑赢大公司(规模效应),低估值股票长期跑赢高估值(价值效应)。他们增加了 SMB(小减大)和 HML(价值减成长)两个因子。
Carhart 四因子(1997)
加入动量因子 UMD(赢家减输家),因为三因子模型无法解释动量效应。
Fama-French 五因子(2015)
又增加盈利因子 RMW(高盈利减低盈利)和投资因子 CMA(保守减激进)。五因子模型能解释约 90%-95% 的组合收益率差异。
因子动物园
学术论文报告的"有效因子"已超过 400 个,被戏称"因子动物园"。Harvey 等人 2016 年指出:绝大多数可能是数据挖掘的产物。实践中,大多数基金只使用 5-10 个核心因子。
三、六大核心因子
1. 市场因子(Market)
承担市场整体风险的补偿。美股 1926-2025 年年化超额收益约 7%-8%,但代价是承受可能持续数年的熊市。
2. 价值因子(Value)
买"便宜"卖"昂贵"。年化超额约 3%-5%。2018-2020 年经历史上最大回撤,很多人宣布"价值已死",但 2021-2022 年强劲反弹——这正说明了因子投资需要极强纪律。
3. 规模因子(Size)
小市值长期跑赢大市值。但近二十年单纯规模因子几乎没有超额收益,需要和价值、质量因子组合使用。
4. 动量因子(Momentum)
买入过去 12 个月(跳过最近 1 个月)涨幅最大的,卖空跌幅最大的。年化超额约 6%-8%,最强因子之一,但尾部风险巨大(2009 年 3 月一个月亏 40%+)。
5. 质量因子(Quality)
买高质量(高 ROE、低负债、稳定盈利),卖低质量。AQR 2018 年论文指出:巴菲特的超额收益很大程度上可用市场+价值+质量+低波动因子解释。
6. 低波动因子(Low Volatility)
低波动股票长期收益反而更高——完全违反"高风险高收益"的直觉。原因包括"彩票偏好"(投资者高估高波动股票的暴涨概率)和杠杆约束。
四、因子的周期性
每个因子都有好时候和坏时候:
| 因子 | 表现好 | 表现差 |
|---|---|---|
| 价值 | 经济复苏、利率上升 | 流动性泛滥、科技泡沫 |
| 动量 | 趋势明确、波动适中 | 极端反转、危机结束 |
| 质量 | 经济下行、避险情绪高 | 风险偏好大开 |
| 低波动 | 市场下跌、恐慌蔓延 | 市场暴涨、情绪狂热 |
因子投资最大的挑战不是找到因子,而是在因子暂时失效时不放弃。 2019 年底放弃价值策略的人,错过了 2021-2022 年的反弹。
五、因子组合的力量
为什么要组合?
单因子波动太大。但如果同时持有价值、动量、质量、低波动等多个因子,由于它们之间的低相关性,组合的波动会大幅降低。
| 配置方式 | 年化收益 | 最大回撤 | 夏普比率 |
|---|---|---|---|
| 纯价值 | ~10% | ~45% | ~0.4 |
| 纯动量 | ~12% | ~50% | ~0.5 |
| 价值+动量+质量等权 | ~11% | ~25% | ~0.8 |
组合收益没降多少,但风险大幅下降。 这就是多因子的核心价值。
因子择时:诱人但危险
既然因子有周期性,能不能在价值因子表现好时加仓价值、在动量表现好时加仓动量?
理论上可以,但实证研究表明:因子择时极其困难,大多数尝试反而降低了收益。 AQR 的 Asness 在多篇论文中反复论证这一点。
原因很简单:因子的周期不像四季更替那样可预测。你永远不知道价值因子的低谷期会持续一年还是五年。
专业建议:保持各因子的恒定配置权重,定期再平衡,不要试图择时。 这听起来很无聊,但"无聊"恰恰是投资中最大的优势。
六、因子投资在加密市场的应用
加密市场和传统金融市场有本质不同,但因子的思维框架仍然适用:
哪些因子在加密市场有效?
动量——加密市场的动量效应极其显著。Liu, Tsyvinski 和 Wu 在 2019 年的论文中证明:加密货币的横截面收益率中,动量是最强的预测因子。直觉上也说得通——加密市场散户比例极高,行为偏差更严重。
规模——小市值代币的波动率和潜在收益都远高于 BTC/ETH。但这里有一个巨大的幸存者偏差陷阱:你看到的是暴涨 100 倍的小币,看不到的是归零的 99%。
价值——在加密市场中如何定义"价值"?这是一个未解问题。传统的市盈率、市净率在绝大多数代币上不适用。一些研究尝试用 NVT(Network Value to Transactions,网络价值与交易量之比)作为加密资产的"市盈率",初步结果显示有一定预测能力。
加密市场因子的独特之处
- Alpha 衰减更快。 加密市场参与者虽然不成熟,但信息传播极快(Twitter/Telegram),有效的因子被发现后很快拥挤。
- 尾部风险更大。 加密市场的日波动率是传统市场的 3-5 倍,极端事件更频繁。
- 流动性分化严重。 BTC/ETH 的流动性接近传统大盘股,但大多数山寨币的流动性极差。
七、因子投资的常见误区
误区一:"过去有效的因子未来一定有效"
因子可能因为以下原因失效:
- 策略拥挤:太多人使用导致 Alpha 消失
- 结构变化:市场结构改变(如被动投资占比从 10% 上升到 50%)
- 监管变化:新法规可能消除某些结构性机会
误区二:"因子收益是免费的午餐"
每个因子收益背后都有对应的风险。价值因子赚钱是因为你承担了"价值陷阱"的风险——买入的"便宜"公司可能真的在走向破产。动量因子赚钱是因为你承担了"动量崩溃"的尾部风险。
没有风险的收益不存在。如果你觉得自己找到了"无风险的超额收益",要么是你没看到风险,要么是你被骗了。
误区三:"我可以同时获得所有因子的收益"
不同因子之间有时是矛盾的。比如价值因子要求你买"便宜"的股票,但便宜的股票往往质量很差(低 ROE、高负债)。同时满足价值和质量要求的股票数量很有限。
因子组合的艺术,就在于在矛盾中找到平衡。
八、总结:因子是理解市场的"元语言"
多因子模型的价值不仅在于构建策略,更在于提供了一种理解市场的统一框架:
- 你赚了钱?分解一下,到底是市场 Beta、因子暴露还是真正的 Alpha
- 你亏了钱?看看是哪个因子在拖后腿
- 你想评估一个基金经理?用因子模型分析他的历史收益,看看扣掉因子暴露后还剩多少真正的 Alpha
大多数人以为自己在做"主动投资",其实只是在被动承担某些因子的风险。 意识到这一点,是量化思维的开始。
下一篇:量化交易系列(五)——认知陷阱:过拟合、幸存者偏差和黑天鹅。为什么你的回测年化 100%,实盘却亏成狗?
关注公众号「coft」,获取更多 AI 时代的深度思考。

浙公网安备 33010602011771号