量化交易系列(六):做量化为啥这么难?散户量化会被收割么?
量化交易系列(六):做量化为啥这么难?散户量化会被收割么?
导语
每隔一段时间,我的后台就会收到类似的留言:
"我学了 Python,学了因子模型,回测跑得飞起,怎么一实盘就亏?"
"量化不是用数学和科学打败市场吗?为什么我感觉自己在被市场打?"
"是不是散户做量化,本质上就是给机构送钱?"
这些问题问到了量化交易最核心的痛处。
前五篇文章,我们聊了底层逻辑、经典策略、风险管理、多因子模型和认知陷阱。如果说那五篇是在教你"怎么打仗",这一篇要回答一个更根本的问题——这场仗,你到底打不打得赢?
答案可能让你不舒服:对绝大多数人而言,做量化极难成功,而且确实存在被收割的风险。 但这个"难"不是无解的,"被收割"也不是必然的。关键在于你是否真正理解了自己面对的是什么。
一、做量化到底难在哪?
很多人以为量化交易的门槛是"写代码"和"懂数学"。这大错特错。代码和数学只是入场券,真正的门槛远比这高得多。
1. 你面对的是有史以来最激烈的智力竞争
量化交易的本质是什么?是从其他聪明人手里抢钱。
你的对手是谁?
- Renaissance Technologies(文艺复兴科技):200 多名博士,以数学家、物理学家和计算机科学家为主,Medallion Fund 年化 66%,三十年不败。他们的招聘标准是"在你的学术领域做出过世界级贡献"。
- Citadel(城堡投资):Ken Griffin 的帝国,管理超过 600 亿美元,拥有全球最快的交易基础设施,光纤直连交易所,延迟以微秒计。
- Two Sigma:David Siegel 和 John Overdeck 联合创立,管理超过 600 亿美元,拥有全球最大的私有云计算集群之一。
- D.E. Shaw:Jeff Bezos 在创立亚马逊之前工作的地方。创始人 David Shaw 是计算机科学家,团队中不乏图灵奖得主的学生。
- Jump Trading、Jane Street、Virtu Financial:高频交易领域的巨头,在你下单之前,他们的算法已经执行完毕。
这些机构每年在技术上投入数十亿美元。它们拥有:
- 最快的数据:直接从交易所获取原始数据流,比你快几十毫秒到几百毫秒
- 最强的算力:专用 GPU 集群、FPGA 加速、甚至定制芯片
- 最多的人才:全球顶尖的数学家、物理学家、统计学家
- 最低的交易成本:规模效应 + 做市商身份 + 与交易所的特殊协议
- 最深的口袋:可以承受数月甚至数年的亏损等待策略回归
你拿着一台笔记本电脑、一个免费的行情 API、和网上学来的因子模型,要跟这些人竞争 Alpha。
这就好比你拿着一把木剑,走进了一群装备精良的特种兵的战场。不是你不勇敢,是装备差距太大了。
2. Alpha 的数学困境:你连"正期望"都很难证明
系列第一篇讲过,量化交易的核心是找到正期望值的策略。但问题是——你怎么知道你的策略真的有正期望?
假设你开发了一个策略,回测五年年化 15%。这个 15% 到底是:
- A)策略真的有效,你捕捉到了市场的某种规律?
- B)纯粹的运气——在噪声中碰巧找到了一段好看的曲线?
区分 A 和 B,需要的是统计显著性。但在金融领域,统计显著性极难达到。
原因很简单:数据太少了。
物理学家做实验可以重复上百万次。医学做临床试验可以有几千个样本。但金融市场——
- 你能用的独立样本有多少?如果是日线级别的策略,过去 20 年大约 5000 个交易日。
- 这 5000 个交易日里有多少个独立的"市场体制"?牛市、熊市、震荡市加起来可能就五六个。
- 你的策略在这五六个不同的市场体制下都有效吗?还是只在其中两三个有效?
Harvey, Liu & Zhu 在 2016 年发表了一篇重磅论文《...and the Cross-Section of Expected Returns》,统计了过去 50 年学术界"发现"的 316 个因子。他们的结论触目惊心:绝大多数因子在修正多重比较偏差后,统计显著性消失了。
换句话说,学术界半个世纪以来"发现"的几百个赚钱因子,大部分是幻觉。
更残酷的是,即使策略真的有效,你也很难确信这一点。 因为任何合理的统计检验都需要大量的样本外数据——而等你积累到足够的样本外数据来确认策略有效时,可能已经过去了三五年,而这三五年里市场结构可能已经变了,策略可能已经失效了。
这是一个残酷的悖论:你需要时间来验证策略,但时间本身会让策略失效。
3. 回测是天堂,实盘是地狱
系列第五篇详细讲了回测的五大陷阱。这里只强调一个被严重低估的问题:滑点和流动性。
假设你的策略在回测中年化收益 20%,看起来很不错。但当你开始实盘交易:
- 滑点:回测假设你以收盘价成交,实际上你的订单可能让价格移动了 0.1%。一年交易 200 次,0.1% × 200 = 20%。恭喜,你的 Alpha 被滑点吃光了。
- 冲击成本:你想买 10 万元的小盘股,但当天该股票的交易额只有 50 万。你的买入行为直接推高了价格 2%。
- 延迟:你的信号在 14:55 生成,但从信号生成到订单执行,中间有网络延迟、撮合延迟、你犹豫要不要下单的延迟……等你真正成交时,价格已经动了。
- 市场结构变化:回测用的是历史数据,但市场微观结构一直在变——交易所规则改了、手续费调了、竞争对手的策略变了、流动性分布变了。
Renaissance Technologies 的 Medallion Fund 有一个著名的数据:它的策略在扣除交易成本前的年化收益率约为 66%,扣除交易成本和管理费后约为 39%。 这意味着即使是全世界最成功的量化基金,交易成本也吃掉了其毛收益的约 40%。
你的策略,有这个"耐磨度"吗?
4. 心理账户:你最大的敌人是自己
理论上,量化交易的最大优势是"去人性化"——用算法代替情绪。但现实中,你真的能做到吗?
- 策略连续亏损 15 天,你敢继续执行吗?
- 策略说"做空",但市场舆论一片看多,你敢做空吗?
- 策略回撤到 25%,你的家人问你"到底亏了多少",你能冷静吗?
- 你的朋友买了 AI 概念股涨了 50%,你的量化策略同期只赚了 3%,你不焦虑吗?
- 策略判断要清仓等待,但市场每天都在涨,你不手痒吗?
Mark Douglas 在《交易心理学》中有一句经典的话:"最好的策略给了一个心理素质不合格的人,效果和最差的策略没有区别。"
量化不是消灭了心理问题,只是把心理问题从"每笔交易的买卖决策"转移到了"要不要继续信任这个系统"。后者甚至更难,因为你面对的不是一次亏损,而是持续数周甚至数月的系统性回撤——你根本不知道这是正常波动还是策略失效。
5. 基础设施:那些看不见的成本
做量化交易需要的基础设施远超大多数人的想象:
| 项目 | 业余量化 | 专业量化 |
|---|---|---|
| 数据 | 免费 API / 几百元/月 | 数万至数十万/年(Bloomberg、Wind、高频数据) |
| 算力 | 个人电脑 | 云服务器集群 / GPU 集群 |
| 网络 | 普通宽带 | 低延迟专线 / 交易所co-location |
| 软件 | 开源框架(backtrader等) | 自研回测+执行引擎 |
| 运维 | 手动监控 | 24×7 自动化监控 + 告警 |
| 合规 | 不考虑 | 监管报告、审计 |
| 人力 | 你自己 | 团队(策略、开发、运维、风控) |
一个人做量化,你既是策略研究员、又是软件工程师、又是运维、又是风控、又是交易员。每一个角色都需要专业技能,而你只有一个人。
这不是能力问题,是带宽问题。一个人的时间和精力是有限的,你不可能在所有维度上都做到专业级别。
二、散户量化会被收割么?
这个问题的答案取决于你对"收割"的定义。
"收割"的三层含义
第一层:直接的对手盘收割
高频交易公司(HFT)通过速度优势,确实在系统性地赚取散户的钱。
一个经典的机制是"先手交易"(Front-Running)。虽然法律意义上的先手交易是违法的,但 HFT 有一种合法的变体:
你在券商下了一个买入订单。你的订单通过券商路由到交易所,这个过程需要几毫秒。在这几毫秒内,HFT 的算法已经检测到了你的订单(通过分析订单流模式),在你之前买入,推高价格,然后卖给你。你多付出的那一点点价差,就是 HFT 赚走的。
Michael Lewis 在《Flash Boys》中详细揭露了这种机制。虽然每笔交易中散户多付的金额很小(可能只有几分钱),但 HFT 每天处理数亿笔交易,积少成多就是天文数字。
Virtu Financial 在 2014 年 IPO 时披露了一个惊人的数据:在过去 1238 个交易日中,它只有一天是亏损的。这不是因为它预测市场方向有多准,而是因为它在每笔交易中通过速度优势赚取微小的价差——而这些价差的对手方,很大一部分就是散户。
第二层:信息不对称收割
机构拥有散户根本无法获得的信息优势:
- 另类数据:卫星图像、信用卡消费数据、社交媒体情绪分析、供应链追踪——这些数据的年费从几万到几百万美元不等。
- 暗池(Dark Pool):大型机构之间的私下交易场所,约占美国股市交易量的 40%。散户看不到这些交易,但这些交易影响价格。
- 研究优势:顶级量化基金每年在研究上投入数亿美元,雇佣数百名博士级研究员。一个散户利用业余时间做的研究,怎么和这种投入竞争?
第三层:结构性收割
这是最隐蔽、也最致命的一层。
你可能听过一个词叫 PFOF(Payment for Order Flow,订单流付费)。在美国,像 Robinhood 这样的"零佣金"券商,其实是把你的订单卖给了做市商(如 Citadel Securities)。做市商付钱买你的订单,是因为你的订单是"无毒"的——散户的订单通常不包含信息优势,做市商可以安全地站在你的对面赚取价差。
这意味着什么?你以为你是客户,其实你是产品。 你的交易行为本身就在为机构创造利润。
在加密市场,类似的结构性收割更加赤裸裸:
- 交易所自营盘:部分交易所同时做裁判和运动员,利用用户数据指导自营交易
- 插针:市场流动性薄弱时,突然出现极端价格波动,触发大量杠杆用户爆仓,随后价格迅速回归。这些"插针"是否是人为的,一直是争议话题
- 抢跑(MEV):在 DeFi 中,矿工/验证者可以看到待处理的交易,通过重排序交易来提取价值——你的大额 DEX 交易被三明治攻击(sandwich attack),前后被夹击
那么,散户做量化就是送死吗?
不一定。 但你必须极度清醒地认识到自己的劣势,然后找到属于你的"生态位"。
三、散户量化的生存之道
如果你已经被前面的内容劝退了,这很正常。事实上,大多数人不应该做量化交易——把钱放进指数基金,长期持有,大概率比自己折腾要好。
但如果你已经想清楚了,仍然决定在这个领域深耕,以下是几条生存策略:
1. 找到大象踩不到的角落
机构的最大弱点是什么?规模。
管理 500 亿美元的基金,需要在流动性充足的大盘股中交易。小盘股、微盘股、冷门市场——它们进不去,因为进出的成本太高。
这就是散户的机会。
- 小盘股 / 微盘股:机构无法涉足的领域,市场效率更低,错误定价更多
- 新兴市场 / 冷门资产:东南亚股市、小型加密货币——研究覆盖不足,定价效率低
- 低频策略:持仓周期在数周到数月的策略,不需要毫秒级的速度,执行成本也较低
- 特殊事件:小型并购、冷门股票的分红事件、指数微调——大基金看不上的"碎肉"
Joel Greenblatt(哥伦比亚大学教授、传奇投资者)在他的《你也可以成为股市天才》中指出:分拆、重组、破产重整等特殊事件中,经常有被忽视的投资机会——因为大型机构的研究覆盖不到这些角落。
2. 发挥个体优势
散户有几个机构不具备的优势,你可能没意识到:
a)没有规模诅咒
你的资金量小,意味着你的交易不会造成价格冲击。你可以在流动性很差的市场中自由进出,而机构做不到。
记住 Kyle 模型的结论:价格冲击与交易量的平方根成正比。你交易 1 万元,冲击几乎为零;机构交易 1 亿元,冲击可能是 1%-2%。
b)没有持仓限制
机构有各种合规要求:最低分散度、禁止投资某些行业、流动性要求等。你没有这些限制,可以 100% 配置在你最有信心的策略上。
c)没有委托人压力
机构基金经理有客户——客户看到亏损就要赎回,赎回逼迫基金经理在最差的时候卖出。2022 年加密市场暴跌期间,大量基金因客户赎回被迫在底部清仓。
你只对自己负责。你可以在别人恐慌清仓的时候不动,甚至加仓。这是一个巨大的结构性优势。
d)时间的朋友
机构基金经理被季度业绩、年度排名、客户报告追着跑。他们不能承受连续两个季度的亏损——即使策略长期有效。
你可以。你可以用三年、五年甚至十年的视角来评估策略,而不是纠结于这个月的盈亏。
3. 降低"军备竞赛"的维度
不要在机构擅长的维度上竞争。
| 维度 | 机构优势 | 散户策略 |
|---|---|---|
| 速度 | 微秒级延迟 | 放弃高频,做中低频策略 |
| 数据 | 另类数据、独家数据 | 聚焦公开数据中的深度分析 |
| 算力 | GPU 集群 | 简单但鲁棒的模型 |
| 资金 | 数百亿 | 利用小资金的灵活性 |
| 人才 | 博士团队 | 专注 1-2 个细分领域,做到极致 |
Edward Thorp(量化交易教父、凯利公式在投资领域的先驱)在回忆录中写道:"小投资者的最大优势是可以专注在大机构看不上的小机会上。一年赚 50 万美元的机会,对管理 500 亿的基金来说不值一提,但对个人来说已经改变了人生。"
4. 构建真正的认知壁垒
在信息和速度上你比不过机构,但在特定领域的深度认知上,你可以。
- 如果你是某个行业的从业者,你对该行业的理解可能比任何量化模型都深
- 如果你深度研究某个细分市场五年以上,你积累的直觉和模式识别能力是真实的 Alpha
- 如果你是开发者,你可以构建高度定制化的工具和框架,而不是用通用的开源框架
Buffett 不是量化交易者,但他说的这句话适用于所有投资:"能力圈不在于圈有多大,而在于你是否真的知道边界在哪里。"
5. 接受"小 Alpha"
很多人做量化的期望是年化 50% 以上。这是不切实际的。
回看全球最成功的量化基金的长期业绩:
| 基金 | 策略类型 | 年化收益(扣费后) |
|---|---|---|
| Medallion Fund | 多策略 | ~39%(但对外部投资者不开放) |
| Citadel Wellington | 多策略 | ~19% |
| Two Sigma Compass | 系统化 | ~14% |
| AQR | 因子投资 | ~8%-12% |
| Bridgewater Pure Alpha | 全球宏观 | ~9% |
注意:除了 Medallion 这个几乎不可复制的异类,其他顶级量化基金的年化收益大多在 10%-20% 之间。 这些基金有着几百名博士、数十亿美元的基础设施投入和数十年的积累。
作为散户量化交易者,如果你能做到年化 10%-15%、最大回撤控制在 20% 以内、夏普比率在 1.0 以上——你已经非常出色了,超过了绝大多数专业基金经理。
不要追求暴利。长期的、稳定的正 Alpha 是世界上最稀缺的东西之一。
四、量化交易的"暗面":行业里不愿意说的真话
1. 大部分"量化课程"在割韭菜
互联网上充斥着各种量化交易培训课程,价格从几百到几万不等。它们通常承诺:
- "零基础入门量化交易"
- "手把手教你打造年化 30% 的策略"
- "实现财务自由的量化交易系统"
冷静想一下:如果教课的人真的有年化 30% 的策略,他为什么要卖课?
Renaissance Technologies 的 Medallion Fund 管理的资金上限是 100 亿美元——因为超过这个规模,策略的容量不够了。如果你真的有持续赚钱的策略,最理性的做法是闷声发大财,而不是广而告之。
当然,并非所有量化教育都是骗局。好的课程可以教你基础知识和思维框架。但任何承诺具体收益率的课程,都是骗局,没有例外。
2. "量化基金"也在收割自己的投资者
对冲基金行业有一个经典的利益结构:2/20——2% 的管理费 + 20% 的业绩提成。
这意味着什么?
假设一个量化基金管理 10 亿元:
- 不管赚不赚钱,每年收 2000 万管理费
- 如果赚了 10%(1 亿),再收 2000 万业绩提成
- 基金经理总收入:4000 万
如果第二年亏了 10%:
- 仍然收 2000 万管理费
- 不收业绩提成
- 基金经理总收入:2000 万
两年合计:投资者赚了 0%(先赚 10% 再亏 10%,实际还亏了),基金经理赚了 6000 万。
Warren Buffett 在 2016 年的致股东信中做过一个计算:如果你在 1966 年投入 10000 美元到一个收费 2/20 的基金,假设基金业绩等同于标普 500 指数,到 2016 年你会得到约 22 万美元。而如果直接投资标普 500 指数基金,你会得到 119 万美元。 差额——97 万美元——被基金经理通过费用拿走了。
这不是"收割"是什么?
3. 量化行业的"幸存者叙事"
你听过文艺复兴、桥水、Citadel 的传奇故事。但你没听过的是:
- 每年有数百家量化基金悄悄关门
- 大量有着博士学位和顶级履历的量化研究员,开发的策略最终被证明无效
- 即使是成功的量化基金,也有长达数年的低迷期——AQR 在 2018-2020 年经历了有史以来最严重的回撤,价值因子几乎全面失效
你看到的是冰山之上的辉煌,看不到的是冰山之下的累累白骨。
五、一个诚实的自我评估框架
在你决定投入时间和金钱到量化交易之前,诚实地回答以下问题:
入场前的灵魂拷问
1. 你的机会成本是什么?
如果你是一个年收入 50 万的程序员,花 2000 小时研究量化交易的机会成本是:你可以用这些时间提升职业技能、跳槽到更好的公司、或者创业。2000 小时 × 你的时薪 = 一个很大的数字。
量化交易值得这个投入吗?除非你有极强的兴趣和天赋,否则对大多数人来说,答案是"不值得"。
2. 你有多少可以亏得起的钱?
量化交易必须用你"完全亏得起"的钱。这笔钱归零不会影响你的生活质量、家庭关系和心理健康。
如果你用的是养老钱、首付款或者借来的钱——不要做。因为心理压力会摧毁你的决策质量,你几乎肯定会在最差的时候退出。
3. 你能坚持多久?
量化交易从入门到可能盈利,通常需要 2-5 年的全方位学习和实践。这段时间里,你的主要产出是"学费"(亏损 + 时间成本)。
你有耐心和资源度过这段"冷启动期"吗?
4. 你有什么独特的优势?
回到系列第一篇的灵魂拷问:你的 Alpha 来源是什么?如果你说不清楚,或者你的回答是"我学了一个策略/因子模型"——那这不是优势,因为所有人都能学到同样的东西。
真正的优势可能是:
- 你在某个行业有 10 年以上的深度经验
- 你有独特的数据源
- 你在某种数学/统计方法上有极深的造诣
- 你有超强的工程能力,可以构建别人构建不了的系统
5. 你能接受大概率失败吗?
即使你做对了所有事情,量化交易的成功率仍然很低。保守估计,只有 5%-10% 的量化交易尝试者能在扣除所有成本后实现长期正收益。
这不是因为他们不聪明、不努力。这是因为市场本身的竞争强度决定了——大多数参与者注定是负 Alpha 的。这是数学。
六、终极答案:做量化最难的,不是技术
写到最后,我想说一个可能出乎你意料的结论:
做量化最难的,不是数学、不是编程、不是策略设计、甚至不是风控——而是"认清自己"。
认清自己意味着:
- 诚实地评估自己的能力边界,不高估自己
- 接受"我可能就是那 90% 中的一个"的可能性
- 区分"我真的有优势"和"我以为我有优势"
- 在市场面前保持谦逊,承认自己知道的远比不知道的少
- 接受小 Alpha、慢回报、长周期的现实
Ray Dalio(桥水基金创始人) 说过一句我反复咀嚼的话:
"The biggest mistake investors make is to believe that what happened in the recent past is likely to persist."
"投资者犯的最大的错误,是相信最近发生的事情会一直持续下去。"
这句话用在量化交易上格外精准:
- 你的策略最近三个月赚钱了 → 不意味着它一直能赚
- 你的策略最近一个月亏钱了 → 不意味着它失效了
- 市场最近很好做 → 不意味着以后也好做
- 市场最近很难做 → 不意味着以后没机会
量化交易不是一道题目,做完了就有标准答案。它是一场马拉松,跑的是你对市场、对概率、对自己的理解深度。
如果你在读完这篇文章后仍然决定做量化——祝你好运。不是客套话,是真心话。因为你需要运气,就像你需要技术、纪律和自知之明一样。
在这场游戏里,最终活下来的不是最聪明的人,而是最清醒的人。
系列回顾
六篇文章,我们走过了这样一条路:
- 底层逻辑:Alpha 从哪来、市场微观结构、期望值思维
- 经典策略:动量、均值回归、统计套利的原理和局限
- 风险管理:仓位管理、回撤控制、尾部风险、杠杆
- 多因子模型:因子的定义、六大核心因子、因子组合
- 认知陷阱:过拟合、幸存者偏差、前视偏差、黑天鹅
- 做量化为啥这么难(本篇):竞争格局、被收割的风险、散户的生存之道
如果只记住一句话:做量化最重要的不是找到一个赚钱的策略,而是搞清楚在这场所有聪明人的博弈中,你的位置到底在哪里。
免责声明:本系列文章仅为教育目的,不构成任何投资建议。金融市场存在极高风险,请在充分了解风险后做出自己的判断。
关注公众号「coft」,获取更多 AI 时代的深度思考。

浙公网安备 33010602011771号