3. 金融机器学习之【订单流与价格形成】 - 指南
目录
系列文章目录
3. 金融机器学习之【订单流与价格形成】
前言
本文章所属系列:
《Machine Learning and Data Sciences for Financial Markets: A Guide to Contemporary Practices》文章解读。
该书是由Agostino Capponi和Charles-Albert Lehalle联合主编的学术著作,由剑桥大学出版社于2023年8月出版。
该书整合60余位领域专家的研究成果,涵盖金融机器学习的前沿实践,旨在桥接传统量化金融与现代数据科学,环境探讨机器学习在金融市场的应用。
Order Flow and Price Formation位于原书129-151页,隶属于该书第一大板块。
文章指出订单流(order flow)和市场影响(market impact)是在金融市场价格形成的微观机制中的核心要素。这一过程高度复杂,存在反馈循环和市场结构的制约。
文章是针对金融市场的微观机制的科普、数理建模和对模型性质的分析众多计量经济模型、动态决策、数据流方法等的基础,但并不涉及具体的算法、模型或实证。就是,
感兴趣的读者请自行延申学习,或向笔者留言。

阅读难度:★★★☆☆(研究生/入门水平)
一、预备知识
- 限价订单簿(Limit Order Book, LOB)

金融市场中存储就是现价订单簿,未成交买卖订单的电子队列架构。
其包括的信息有:买价(Bid)、卖价(Ask)、价差(Spread)、中间价(Midprice)。其动态机制包括:市价单(Market Order)、限价单(Limit Order)。
- 市场影响

市场影响指的是订单对价格的瞬时或滞后影响。
市场影响行被这三个理论解释:(1)信息效应:交易传递私有信息(如知情交易者买入推升价格)。(2)预测效应:订单预测短期价格变动(Hasbrouck观点)。(3)机械效应:单纯供需失衡导致价格偏移(与信息无关)。
- 元订单(Metaorder)

元订单指的是同一交易决策下拆分的订单序列(如机构大额交易)。
二、对限价订单簿建模
限价订单簿(LOB)的动态本质是订单流驱动的队列系统。价格形成过程通过买卖订单的到达、执行与撤销实现,而建模需捕捉其高维非线性特征。
现有方法可分为三大类:
1. 计量经济学模型
该模型的核心思想是将LOB的高维状态变量(如最优买卖价、队列深度)与价格变动视为联合时间序列,建立向量自回归(VAR)、条件向量自回归(CVAR)或误差修正模型(ECM)。
时间序列模型可以容纳很高维的变量,但实际上,LOB状态变量的维数通常并不高,甚至不超过10。笔者注。
这种典型的统计模型能够兼容标准时间序列分析软件,比如可能量化计算脉冲响应函数的影响。但会忽略订单流与LOB状态的非线性反馈。
2. 随机点过程模型
该模型的核心思想是将订单到达(限价单/市价单/撤单)建模为多变量标记点过程,通过强度函数(intensity)刻画事件相关性。
关键的模型包括零智能模型(Zero-Intelligence)和霍克斯过程(Hawkes Process)。
因为就是零智能模型被称为“零智能”模型假设交易者行为完全随机,典型的假设是由随机泊松过程驱动,没有任何智能或策略成分。

霍克斯过程通过引入关于时间强度的核函数矩阵,描述事件间自激励与交叉激励(如市价单引发同向限价单)。g为激励函数,当g=0时退化为齐次泊松过程,即零智能模型的假设。
霍克斯过程在时序分析的各类对象、各个目标中都极其常用且有用。笔者注。
随机过程模型的优势在于存在解析解,且兼容LOB状态方程。

LOB状态方程表明t时刻的价格变动由历史LOB状态与近期订单流两者共同决定。但这个方程没有实际的计算意义,因为函数F需要自行确定。
在实际建模中,需引入LOB状态以降低维度,本质是高维非线性系统的信息压缩问题,计算量极大。现已经达成了用深度神经网络直接从LOB状态预测价格变动(Sirignano ,2019),突破了传统模型维度限制。笔者注。
3. 多主体模型
多主体模型(Agent-Based)意在构建人工市场,定义异质代理人(如趋势跟踪者、做市商)在LOB中的策略交互,是一种更接近现实场景的模型。
该模型包含主动的机制模拟(统计模型只被动地接收信息),代理人根据私有信息、市场状态(如价差、队列深度)制定策略、提交订单。
具体来说,流动性提供者的行为是动态调整限价单价格与数量,流动性消耗者则根据短期价格预测提交市价单。
该模型的优势十分明显,可以复现LOB典型事实(如fat-tailed returns、波动聚集),并用于政策测试(如最小报价单位改革的影响)。
其局限性也很明显,即计算成本高、计算复杂度高、不适用高频交易。
这是因为策略参数的数量过于庞大,但在未来可能能够依赖量子计算机。笔者注。
三、建模方法的选择
通常,选择何种建模方法,取决于手头的数据、计算资源,以及模型的目标。
针对LOB,另一标准是:模型是否存在外生性假设,即你是否认为订单流独立于价格变动。
必然成立的。笔者注。就是主流观点和个人观点都是[不外生],即当下的价格变动会影响未来的订单流,并将影响传递下去并反馈上来。总之,LOB方程
1. 外生订单流模型
外生订单流模型存在外生性假设,即订单流独立于价格变动。
1.1 瞬态影响模型(TIM):
TIM(Transient Impact Model)模型由霍克斯过程衍生而来。

其中,
是随时间衰减的核函数,
是s时刻的带方向的订单交易量,
为交易量函数,通常写作
,是一个凸函数。
1.2 历史依赖模型(HDIM):
引入交易符号的线性预测算子
,可以得到价格过程的精确鞅,再将TIM模型推广到多个事件中,可以得到历史依赖模型(History Dependent Impact Model)。

其中,
是影响核,取决于过去的事件类型和当下的事件类型。
TIM与HDIM在单一事件类型下等价,但多事件类型下不等价(Taranto et al., 2018)。核函数的幂律衰减G与订单流长记忆性相关。笔者注。
2. 内生订单流
内生订单流模型不存在外生性假设,即订单流不独立于价格变动。
典型的模型是VAR模型(Hasbrouck,1991),用
表示价格变化和交易量函数的向量,可以得到递推式:

VAR模型在学术研究领域早已不是前沿模型了,但在实证中依旧很常用。笔者注。
在VAR模型的基础上,Hautsch & Huang (2012)考虑一个向量具备:bid/买入价、ask/卖出价、LOB两侧前三个报价的排队量,以及两个指示买入和卖出交易发生的虚拟变量。
将VAR模型拓展为:

α和β分别为加载系数和协整矩阵,
为参数矩阵。
连续时间霍克斯过程(Bacry & Muzy,2014)则是将VAR模型拓展到连续时间的场景:

四、订单流的实证特征
过去的几十年内,订单流在众多的实验中展现出了以下的特征:
长记忆性:市场订单符号
的自相关函数满足
。实证表明
,这意味着市场订单符号是一个长记忆过程,即缺乏典型的时间尺度(Lillo & Farmer, 2004)。分解验证:通过经纪商标签内容,证明自相关主要来自同一交易者的订单拆分(
>75%),而非羊群效应(Tóth et al., 2015)。霍克斯过程应用:8维霍克斯模型(Bacry et al., 2016)显示订单流以自激励(self-excitation)为主,而价格变动呈均值回归。
文章只是总结罗列这些特征,感兴趣的读者可以自行了解这些特征的实证。笔者注。
五、交叉影响
交叉影响的概念在《金融机器学习之【资金流动与价格形成】》一文中也有提及。
在订单流的场景中,类似地,资产i的订单流会影响资产j的价格,它们的作用关系记为交叉反馈函数(cross response function):

举个例子,将交叉影响考虑到TIM模型中,TIM模型就会扩展为:

其中
是在交易资产j时对资产i价格产生的(瞬时)影响度量,
表示资产i的波动率,
是一个维纳过程,即布朗运动。
交叉影响源于流动性共通性(commonality)和报价修订(quote revision),对投资组合执行、风险管理与成本控制至关重要。但也会给模型增加参数、增加约束,甚至在量化策略中,考虑交叉影响可能需要重构策略,比较常见的例子是跨境ETF套利。笔者注。
六、元订单的市场影响
元订单(同一决策下的订单序列)的市场影响定义为:
![]()
其中,
是元订单开始和结束之间的对数价格变化,
是元订单的大小,
是元订单的持续时间。
可见元订单建模的输入变量和数据结构与原始订单流是不同的,后面会进一步解释。笔者注。
文章指出,市场影响是与元订单执行的平均影响成本直接相关的。用
表示t时刻的资产状况,
表示资产状况对时间的一阶导数,可以表示预期的实施成本缺口,即预期成本与通过以初始价格进行市值计价后的理论成本之间的差额。

在实证中,元订单(在某些限制下)展现出了大订单平方根定律(squareroot impact law)、分区回归、小订单线性偏离等数理性质,在此不一一展开。
在对订单流的整体建模中,需要设计一个识别机制(如隐马尔可夫模型、层级建模、异质代理等),从原始订单流中提取出元订单,对元订单降维后进行建模和计算。元订单的数据结构、输入维度等和原始订单流都是不同的,因此实证中,常用层级建模(检测→属性提取→冲击叠加→动态计算价格),被证明是平衡精度与复杂度的最优解。笔者注。
七、协共影响
协共影响的概念在《金融机器学习之【资金流动与价格形成】》一文中也有提及。
考虑某一天有N个元订单,每笔订单记作
,V是当天的平均交易量。记
是一个买入的元订单,
是在它之前的所有元订单,在平方根定律成立的前提下,定义元订单对价格变化的协同影响为:

在N个元订单的场景中,具体为:

在N比较小的时候,协同影响接近线性。N比较大的时候则是接近平方根影响。
总结
本篇文章为文献综述和学科发展回顾的论文,涉及到了专业术语解释、数理理论推导、抽象数据建模等,但整体依旧为科普性质的文章。适合已有金融市场和计量经济学基础知识的学生及从业者进行阅读学习。
更多的文章请关注该文章解读系列,我会持续更新。
欢迎各位读者在评论区交流讨论。
浙公网安备 33010602011771号