End-to-end Symmetry Preserving Inter-atomic Potential Energy Model for Finite and Extended Systems 论文笔记
End-to-end Symmetry Preserving Inter-atomic Potential Energy Model for Finite and Extended Systems
简介
精确、高效地表示 PES (inter-atomic potential energy surface) 是分子模型中最具挑战性的问题之一。对于该问题,传统方法无外乎两种:
-
直接应用量子力学模型,例如 DFT (density functional theory),这种方法精度高,缺点是系统规模大小严重受制于当前算力;
-
构造经验原子势能模型,例如 EAM (embeded atomic method),这种方法速度快很多,但缺点是精度不高,可移植性差。
上面两种方法的精度-速度取舍长时间影响了分子模型的发展。近年诞生了以机器学习和神经网络模型求解 PES 的方法,对于同时提升精度-速度方面有很大潜力。因此一个通用的、泛化性好的、置信度高的 ML-based PES 框架非常重要。
一个好的 PES 模型应该满足以下条件:
-
模型应该和量子力学具有相同的精度,无论是有限系统还是扩张系统。
有限系统 (finite system):系统是隔离的,并且被真空包裹
扩张系统 (extended system):系统具有周期边界条件
-
模型只能输入元素类型和原子坐标
-
模型是可扩张的。即假设系统由 A 和 B 两个子系统组成,那么总系统的能量应该接近 A 和 B 各自能量之和
-
模型应该是自然保持对称性的。包括平移 (translation)、旋转 (rotation)、对换 (permutation)
-
模型中无人工经验参与。即模型应该是端到端的,尤其是对于多成分 (multi-component)、多相 (multi-phase) 系统,这种尚没有很好的人工经验的。
-
模型应当具有一定的平滑性,例如为了保证相互作用力的合理性,PES 应该一阶连续可导。
现存的模型往往只能满足上述的一部分要求。本文提出的 DeepPot-SE 满足以上所有条件,并且在较难的数据中做了测试(例如 HEAs (high entropy alloys))
方法
预备知识
考虑一个三维欧氏空间中包含\(N\)个原子的系统,\(r=\{r_1, r_2,\cdots, r_N\}\)。定义坐标矩阵 \(R\in \R^{N\times3}\),其中第 \(i\) 列表示 \(r_i\) 的三维坐标
PES 函数 \(E(R)\equiv E\) 把原子坐标和元素类型映射成一个实数。使用能量 \(E\) 我们可以定义力 \(F(R)\equiv F\in \R^{N\times3}\) 和维里张量 \(\Xi(R)=\Xi\)
设 \(w\) 是模型的参数。我们可以把系统的总能量写成每个原子所占有的能量之和,即
其中\(\alpha_i\)表示第\(i\)个原子的元素种类。\(E^{w_{\alpha_i}}\)表示该原子的能量函数依赖于 \(\alpha_i\)。取截断半径为\(r_c\),即两个原子之间的距离如果超过\(r_c\),则其能量忽略不计。对于每个原子 \(i\),考虑其半径为 \(r_c\) 的邻域内的原子 \(\{j|j \in N_{r_c}(i)\}\),记这样的原子共有 \(N_i\) 个,即 \(N_i=|N_{r_c}(i)|\),则原子的局部环境 (local environment)
其中 \(r_{ji}=r_j-r_i\) 表示邻域内的原子相对中心原子的相对坐标。
对于每一个原子,我们使用一个子网络计算其能量。每个子网络包括一个 encoding 网络和 fitting 网络。encoding 网络把 \(R^i\) 映射成一个平移、旋转、对换不变性的特征图;fitting 网络是一个含跳层连接的全连接网络,把上一步的特征图映射成原子能量。
构建保持对称性的映射
首先表示一个等变性的标量函数\(f\)
损失函数包括能量、力、维里张量三个部分。只用能量也足以训练,但是有后面二者的监督精度会更高(数值拟合中常见的情况,一阶导数提升拟合精度)。

浙公网安备 33010602011771号