End-to-end Symmetry Preserving Inter-atomic Potential Energy Model for Finite and Extended Systems 论文笔记

End-to-end Symmetry Preserving Inter-atomic Potential Energy Model for Finite and Extended Systems

简介

精确、高效地表示 PES (inter-atomic potential energy surface) 是分子模型中最具挑战性的问题之一。对于该问题,传统方法无外乎两种:

  1. 直接应用量子力学模型,例如 DFT (density functional theory),这种方法精度高,缺点是系统规模大小严重受制于当前算力;

  2. 构造经验原子势能模型,例如 EAM (embeded atomic method),这种方法速度快很多,但缺点是精度不高,可移植性差。

上面两种方法的精度-速度取舍长时间影响了分子模型的发展。近年诞生了以机器学习和神经网络模型求解 PES 的方法,对于同时提升精度-速度方面有很大潜力。因此一个通用的、泛化性好的、置信度高的 ML-based PES 框架非常重要。

一个好的 PES 模型应该满足以下条件:

  1. 模型应该和量子力学具有相同的精度,无论是有限系统还是扩张系统。

    有限系统 (finite system):系统是隔离的,并且被真空包裹

    扩张系统 (extended system):系统具有周期边界条件

  2. 模型只能输入元素类型和原子坐标

  3. 模型是可扩张的。即假设系统由 A 和 B 两个子系统组成,那么总系统的能量应该接近 A 和 B 各自能量之和

  4. 模型应该是自然保持对称性的。包括平移 (translation)、旋转 (rotation)、对换 (permutation)

  5. 模型中无人工经验参与。即模型应该是端到端的,尤其是对于多成分 (multi-component)、多相 (multi-phase) 系统,这种尚没有很好的人工经验的。

  6. 模型应当具有一定的平滑性,例如为了保证相互作用力的合理性,PES 应该一阶连续可导。

现存的模型往往只能满足上述的一部分要求。本文提出的 DeepPot-SE 满足以上所有条件,并且在较难的数据中做了测试(例如 HEAs (high entropy alloys))

方法

预备知识

考虑一个三维欧氏空间中包含\(N\)个原子的系统,\(r=\{r_1, r_2,\cdots, r_N\}\)。定义坐标矩阵 \(R\in \R^{N\times3}\),其中第 \(i\) 列表示 \(r_i\) 的三维坐标

\[R=\{r_1^T, \cdots, r_i^T, \cdots, r_N^T\},\quad r_i=(x_i, y_i, z_i) \]

PES 函数 \(E(R)\equiv E\) 把原子坐标和元素类型映射成一个实数。使用能量 \(E\) 我们可以定义力 \(F(R)\equiv F\in \R^{N\times3}\) 和维里张量 \(\Xi(R)=\Xi\)

\[F=-\nabla_RE\quad (F_{ij}=-\nabla_{R_{ij}}E)\\ \Xi=tr(R\otimes F)\quad (\Xi_{ij}=\sum_{k=1}^NR_{ki}F_{kj}) \]

\(w\) 是模型的参数。我们可以把系统的总能量写成每个原子所占有的能量之和,即

\[E^w(R)=\sum_iE^{w_{\alpha_i}}(R^i)\equiv E_i \]

其中\(\alpha_i\)表示第\(i\)个原子的元素种类。\(E^{w_{\alpha_i}}\)表示该原子的能量函数依赖于 \(\alpha_i\)。取截断半径为\(r_c\),即两个原子之间的距离如果超过\(r_c\),则其能量忽略不计。对于每个原子 \(i\),考虑其半径为 \(r_c\) 的邻域内的原子 \(\{j|j \in N_{r_c}(i)\}\),记这样的原子共有 \(N_i\) 个,即 \(N_i=|N_{r_c}(i)|\),则原子的局部环境 (local environment)

\[R^i=\{r_{1i}^T,\cdots, r_{ji}^T,\cdots,r_{N_i,i}^T\},\quad r_ji=(x_{ji}, y_{ji}, z_{ji}) \]

其中 \(r_{ji}=r_j-r_i\) 表示邻域内的原子相对中心原子的相对坐标。

对于每一个原子,我们使用一个子网络计算其能量。每个子网络包括一个 encoding 网络和 fitting 网络。encoding 网络把 \(R^i\) 映射成一个平移、旋转、对换不变性的特征图;fitting 网络是一个含跳层连接的全连接网络,把上一步的特征图映射成原子能量。

构建保持对称性的映射

首先表示一个等变性的标量函数\(f\)

\[{\hat T}_bf(r)=f(r+b), {\hat R}_Uf(r)=f(rU), {\hat P}_\sigma f(r)=f(r_{\sigma(1)},r_{\sigma(2)},\cdots,r_{\sigma(N)}) \]

损失函数包括能量、力、维里张量三个部分。只用能量也足以训练,但是有后面二者的监督精度会更高(数值拟合中常见的情况,一阶导数提升拟合精度)。

posted @ 2021-01-12 15:38  许瑞晗  阅读(351)  评论(0)    收藏  举报