1、材料科学、物理、化学等相关专业学生及高校教师、实验组人员;
2、生物制药、半导体、新能源、高分子等相关领域的科研工作者;
3、人工智能、工业设计、材料研发、药物结构等相关领域的开发人员
我们都知道从第一性原理出发的分子动力学(Ab Initio Molecular Dynamics, AIMD)计算,需要消耗大量时间和计算资源。但另一方面,体系中每个原子的能量,可通过考察其邻近原子的几何位置即组态(Configuration)近似得到。因此借助机器学习的方法,辅助已有的第一性原理计算结果,有望大幅加速分子动力学计算,提高在有限计算资源内可模拟的体系的大小以及模拟的时长。
在许多特定的工业领域,PWmat-MLFF机器学习平台有望带来前所未有的改变。例如,对晶体结晶过程模拟的时长和体系规模,可以借助机器学习方法大幅提高,从而加深人们对结晶过程的认识;而机器学习也可以结合动能蒙特卡罗(Kinetic Monte Carlo),模拟各种表面生长过程;最后,机器学习也可应用于对电解液等溶剂体系的研究当中。
一、课程大纲
1、理论背景
特征的产生
线性模型
VV模型
KFNN模型
KFDP模型
2、实际操作
(1)数据预处理
如何处理PWmat格式的分子动力学数据
如何处理VASP格式的分子动力学数据
(2)训练:如何判断训练模型的质量
(3)分子动力学计算
PWmat框架下的分子动力学计算
LAMMPS框架下的分子动力学计算
二、PWmat—MLFF亮点
1、对于扩展系统,PWmat-MLFF假设系统的总能量是系统中每个原子能量的总和。我们用不同的局域原子描述符(即所谓“特征”)来描述局部原子结构,以这些特征作为回归模型的输入,拟合原子能量。PWmat-MLFF支持的回归模型包括线性模型、VV模型(龙讯团队开发的一种独特的非线性模型)、深度神经网络(Deep NN)模型和DP-torch模型,同时也包含大部分的常用特征,用户可以任意地重新组合它们。
2、PWmat-MLFF另一个独特功能是可以结合PWmat分子动力学计算中的能量分解功能,将局域的原子能量作为输入。由于局域原子能量可以直接作为数据输入回归模型,这可以显著减少训练所需的分子动力学步数,因此可以克服机器学习需要长时间预运算来产生训练数据这一困难。在PWmat- MLFF中,总能量、局域原子能量和原子受力均可以作为训练输入。与此同时,使用市面上常规第一性原理软件的用户也可以使用PWmat-MLFF进行训练,但将无法使用PWmat的能量分解功能。
3、PWmat-MLFF是GNU License的开源平台,结构灵活,用户可以自由组合特征和训练模型,且可以根据自身需要开发新的特征以及训练模型。
4、PWmat-MLFF 在训练过程中引入Kalman滤波器,加速训练过程。在DP-torch模型中,引入Kalman滤波器使得训练收敛的时间减少了一半。