小分子配体可以广泛应用在生物领域例如药物设计等,其中在生物应用领域,蛋白质是最为广泛的药物靶点。本文介绍一种建立力场的方式以及在蛋白质-小分子模拟过程中需要注意的重要问题。
首先,我们选择需要模拟的蛋白质和小分子。蛋白质的构象可以从在线的PDB库找到(https://www.rcsb.org/ )。小分子的构象可以通过相关的网页或者软件进行构建。然后通过手动或者对接的方式将蛋白和小分子组合。这样就可以初步得到蛋白-配体复合物的构象。如下图:
之前的模拟介绍过如何生成蛋白质的力场。如果此时使用gmx pdb2gmx -f AA.pdb -o AA.gro命令来建立力场时,会发现gromacs无法识别小分子并产生相关的力场。在此我们介绍一种生成力场的工具:CGenFF (https://cgenff.umaryland.edu/ ),我们可以通过该网站提供的工具产生mol2文件。其中要注意的是生成力场是一定要对配体把缺失的H原子补上,以生成准确的全原子力场。注意生成的mol2文件可能存在一些小错误需要手动修改。
在此我们还需要准备需要的力场文件,然后利用我们提供的脚本来进行力场的建立。大概命令为:python ff_charmm2gmx.py AA AA_fix.mol2 aa.str charmm36-mar2019.ff。力场生成后需要准确将力场文件以及对应的模拟参数文件逐个写入top文件。如图所示:
力场生成后我们可能还需要手动修改蛋白-配体结构文件。在此我们就可以通过使用对应命令来构建盒子并且添加溶剂。如图所示
之后的模拟就可以按步骤利用对应的mdp文件生成tpr并且进行模拟。如:
gmx editconf -f complex.gro -o newbox.gro -bt cubic -d 1.0
gmx solvate -cp newbox.gro -cs spc216.gro -p topol.top -o solv.gro。
本文中,我们主要介绍了CGenFF 这一较为精确的力场产生工具。但是在使用该工具是仍会遇到各种问题,例如脚本内容的更换,原子的检查以及成键信息或者位置限定的多种方式。