分子力场拟合方法

文档序号:1143100 发布日期:2020-09-11 浏览:17次 >En<

阅读说明:本技术 分子力场拟合方法 (Molecular force field fitting method ) 是由 周云飞 马健 温书豪 赖力鹏 于 2020-04-21 设计创作,主要内容包括:一种分子力场拟合方法,其特征在于,包括:切分:输入大分子3D构象,指定切分位置,将大分子切分为小分子片段,保存小分子片段与输入的大分子之间的原子对应关系;专有力场拟合:对小分子片段进行专有力场拟合,保存拟合好的力场参数;拼接:根据小分子片段与输入的大分子之间的原子对应关系,将拟合后小分子力场拼接成大分子力场;上述分子力场拟合方法将大分子切为较小分子片段,切分原则是在尽可能减少分子自由度(分子复杂度)的同时,保留分子内部临近基团之间的耦合作用,然后分别拟合小分子的力场参数,这个做法弥补了通用力场自身的不足,同时分子量的减少,也相应的减少了量化计算量以及力场参数拟合的难度。(A molecular force field fitting method, comprising: cutting: inputting a macromolecule 3D conformation, designating a segmentation position, segmenting the macromolecule into small molecular fragments, and storing atom corresponding relations between the small molecular fragments and the input macromolecule; fitting of a proprietary force field: carrying out special force field fitting on the small molecular fragments, and storing the fitted force field parameters; splicing: splicing the fitted small molecular force fields into a large molecular force field according to the atom corresponding relation between the small molecular fragments and the input large molecules; according to the molecular force field fitting method, macromolecules are cut into smaller molecular fragments, the principle of cutting is that the degree of freedom (molecular complexity) of molecules is reduced as much as possible, the coupling effect between adjacent groups in the molecules is kept, and then force field parameters of the small molecules are fitted respectively.)

分子力场拟合方法

技术领域

本发明涉及分子力场分析领域,特别涉及一种分子力场拟合方法。

背景技术

分子力场从覆盖度可分为通用力场和专有力场两大类。通用力场的参数是基于大量的小分子片段或者原子的量化数据以及一些实验数据拟合而来,不同类别的通用力场定义的方式(函数形式和原子类型的定义)不同,训练的方式也会有所差异,但是他们的通性都是具有可迁移性,可拓展性,并满足一定精度;而专有力场则是针对某一具体分子,在通用力场参数的基础之上拟合而来,使用训练集,采取一定的策略对力场的各项参数的进一步拟合修正,对这一分子或者这一类分子的描述精度随之提高。

实际的应用中,通用力场展现了其较强的迁移性,但是不足之处是对于一些自由度较高的有机分子,通用力场表现出来的精度较低(以量化数据为参比,与量化数据的相关性较差),原因是由于通用力场的参数在拟合时,为了平衡计算量以及其通用性,一般采用的是最小分子片段,最多覆盖1~2个柔性角,并未考虑到实际分子内部临近的化学基团(可理解为不同的二面角)之间的存在耦合作用,从而导致对分子的势能面描述不准确,这样的力场在模拟中很可能引起较大的结构偏差和能量偏差。

现有的专有力场的拟合所采用的是完整分子的量化数据,弥补了通用力场的不足之处,提高了力场计算的精度,但是专有力场需要预先准备大量的量化数据作为训练集。分子自由度较高时,构象搜索空间会随之增加,那么量化计算的计算量也随之增加,无疑增加了力场拟合的难度和消耗。因此就需要在精度和成本之间做选择。

发明内容

基于此,有必要提供一种可平衡精度和成本的分子力场拟合方法。

一种分子力场拟合方法,包括:

切分:输入大分子3D构象,指定切分位置,将大分子切分为小分子片段,保存小分子片段与输入的大分子之间的原子对应关系;

专有力场拟合:对小分子片段进行专有力场拟合,保存拟合好的力场参数;

拼接:根据小分子片段与输入的大分子之间的原子对应关系,将拟合后小分子力场拼接成大分子力场。

在优选的实施例中,所述大分子3D构象包括:每个原子对应的唯一的序号、及三维坐标。

在优选的实施例中,所述切分位置的位点间隔至少三个原子,间隔部分的基团为共用基团,切分出来的小分子片段包括公共基团,被切断的化学键于断开位置补充氢原子。

在优选的实施例中,所述切分时保留大分子内部邻近基团之间的耦合作用。

在优选的实施例中,所述耦合作用:判断大分子邻近基团做柔性二面角扫描时相互之间的位置是否对扫描结果有显著影响。

在优选的实施例中,柔性二面角扫描为二面角绕着中间轴做360度旋转,同时计算分子各个位置的能量,二面角做扫描时邻近两基团之间由于有位阻效应或形成分子氢键则判断相互显著影响,具有耦合作用;切分时位点不能选在两个基团之间,将两个基团切分到同一个分子中。

在优选的实施例中,切分后返回切分后小分子片段的3D结构、及小分子片段与输入大分子原子之间的原子对应关系。

在优选的实施例中,所述专有力场拟合:对小分子片段进行电荷参数的拟合并保存拟合后的电荷参数文件,同时分别对小分子片段拟合键、角、二面角、非键作用项参数保存到参数文件中,根据键参数、角参数、二面角参数、非键作用项计算分子的能量。

在优选的实施例中,电荷参数的拟合为计算每一个原子所带电荷,非键作用项包括:静电作用、范德华作用,所述专有力场拟合:根据键参数、角参数、二面角参数、静电作用项、范德华作用项计算分子的能量;计算公式如下;

Figure BDA0002460077980000031

其中键伸缩项中kb是力常数,r是键长,r0是键处于平衡位置的长度;

键角弯曲项:kθ是力常数,θ是键角,θ0是平衡位置的键角;

二面角项Vn代表二面角旋转过程中势能的最高时值,n用来调整周期性,φ为变量二面角的值,γ代表相即二面角的角度;

Aij,Bij,Rij是范德华参数,

范德华作用可以用标准的lennard-Jones势表示:在力场表达式中:Aij=4εijσij 12,Bij=4εijσij 6

Rij表示两个原子之间的距离,εij表示两个原子之间势阱的深度,σij是势能为零时两个原子之间的距离。

静电作用表达式:

Figure BDA0002460077980000033

中,ε为有效介电常数,qi、qj分别是原子i,j所带的电荷,Rij是两个原子之间的距离;

参数文件包括:原子类型定义、分子拓扑。

专有力场拟合还包括:对小分子片段扫描得到小分子片段结构作为训练集,根据函数计算小分子片段的能量,若较计算的能量与标准能量相关性好,获得力场参数,通过迭代解出各项参数值。

在优选的实施例中,所述拼接步骤中,首先获取输入大分子的初始参数,根据小分子片段与输入大分子之间的原子对应关系重组输入大分子的力场参数,所述初始参数包括分子拓扑。

上述分子力场拟合方法将大分子切为较小分子片段,切分原则是在尽可能减少分子自由度(分子复杂度)的同时,保留分子内部临近基团之间的耦合作用,然后分别拟合小分子的力场参数,这个做法弥补了通用力场自身的不足。利用小分子片段构建训练集拟合专有力场,虽然分子数有所增加,但是由于每个分子的自由度较低,在进行系统构象搜索时,搜索空间大幅度降低,减少了时间上的耗费,同时分子量的减少,也相应的减少了量化计算量以及力场参数拟合的难度。这种方法既提高了力场参数的精度,同时又减少了参数重拟合的难度和成本。

附图说明

图1为本发明一实施例的分子力场拟合方法的流程图;

图2为本发明一实施例的待拟合大分子;

图3为图2的待拟合大分子的3D图;

图4为图2的待拟合大分子切分后的分子片段的示意图。

具体实施方式

如图1所示,本发明一实施例的分子力场拟合方法,包括:

步骤S101,切分:输入大分子3D构象,指定切分位置,将大分子切分为小分子片段,保存小分子片段与输入的大分子之间的原子对应关系;

步骤S103,专有力场拟合:对小分子片段进行专有力场拟合,保存拟合好的力场参数;

步骤S105,拼接:根据小分子片段与输入的大分子之间的原子对应关系,将拟合后小分子力场拼接成大分子力场。

本实施的3D构象不限形式。

进一步,本实施例的大分子3D构象包括:每个原子对应的唯一的序号、及三维坐标。

进一步,本实施例的切分位置的位点间隔至少三个原子,间隔部分的基团为共用基团,切分出来的小分子片段包括公共基团,被切断的化学键于断开位置补充氢原子。

进一步,本实施例切分时保留大分子内部邻近基团之间的耦合作用。

进一步,本实施例的耦合作用:判断大分子邻近基团做柔性二面角扫描时相互之间的位置是否对扫描结果影响显著。

进一步,本实施例的柔性二面角扫描为:二面角绕着中间轴做360度旋转,同时计算分子各个位置的能量。

进一步,若二面角做扫描时邻近两基团之间由于有位阻效应或形成分子氢键则判断相互影响,具有耦合作用。

进一步,本实施例切分时位点不能选在两个基团之间,将两个基团切分到同一个分子中。

进一步,本实施例切分后返回切分后小分子片段的3D结构、及小分子片段与输入大分子原子之间的原子对应关系。

进一步,本实施例专有力场拟合步骤:对小分子片段进行电荷参数的拟合并保存拟合后的电荷参数文件,同时分别对小分子片段拟合键、角、二面角、非键作用项参数保存到参数文件中,根据键参数、角参数、二面角参数、非键作用项计算分子的能量。

电荷参数的拟合为计算每一个原子所带电荷,非键作用项包括:静电作用、范德华作用,所述键参数包括:键伸缩项、键角弯曲项,所述专有力场拟合:根据键伸缩项、键角弯曲项、角参数、二面角参数、静电作用项、范德华作用项计算分子的能量,计算公式如下;

Figure BDA0002460077980000051

其中键伸缩项中kb是力常数,r是键长,r0是键处于平衡位置的长度;

键角弯曲项:kθ是力常数,θ是键角,θ0是平衡位置的键角;

二面角项Vn代表二面角旋转过程中势能的最高时值,n用来调整周期性,φ为变量二面角的值,γ代表相即二面角的角度;

Aij,Bij,Rij是范德华参数,

范德华作用可以用标准的lennard-Jones势表示:

Figure BDA0002460077980000052

在力场表达式中:Aij=4εijσij 12,Bij=4εijσij 6

Rij表示两个原子之间的距离,εij表示两个原子之间势阱的深度,σij是势能为零时两个原子之间的距离。

静电作用表达式:中,ε为有效介电常数,qi、qj分别是原子i,j所带的电荷,Rij是两个原子之间的距离。

其中:kb,r0是键参数;kθ,θ0,是角参数项;Vn,γ是二面角参数;Aij,Bij,Rij是范德华参数;qi、qj,是静电参数。

进一步,本实施例的参数文件包括:原子类型定义、分子拓扑。

专有力场拟合还包括:对小分子片段扫描得到小分子片段结构作为训练集,根据函数计算小分子片段的能量,若较计算的能量与标准能量相关性好,获得力场参数,通过迭代解出各项参数值。

进一步,本实施例的电荷参数的拟合为计算每一个原子所带电荷。

非键作用项包括:静电作用、范德华作用。

专有力场拟合:根据键参数、角参数、二面角参数、静电作用项、范德华作用项计算分子的能量。

参数文件包括:原子类型定义、分子拓扑、参数。

进一步,本实施例的专有力场拟合:对小分子片段扫描得到小分子片段结构作为训练集,根据公式(1)计算小分子片段的能量,若较计算的得到能量与标准能量相关性好,获得力场参数,通过迭代解出各项参数值。

如图2至图4所示,本发明一具体实施例中,待拟合的大分子(如图2所示)的3D结构(如图3所示),每个原子对应唯一的序号和三维坐标。

切分:根据需求选择待切分的位点即要断开的化学键,位点的选择必须间隔至少三个原子,间隔这部分基团被称为共用基团,被切出来的碎片均包含此共用基团(目的是为了保证原分子力场的二面角参数完整性),被切断的化学键在断开位置自动补充氢原子,以确保小分子的化学完整性。如上分子,若切分为Mol1,Mol2,Mol3三个小分子(如图4所示),切分位点分别为bond:19-20,22-28,28-29,32-39(如图3所示)。定义切分的位点:slicing_groups=[((22,28),(19,20)),((19,20),(32,39)),((28,29),(32,39))],执行,程序会返回被切分后的三个小分子的3D结构(mol1,mol2,mol3)(如图4所示),以及小分子片段与原分子(输入的待拟合大分子)原子之间的对应关系。

专有力场拟合:对输入的待拟合大分子进行电荷参数的拟合并保存拟合后的电荷参数文件,同时分别对三个小分子片段拟合键、角、二面角和范德华参数,分别保存其参数文件(如mol1_ff,mol2_ff,mol3_ff)。初始参数可以采用的可以免费获取的Gaff2力场参数。

拼接:首先用Gaff2获取Model_molecule分子(待拟合大分子)的初始参数文件(如model_ff,包含其分子拓扑),然后利用小分子片段与原分子(待拟合大分子)之间的原子对应关系,来重组原分子(待拟合大分子)的力场参数。其中键、角、二面角、范德华参数由各个小分子片段的力场参数按照其对应关系进行组合,电荷参数采用是原分子(待拟合大分子)单独拟合的参数,以保证电荷分布的合理性。

专有力场拟合需要:1.目标函数即需要求解的函数形式,如式(1);2.训练集,带QM能量的分子结构,对所切的小分子片段会先进行扫描,得到一批结构作为训练集(力场的参比项,即拟合出来的函数所计算得的能量与标准的QM有好的相关性,才算得到好的力场参数);3.算法,用来求解函数,采用拟牛顿法BFGS算法,通过不断的迭代解出各项参数值。各个碎片的分子力场参数拟合的方法都是此法。初始参数形式都是相同的,可以选择来自Gaff2,电荷拟合就是需要计算出每一个原子所带的电荷。

本发明的分子力场拟合方法,分子自动切分:算法会根据人为指定的切分位点,对大分子进行切分,并在断键位置自动补氢原子,以确保分子的完整性,同时保存碎片分子和大分子的之间的原子对映关系。

小分子片段力场参数的拼接:自动拼接工具可以将小分子片段重拟合后的力场参数,按切分时保存的原子对应关系,重构主体分子的力场参数文件。

本发明利用了将大分子切为较小分子片段,切分原则是在尽可能减少分子自由度(分子复杂度)的同时,保留分子内部临近基团之间的耦合作用,然后分别拟合小分子的力场参数,这个做法弥补了通用力场自身的不足。利用小分子片段构建训练集拟合专有力场,虽然分子数有所增加,但是由于每个分子的自由度较低,在进行系统构象搜索时,搜索空间大幅度降低,减少了时间上的耗费,同时分子量的减少,也相应的减少了量化计算量以及力场参数拟合的难度。这种方法既提高了力场参数的精度,同时又减少了参数重拟合的难度和成本。

本发明的分子力场拟合方法已在多个体系上进行了测试,经过对比,所拟合的力场精度要高于初始的通用力场参数(gaff),并与常规化拟合的专有力场精度相当,但计算量要明显少于大分子在相同拟合过程中的消耗。

本发明的分子力场拟合方法不同于实际的通用力场的参数化过程,它考虑了分子内基团之间的相互作用,对分子的势能面描述更加准确,精度较高。力场参数的拼接方法,力场拼接工具可以利用切分时保留的对映关系,自动将小分子片段拟合后的参数拼接成完整的大分子力场参数文件,有较好的辅助功能,减少了人为操作。

以上述依据本申请的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项申请技术思想的范围内,进行多样的变更以及修改。本项申请的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:燃料电池催化剂活性的计算装置、计算方法及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!