一种基于分子能量数据预测多环芳烃化合物沸点的方法

文档序号:1891664 发布日期:2021-11-26 浏览:32次 >En<

阅读说明:本技术 一种基于分子能量数据预测多环芳烃化合物沸点的方法 (Method for predicting boiling point of polycyclic aromatic hydrocarbon compound based on molecular energy data ) 是由 周晶晶 刘太昂 刘太行 刘振昌 吴治富 周央 朱峰 刘远 刘婷婷 朱鲁阳 于 2021-09-30 设计创作,主要内容包括:多环芳烃是指两个以上苯环以稠环形式相连的化合物,是一类广泛存在于环境中的有机污染物。文献中有关多环芳烃理化性质的数据报道不多,即使文献中有记载的数据其精度也不够。主要的原因是检测多环芳烃理化性质实验复杂、而且困难比较多。为克服传统方法的缺点,本专利利用第一性原理密度泛函理论方法,全优化计算了多个多环芳烃的分子结构和电子结构,得到量子化学的能量描述符的基础数据,然后对这些基础数据进行映射组合得到其中间数据,基于中间数据利用基于支持向量回归方法建立多环芳烃沸点与量子化学能量参数间的构效关系模型,最后用建立的构效关系模型,预报新收集的多环芳烃样本的沸点。(Polycyclic aromatic hydrocarbons refer to compounds in which two or more benzene rings are connected in a fused ring form, and are a class of organic pollutants widely existing in the environment. There are few data reports on the physicochemical properties of polycyclic aromatic hydrocarbons in the literature, and the accuracy is not sufficient even for the data described in the literature. The main reason is that the experiment for detecting the physical and chemical properties of the polycyclic aromatic hydrocarbon is complex and difficult. In order to overcome the defects of the traditional method, the method utilizes a first principle density functional theory method to calculate the molecular structures and the electronic structures of a plurality of polycyclic aromatic hydrocarbons in a full optimization manner to obtain basic data of quantum chemistry energy descriptors, then the basic data are mapped and combined to obtain intermediate data, a structure-activity relationship model between the polycyclic aromatic hydrocarbon boiling point and quantum chemistry energy parameters is established based on the intermediate data and based on a support vector regression method, and finally the boiling point of a newly collected polycyclic aromatic hydrocarbon sample is forecasted by the established structure-activity relationship model.)

一种基于分子能量数据预测多环芳烃化合物沸点的方法

技术领域

本发明涉及多环芳烃化合物沸点的预测,特别是一种基于分子能量数据预测多环芳烃化合物沸点的方法。

背景技术

多环芳烃是指两个以上苯环以稠环形式相连的化合物,是一类广泛存在于环境中的有机污染物。多环芳烃由于苯环上的氢原子可以被不同的基团取代而形成数以千计的不同化合物,也是数量最多的一类环境致癌物质,在多达1000多种致癌物质中,多环芳烃占1/3以上。文献中有关多环芳烃理化性质的数据报道不多,即使文献中有记载的数据其精度也不够。主要的原因是检测多环芳烃理化性质实验复杂、而且困难比较多。由于对多环芳烃理化性质进行定量结构-性质关系的构效关系研究,对了解多环芳烃化合物的毒性,并了解其对环境污染的防治都有着重要的意义。近年来,有关多环芳烃的勾选关系研究也越来越多。这些研究大多以传统的化学计量学方法,如多元线性回归、偏最小二乘回归等为建模工具,以半经验方法计算的结构参数为分子描述符来建立多环芳烃理化性质的构效关系模型,这些都是半经验方法,而且其参数还比较多,带来一定量的噪声数据,导致其结果的准确性也值得商榷,结果的可解释性也比较差。近年来,量子化学方法能更加详细和精确的描述电子及其相互作用,并从理论上表征分子和分子间相互作用的电子和几何特性,而且量子化学参数还具有明确的物理意义,因此更多的研究将量子化学参数引入构效关系建模过程中。本专利利用第一性原理密度泛函理论方法,全优化计算了50个多环芳烃的分子结构和电子结构,得到4个量子化学的能量描述符的基础数据,然后对这些基础数据进行映射组合得到其中间数据,基于中间数据利用基于支持向量回归方法建立多环芳烃沸点与量子化学能量参数间的构效关系模型,最后用建立的构效关系模型,预报新收集的7个多环芳烃的沸点。

发明内容

本发明的目的是为了克服现有技术存在的缺陷,提供一种基于分子能量数据预测多环芳烃化合物沸点的方法。其过程利用计算机技术实现,避免化学实验,节约了时间和成本。

本发明的目的可以通过如下的技术方案实现:

一种基于分子能量数据预测多环芳烃化合物沸点的方法,包括如下步骤:

1)从文献中查找到多个多环芳烃化合物及其对应的沸点数据,利用量子化学计算得到4个量子化学结构能量描述符;

2)对这4个量子化学结果能量描述符进行映射转化;

3)基于映射转化后的方程,利用支持向量机回归算计建立多环芳烃化合物的沸点定量预报模型;

4)收集多个新的多环芳烃化合物,利用量子化学计算得到4个量子化学结构能量描述符,并将这4个参数代入映射转化方程,再将转化后的数据代入沸点预测的支持向量机回归模型,预测出这些新的多环芳烃化合物的沸点。

本发明与现有技术比,具有以下优点:

1.本发明整个过程都可以通过计算机实现,节约时间,避免了实验,大大降低了成本。

2.苯发明整个操作过程简单,通过简单的培训,一人便可完成。

3.本发明整个过程不涉及实验及化学品,不产生环境污染,符合绿色环保理念。

附图说明

图1为多环芳烃沸点的建模结果图。

图2为多环芳烃沸点模型的留一法交叉验证结果图。

具体实施方式

以下结合具体的实施例子对本发明进行详细的说明,包括如下步骤:

(1)从文献中查找到50个多环芳烃化合物及其对应的沸点数据,使用Gaussian 03软件包及DFT-B3LYP/6-311G**方法对多环芳烃实施分子几何最优化计算。经振动频率分析,所得稳定结构无虚频,达到对应于势能面上的极小点后,通过量子化学计算得到4个量子化学结构能量描述符,这样由4个量子化学结构能量描述符和多环芳烃化合物沸点构成了48*4基础数据。部分基础示例数据如表1所示。

表1.部分基础数据

分子 沸点 EH(分子最高占有轨道能量) EL(分子最低未占有轨道能量) ΔE(前线轨道能量差) ET(分子总能量)
Acenaphthylene 543.15 -0.223 -0.079 -0.144 -462.19
1-Methylnaphthalene 518.15 -0.217 -0.044 -0.173 -425.31
Acenaphthene 552.15 -0.21 -0.038 -0.172 -463.42
2-Methylnaphthalene 536.15 -0.214 -0.041 -0.173 -464.64
Anthracene 613.15 -0.201 -0.07 -0.131 -539.66
Phenanthrene 611.15 -0.22 -0.046 -0.174 -539.66
2,3,5-Trimethylnaphthalene 558.15 -0.211 -0.038 -0.173 -503.97
Pyrene 666.15 -0.205 -0.064 -0.141 -615.91
1-Methylphenanthrene 632.15 -0.217 -0.047 -0.17 -578.99
3-Methylphenanthrene 625.15 -0.215 -0.043 -0.172 -578.99
Fluoranthene 656.15 -0.221 -0.074 -0.147 -615.89
2-Methylphenanthrene 628.15 -0.218 -0.045 -0.173 -578.99
11H-benzo[a]fluorene 676.15 -0.209 -0.052 -0.157 -655.22

(2)对这4个量子化学结果能量描述符进行映射转化,得到48*4中间数据。映射转化方程如下:

Y1=+42.587[EH]-30.122[EL]+22.400[ΔE]-4.197E-3[ET]+8.091

Y2=-44.325[EH]+12.856[EL]-13.697[ΔE]-5.696E-3[ET]-14.333

Y3=+79.749[EH]+42.566[EL]-9.506[ΔE]-1.968E-3[ET]+16.500

部分中间数据如表2所示。

表2. 部分中间数据

Y<sub>1</sub> Y<sub>2</sub> Y<sub>3</sub>
-0.3117 -0.8588 -2.3684
-1.9147 -0.4875 -0.1971
-1.615 -0.5173 0.682
-1.7122 -0.3579 0.2472
0.9705 -1.4551 -0.2021
-1.5247 0.2848 -0.2869
-1.5098 -0.2283 0.6916
0.7155 -0.6294 -0.0205
-1.1121 0.3081 -0.0509
-1.1922 0.2983 0.2979
0.2008 0.0334 -1.6651
-1.2821 0.4193 -0.017
-0.0097 0.1453 0.4007

(3)基于映射转化后的方程,利用支持向量机回归算计建立多环芳烃化合物的沸点定量预报模型。支持向量机回复算法中选择径向基核函数,惩罚因子选取80,不敏感函数选取0.015。

(4)收集7个新的多环芳烃化合物,利用量子化学计算得到4个量子化学结构能量描述符,并将这4个参数代入映照转化方程,再将转化后的数据代入沸点预测的支持向量机回归模型,预测出这些新的多环芳烃化合物的沸点。

实施例1:基于50个多环芳烃的4个量子化学结构能量描述符,建立的多环芳烃化合物沸点的支持向量机回归构效关系预报模型,其建模结果如图1所示。

利用支持向量机回归算法对50个多环芳烃样本数据进行回归建模,建立多环芳烃沸点的定量预报模型,模型预报值与文献真实值的相关系数为0.99。

实施例2:基于50个多环芳烃的4个量子化学结构能量描述符,建立的多环芳烃化合物沸点的支持向量机回归构效关系预报模型,该模型留一法内部交叉验证结果如图2所示。

利用支持向量机回归算法对50个多环芳烃样本数据进行回归建模,建立多环芳烃沸点的定量预报模型,该模型的内部交叉验证结果,模型预报值与文献真实值的相关系数为0.98。

实施例3:新收集的4个多环芳烃化合物,其4个量子化学结构能量描述符,映射转化数据,及其沸点预报结果如表3所示。

表3 预报结果

分子 EHOMO ELUMO ΔE ETot Y<sub>1</sub> Y<sub>2</sub> Y<sub>3</sub> 沸点(预报值)
2-Methylpyrene -0.203 -0.062 -0.141 -655.24 0.905568 -0.4682 0.301476 692.35
4-Methylpyrene -0.203 -0.062 -0.141 -655.24 0.905568 -0.4682 0.301476 692.55
Cyclopenta[cd]pyrene -0.208 -0.087 -0.121 -692.12 2.048481 -0.63185 -1.27897 694.36
Indeno[1.2.3-cd]fluoranthene -0.212 -0.092 -0.12 -845.78 2.696115 0.342725 -1.51794 764.71
dibenzo(a. e)pyrene -0.2 -0.07 -0.13 -923.26 2.645691 0.67195 0.62301 850.66
dibenzo(a. i)pyrene -0.194 -0.075 -0.119 -923.26 3.298222 0.191049 0.784106 843.40
Dibenzo[b.def]chrysene -0.189 -0.083 -0.106 -923.26 4.043333 -0.31149 0.718747 831.34

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!