一种提高污染物qsar模型预测毒性效应终点值准确度的方法

文档序号:1965080 发布日期:2021-12-14 浏览:19次 >En<

阅读说明:本技术 一种提高污染物qsar模型预测毒性效应终点值准确度的方法 (Method for improving accuracy of pollutant QSAR model for predicting toxic effect end point value ) 是由 董玉瑛 陈玉婷 焦健 邹学军 于 2021-08-20 设计创作,主要内容包括:本发明属于化学品毒理学机制分析领域,公开了一种提高污染物QSAR模型预测毒性效应终点值准确度的方法。包括计算毒性级数、界定毒性级数、基于毒性级数的QSAR模型参数选择原则。建立作用机制导向下的QSAR模型,可提高QSAR模型预测的准确度和有效性。识别和减少风险评价和管理过程的不确定性,有助于深入研究有机污染物对生物的毒性作用机制,为有机污染物对生物毒性预测和安全评价提供科学、精准信息。(The invention belongs to the field of chemical toxicology mechanism analysis, and discloses a method for improving accuracy of a pollutant QSAR model predicted toxic effect end point value. The method comprises the steps of calculating toxicity series, defining toxicity series and selecting the principle based on QSAR model parameters of the toxicity series. And the QSAR model under the guidance of the action mechanism is established, so that the accuracy and effectiveness of the QSAR model prediction can be improved. The uncertainty of risk evaluation and management processes is identified and reduced, the deep research on the toxic action mechanism of the organic pollutants on organisms is facilitated, and scientific and accurate information is provided for the prediction and safety evaluation of the organic pollutants on the biological toxicity.)

一种提高污染物QSAR模型预测毒性效应终点值准确度的方法

技术领域

本发明属于化学品毒理学机制分析领域,具体涉及一种提高污染物QSAR模型预测毒性效应终点值准确度的方法。

背景技术

随着环境问题日益突出,污染问题给生物的生存与发展带来了挑战,污染物对于生物的毒害作用预测变得尤为重要。当前大多数研究学者选择采用动物实验来获取毒性数据以及评估污染物的环境风险,该方法对于毒性作用研究理论性较好,接近真实的污染物对生物的毒害作用方式,但对暴露生物需求量大。1959年罗素提出保护动物学伦理的3R原则,包括替代(replace)实验动物、减少(reduce)实验动物数量、以及优化(refine)实验程序以减少对动物的伤害。基于污染物定量结构和活性之间关系的模型来预测毒性作用,即定量结构-活性相关关系(quantitative structure activity relationship,QSAR)模型,已广泛应用于预测医药品、个人护理品、工业等各个行业污染物的毒性作用。通过模型预测获得可靠的毒性数据,可最大限度地利用非实验方法,减少实验测试(尤其是动物实验)及降低昂贵的测试费用。

QSAR模型对不同作用模式类型的污染物毒性预测的实际应用,存在一些偏离值较大的污染物,这类偏离值较大的污染物对QSAR模型准确度具有较大影响。

发明内容

为了甄别和剔除偏离值较大的污染物影响,提高QSAR模型的准确度,本发明提供一种提高污染物QSAR模型预测毒性效应终点值准确度的方法,筛选离群值较大污染物对其进行界定来提高污染物毒性作用预测的准确性以及扩大其应用范围。

本发明的上述目的是通过以下技术方案实现的:一种提高污染物QSAR模型预测毒性效应终点值准确度的方法,包括以下内容:

1.计算毒性级数

通过利用计算毒性级数来有效弥补QSAR模型预测离散值较大的污染物毒性作用。毒性级数运用急性毒性参数和无毒害效应浓度参数之间的相关性来表示毒性等级。毒性参数主要是根据污染物对于生物体的毒性数据进行计算,即

其中,TO是毒性级数(toxicity order)值,该值无量纲;LC50(mg·L-1)浓度数据为急性毒性参数,具体为能够杀死50%生物的药剂浓度数据;NOEC(mg·L-1)浓度数据为无毒害效应浓度参数,具体为化合物对生物体的最大无毒作用剂量浓度数据。

2.毒性级数界定

由于不同污染物对于生物体的作用方式不同,所以基于QSAR模型作用模式的分类进行了一种涵盖了QSAR模型预测离散值较大的分类,从而实现对QSAR模型预测准确度的提升。具体为提出取TO值以10为底的对数值lg TO,将lg TO代入评估范围。当lg TO≤1,污染物MOA为麻醉型化合物;当1﹤lg TO﹤3,污染物MOA为过渡型化合物;当lg TO≥3,污染物MOA为反应型化合物。

其中,界定值1根据QSAR模型对亚磷酸三苯酯预测,预测结果表明亚磷酸三苯酯属于反应型和麻醉型之间相对离散值较大的物质,QSAR模型并不能准确的对亚磷酸三苯酯进行预测。采用毒性数据LC50=9.83×10-2mg/L,NOEC=1×10-2mg/L,TO=9.83,lg TO=1,取1作为麻醉型和过渡型边界值,可以有效的对这类离散值进行界定和保护。

界定值3根据QSAR模型对硝基苯酚的毒性作用进行划分,研究表明对硝基苯酚的剩余毒性很高,确属于反应型化合物,考虑了对硝基苯酚电离毒性较高,很容易与生物大分子发生反应,这符合反应型作用机理,对硝基苯酚可以作为反应型和过渡型之间的界定值。采用毒性数据LC50=10232.9mg/L,NOEC=11.31mg/L,TO=904.77,lg TO=3,取3作为过渡型和反应型边界值,可以有效的对反应型和过渡型污染物之间进行区分。

3.基于毒性级数的QSAR模型参数选择原则

QSAR模型的建立与污染物的数据筛选和参数选择密不可分,因此采用毒性级数法进行毒性数据的筛选,提高QSAR模型准确性。当污染物的lg TO值小于1时采用二维QSAR模型,即Kow与活性参数进行线性回归,回归效果较好,与麻醉型毒性作用具有较好的一致性。当污染物的lg TO值大于3时采用三维QSAR模型,即Kow与分子轨道理论数据进行线性回归,回归效果较好,与反应型毒性作用具有较好的一致性。剔除兼具了两种作用模式之间的过渡型污染物,然后进行QSAR模型的拟合,从而达到较好的预测效果。

其中,Kow为正辛醇-水分配系数(Octanol-Water Partition Coefficient,Kow),正辛醇-水分配系数是指为某一有机物在某一个温度下,在正辛醇相和水相达到分配平衡之后,在两相的浓度的比值。生物活性与Kow相关性较好,反映了污染物的亲脂性。

计算公式(1)如下。

其中,C1指在一定温度下达到平衡时有机物在正辛醇相中的浓度,单位:mg/L;C2指的是一定温度下达到平衡时有机物在水相中的浓度,单位:mg/L。

本发明与现有技术相比的有益效果是:有助于建立和完善QSAR模型,提高QSAR模型预测的准确度和有效性。识别和减少风险评价和管理过程的不确定性,有助于深入研究有机污染物对生物的毒性作用机制,为有机污染物对生物毒性预测和安全评价提供科学、精准信息。

附图说明

图1是实施例1中9种有机磷酸酯(OPEs)的lg Kow与lgLC50拟合曲线。

图2是实施例1中异常值剔除后OPEs的lg Kow与lgLC50拟合曲线。

图3是实施例2中苯类衍生物的-lg EC50实验值与预测值拟合曲线。

图4是实施例2中异常值剔除后苯类衍生物的-lg EC50实验值与预测值拟合曲线。

具体实施方式

下面通过具体实施例详述本发明,但不限制本发明的保护范围。如无特殊说明,本发明所采用的实验方法均为常规方法,所用实验器材、材料、试剂等均可从商业途径获得。

实施例1

以有机磷酸酯类为例,毒性较小时,即lg TO值小于1,污染物的lg Kow与其急性数据如LC50、EC50等方面具有很好的相关性。以lg Kow和lg LC50拟合曲线,具有较好的拟合效果,实施本发明。

在常用有机磷酸酯的毒性影响中,选用lg Kow和lg LC50拟合,建立非氯代类有机磷酸酯的QSAR模型,运用软件SIMCA-P 6.0中的最小二乘法(PLS)创建模型-lg EC50=2.979+0.246P+0.220lgKow+0.204NAr+0.186TSA-0.129LUMO-0.084NA+0.080ND,其中最低空轨道能级(LUMO)、极化率(P)、正辛醇/水分配系数(lg Kow)、芳香环个数(NAr)、氢键受体个数(NA)、氢键供体个数(ND)和分子表面积(TSA),详细模型可查阅文献,详细信息如下表1所示:

表1有机磷酸酯的相关参数

注:表中lg Kow、lg LC50、lg NOEC可由软件EPI Suit4.1查得,lg TO由计算而得。

本发明运用毒性级数法对非氯代类OPEs建模数据进行筛选,发现磷酸三丙酯属于过渡型化合物,可能影响Kow和lg LC50建立QSAR模型拟合效果。通过图1和图2(剔除磷酸三丙酯)拟合效果对比,可以清楚的看到,在去除毒性级数筛选的过渡型化合物后,lgKow和lgLC50相关性拟合效果大大增加,R2达到了0.9以上,可有效提高QSAR模型对于污染物毒性作用评价的准确性。

实施例2

以苯类衍生物为例,毒性较大时,即lg TO值大于3,污染物的活性与其自身结构如轨道能量、电性等方面具有很好的相关性。经过查阅文献[2]可得,在苯类衍生物的定量构效关系研究中,利用量子化学参数对于化合物结构优化得出-lg EC50预测值,用-lg EC50实验计算值和-lg EC50预测值进行拟合,建立多种苯类衍生物的-lg EC50的QSAR模型,即其中8个范数描述符及其对应系数值如下表2所示,详细模型可查阅文献。污染物参数详细信息如下表3所示。

表2模型中8个范数描述符及其对应数值

表3苯类衍生物基本参数(mol/L)

注:表中数据除lg TO、-lg EC50实验值均可由软件EPI Suit4.1查得,-lg EC50计算值经现有文献查得,lg TO由计算而得。

由图3中看出,苯类衍生物建立的QSAR模型中存在离群值较大的污染物,通过对比剔除离群值大的污染物拟合效果图4,可以清楚的看到,-lg EC50实验计算值和-lg EC50预测值相关性拟合效果大大增加,R2几乎达到了0.99。对比表2数据可以发现,离群值污染物主要是苯胺,采用毒性级数的方法提前进行甄别,苯胺的-lgLC50值为3.2mol/L,-lg NOEC值为1.7mol/L,则lg TO=1.54,属于过渡型化合物。毒性较大的污染物进行QSAR模型建模时,可采用本发明毒性级数法进行污染物的筛选,去除毒性作用处于麻醉型和反应型之间的过渡区域,即过渡型,可有效提高QSAR模型对于污染物毒性作用评价的准确性。

本发明通过将QSAR模型和毒性级数法联合形成一种提高QSAR模型预测效率的方法,提出的毒性级数法可以有效弥补QSAR模型建模对于污染物毒性数据的筛选,运用到污染物毒性作用当中,扩大QSAR模型应用范围,弥补QSAR模型预测不足的缺陷,实现了用很少的数据来提高对污染物的毒性预测效果,节省了毒性数据获取成本,为国内风险防控提供了基础。

实施例3

1.计算毒性级数

由于污染物对于生物体的毒性作用方式的差异性会影响分析毒性作用,所以本发明研究提高QSAR模型预测准确度的方法,通过计算毒性级数来有效弥补QSAR模型预测离散值较大的污染物毒性作用。毒性级数运用急性毒性参数和无毒害效应浓度参数之间的相关性来表示毒性等级。毒性参数主要是根据污染物对于生物体的毒性数据进行计算,即

其中,TO是毒性级数(toxicity order)值,该值无量纲;LC50(mg·L-1)浓度数据为急性毒性参数,具体为能够杀死50%生物的药剂浓度数据;NOEC(mg·L-1)浓度数据为无毒害效应浓度参数,具体为污染物对生物体的最大无毒作用剂量浓度数据。

2.毒性级数界定

由于不同污染物对于生物体的作用方式不同,所以本发明基于QSAR模型作用模式的分类进行了一种涵盖了QSAR模型预测离散值较大的分类,从而实现对QSAR模型预测准确度的提升。本发明提出取TO值以10为底的对数值lg TO,将lg TO代入评估范围。当lg TO≤1,污染物MOA为麻醉型化合物;当1﹤lg TO﹤3,污染物MOA为过渡型化合物;当lg TO≥3,污染物MOA为反应型化合物。

其中,界定值1主要是根据QSAR模型对亚磷酸三苯酯预测,预测结果表明亚磷酸三苯酯属于反应型和麻醉型之间相对离散值较大的物质,QSAR模型并不能准确的对亚磷酸三苯酯进行预测。采用毒性数据LC50=98.3mg/L,NOEC=10mg/L,TO=9.83,lg TO=1,取1作为反应型和过渡型边界值,可以有效的对这类离散值进行界定和保护。

界定值3根据QSAR模型对硝基苯酚的毒性作用进行划分,研究表明对硝基苯酚的剩余毒性很高,确属于反应型化合物,考虑了对硝基苯酚电离毒性较高,很容易与生物大分子发生反应,这符合反应型作用机理,对硝基苯酚可以作为反应型和过渡型之间的界定值。采用毒性数据LC50=10232.9mg/L,NOEC=11.31mg/L,TO=904.77,lg TO=3,取3作为过渡型和反应型边界值,可以有效的对反应型和过渡型污染物之间进行区分。

3.基于毒性级数的QSAR模型参数选择原则

QSAR模型的建立与污染物的数据筛选和参数选择密不可分,因此采用毒性级数法进行毒性数据的筛选,提高QSAR模型准确性。当污染物的lg TO值小于1时采用二维QSAR模型,即Kow与活性参数进行线性回归,回归效果较好,与麻醉型毒性作用具有较好的一致性。当污染物的lgTO值大于3时采用三维QSAR模型,即Kow与分子轨道理论数据进行线性回归,回归效果较好,与反应型毒性作用具有较好的一致性。剔除兼具了两种作用模式之间的过渡型污染物,然后进行QSAR模型的拟合,从而达到较好的预测效果。

其中,Kow为正辛醇-水分配系数(Octanol-WaterPartition Coefficient,Kow),正辛醇-水分配系数是指为某一有机物在某一个温度下,在正辛醇相和水相达到分配平衡之后,在两相的浓度的比值。生物活性与Kow相关性较好,反映了污染物的亲脂性。计算公式(1)如下。

其中,C1指在一定温度下达到平衡时有机物在正辛醇相中的浓度,单位:mg/L;C2指的是一定温度下达到平衡时有机物在水相中的浓度,单位:mg/L。

有机污染物分子对水生生物的毒性作用包括跨膜和与靶分子发生作用两个过程。

有机污染物分子通过扩散作用透过细胞膜到达生物体内的靶分子(外源性物质进入生物体后进攻并与之结合的生物大分子),并在水相与生物相达到分配平衡的过程,这一过程用正辛醇-水分配系数Kow来描述,适用于处于麻醉型和过渡型污染物,采用毒性级数法提前进行甄别,即lgTO<3,建立QSAR模型可以获得较好的准确度。

毒物分子与靶分子发生作用而使生物呈现毒性效应的过程。毒物分子与靶分子的相互作用实际上是分子间的作用力,这种分子间的作用力包括定向力、诱导力、氢键力和电荷转移作用力等,它们会用到一些量子化学描述符,主要包括最高已占用分子轨道能量、最低未占用分子轨道能量、能级距离、总柔软度、HOMO/LUMO能量分数、最终生成热、总能量、电子能、电离电位、EEVA描述符、亲电原子前沿电子密度、亲核原子前沿电子密度、EVA描述符等;分子间的相互作用会影响化合物与生物组织作用的强度和范围。电子参数描述符包含偶极矩、绝对原子电荷总数、原子电荷总平方数、拓扑电子指数、局部偶极指数、负电荷总数、正电荷总数、亚分子极性参数、二阶亚分子极性参数、电子拓扑描述符、电子电荷密度连通性指数等。该方法适用于反应型污染物,可采用毒性级数法提前进行甄别,即lg TO>3,建立QSAR模型可以获得较好的准确度。

以上所述实施方式仅为本发明的优选实施例,而并非本发明可行实施的全部实施例。对于本领域一般技术人员而言,在不背离本发明原理和精神的前提下对其所作出的任何显而易见的改动,都应当被认为包含在本发明的权利要求保护范围之内。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于分段智能优选的谱图化学计量学解析方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!