基于多层网络表示学习的药物靶标相互作用预测方法

文档序号:1075097 发布日期:2020-10-16 浏览:7次 >En<

阅读说明:本技术 基于多层网络表示学习的药物靶标相互作用预测方法 (Drug target interaction prediction method based on multilayer network representation learning ) 是由 鱼亮 尚奕帆 于 2020-06-28 设计创作,主要内容包括:本发明公开了一种基于多层网络表示学习的药物靶标相互作用预测方法,主要解决现有技术预测准确率低的问题。其方案是:从药物和蛋白质数据库中下载数据,分别构建药物和蛋白质的多层相似性网络;对这两种相似性网络分别计算其扩散状态,并分别整合各自扩散状态得到药物和蛋白质的特征向量;将已知的药物靶标相互作用数据作为监督信息,把药物和蛋白质特征向量投入到同一药物靶标空间中,使用双线性函数分别得到药物和蛋白质的投影矩阵;根据这两个投影矩阵得到药物靶标相互作用的预测得分矩阵并对其排名;把排名靠前的8对未知药物靶标对视作潜在的药物靶标相互作用。本发明提高了药物靶标相互作用的预测准确率,可用于预测药物靶标对的候选。(The invention discloses a medicine target interaction prediction method based on multilayer network representation learning, and mainly solves the problem of low prediction accuracy in the prior art. The scheme is as follows: downloading data from a drug and protein database, and respectively constructing a multilayer similarity network of the drug and the protein; respectively calculating the diffusion states of the two similarity networks, and respectively integrating the respective diffusion states to obtain the characteristic vectors of the drug and the protein; the known drug target interaction data is used as supervision information, the drug and protein characteristic vectors are put into the same drug target space, and projection matrixes of the drug and the protein are respectively obtained by using a bilinear function; obtaining a prediction score matrix of the interaction of the drug targets according to the two projection matrices and ranking the prediction score matrix; the top 8 pairs of unknown drug target pairs were targeted for potential drug target interactions. The method improves the prediction accuracy of the drug target interaction, and can be used for predicting the candidate of the drug target pair.)

基于多层网络表示学习的药物靶标相互作用预测方法

技术领域

本发明属于生物信息技术领域,特别涉及一种药物靶标相互作用预测方法,可用于在药物重定位实验,提供候选的药物靶标相互作用。

背景技术

药物靶标是指体内具有药效功能并能被药物作用的生物大分子,如某些蛋白质和核酸等生物大分子。而药物靶标相互作用是指药物分子与人体内的生物大分子即蛋白质相结合并发挥作用。如果药物与不同的靶标蛋白质相结合,药物的作用效果会存在差异,若预测的药物靶标与某种疾病相关,则药物对该疾病可能具有潜在的治疗作用。

预测药物靶标相互作用是药物重定位中重要的一步,其目的是预测出药物可能作用的蛋白质即药物的靶标,进一步发现药物的潜在治疗作用。因此,更多的药物靶标相互作用可以帮助人们提高在药理学方面的理解,充分发挥药物更多的疗效。如果确定药物新的靶标,发现药物新的用途,就可以大大降低药物研发的成本,缩短周期,减小新药因副作用不能通过临床检验的风险。

使用实验方法确定药物靶标相互作用,其结果可靠,但是代价昂贵。因此,如果仅使用实验方法确定每一对药物-靶标相互作用,是难以实现的。所以,需要通过计算的方法预测药物靶标相互作用,缩小实验范围、降低成本、缩短时间。

现有这些计算方法主要基于以下假设:相似的药物可能具有相同的靶标,反之亦然。根据使用的数据类型可以将现有的计算方法分为两类:基于单一类型数据和基于多类型数据整合的预测药物靶标相互作用模型:

一.基于单一类型数据的预测模型

基于单一类型数据的预测模型,根据使用数据类型的不同,其算法主要基于以下几类:化学结构,药物副作用,基因表达数据等。

药物作为化合物分子,都具有化学结构,不同的化学结构会有不同的作用效果,因此可以通过药物的化学结构描述药物之间的相似关系。将药物的化学结构分子式分解,使用一个高维向量表示药物的化学结构特征。例如,其中一个维度表示该药物的化学结构是否包含苯环,如果有,则标1,反之标0。因此每个药物的化学结构是用一个向量表示,通过计算药物向量之间的距离衡量药物之间的相似性,预测药物的靶标。

药物的副作用也包含了重要的临床表型信息,利用表型副作用的相似性来推断两种药物是否有共同的靶点。利用美国食品和药物管理局FDA的副作用事件报告系统AERS将所有副作用反应表示为一个不重复的列表。使用一个高维向量表示药物的副作用特征,如果标1,则表示药物拥有该位置对应的副作用列表中的不良反应,如果标0,则表示没有不良反应。最终药物可以表示为一个0,1特征向量,再计算向量之间的距离衡量相似性。

当药物发挥作用后会引起体内基因表达的改变,这是转录组学中一个重要的特征,因此可以利用药物治疗引起的基因表达谱变化的特征预测药物靶标相互作用。CMap是一个拥有高通量化合物干扰下的基因表达谱数据库,该数据库中有提出使用CMap药物作用下的基因表达数据,并采用了机器学习的分类技术,结果表明可以单独使用基因表达数据来预测药物靶标相互作用。

但是采用这种单一类型数据计算的相似性包含有偏性,而多类型数据包含不同的信息,已经有许多研究提出整合多类型数据进行药物靶标相互作用预测。相比于基于单一类型数据的方法,多类型数据之间存在着信息补充,因此整合多类型数据最终可以提升预测药物靶标相互作用准确率。

二.基于多类型数据整合的预测模型

为整合多类型的数据,人们使用的方法大致有两类,分别是基于网络的方法以及基于机器学习的方法。

基于网络的方法,是根据不同类型数据构造多个关系网络,然后利用信息在网络中的扩散,最终将多类型信息整合在一起。这类方法首先根据药物的不同类型数据,构建多个药物相似性网络,这些相似性网络从多个角度描述了药物之间的关系,然后利用网络融合的方法比如SNF,将多个相似性网络融合。不同于传统的方法,这是一种非线性融合,使得多个相似网络之间形成一种信息互补。还有采用基于网络的随机游走方法,随机游走的核心是无任何规则的扩散,最终将网络节点之间的关系都可以稳定于一个概率分布。传统的随机游走方法是在同构网络中,而现在有研究将药物及靶标相似网络与已知的药物靶标相互作用的二部网络结合,在异构网络中采用一种双向随机游走方法,来推测潜在的药物靶标相互作用。

基于机器学习的方法,是学习到药物和靶标的特征,然后根据特征预测药物靶标相互作用。学习特征的方法中有利用基于同构网络的协同矩阵分解的方法;还有基于拉普拉斯正则化稀疏子空间学习LRSSL方法,为满足子空间的光滑性加入了拉普拉斯正则化项。这类方法是将不同类型数据构建的多个异构网络投影到一个公共的特征空间中,这样就可以把多个网络集成为一个网络,然后从单个集成网络中学习特征。

然而,这些整合多类型数据的方法并不能很好地集成数据。首先,通过网络融合的方法,直接将扩散状态作为特征或者预测分数,很容易受到不同网络中噪音的影响。其次,将多个网络集成为一个网络或者投入一个公共子空间中,可能会导致不同网络特异性信息的丢失,因为来自多个数据源的信息是混合的,不能区分。这些因素都会影响预测药物靶标相互作用的准确率。

发明内容

本发明的目的在于克服上述现有技术的不足,提出一种基于多层网络表示学习的药物靶标相互作用预测方法,以减小不同网络特异性信息的丢失及多类型数据网络的噪音,提高预测准确率。

本发明的技术思路是:通过使用药物和蛋白质的多组学数据构建多个相似性网络,计算每个相似性网络的扩散状态捕获网络的拓扑结构特征;通过使用多层网络表示学习方法整合多个网络扩散状态,学习到药物和靶标的特征向量,并将药物和靶标的特征向量投入药物-靶标空间中,通过利用矩阵补全的方法,预测药物靶标相互作用得分。

根据上述思路,本发明的实现步骤包括如下:

(1)下载药物和蛋白质的数据,分别构建药物相似性网络和蛋白质相似性网络:

(1a)从与药物化学结构相关的任意一个数据库下载n个药物的结构数据CHn,构建药物化学结构相似性网络Dch

(1b)从与药物副作用相关的任意一个数据库下载n个药物和这n个药物所对应的副作用的药物副作用数据,得到药物与副作用矩阵Mse,构建药物副作用相似性网络Dse

(1c)从与药物疾病相关的任意一个数据库下载n个药物和这n个药物所对应的药物相关疾病数据,得到药物与疾病关系矩阵Mdi,构建药物疾病相似性网络Ddi

(1d)从与药物相互作用相关的任意一个数据库下载n个药物和这n个药物之间的相互作用,构建药物与药物相互作用相似性网络Ddr

(1e)从与蛋白质相互作用相关的任意一个数据库下载m个药物和这m个蛋白质之间的相互作用,构建蛋白质与蛋白质相互作用相似性网络Tpr

(1f)从与蛋白质序列相关的任意一个数据库下载m个蛋白质的序列数据SEQm,构建蛋白质序列相似性网络Tseq

(1g)从与蛋白质疾病相关的任意一个数据库下载m个蛋白质和这m个蛋白质所对应的相关疾病数据,得到蛋白质与疾病关系矩阵Mpdi,构建蛋白质疾病相似性网络Tdi

(2)从与药物靶标相关的任意一个数据库中下载n个药物和m个蛋白质之间已知的药物靶标相互作用数据,得到药物靶标相互作用矩阵P;

(3)对相似性网络计算网络扩散状态:

(3a)对基于(1)构建的7层相似性网络分别独立使用重启随机游走算法RWR捕获每层相似性网络的拓扑结构,得到药物化学结构相似性网络Dch的初始状态矩阵

Figure BDA0002557041800000041

药物副作用相似性网络Dse的初始状态矩阵

Figure BDA0002557041800000042

药物之间作用相似性网络Ddr的初始状态矩阵

Figure BDA0002557041800000043

药物疾病相似性网络Ddi的初始状态矩阵蛋白质序列相似性网络的Tseq的初始状态矩阵

Figure BDA0002557041800000045

蛋白质之间作用相似性网络Tseq的初始状态矩阵

Figure BDA0002557041800000046

蛋白质疾病相似性网络Tdi的初始状态矩阵

(3b)利用正交点互信息PPMI方法,对初始状态矩阵

Figure BDA0002557041800000048

Figure BDA0002557041800000049

的节点计算共现概率,得到其对应的扩散状态矩阵

Figure BDA00025570418000000410

(4)使用多层网络表示学习方法得到药物和靶标的特征向量:

(4a)使用多层网络表示学习方法,对药物化学结构扩散状态矩阵药物副作用扩散状态矩阵

Figure BDA00025570418000000413

药物相互作用扩散状态矩阵

Figure BDA00025570418000000414

和药物疾病扩散状态矩阵

Figure BDA00025570418000000415

进行集成,得到药物特征向量矩阵X;

(4b)使用多层网络表示学习方法,对蛋白质序列扩散状态矩阵蛋白质相互作用扩散状态矩阵蛋白质疾病扩散状态矩阵

Figure BDA00025570418000000418

进行集成,得到靶标特征向量矩阵Y;

(5)将药物特征向量X与靶标特征向量Y同时投入到药物靶标空间Z中,再将药物靶标相互作用矩阵P作为监督信息,利用交替最小化的方法最小化药物靶标相互作用预测矩阵与已知矩阵P之间的差距,得到最终药物靶标相互作用预测矩阵

Figure BDA00025570418000000420

该矩阵中的项即是预测的药物靶标相互作用得分,完成对药物靶标相互作用的预测。

本发明与现有技术相比,具有以下优点:

1.本发明通过集成多类型数据预测药物靶标相互作用,能从多个角度描述药物之间和靶标之间的相似关系,避免了现有采用单一类型数据方法存在有偏性的缺点,提高药物靶标相互作用预测准确率。

2.本发明由于利用多层网络表示学习方法集成多层相似性网络,根据自动编码器去噪的特性去降低多层网络噪音的影响,提高了药物靶标相互作用预测准确率。

3.本发明由于利用多层网络表示学习方法生成药物和蛋白质的特征向量,可捕获网络拓扑结构的非线性转换特征,得到高质量的药物和蛋白质特征向量。

4.本发明由于利用多层网络表示学习方法训练数据预测药物靶标相互作用,可防止参数过多而导致训练数据过拟合的风险,提高了药物靶标相互作用预测准确率。

附图说明

图1是本发明的实现流程图;

图2是本发明与现有的多层网络表示学习方法MDA,预测药物靶标相互作用的准确率比较图。

具体实施方式

以下结合附图对本发明的具体实施例和效果进一步详细描述:

参照图1、本实例的实现步骤如下:

步骤1,下载药物和蛋白质的数据,构建药物相似性网络,蛋白质相似性网络。

1.1)下载药物化学结构数据:药物化学结构相关数据库有DrugBank和CTD数据库等,本实例下载的数据库采用但不限于DrugBank,构建药物化学结构相似性网络Dch

1.1.1)从DrugBank数据库下载882个药物的化学结构数据CH882

1.1.2)基于药物的化学结构数据CH882,使用R语言的工具包rcdk得到药物的SMILES化学结构式特征向量;

1.1.3)基于药物的SMILES化学结构式特征向量,使用R语言的工具包fingerprint得到药物化学结构相似性网络Dch,计算该网络中的任意一个元素[Dch]ij

Figure BDA0002557041800000051

其中,A,B是药物化学结构特征向量,·表示向量的内积运算,|| ||2表示向量模的运算;

1.2)下载药物副作用数据:药物副作用相关数据库有SIDER和CTD数据库等,本实例下载的数据库采用但不限于SIDER,构建药物副作用相似性网络Dse

1.2.1)从SIDER数据库下载882个药物和与这882个药物所对应的5439个副作用的药物副作用数据,得到药物与副作用矩阵Mse,该矩阵Mse有882行和5439列,其中行表示药物,列表示副作用;

1.2.2)将药物副作用矩阵Mse的每一行作为一个药物的副作用特征,得到药物的副作用特征集合:

1.2.3)基于药物副作用特征集合得到药物副作用相似性网络Dse,该网络中的任意一个元素计算方式如下:

Figure BDA0002557041800000063

其中,Fi se代表第i个药物的副作用特征,

Figure BDA0002557041800000064

代表第j个药物的副作用特征,i=1,2,3,...,882,j=1,2,3,...,882;

1.3)下载药物疾病数据:药物疾病相关数据库有DrugBank和CTD数据库等,本实例下载的数据库采用但不限于CTD,构建药物疾病相似性网络Ddi

1.3.1)从CTD数据库下载882个药物和这882个药物所对应的6902个疾病的药物疾病数据,得到药物与疾病矩阵Mdi,该矩阵Mdi有882行和6902列,其中行表示药物,列表示疾病;

1.3.2)将药物疾病矩阵Mdi的每一行作为一个药物的疾病特征,得到药物的疾病特征集合:

1.3.3)基于药物疾病特征集合得到药物疾病相似性网络Ddi,该网络中的任意一个元素计算方式如下:

其中,Fi di代表第i个药物的疾病特征,

Figure BDA0002557041800000071

代表第j个药物的疾病特征,i=1,2,3,...,882,j=1,2,3,...,882;

1.4)下载药物相互作用数据:药物相互作用数据库有DrugBank和CTD数据库等,本实例下载的数据库采用但不限于DrugBank,构建药物相互作用网络Ddr

1.4.1)从DrugBank数据库下载882个药物之间的相互作用,再判断药物i和药物j之间是否存在相互作用:

若存在,则否则

Figure BDA0002557041800000073

最终得到药物相互作用相似性网络Ddr

1.5)下载蛋白质相互作用数据:蛋白质相互作用数据库有DrugBank和HPRD数据库等,本实例下载的数据库采用但不限于HPRD,构建蛋白质相互作用网络Tpr

1.5.1)从HPRD数据库下载1449个蛋白质之间的相互作用,再判断蛋白质i和蛋白质j之间是否存在相互作用:

若存在,则否则

Figure BDA0002557041800000075

最终得到药物相互作用相似性网络Tpr

1.6)下载蛋白质序列数据:蛋白质序列数据库有DrugBank和HPRD数据库等,本实例下载的数据库采用但不限于HPRD,构建蛋白质序列相似性网络Tseq

1.6.1)从HPRD数据库下载1449个蛋白质的序列数据SEQ1449,然后利用Smith-Waterman算法计算蛋白质的序列相似性网络Tseq

1.7)下载蛋白质疾病数据:蛋白质疾病相关数据库有DrugBank和CTD数据库等,本实例下载的数据库采用但不限于CTD,构建蛋白质疾病相似性网络Tdi

1.7.1)从CTD数据库下载1449个蛋白质和这1449个蛋白质所对应的6902个疾病的蛋白质数据,得到蛋白质与疾病矩阵Mpdi,矩阵Mpdi有1449行和6902列,其中行表示药物,列表示疾病;

1.7.2)将蛋白质疾病矩阵Mpdi的每一行作为一个蛋白质的疾病特征,得到蛋白质的疾病特征集合:

1.7.3)基于蛋白质疾病特征集合得到蛋白质疾病相似性网络Tdi,该网络中的任意一个元素计算方式如下:

其中,Fi pdi代表第i个蛋白质的疾病特征,代表第j个蛋白质的疾病特征,i=1,2,3,...,1449,j=1,2,3,...,1449。

步骤2,构建药物靶标相互作用矩阵P。

2.1)下载已知药物靶标相互作用数据:药物靶标相关数据库有DrugBank和CTD数据库等,本实例下载的数据库采用但不限于DrugBank,从该数据库中下载882个药物与1449个蛋白质之间共计3185个相互作用的数据;

2.2)用这些相互作用的数据组成药物靶标相互作用矩阵P,该矩阵的每一行是药物每一列为蛋白质,若药物i与蛋白质j之间存在相互作用,则矩阵P中的对应项Pij=1,反之,则Pij=0。

步骤3,分别计算相似性网络Dch、Dse、Ddi、Ddr、Tpr、Tseq、Tdi对应的扩散状态矩阵

Figure BDA0002557041800000083

3.1)计算药物化学结构相似性网络Dch的初始状态状态矩阵

3.1.1)对药物化学结构相似性网络Dch的每一行进行归一化,得到概率转移矩阵

3.1.2)对概率转移矩阵

Figure BDA0002557041800000086

通过重启的随机游走RWR算法捕获网络结构特征:

其中,是t步游走之后网络节点i的行向量,是初始的one-hot编码向量,该向量第i个位置是1,其余为0,α是重启概率;

3.1.3)将t步内的

Figure BDA00025570418000000810

进行相加,捕获网络全局拓扑结构:

其中,i∈[1,2,...,882],T是设定的步长,ri是药物化学结构相似性网络i节点的向量;

3.1.4)由3.1.3)得到882个节点的全局拓扑结构向量ri,组成初始状态矩阵

3.2)计算初始状态矩阵

Figure BDA00025570418000000813

的扩散状态矩阵

Figure BDA00025570418000000814

计算扩散状态矩阵的方法有归一化、随机游走、正交点互信息等,本实例计算扩散状态矩阵采用但不限于正交点互信息PPMI的方法,其步骤如下:

3.2.1)利用正交点互信息PPMI的方法计算初始状态矩阵

Figure BDA0002557041800000091

节点的共现概率:

Figure BDA0002557041800000092

其中,

Figure BDA0002557041800000093

是药物化学结构初始状态矩阵中

Figure BDA0002557041800000094

节点i与j的关联概率,

Figure BDA0002557041800000095

是节点i与节点j的共现概率;

3.2.2)用任意两个节点之间的共现概率

Figure BDA0002557041800000096

组成药物化学结构相似性网络的扩散状态矩阵

3.3)对其他相似性网络分别重复步骤3.1)~3.2),计算得到药物相互作用网络Ddr的扩散状态矩阵药物疾病相似性网络Ddi的扩散状态矩阵药物副作用相似性网络Dse的扩散状态矩阵蛋白质序列相似性网络Tseq的扩散状态矩阵蛋白质疾病相似性网络Tdi的扩散状态矩阵

Figure BDA00025570418000000913

蛋白质相互作用网络Tpr的扩散状态矩阵

步骤4,使用多层网络表示学习方法集成药物多层扩散状态矩阵

Figure BDA00025570418000000915

得到药物的特征向量X,集成蛋白质多层扩散状态矩阵

Figure BDA00025570418000000917

得到靶标的特征向量Y:

多层网络表示学习的方法包括有多模态深度自动编码器MDA、多层网络嵌入MNE,本实例采用但不限于改进后的MDA方法整合多层扩散状态矩阵得到特征向量,其步骤如下:

4.1)利用改进后的MDA方法集成药物多层扩散状态矩阵得到药物特征向量矩阵X:

4.1.1)对药物的所有扩散状态矩阵

Figure BDA00025570418000000919

计算非线性编码嵌入:

Figure BDA00025570418000000920

其中,

Figure BDA00025570418000000921

是嵌入特征,是编码权重矩阵,是编码偏置矩阵,

Figure BDA0002557041800000101

是sigmoid激活函数;

4.1.2)将所有嵌入特征

Figure BDA0002557041800000102

进行拼接,计算集成网络的共同特征Hc,1

Figure BDA0002557041800000103

其中,[]是concatenated激活函数,Wc是拼接权重矩阵,Bc是拼接偏置矩阵;

4.1.3)对共同特征Hc,1再进行L层的编码转换,得到转换后的编码特征Hc,p+1为:

Hc,p+1=σ(WpHc,p+Bp),

其中,p∈{1,...,L}是编码层数,Wp是编码转换权重矩阵,Bp是编码转换偏置矩阵;

4.1.4)对转换后的编码特征Hc,L+1计算L层的解码转换,得到转换后的解码特征Hc,p+L+1为:

Hc,p+L+1=σ(Wp,1Hc,p+L+Bp,1),

其中,p∈{1,...,L}是解码层数,Wp,1是解码转换权重矩阵,Bp,1是解码转换偏置矩阵;;

4.1.5)利用解码得到的特征Hc,2L+1计算每层药物网络扩散状态矩阵的解码嵌入:

其中,

Figure BDA0002557041800000105

是每层扩散状态矩阵的解码嵌入特征,

Figure BDA0002557041800000106

是解码权重矩阵,是解码偏置矩阵;

4.1.6)利用解码嵌入特征还原每层药物网络的扩散状态矩阵

Figure BDA00025570418000001010

其中,是还原权重矩阵,

Figure BDA00025570418000001012

是还原偏置矩阵;

4.1.7)最小化原始扩散状态矩阵与还原扩散状态矩阵之间的差距θ:

Figure BDA00025570418000001015

其中,l(*)是sample-wise binary cross-entropy函数,

Figure BDA0002557041800000111

是最小化函数,

是编码解码过程中所有参数矩阵的正则化约束项;

4.1.8)将θ取最小值后,还原的扩散状态矩阵与原始扩散状态矩阵差距最小,此时,所对应的中间层的编码特征Hc,L+1就可以捕获药物在每层相似性网络中的拓扑结构,表示药物的特征,即将该中间层的编码特征Hc,L+1作为药物特征向量X;

4.2)利用改进后的MDA方法集成蛋白质的多层扩散状态矩阵得到靶标特征向量Y:

本步骤的具体实现与4.1)相同,只是在输入端输入蛋白质的多层扩散状态矩阵

Figure BDA0002557041800000114

再重复4.1.1)~4.1.8)得到靶标特征向量Y。

步骤5,基于药物特征向量X、靶标特征向量Y和已知药物靶标相互作用数据P,得到药物靶标相互作用预测矩阵

5.1)将药物特征向量X投入到药物靶标空间Z中,得到X在Z空间中的投影向量XG,其中G为药物特征向量转换矩阵;

5.2)将靶标特征向量Y投入到药物靶标空间Z中,得到Y在Z空间中的投影向量YH,其中H为靶标特征向量转换矩阵;

5.3)根据药物的投影向量XG和靶标的投影向量YH,并对投影向量YH进行转置即(YH)T,得到药物靶标相互作用预测矩阵

Figure BDA0002557041800000116

其中,HT是H矩阵的转置矩阵,YT是Y矩阵的转置矩阵;

5.4)把已知的药物靶标相互作用P作为监督信息,利用交替最小化的方法最小化该矩阵P与预测矩阵

Figure BDA0002557041800000118

之间的差距:

其中,Pij是药物i与靶标j的相互作用,若Pij=1表示存在相互作用,Pij=0表示不存在相互作用;xi是药物特征向量矩阵X中第i个行特征向量,

Figure BDA0002557041800000121

是靶标特征向量矩阵YT中第j个列特征向量,

Figure BDA0002557041800000122

是矩阵Frobenius范数计算;λ是惩罚项参数,当转换矩阵G和H的Frobenius范数过大时,惩罚越大,反之,惩罚越小;

5.5)取药物靶标相互作用预测矩阵与已知药物靶标相互作用矩阵P差距最小时的即为最终药物靶标相互作用预测矩阵。

以下结合仿真实验,对本发明的技术效果作进一步说明:

1.仿真条件

仿真实验在Intel(R)Core(TM)i7-8700k CPU、主频3.70GHz,内存48G,Ubuntu平台上的Python 3.6.5上进行。

2.仿真内容:

仿真1,在相同数据集上,分别采用本发明的方法和现有的多层网络表示学习方法MDA预测药物靶标相互作用,并计算预测准确率,其结果如图2所示,其中AUROC是接受者操作特性曲线ROC的曲线下面积,AUPR是精确召回曲线下面积,AUROC和AUPR均是衡量预测准确率的指标,数值越大表示准确率越高。

图2表明本发明能有效提高药物靶标相互作用预测准确率。

仿真2,利用本发明集成药物和蛋白质的多类型数据预测潜在的药物靶标相互作用,得到882个药物和1449个靶标之间预测的相互作用结果,并对预测结果进行排名,取排名靠前的8对未知药物靶标相互作用进行验证,结果如表1所示。

表1

Figure BDA0002557041800000131

表1中,标有√则说明该药物靶标相互作用已被列代表的验证方式所验证。

从表1中可知在预测的8对药物靶标相互作用中,排名31,41,43的药物靶标相互作用已同时通过文献验证、疾病关联、Pathway富集分析验证三种方式的验证,表明这3对药物靶标相互作用预测结果最可靠,而其他5对药物靶标相互作用也通过了部分方式的验证,预测结果较为可靠,通过预测结果说明了本发明的预测准确性和可靠性。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于深度卷积神经网络的DNA绑定残基预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!