基于离散化蝙蝠算法的两个生物网络全局比对方法

文档序号:1289184 发布日期:2020-08-28 浏览:13次 >En<

阅读说明:本技术 基于离散化蝙蝠算法的两个生物网络全局比对方法 (Two biological network global comparison method based on discretization bat algorithm ) 是由 陈璟 夏金芳 于 2020-05-25 设计创作,主要内容包括:本发明公开了一种基于离散化蝙蝠算法的两个生物网络全局比对方法,包括:使用基于目标函数的搜索方法的框架,将蝙蝠算法离散化应用在网络比对中;融合先验知识初始化种群;保留保守节点的比对结果;蝙蝠算法的离散化体现在速度和解两方面,速度采用0或1表示当前解是否需要进行扰动,对蝙蝠个体的编码进行排列来表示个体的解。本发明的有益效果:在生物指标上及拓扑指标上表现均有不错表现的生物网络比对方法。(The invention discloses a two biological network global comparison method based on a discretization bat algorithm, which comprises the following steps: discretizing and applying a bat algorithm to network comparison by using a frame of a search method based on an objective function; fusing prior knowledge to initialize a population; keeping the comparison result of the conservative nodes; the discretization of the bat algorithm is embodied in two aspects of speed and solution, wherein the speed adopts 0 or 1 to represent whether the current solution needs to be disturbed, and codes of bat individuals are arranged to represent the solutions of the individuals. The invention has the beneficial effects that: the biological network comparison method has good performance on both biological indexes and topological indexes.)

基于离散化蝙蝠算法的两个生物网络全局比对方法

技术领域

本发明涉及生物网络全局比对领域,具体涉及一种基于离散化蝙蝠算法的两个生物网络全局比对方法。

背景技术

网络比对是复杂网络的一个研究方向,可以应用在生活中常见的交通网络、社会网络、生物网络等。其中,生物网络比对是一种常用的研究生物分子间相互作用的方法,也是分析物种间功能差异的重要手段,通过对生物网络的比较,可以挖掘物种间功能的差异性、物种间的知识转移、系统发育关系等。

目前,两个网络比对方法有二步方法和基于目标函数的搜索方法两种类型。

二步方法,顾名思义,比对方法主要分两步进行,一是计算网络间节点对之间的相似性;二是根据第一步的相似性指导完成比对过程。

基于目标函数的搜索方法是围绕目标函数进行搜索以产生更优的新解,将最终使目标函数最优的结果作为比对输出。在这种类型的比对方法中,目标函数可以直接使用衡量标准,然后通过搜索方法,不断地调整比对结果,以期待找到更优的结果。

比较这两种类型的方法,二步方法研究较早、相对比较成熟,但这类方法是在比对完成后才对结果进行评价衡量。而基于目标函数的搜索方法直接以衡量指标作为目标函数,然后不停地产生新解来优化目标函数,然而这种方法也存在很难将先验知识融入到搜索方法里的问题,尤其是当网络规模较大时,如果搜索方法中不加入先验知识,那么,它的搜索效率就会比较低效。

发明内容

本发明要解决的技术问题是提供一种基于离散化蝙蝠算法的两个生物网络全局比对方法,通过比较网络,建立网络间节点的映射关系。本发明将传统蝙蝠算法离散化应用在网络比对问题中,并结合网络间节点的相似性进行贪心比对产生初始种群,解决基于目标函数的搜索方法不加入先验知识,搜索效率低下的问题。

为了解决上述技术问题,本发明提供了一种基于离散化蝙蝠算法的两个生物网络全局比对方法,包括:使用基于目标函数的搜索方法的框架,将蝙蝠算法离散化应用在网络比对中;融合先验知识初始化种群;保留保守节点的比对结果。

在其中一个实施例中,网络比对方法具体分为以下四个步骤:

(1)输入:输入两个待比对的网络以及它们之间的序列相似性;

(2)个体编码及初始化:

(3)个体及种群迭代:

(4)比对结果的输出:每一次迭代更新后,对每一次循环中所有种群中的解更新后找出种群中的最优解,若最优解连续N次不改变,则将此最优解作为最终的比对结果输出。

在其中一个实施例中,“个体编码及初始化:”具体包括:(a)每只蝙蝠个体代表一个比对结果,将两个网络分别从1开始编号,比对结果是一个与小网络维度一致的排列,排列中的数字表示第二个网络中的节点的编号,该编号所在的位置表示第一个网络中节点的编号;

(b)蝙蝠种群的初始化采用贪心算法根据节点的相似性进行比对;

在其中一个实施例中,“个体及种群迭代:”具体如下:个体迭代部分先是扰动产生新解,然后,若产生的0~1之间的随机数大于当前个体的脉冲频率r,则进行局部扰动,然后判断是否更新;否则,不进行局部扰动,直接判断是否更新;是否更新是根据产生的0~1之间的随机数是否大于当前个体的响度A,且更新扰动后的目标函数是否变优进行判断的,若同时满足这两个条件,则进行更新,否则进行下一次的个体扰动;在种群迭代时,每完成一次种群迭代后,寻找种群中的最优解,并对最优解进行更新。

在其中一个实施例中,个体迭代中涉及的几个过程如下:

(a)扰动产生新解:新解是根据速度产生的,若速度为0,保持当前节点的匹配;若速度为1,则在未比对上的节点中随机匹配;

(b)局部交换扰动:局部扰动根据速度进行交换操作,将一个个体中所有速度为1的节点组成一个交换集合,对交换集合中的节点匹配进行随机交换匹配。

(c)更新:更新的内容有速度、解、响度和频率,其中,在计算目标函数时会生成新的待更新的速度,若节点是保守节点,则速度为0,否则为1。

在其中一个实施例中,所述N为10。

在其中一个实施例中,蝙蝠算法的离散化体现在速度和解两方面,速度采用0或1表示当前解是否需要进行扰动,对蝙蝠个体的编码进行排列来表示个体的解。

基于同样的发明构思,本申请还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述方法的步骤。

基于同样的发明构思,本申请还提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行任一项所述的方法。

本发明的有益效果:

在生物指标上及拓扑指标上表现均有不错表现的生物网络比对方法。

附图说明

图1是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法的流程图。

图2(a)、(b)、(c)分别是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法中的案例图及编码图。

图3是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法中的扰动产生新解示意图。

图4是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法中的个体扰动的流程图。

图5是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法中的根据目标函数返回速度。

图6是本发明基于离散化蝙蝠算法的两个生物网络全局比对方法中的局部扰动。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。

本发明是一种基于离散化蝙蝠算法的两个生物网络全局比对方法,使用基于目标函数的搜索方法的框架,将蝙蝠算法离散化应用在网络比对中;融合先验知识初始化种群;保留保守节点的比对结果。

传统蝙蝠算法是针对连续性问题的,本发明将传统蝙蝠算法离散化,应用在网络比对问题中。蝙蝠算法的离散化主要体现在速度和解两方面,速度采用0或1表示当前解是否需要进行扰动,对蝙蝠个体的编码进行排列来表示个体的解。

网络比对如图1所示,分为四个部分:

(1)输入:输入两个待比对的网络以及它们之间的序列相似性。

(2)个体编码及初始化:

(a)每只蝙蝠个体代表一个比对结果,将两个网络分别从1开始编号,比对结果是一个与小网络维度一致的排列,排列中的数字表示第二个网络中的节点的编号,该编号所在的位置表示第一个网络中节点的编号。以图2案例图及编码中的两个网络为例,图2(a)是源网络,图2(b)是目标网络,分别对两个网络中的节点从1开始编号,如图2(c)中的相似性矩阵所示,括号外的数字是括号内节点的编号。

(b)蝙蝠种群的初始化采用贪心算法根据节点的相似性进行比对。图3是根据图2(c)中的相似性矩阵,利用贪心算法产生的比对xi,然后,该比对根据速度vi产生了新的xi

(3)个体及种群迭代:

如图4所示,个体迭代部分先是扰动产生新解,然后,若产生的0~1之间的随机数大于当前个体的脉冲频率r,则进行局部扰动,然后判断是否更新;否则,不进行局部扰动,直接判断是否更新。是否更新是根据产生的0~1之间的随机数是否大于当前个体的响度A,且更新扰动后的目标函数是否变优进行判断的,若同时满足这两个条件,则进行更新,否则进行下一次的个体扰动。在种群迭代时,每完成一次种群迭代后,寻找种群中的最优解,并对最优解进行更新。个体迭代中涉及的几个过程如下:

(a)扰动产生新解:新解是根据速度产生的,若速度为0,保持当前节点的匹配;若速度为1,则在未比对上的节点中随机匹配,如图3所示。

(b)更新:本发明更新的内容有速度、解、响度和频率,其中,在计算目标函数时会生成新的待更新的速度,若节点是保守节点,则速度为0,否则为1。计算目标函数返回速度的过程如图5所示。

(c)局部交换扰动:局部扰动根据速度进行交换操作,将一个个体中所有速度为1的节点组成一个交换集合,对交换集合中的节点匹配进行随机交换匹配,如图6所示。

(4)比对结果的输出:每一次迭代更新后,对每一次循环中所有种群中的解更新后找出种群中的最优解,若最优解连续10次不改变,则将此最优解作为最终的比对结果输出。

表1是本发明应用在真实生物网络上的实验数据,本实验分别将本发明的方法与MAGNA++、L-GRAAL、AligNet方法进行对比,这三个对比方法分别代表了典型的基于目标函数的搜索方法、纯拓扑的GRAAL家族中最新的比对方法、能够获得的最新的两个网络比对方法。

表2是本发明及对比方法在真实网络上在拓扑(EC、ICS、s3)和生物指标(FC)上的表现。在真实网络的实验中,由于SC(SaccharomycesCerevisiae)物种网络比对HS(HomoSapiens)物种网络是一个密集网络到稀疏网络的比对,所以拓扑指标主要看EC和s3。在这两个拓扑指标上,纯拓扑的L-GRAAL表现最好,本发明方法次之。而在生物指标FC上,AligNet表现最好,但是它很大可能是因为在比对时较其它算法多使用了同一个网络中蛋白质之间的序列相似性,这使得AligNet方法在应用时受到了必须有同物种间相似性的约束。生物指标上本发明方法次之,与最优的FC值相差0.01,但是本发明方法在拓扑指标上表现值是AligNet方法的两倍左右。可见本发明是在生物指标上及拓扑指标上表现均有不错表现的生物网络比对方法。

下面给出一个更具体的实施例:

(1)对数据预处理,去除网络中的重复边和自循环边。

(2)输入预处理后的两个网络和网络间的序列相似性。

(3)设置该发明的参数,初始种群大小为40,迭代次数为1000,序列与拓扑相似性的权重为0.9,其他参数使用蝙蝠算法中推荐的参数。

(4)分析输出的比对结果在拓扑和生物学的表现。

以上所述实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。本发明的保护范围以权利要求书为准。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:融合多种拓扑信息的生物网络比对方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!