一种不依赖网络结构的在线影响最大化方法

文档序号:170260 发布日期:2021-10-29 浏览:44次 >En<

阅读说明:本技术 一种不依赖网络结构的在线影响最大化方法 (Online influence maximization method independent of network structure ) 是由 张风格 于 2021-07-31 设计创作,主要内容包括:本发明公开了一种不依赖网络结构的在线影响最大化方法,首先在从未被选为种子节点的节点集合中随机选择一个种子节点;然后使用当前种子节点在真实网络上执行b次影响传播过程,计算种子节点的影响可达性;根据所有历史感染状态结果推断节点之间的激活概率;然后在推断网络上模拟b次影响传播过程,估计还未被选为种子节点的每个节点的影响可达性;使用贪婪算法根据得到的影响可达性识别前k个影响最大的节点;最后,如果影响最大的节点尚未被选择过,则选择它作为新的种子节点重复,否则随机选择重复以上过程。本发明能够在未知网络结构的条件下进行影响可达性估计,同时更新了种子和非种子节点的只是,更加准确地识别了一组最具影响力的k个节点。(The invention discloses an online influence maximization method independent of a network structure, which comprises the steps of firstly randomly selecting a seed node from a node set which is not selected as the seed node; then, using the current seed node to execute b times of influence propagation processes on the real network, and calculating influence accessibility of the seed node; deducing the activation probability among the nodes according to all historical infection state results; then simulating the b times of influence propagation process on the inference network, and estimating the influence reachability of each node which is not selected as the seed node; identifying the front k nodes with the largest influence according to the obtained influence reachability by using a greedy algorithm; and finally, if the node with the largest influence is not selected, selecting the node with the largest influence as a new seed node for repeating, and otherwise, randomly selecting and repeating the above process. The method can estimate the influence accessibility under the condition of unknown network structure, and only updates the seed and non-seed nodes, thereby more accurately identifying a group of k nodes with the most influence.)

一种不依赖网络结构的在线影响最大化方法

技术领域

本发明属于信息传播领域,尤其涉及一种不依赖网络结构的在线影响最大化方法。

背景技术

信息传播是社会网络的一个基本过程,影响最大化是社会网络分析领域的基本问题之一,它旨在确定一组最具影响力的k个节点,这些节点可以影响网络中最大数量的节点。影响最大化在诸如病毒营销、流行病预防等方面有着广泛应用。

在影响最大化问题的研究上,大多都集中在离线影响最大化问题上,即假设节点之间的激活概率是预先已知的,然而,在现实的社会网络中,这些信息并不易得到,故通过种子节点与网络交互的激活反馈来逐渐逼近前k个有影响力的节点的在线影响最大化的做法得到了关注。其中,往往都需要预先知道整个网络的确切结构或种子节点周围的局部结构,然而,结构信息在现实中也不易得到且侧重于学习种子节点的特征,导致信息利用不充分。为了在无先验的情况下充分利用反馈信息来更加准确地识别影响节点,需要提出新的方法。

发明内容

为了解决上述技术问题,本发明提供了一种不依赖网络结构的在线影响最大化方法,可以在不需要网络结构的先验知识下,学习种子和非种子节点的特征,提供了更多的信息来指导确定一组最具影响力的k个节点。

本发明所采用的技术方案是:一种不依赖网络结构的在线影响最大化方法,其特征在于,定义影响最大化问题中网络为有向图G=(V,E,P),G的潜在传播模型为M,其中V={v1,v2,...,vn}表示网络的节点集合,E表示节点间的有向边集合,P表示有向边上激活概率的集合,其中有向边(vi,vj)表示当vi被激活而vj未被激活时,vi以一定的激活概率pij成功激活vj。此外,使用集合D={D1,...,Dβ}记录网络中β次传播过程的感染状态结果,其中表示第l次传播过程结束后网络中n个节点的感染状态, 表示第l次传播过程结束后节点vi的感染状态,表示被激活,表示未激活。

步骤1:在从未被选为种子节点的节点集合中随机选择一个种子节点vi

步骤2:使用当前选择的种子节点在真实网络上执行b次影响传播过程,并记录每次传播过程节点的最终感染状态,计算种子节点的影响可达性,求影响可达性的方式如下:

其中,b′(0≤b′≤b)为vj在这b次传播过程中被激活的次数。从集合到不在集合S中的节点vj的影响可达性可定义为

步骤3:根据所有历史感染状态结果推断节点之间的激活概率。首先,基于父节点与相应子节点的状态应该具有相对高的相关性,找出潜在的边集合(即父子影响关系),激活节点之间相关性APCC(vi,vj)的计算为:

其中,I(·)表示指示函数。

然后,根据潜在边集合利用EM算法,根据传播概率参数推断方法找到每条边的最佳激活概率。

步骤4:对于当前选择的种子节点,根据最近的b次传播过程的感染状态结果直接计算它的影响可达性;对于还从未被选为种子节点的每个节点,通过在使用步骤3中推断的激活概率重构的网络上模拟b次影响传播过程来估计影响可达性;

步骤5:使用贪婪算法根据计算出的影响可达性识别出前k个影响最大的节点;

步骤6:如果影响最大的节点尚未被选择过,则选择它作为新的种子节点并重复步骤2;否则,重复步骤1。

因此,本发明具有如下优点:在未知网络结构的条件下进行影响可达性估计,降低了数据收集的难度,且减少了因为不精确的数据带来的影响;同时更新了种子和非种子节点的知识,提供了更多有用的信息指导前k个影响最大的节点的识别。

附图说明

图1是本发明实施例的流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

在本实施例中,我们使用NetSci网络和LFR算法生成的人工网络进行实验,网络结构如表1所示,其中NetSci是一个表示科学家研究工作的合作关系网络,其中结点表示科学家,边表示两个科学家之间存在合作关系。每个网络的传播数据生成过程如下:假定网络中各个结点之间的影响程度相同,每次传播过程中,从测试网络中随机选择15%的结点作为初始“感染”点,记录这些初始感染点,然后根据IC模型进行传播模拟,在传播模拟结束后,记录每个结点的感染状态作为一条传播轨迹数据,并生成多条数据作为实验的观测数据集。

表1实验网络

网络 结点个数 网络平均度数
LFR1-5 100,150,200,250,300 4
LFR6-10 200 2,3,4,5,6
NetSci 379 4

请见图1,本发明包括以下步骤:

步骤1:在从未被选为种子节点的节点集合中随机选择一个种子节点vi

步骤2:使用当前选择的种子节点在真实网络上执行b次影响传播过程,并记录每次传播过程节点的最终感染状态,计算种子节点的影响可达性,求影响可达性的方式如下:

其中,b′(0≤b′≤b)为vj在这b次传播过程中被激活的次数。从集合到不在集合S中的节点vj的影响可达性可定义为

步骤3:根据所有历史感染状态结果推断节点之间的激活概率。首先,基于父节点与相应子节点的状态应该具有相对高的相关性,找出潜在的边集合(即父子影响关系),激活节点之间相关性APCC(vi,vj)的计算为:

其中,I(·)表示指示函数。

然后,根据潜在边集合利用EM算法,根据传播概率参数推断方法找到每条边的最佳激活概率。

步骤4:对于当前选择的种子节点,根据最近的b次传播过程的感染状态结果直接计算它的影响可达性;对于还从未被选为种子节点的每个节点,通过在使用步骤3中推断的激活概率重构的网络上模拟b次影响传播过程来估计影响可达性;

步骤5:使用贪婪算法根据计算出的影响可达性识别出前k个影响最大的节点;

步骤6:如果影响最大的节点尚未被选择过,则选择它作为新的种子节点并重复步骤2;否则,重复步骤1。

本发明研究了利用传播结束后节点的感染状态数据来进行在线影响最大化的方法,通过本文方法,只需利用节点最终的感染状态数据就可以估计节点的影响可达性并识别出前k个影响最大的节点。

应当理解的是,本说明书未详细阐述的部分均属于现有技术,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于立体农业的线上互动平台

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!