一种基于多特征用户群体的基站协作缓存方法

文档序号：1893857 发布日期：2021-11-26 浏览：17次 >En<

阅读说明：本技术 一种基于多特征用户群体的基站协作缓存方法 (Base station cooperation caching method based on multi-feature user group ) 是由谷玮康玉琴魏明谭敏江昊周建国吴静于 2021-08-09 设计创作，主要内容包括：本发明提出了一种基于多特征用户群体的基站协作缓存方法。本发明通过分析移动互联网的基站数据集构建多个用户特征相似矩阵；将多个用户特征相似矩阵结合优化目标进行相似矩阵融合,得到最终融合后相似矩阵；将最终融合后相似矩阵通过社区发现得到多个用户群体；统计用户群体访问各基站的次数,其中最多访问次数为同一用户群体的基站将建立基站集群协作缓存；根据每个基站集群,构建命中率函数以及传输代价函数,构建约束条件,进一步使用MCMC算法求解得到缓存矩阵。本发明优点在于,使用基于零范数的特征相似矩阵融合算法能充分利用用户的多种特征划分用户群体,结合优化目标,使基站缓存具有更强的针对性、更高的缓存利用率和更小的传输成本。(The invention provides a base station cooperative caching method based on a multi-feature user group. The method comprises the steps of constructing a plurality of user characteristic similar matrixes by analyzing a base station data set of the mobile internet; combining the plurality of user characteristic similar matrixes with the optimization target to perform similar matrix fusion to obtain a final fused similar matrix; finding the finally fused similar matrixes through a community to obtain a plurality of user groups; counting the times of accessing each base station by a user group, wherein the base station with the most access times being the same user group establishes a base station cluster cooperative cache; and constructing a hit rate function and a transmission cost function according to each base station cluster, constructing constraint conditions, and further solving by using an MCMC algorithm to obtain a cache matrix. The method has the advantages that the zero norm-based characteristic similarity matrix fusion algorithm can fully utilize various characteristics of users to divide user groups, and the optimization target is combined, so that the base station cache has stronger pertinence, higher cache utilization rate and lower transmission cost.)

技术领域

本发明属于移动互联网技术领域，具体涉及一种基于多特征用户群体的基站协作缓存方法。

背景技术

网络信息时代终端用户数量不断增加，尤其是在万物互联的背景下，具有定位等各种数据采集的传感器无时无刻在向网络传递着信息，网络边缘的数据量正经历着爆炸式增长，这给传输链路带来了巨大的压力。超负荷的网络流量会导致传输链路拥塞，数据传输效率降低，从而影响用户体验。在第五代移动通信中，蜂窝面积的缩小和无线接入点的密集部署为更快的数据传输提供了新机会。然而，移动网络架构的集中化特性以及无线回程链路所带来的有限传输容量使得这种方法无法跟上飞速增长的流量，而为每个基站部署理想的回程会因为成本过高变得不切实际，这还可能会导致回程拥堵和性能降低。

因此，核心网功能下沉到网络边缘已经成为趋势，一些服务也可以由网络边缘提供。在移动边缘计算(MEC)中，可以在基站侧缓存部分流行的网络资源，这样已缓存的网络内容就可以通过基站间的多点协作直接传送到请求用户，而无需回程或核心网络传输。用户获取该资源的传输时延将得到很大改善，同时还能降低传输过程中的资源消耗。但基站的缓存空间是有限的，因此基站协同缓存，共享空间的思想应运而生。协作缓存间接扩展了单个基站的缓存空间，扩大了原本由单个基站存储的缓存文件集，这使得由多个基站服务的用户能够利用空间的缓存多样性。当用户发出请求时，被请求基站及其合作基站可以共同为用户提供服务。如何高效的缓存网络内容，提高用户请求命中率，从而更好的利用有限的缓存空间，在哪些基站缓存哪些内容，这是协作缓存首先考虑的问题，同时基站协作缓存还应考虑哪些基站建立合作关系。很容易想到，如果协作基站的数量越多，那么它们一起共享的缓存空间也就越大，用户请求命中率也就越高。但需要注意的是，基站之间保持合作关系并相互通信是需要一定的控制转移和资源调度开销，以及链路的传输成本。而且大范围的基站集群，缓存方法制定时考虑了大范围的用户，不同用户群体在访问行为上的差异性就会被平均，导致基站缓存内容没有针对性，共享缓存空间利用率不高。

因此需要挖掘和分析基站所服务的用户访问行为特征，使得协作基站群主要服务于具有相似访问行为的人群，这样基站协作缓存就能针对不同的用户群体。通过分析移动互联网的基站数据集，可以获得每个访问用户不同维度的描述，比如用户的访问位置、访问时间、访问频次、访问内容和持续时间等行为特征。如果融合用户的多种特征，我们将会更好的描述用户行为。

发明内容

本发明为了更好的解决基于多用户特征描述下的基站协作缓存，提出了一种基于多特征用户群体的基站协作缓存方法。该策略通过划分多种特征下具有相似访问行为的用户群体，继而围绕不同用户群体搭建一对一缓存优化的基站集群，使得基站协作缓存更具有针对性。缓存方法优化以内容命中率和传输代价作为优化函数来确定缓存空间的内容放置。

一种基于多特征用户群体的基站协作缓存方法，其特征在于，具体步骤如下：

步骤1，通过分析移动互联网的基站数据集构建多个用户特征相似矩阵；

步骤2，将多个用户特征相似矩阵结合优化目标进行相似矩阵融合，得到最终融合后相似矩阵；

步骤3，将最终融合后相似矩阵通过Louvain算法进行社区发现，从而得到多个用户群体；

步骤4，待集群的基站分别统计具有相同uid字段记录项的次数，根据步骤3的群体划分结果，找到该uid字段对应的用户群体成员person_d，e，则该uid字段记录项的次数表示为num_d，e。从而得到用户群体group_d访问本基站次数NUM_G_d＝∑_e num_d，e。每个基站中访问次数最多的用户群体为该基站的主要服务对象。主要服务对象是同一用户群体的基站将建立合作关系，搭建与U个用户群体一一对应的基站集群BS₁，BS₂…BS_U；

步骤5，根据步骤4得到的每个基站集群，构建命中率函数以及传输代价函数，构建约束条件，进一步使用MCMC算法求解得到缓存矩阵；

作为优选，步骤1所述多个用户特征相似矩阵为：S₁，S₂...S_H

其中，S_t表示第t个用户特征相似矩阵，H表示用户特征相似矩阵的数量；

作为优选，步骤2所述将多个用户特征相似矩阵结合优化目标进行相似矩阵融合，具体为：

步骤2所述优化目标为：

其中，S_b表示第b个用户特征相似矩阵，S代表待优化求解的融合后相似矩阵，||S||₀是融合后相似矩阵的零范数，α_b是第b个用户特征相似矩阵的权重因子。λ＞0，是正则化项||S||₀的参数，代表待优化式子中稀疏度的比重；

使用快速PIHT算法求解优化目标从而得到最终融合后相似矩阵S*；

作为优选，步骤3所述多个用户群体为：

group₁，group₂…group_U

group_d＝{person_d，1，person_d，2...person_d，e}

其中，U表示用户群体的数量，group_d代表第d个用户群体，person_d，e代表属于第d个用户群体的第e个用户，每个用户在基站访问记录里都有唯一的uid 字段标识；

作为优选，步骤5所述命中率函数为：

其中，M表示本基站群中基站的数量，N表示系统中拥有的内容的数量，φⁱ代表基站R_i所属的集群，k∈φⁱ且k≠i表示在基站集群φⁱ中除了本基站R_i的其他基站。P_i，j是用户请求矩阵P的第i行第j列元素，表示用户向基站R_i请求内容c_j的概率，满足Q_i，j是缓存矩阵Q的第i行第j列元素，表示基站R_i上是否缓存了内容c_j，Q_i，j＝1时表示基站R_i上缓存了内容C_j，Q_i，j＝0时表示基站R_i上没有缓存内容C_j。

步骤5所述传输代价函数为：

其中，0＜γ＜1，表示基站相对于直接从互联网获取内容，而从合作基站中获取内容的代价系数。其余符号与命中率函数中定义一致。

步骤5所述约束条件为：

其中，S_j表示内容C_j的大小，所有内容大小的集合为S＝{S₁，S₂，...，S_N}。V_i表示基站R_i的缓存空间大小，每个基站的缓存空间集合为V＝{V₁，V₂，...，V_M}。

本发明优点在于，使用基于零范数的特征相似矩阵融合算法能充分利用用户的多种特征划分用户群体，同时以内容命中率和传输代价作为优化目标优化基站的缓存策略，使基站缓存具有更强的针对性、更高的缓存利用率和更小的传输成本。

附图说明

图1：是本发明实施例的流程图。

具体实施方式

本发明首先是要根据收集的用户数据得到多个用户特征描述。考虑到不同应用场景多个特征的重要程度不同，并且为了更好的融合多个特征，本发明使用一种基于零范数的加权融合算法进行多个特征相似网络融合。

本发明的具体实施方式为一种基于多特征用户群体的基站协作缓存方法的具体步骤如下：

步骤1，通过分析移动互联网的基站数据集构建多个用户特征相似矩阵；

步骤1所述多个用户特征相似矩阵为：S₁，S₂...S_H

其中，S_t表示第t个用户特征相似矩阵，H表示用户特征相似矩阵的数量

根据实际应用场景，可构建如用户的访问位置、访问时间、访问频次、访问内容和持续时间等特征相似矩阵。而且用户的多个特征相似矩阵的描述方法可能是不一样的，常用的相似度定义方法有欧几里得距离、余弦相似度、Jaccard相似度和Pearson相似度。具体定义用户的某个特征相似矩阵时可能还需要对传统的定义方法做一些针对性的改进，比如使用Jaccard相似度定义用户访问内容相似度时要考虑某些流行内容可能会被很多人访问，该部分内容对相似度计算影响较大且导致计算的Jaccard相似度较高，但这不能说明任意两个用户的访问行为是相似的。因此定义相似度时需要对那部分流行内容的访问频次做相应的改动，来减少它对相似度大小的影响；

步骤2，将多个用户特征相似矩阵结合优化目标进行相似矩阵融合，得到最终融合后相似矩阵；

步骤2所述将多个用户特征相似矩阵结合优化目标进行相似矩阵融合，具体为：

步骤2所述优化目标为：

使用快速PIHT算法求解优化目标从而得到最终融合后相似矩阵S*；

具体融合步骤如下：

1.令对原矩阵元素做简单的行(列)串联使之成为向量，极大降低运算复杂度。选择初始迭代点x₀，选择参数并计算对应的Lipschitz常数L。

2.令k＝0，执行以下循环：

while(k＜max_iter)do//循环条件，max_iter为最大迭代次数

//x^k代表待求解的向量x第k次迭代的结果。代表x^k的第i个元素。

//y^k是用于外推的中间变量，i∈I(x^k)表示外推只//在子空间I(x^k)中进行，其中I(x^k)表示向量x的零元素索引集。

then//判断

梯度信息和外

//息是否满足条件，X是待

求解向量的定义域

y^k+1＝x^k//满足上述条件则不接收外推信息，反之y^k+1代表外推信息

end if//if语句结束标志

迭代表达式，L是对应的Lipschitz常数。

k＝k+1//此次迭代完成，k值加一。

end while//循环结束

步骤3，将最终融合后相似矩阵通过Louvain算法进行社区发现，从而得到多个用户群体；

步骤3所述多个用户群体为：

group₁，group₂…group_U

group_d＝{person_d，1，person_d，2...person_d，e}

具体步骤为：

初始化，将每一个用户看作一个用户群体计算其模块度modularity。

将每一个群体与其相邻的群体合成一个新的群体，计算新的全局模块度Modularity。

如果Modularity＞modularity，则保留步骤2的合并结果以及新的模块度。

当还有群体没有遍历到时，循坏执行步骤2。

判断上一轮循环是否提高了模块度，如果有则继续进入循环，否则循环结束。

步骤4，待集群的基站分别统计具有相同uid字段记录项的次数，根据步骤三的群体划分结果，找到该uid字段对应的用户群体成员person_d，e，则该uid字段记录项的次数表示为num_d，e。从而得到用户群体group_d访问本基站次数 NUM_G_d＝∑_e num_d，e。每个基站中访问次数最多的用户群体为该基站的主要服务对象。主要服务对象是同一用户群体的基站将建立合作关系，搭建与U个用户群体一一对应的基站集群BS₁，BS₂…BS_U。

步骤5，根据步骤4得到的每个基站集群，构建命中率函数以及传输代价函数，构建约束条件，进一步使用MCMC算法求解得到缓存矩阵；

步骤5所述命中率函数为：

其中，M表示本基站群中基站的数量，N表示系统中拥有的内容的数量，φⁱ代表基站R_i所属的集群，k∈φⁱ且k≠i表示在基站集群φⁱ中除了本基站R_i的其他基站。P_i，j是用户请求矩阵P的第i行第j列元素，表示用户向基站R_i请求内容C_j的概率，满足Q_i，j是缓存矩阵Q的第i行第j列元素，表示基站R_i上是否缓存了内容C_j，Q_i，j＝1时表示基站R_i上缓存了内容C_j，Q_i，j＝0时表示基站R_i上没有缓存内容C_j。

P_i，j·Q_i，j表明向基站R_i请求的内容C_j能够被响应的概率，称为本地命中率。是用于指示用户请求的内容C_j是否在合作基站群φⁱ (k∈φⁱ，k≠i表示除了本基站)的某个基站中。表明向基站R_i请求的内容C_j能够被基站群φⁱ除了本基站R_i的其他基站响应的概率。

步骤5所述传输代价函数为：

其中，0＜γ＜1，表示基站相对于直接从互联网获取内容，而从合作基站中获取内容的代价系数。其余符号与命中率函数中定义一致。表示从合作基站获取内容的总成本，表示从互联网获得内容的总成本。

步骤5所述约束条件为：

其中，S_j表示内容C_j的大小，所有内容大小的集合为S＝{S₁，S₂，...，S_N}。V_i表示基站R_i的缓存空间大小，每个基站的缓存空间集合为V＝{V₁，V₂，...，V_M}。i∈[1，M]表示每个基站缓存内容的总大小不能超过基站的缓存空间大小。

具体求解步骤为：

确定缓存策略制定的优化目标注意命中率和传输成本都在[0，1]范围内，因此将上述多目标优化问题转化为一致形式：

使用MCMC算法求解。令M(Q)＝Cost(Q)-Hit(Q)+ζF(Q)。F(Q)是惩罚项，ζ是惩罚因子，Q^k代表第k步马尔可夫链的状态。定义Q^s的秩为定义从状态Q^s到状态Q^t为其中M_S是M(Q^s)简写方式，ω是标准化因子，ρ1，2是缩放因子以确保概率v和q的值是合法的。初始化状态Q⁰，K为最大迭代次数 k＝0，1，2...；

当k＜K时循环以下过程进行采样：

第k个时刻马氏链状态为Q^k，采样Q^*～q(Q^*|Q^k)；从均匀分布中采样 u～Uniform[0，1]；如果则接收转移Q^k→Q^*，即 Q^k+1＝Q^*，否则不接受转移，即Q^k+1＝Q^k。

对于每一个马尔可夫链，矩阵P和Q的维度是M×N，这代表基站的数量为 M，而内容项的数量为N。因此，在马尔可夫链状态中，每个基站缓存的内容数量相等并记为c。使用邻域搜索方法在从q(Q^*|Q^k)生成Q^*以减少算法的空间复杂度，即我们随机选择一个基站，然后发布一个内容项来缓存其他内容项。因此，对于每个迭代状态，下一步可能的状态数为M×c×(N-c)。最终输出的Q^*就是求解的基站缓存放置矩阵。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：多基站多服务器场景下的任务卸载和资源调度方法及装置

一种基于多特征用户群体的基站协作缓存方法

相关技术

网友询问留言