单样本ceRNA网络识别方法、装置、电子设备及存储介质

文档序号:1906617 发布日期:2021-11-30 浏览:27次 >En<

阅读说明:本技术 单样本ceRNA网络识别方法、装置、电子设备及存储介质 (Single-sample CERNA network identification method, device, electronic equipment and storage medium ) 是由 张俊鹏 赵春文 李司婧 杨燕婷 于 2021-09-06 设计创作,主要内容包括:本发明提供一种单样本ceRNA网络识别方法、装置、电子设备及存储介质,涉及基因识别技术领域。该单样本ceRNA网络识别方法包括:根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。将每个样本对应的多个ceRNA竞争关系对进行融合,得到每个样本对应的ceRNA网络。本发明基于匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵和先验miRNA和靶基因调控关系数据识别得到的单样本的ceRNA网络,有助于揭示单样本内的基因调控机制,反映单样本下miRNA靶基因之间的竞争关系。(The invention provides a single-sample CERNA network identification method, a single-sample CERNA network identification device, electronic equipment and a storage medium, and relates to the technical field of gene identification. The single-sample CERNA network identification method comprises the following steps: and identifying and obtaining a plurality of CERNA competition relationship pairs corresponding to each sample in the matched sample according to the transcriptome matrix of the miRNA in the matched sample, the transcriptome matrices of the first target gene and the second target gene in the matched sample, and the prior miRNA and target gene regulation relationship data. And fusing a plurality of ceRNA competition relationship pairs corresponding to each sample to obtain a ceRNA network corresponding to each sample. The single-sample CERNA network obtained by identifying the miRNA of the matched sample, the transcriptome matrix of the first target gene and the second target gene and the prior miRNA and target gene regulation relation data is beneficial to revealing a gene regulation mechanism in the single sample and reflecting the competition relation between the miRNA target genes in the single sample.)

单样本ceRNA网络识别方法、装置、电子设备及存储介质

技术领域

本发明涉及基因识别技术领域,具体而言,涉及一种单样本ceRNA网络识别方法、装置、电子设备及存储介质。

背景技术

微小核糖核酸(Micro RibonucleicAcid,miRNA)是一类非编码保守性小核糖核酸(RibonucleicAcid,RNA)分子。它通常负调控蛋白质编码基因mRNA(MessengerRNA)来调控基因表达水平。虽然miRNA是小分子,但是它在许多生物过程中发挥重要作用。竞争性内源RNA(Competing Endogenous RNA,ceRNA)假说揭示:不同RNA转录物之间通过相互竞争方式来与miRNA结合。这些相互竞争的RNA转录物统称为ceRNA,主要包括四大类:蛋白质编码基因mRNA、长链非编码RNA(lncRNA)、假基因转录本(pseudogene)以及环状RNA(circRNA),所构成的RNA竞争网络为ceRNA网络。前期研究表明:ceRNA网络与包括恶性肿瘤疾病在内的许多人类复杂疾病关联,预示着ceRNA作为潜在的人类复杂疾病诊断和靶向治疗生物标记物。

ceRNA参与许多重要的生物过程,以往研究方法主要基于多个样本的转录组数据来识别多样本层次水平下的ceRNA网络。现有技术中,可基于单细胞转录组数据获取单细胞层次水平下lncRNA关联的ceRNA网络。

但是,现有方法没有考虑miRNA转录组数据。然而,ceRNA网络又与miRNA转录组数据密切关联,导致获取到的ceRNA网络无法准确的反映单样本下miRNA靶基因之间的竞争关系。

发明内容

本发明的目的在于,针对上述现有技术中的不足,提供一种单样本ceRNA网络识别方法、装置、电子设备及存储介质,以获取单样本水平下的ceRNA网络,反映单样本下miRNA靶基因之间的竞争关系。

为实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种单样本ceRNA网络识别方法,包括:

获取匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵,每个匹配样本中包括多个样本,每个样本包括多个miRNA、第一靶基因和第二靶基因。根据匹配样本,获取与匹配样本相关的先验miRNA和靶基因调控关系数据。根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。将每个样本对应的多个ceRNA竞争关系对进行融合,得到每个样本对应的ceRNA网络。

一些实施方式中,获取匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵,包括:根据匹配样本的生物特性,在给定的miRNA、第一靶基因和第二靶基因转录组矩阵中,提取相同生物特性的miRNA、第一靶基因和第二靶基因的转录组矩阵,得到匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵。

一些实施方式中,根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对,包括:根据样本的miRNA的转录组矩阵、样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,获取共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值。当共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件时,确定第一靶基因和第二靶基因为样本的ceRNA竞争关系对。

一些实施方式中,共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件,包括:共享miRNA的显著性p值小于0.05、第一靶基因和第二靶基因之间的正相关显著性p值小于0.05以及第一靶基因和第二靶基因之间的敏感性相关显著性p值小于0.05。

一些实施方式中,在得到单样本的ceRNA网络之后,方法还包括:通过单样本ceRNA网络相似性分析、与目标疾病的关联性分析以及样本聚类分析中的至少一种分析方式,对单样本的ceRNA网络进行分析验证。

第二方面,本发明实施例还提供了一种单样本ceRNA网络识别装置,包括:获取模块,用于获取匹配样本的微小核糖核酸miRNA、第一靶基因和第二靶基因的转录组矩阵,每个匹配样本中包括多个样本,每个样本包括多个miRNA、第一靶基因和第二靶基因。获取模块,还用于根据匹配样本,获取与匹配样本相关的先验miRNA和靶基因调控关系数据。识别模块,用于根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。融合模块,用于将每个样本对应的多个ceRNA竞争关系对进行融合,得到每个样本对应的ceRNA网络。

一些实施方式中,获取模块,具体用于根据匹配样本的生物特性,在给定的miRNA、第一靶基因和第二靶基因转录组矩阵中,提取相同生物特性的miRNA、第一靶基因和第二靶基因的转录组矩阵,得到匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵。

一些实施方式中,识别模块,具体用于根据样本的miRNA的转录组矩阵、样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,获取共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值。当共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件时,确定第一靶基因和第二靶基因为样本的ceRNA竞争关系对。

一些实施方式中,共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件,包括:共享miRNA的显著性p值小于0.05、第一靶基因和第二靶基因之间的正相关显著性p值小于0.05以及第一靶基因和第二靶基因之间的敏感性相关显著性p值小于0.05。

一些实施方式中,该装置还包括验证模块,用于通过单样本ceRNA网络相似性分析、与目标疾病的关联性分析以及样本聚类分析中的至少一种分析方式,对单样本的ceRNA网络进行分析验证。

第三方面,本发明实施例提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行上述第一方面任一方法的步骤。

第四方面,本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行如上述第一方面任一方法的步骤。

本发明的有益效果是:通过获取匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵,每个匹配样本中包括多个miRNA、第一靶基因和第二靶基因。根据匹配样本,获取与匹配样本相关的先验miRNA和靶基因调控关系数据。根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。将每个样本对应的多个ceRNA竞争关系对进行融合。由于miRNA表达水平与miRNA靶基因之间的竞争密切相关,因此,本发明基于匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵和先验miRNA和靶基因调控关系数据识别得到的单样本的ceRNA网络有助于揭示单样本内的基因调控机制,反映单样本下miRNA靶基因之间的竞争关系。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请一实施例提供的单样本ceRNA网络识别方法流程示意图;

图2为本申请另一实施例提供的单样本ceRNA网络识别方法中S130的流程示意图;

图3为本申请一实施例中单样本ceRNA网络相似性的示意图;

图4示出了本申请一实施例中乳腺癌关联ceRNA网络相似性的示意图;

图5示出了本申请一实施例中乳腺癌样本聚类分析的示意图;

图6为本申请一实施例提供的单样本ceRNA网络识别的装置结构示意图;

图7为本申请一实施例提供的电子设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

图1为本申请一实施例提供的单样本ceRNA网络识别方法流程示意图,其中,该方法的执行主体可以是台式电脑、笔记本电脑、服务器、云端服务器、智能终端、平板电脑等具有数据处理能力的设备,在此不做限制。

如图1所示,该方法包括:

S110、获取匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵。

其中,匹配样本中包括多个样本,每个样本中包括多个miRNA和第一靶基因(RNA1)和第二靶基因(RNA2)。

一些实施方式中,可以根据匹配样本的生物特性,在给定的miRNA、第一靶基因和第二靶基因转录组矩阵中,提取相同生物特性的miRNA、第一靶基因和第二靶基因的转录组矩阵,得到匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵。

需要说明的是,给定匹配样本的即转录组矩阵可以来自于基因表达谱数据库(Gene Expression Omnibus,GEO)等提供基因表达谱数据(即转录组矩阵)的数据库。其中靶基因的类型可以是信使RNA(messengerRNA,mRNA),长链非编码RNA(Long non-codingRNA,lncRNA),环状RNA(circRNA)和伪基因(pseudogene)等,在此不做限制。

一些实施方式中,匹配样本miRNA、RNA1和RNA2的表达谱数据,分别表示为:

匹配样本miRNA:

RNA1

RNA2

其中,包含s个匹配样本,每个匹配样本的miRNA、RNA1和RNA2个数分别为n1、n2和n3

S120、根据匹配样本,获取与匹配样本相关的先验miRNA和靶基因调控关系数据。

一些实施方式中,先验miRNA-靶基因调控关系包括miRNA-RNA1和miRNA-RNA2调控关系数据,其数据类型可分为计算机预测型和实验验证型数据。所使用的先验miRNA-靶基因调控关系数据可以从单一数据库获取,也可以融合多种不同数据库获得。

S130、根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。

图2为本申请一实施例提供的单样本ceRNA网络识别方法中S130的流程示意图。

一些实施方式中,参考图2,S130可以通过以下步骤实现:

S1301、根据样本的miRNA的转录组矩阵、样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,获取共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值。

一些实施方式中,计算共享miRNAs显著性p值可以基于先验miRNA-靶基因调控关系数据,利用超几何分布检验(hypergeometric distributiontest)衡量每个样本中RNA1(x)和RNA2(y)之间共享miRNAs的统计显著性p值,计算如下:

其中,N代表数据集中所有的miRNAs个数,M和K分别代表调控RNA1(x)和RNA2(y)的miRNAs个数,R表示RNA1(x)和RNA2(y)共享的miRNAs个数。

共享miRNAs显著性p值越小表明:在单样本k中,RNA1(x)和RNA2(y)共享miRNAs越显著,通常p值<0.05。

一些实施方式中,计算正相关显著p值,可以通过以下方式进行:

在单样本k中,RNA1(x)和RNA2(y)之间的统计相关值定义为:

其中,s为匹配样本个数,分别为RNA1(x)和RNA2(y)在单样本k附近的相邻样本个数,为RNA1(x)和RNA2(y)在单样本k附近的重合样本个数。

基本服从正态分布,其均值和标准差如下:

因此,归一化的统计相关值为:

每个统计相关值对应一个正相关显著性p值,计算如下:

其中,pnorm()函数用于计算标准正态分布随机数小于的概率p值,p值越小表明:在单样本k中,RNA1(x)和RNA2(y)越有可能存在正相关关系,通常p值<0.05。

一些实施方式中,计算敏感性相关显著性p值,可以通过以下方式进行:

在单样本k中,考虑共享miRNAs(z)前提条件下,RNA1(x)和RNA2(y)之间的统计相关值定义为:

其中,为共享miRNAs(z)在单样本k附近的相邻样本个数,为共享miRNAs(z)、RNA1(x)和RNA2(y)在单样本k附近的重合样本个数,为RNA1(x)和共享miRNAs(z)在单样本k附近的重合样本个数,为RNA2(y)和共享miRNAs(z)在单样本k附近的重合样本个数。

基本服从正态分布,其均值和标准差如下:

因此,归一化的统计相关值为:

每个统计相关值对应一个正相关显著性p值,计算如下:

其中,pnorm()函数用于计算标准正态分布随机数小于的概率p值,p值越小表明:在单样本k中,考虑共享miRNAs(z)前提条件下,RNA1(x)和RNA2(y)越有可能存在条件相关关系,通常p值<0.05。

在单样本k中,RNA1(x)和RNA2(y)之间敏感相关系数定义如下:

由于都服从正态分布,因此也服从正态分布。每个敏感相关系数对应一个显著性p值,计算如下:

其中,pnorm()函数用于计算标准正态分布随机数小于的概率p值,p值越小表明:在单样本k中,共享miRNAs(z)RNA1(x)和RNA2(y)之间的相关关系影响显著,通常p值<0.05。

S1302、当共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件时,确定第一靶基因和第二靶基因为样本的ceRNA竞争关系对。

一些实施方式中,预设条件可以是:共享miRNA的显著性p值小于0.05、第一靶基因和第二靶基因之间的正相关显著性p值小于0.05以及第一靶基因和第二靶基因之间的敏感性相关显著性p值小于0.05时,确定第一靶基因和第二靶基因为样本的ceRNA竞争关系对。

S140、将每个样本对应的多个ceRNA竞争关系对进行融合,得到每个样本对应的ceRNA网络。

一些实施方式中,融合多个ceRNA竞争关系对,可以是融合所有第k个样本的ceRNA竞争关系,确定第k个样本的ceRNA网络。

本申请提及的融合是指,将第k个样本中每个ceRNA竞争关系对进行合并,并根据每个竞争关系对的第一靶基因和第二靶基因以及合并后的竞争关系网络生成ceRNA网络。

其中,每个样本都会生成一个对应的ceRNA网络。

本申请提供的单样本ceRNA网络识别方法可以应用于恶性肿瘤转录组数据中,筛选出恶性肿瘤样本特异性ceRNA网络。

在此,结合识别与乳腺癌关联的单样本ceRNA网络,对单样本ceRNA网络识别方法进行说明。

首先,从癌症基因表达谱数据库TCGA(The Cancer GenomeAtla)中获取乳腺癌匹配样本的miRNA、靶基因表达谱数据和乳腺癌样本的生存数据信息。通过去除重复项和没有基因名称的miRNA和靶基因,获得690个乳腺癌匹配样本的894个miRNAs和19068个靶基因表达谱数据。

为了降低计算复杂度,采用基于Cox回归模型的特征选择方法来筛选特征基因(包括miRNAs和靶基因)。经过特征选择后,总共获得690个匹配乳腺癌样本中的45个miRNAs和1824个靶基因表达谱数据。

本实施例中,RNA1为mRNA,RNA2也为mRNA。因此匹配样本miRNA、RNA1和RNA2表达谱数据分别表示为:

D1={G1,1;G1,2;…;G1,690}∈R690×45

D2={G2,1;G2,2;…;G2,690}∈R690×1824

D3={G3,1;G3,2;…;G3,690}∈R690×1824

先验miRNA-mRNA调控关系数据通过融合miRTarBase v8.0和TarBase v8.0两种实验验证型数据库获得,总共获得762540条miRNA-mRNA调控关系对。乳腺癌关联mRNAs从DisGeNET v6.0和COSMIC v86两个数据库中获得,总共获得了5694个与乳腺癌关联的mRNAs。

然后,根据给定乳腺癌匹配样本的miRNA、RNA1和RNA2表达谱数据D1、D2和D3,识别单样本ceRNA网络。其中,共享miRNAs显著性p值阈值,正相关显著性p值阈值和敏感性相关显著性p值阈值都设置为0.05。在每个乳腺癌样本中,融合所有mRNA关联的ceRNA竞争关系对得到每个乳腺癌样本的ceRNA网络。

最后,通过单样本ceRNA网络相似性分析、与目标疾病的关联性分析以及样本聚类分析中的至少一种分析方式,对单样本的ceRNA网络进行分析验证。

首先,对单样本ceRNA网络相似性进行分析。

给定样本i和样本j的ceRNA网络ceRi和ceRj,两种单样本ceRNA网络相似性值Sim(ceRi,ceRj)计算如下:

其中,overlap(ceRi,ceRj)为两种ceRNA网络中相同的ceRNA竞争关系对数,min(ceRi,ceRj)为两种ceRNA网络中最小网络的ceRNA竞争关系对数。Sim(ceRi,ceRj)的取值范围为[0,1],其值越大表明样本i和样本j中的ceRNA网络越相似。

然后,再获取乳腺癌关联的单样本ceRNA网络。

基于5694个乳腺癌关联的mRNAs,提取乳腺癌关联的单样本ceRNA网络。对于每条mRNA-mRNA竞争关系,当且仅当两个mRNAs都与乳腺癌关联,该条mRNA-mRNA竞争关系才被认为是乳腺癌关联的ceRNA竞争关系。每个样本中,融合这些乳腺癌关联的ceRNA竞争关系,得到乳腺癌关联的单样本ceRNA网络。

接着,可以进行样本聚类分析。

参考上例中得到的不同单样本ceRNA网络相似性矩阵

该相似性矩阵也被认为是单样本相似性矩阵。单样本距离矩阵定义如下:

Dis=1-Sim

基于单样本距离矩阵Dis,利用层次聚类法对690个乳腺癌样本进行聚类分析。由于乳腺癌主要有5个亚型(LuminalA型,Luminal B型,HER2过表达型,基底细胞型和正常基因表达型),因此聚类个数设置为5。

图3示出了本申请一实施例中单样本ceRNA网络相似性的示意图,图4示出了本申请一实施例中乳腺癌关联ceRNA网络相似性的示意图,图5示出了本申请一实施例中乳腺癌样本聚类分析的示意图。

本实施例中,690个乳腺癌单样本ceRNA网络相似性取值范围为[0.11,0.43](如图2所示),该结果表明:每个乳腺癌样本中ceRNA网络差异很大。同时,690个样本中乳腺癌关联的ceRNA网络相似性取值范围为[0.09,0.44](如图3所示),该结果表明:每个样本中乳腺癌关联的ceRNA网络差异也很大。基于乳腺癌单样本ceRNA网络的相似性,利用层次聚类法对690个乳腺癌样本进行聚类分析(聚类个数为5),层次聚类结果表明,690个乳腺癌样本能够被很好的分为5个类别(如图4所示)。

以上结果表明:每个乳腺癌样本是独一无二的,要想研究ceRNA参与恶性肿瘤的基因调控,必须从单样本层次识别ceRNA网络。另外,通过单样本ceRNA网络可以构建样本与样本之间的关联关系,为恶性肿瘤样本分类提供新方法。

综上所述,本发明提出的单样本ceRNA网络识别方法能够识别恶性肿瘤特异性ceRNA网络,为人类恶性肿瘤在临床上的诊断和治疗提供技术支持,具有重要的生物学意义。

图6为本申请一实施例提供的单样本ceRNA网络识别装置的结构示意图,如图6所示,

一种单样本ceRNA网络识别装置,包括:

获取模块21,用于获取匹配样本的微小核糖核酸miRNA、第一靶基因和第二靶基因的转录组矩阵,每个匹配样本中包括多个样本,每个样本包括多个miRNA、第一靶基因和第二靶基因。

获取模块21,还用于根据匹配样本,获取与匹配样本相关的先验miRNA和靶基因调控关系数据。

识别模块22,用于根据匹配样本的miRNA的转录组矩阵、匹配样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,识别获取匹配样本中每个样本对应的多个ceRNA竞争关系对。

融合模块23,用于将每个样本对应的多个ceRNA竞争关系对进行融合,得到每个样本对应的ceRNA网络。

一些实施方式中,获取模块21,具体用于根据匹配样本的生物特性,在给定的miRNA、第一靶基因和第二靶基因转录组矩阵中,提取相同生物特性的miRNA、第一靶基因和第二靶基因的转录组矩阵,得到匹配样本的miRNA、第一靶基因和第二靶基因的转录组矩阵。

一些实施方式中,识别模块22,具体用于根据样本的miRNA的转录组矩阵、样本的第一靶基因和第二靶基因的转录组矩阵以及先验miRNA和靶基因调控关系数据,获取共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值。当共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件时,确定第一靶基因和第二靶基因为样本的ceRNA竞争关系对。

一些实施方式中,共享miRNA的显著性p值、第一靶基因和第二靶基因之间的正相关显著性p值以及第一靶基因和第二靶基因之间的敏感性相关显著性p值均符合预设条件,包括:

共享miRNA的显著性p值小于0.05、第一靶基因和第二靶基因之间的正相关显著性p值小于0.05以及第一靶基因和第二靶基因之间的敏感性相关显著性p值小于0.05。

一些实施方式中,参考图6,该装置还包括验证模块24,用于通过单样本ceRNA网络相似性分析、与目标疾病的关联性分析以及样本聚类分析中的至少一种分析方式,对单样本的ceRNA网络进行分析验证。

上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。

图7为本申请一实施例提供的电子设备结构示意图。

如图7所示,该电子设备包括:处理器31、计算机可读存储介质32和总线33,其中:

电子设备可以包括一个或多个处理器31、总线33和存储介质32,其中,计存储介质32用于存储机器可读指令,处理器31通过总线33与存储介质32通信连接,处理器31执行存储介质32存储的机器可读指令,以执行上述方法实施例。

电子设备可以是通用计算机、服务器或移动终端等,在此不做限制。电子设备用于实现本申请的上述方法实施例。

需要说明的是,处理器31可以包括一个或多个处理核(例如,单核处理器或多核处理器)。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用指令集处理器(Application Specific Instruction-set Processor,ASIP)、图形处理单元(GraphicsProcessing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable GateArray,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(Reduced Instruction Set Computing,RISC)、或微处理器等,或其任意组合。

存储介质32可以包括:包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory,ROM)等,或其任意组合。作为举例,大容量存储器可以包括磁盘、光盘、固态驱动器等;可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等;易失性读写存储器可以包括随机存取存储器(Random Access Memory,RAM);RAM可以包括动态RAM(Dynamic Random Access Memory,DRAM),双倍数据速率同步动态RAM(Double Date-Rate Synchronous RAM,DDR SDRAM);静态RAM(Static Random-AccessMemory,SRAM),晶闸管RAM(Thyristor-Based Random Access Memory,T-RAM)和零电容器RAM(Zero-RAM)等。作为举例,ROM可以包括掩模ROM(Mask Read-Only Memory,MROM)、可编程ROM(Programmable Read-Only Memory,PROM)、可擦除可编程ROM(ProgrammableErasable Read-only Memory,PEROM)、电可擦除可编程ROM(Electrically ErasableProgrammable read only memory,EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。

为了便于说明,在电子设备中仅描述了一个处理器31。然而,应当注意,本申请中的电子设备还可以包括多个处理器31,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备的处理器31执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。

可选地,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行如上述方法的步骤。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于卷积去噪自编码机的piRNA-疾病关联关系预测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!