一种精神***症基因-基因互作网络及其构建方法

文档序号:1467595 发布日期:2020-02-21 浏览:11次 >En<

阅读说明:本技术 一种精神***症基因-基因互作网络及其构建方法 (Schizophrenia gene-gene interaction network and construction method thereof ) 是由 杨新平 高玥 梁小珍 任重鲁 李彦君 迟雅丽 于 2019-10-24 设计创作,主要内容包括:本发明公开了一种精神分裂症基因?基因互作网络的构建方法,所述构建方法包括以下步骤:①收集已知精神分裂症候选基因;②将上述收集的已知精神分裂症候选基因映射在人类蛋白质?蛋白质互作网络,转换成以基因命名的相互作用网络;③对网络中的所有基因进行R?score赋值,对网络中的所有基因进行G?score赋值,对每条边赋予权重;④构造节点间最短路径矩阵;以“游走扩展”法提取初步网络;⑤提取最终网络,输出结果。本发明构建精神分裂症基因?基因互作网络移除了部分假阳性基因,囊括进来了更多的与精神分裂症相关的潜在候选基因,富集分析结果表明,保留的基因与精神分裂症更相关,表明本发明构建的基因互作网络质量更优。(The invention discloses a method for constructing a gene-gene interaction network for schizophrenia, which comprises the following steps of ① collecting known schizophrenia candidate genes, ② mapping the collected known schizophrenia candidate genes on a human protein-protein interaction network to be converted into an interaction network named by genes, ③ carrying out R-score assignment on all genes in the network, carrying out G-score assignment on all genes in the network, giving weights to each edge, ④ constructing a shortest path matrix among nodes, extracting a preliminary network by a &#39;walking extension&#39; method, ⑤ extracting a final network and outputting a result.)

一种精神***症基因-基因互作网络及其构建方法

技术领域

本发明属于生物技术领域,具体涉及一种精神***症基因-基因互作网络及其构建方法。

背景技术

精神***症是可遗传的精神障碍,疾病特征在于阳性和阴性表现和症状以及通常在早期成年期开始并且通常持续终生的认知功能障碍。近些年精神***症的研究热点主要集中在致病候选基因的搜寻,这些研究结果表明,精神***症具有高度的遗传异质性。

寻找疾病信号通路中风险基因的传统方法是检测蛋白-蛋白相互作用,如对DISC1的研究,但对于致病基因数目众多的精神***症,逐一对于单个基因进行功能研究不但效率低,而且得不到基因之间相互协调和共同作用的信息。也有些研究将突变映射在KEGG信号通路发现风险基因富集在细胞粘附分子通路,但信号通路并非单独作用,许多其它的分子通路也会参与其中,且目前绝大部分突变的致病机理并不清楚,也尚未有人系统地研究精神***症的致病候选基因突变导致精神***症的相关致病通路。

人们已认识到蛋白与蛋白之间的相互作用在细胞分子信号通路网络中起着特别重要的作用,并且试图通过致病基因的蛋白质-蛋白质相互作用网络来研究疾病的分子机制。从系统生物学的角度来看,精神***症的疾病风险基因可能作用于一个共同的分子网络,这样的共同分子作用网络可能涉及到多个信号通路来执行相关的细胞功能。2013年,Gulsuner(Gulsuner,S.,Walsh,T.,Watts,A.C.,Lee,M.K.,Thornton,A.M.,Casadei,S.,Rippey,C.,Shahin,H.,Nimgaonkar,V.L.,Go,R.C.,Savage,R.M.,Swerdlow,N.R.,Gur,R.E.,Braff,D.L.,King,M.C.,and McClellan,J.M.(2013)Spatial and temporalmapping of de novo mutations in schizophrenia to a fetal prefrontal corticalnetwork.Cell154,518-529)等人通过整合精神***症患者的新生突变和正常人脑不同区域、不同发育阶段的转录组数据,得到了共表达和蛋白-蛋白相互作用的网络模块,这些模块显示出神经元迁移、突触传递、信号转导、转录调控和物质转运的基因功能富集。这样的整合分析可以推断出疾病发病机制可能涉及的大脑部位和发育阶段、突变基因产物的可能功能。

基因存在于生物体内的功能之一便是翻译蛋白质,通过蛋白质活性的表现,决定生物体的表型。换而言之,生物的各种性状几乎都是基因之间相互作用、调控各个基因表达的结果。所谓基因之间的相互作用,是指不同基因存在的表达调控关系,一般都是一个基因的表达产物作用于另一个基因,影响另一个基因的转录、翻译过程,这些相互影响,相互作用,相互制约的关系就构成了基因互作网络。

本发明旨在提供一种精神***症基因-基因互作网络的构建方法。

为了实现上述发明目的,本发明的技术解决方案是:一种精神***症基因-基因互作网络的构建方法,按以下步骤进行:

步骤①:利用生物信息学方法从数据库中收集已知精神***症候选基因;

步骤②:将上述收集的已知精神***症候选基因映射在人类蛋白质-蛋白质互作网络,转换成以基因命名的相互作用网络;该网络中包含精神***症候选基因和非精神***症候选基因,每个基因作为一个节点,每两个基因之间的信号通路连线构成了网络的边;

步骤③:对网络中的所有基因进行R-score赋值,对每个精神***症候选基因根据其在不同数据库中出现的次数赋值R-score,非精神***症候选基因R-score均为0;对网络中的所有基因进行G-score赋值,每个精神***症候选基因赋值G-score等于其R-score,每个非精神***症候选基因赋值G-score,对每条边赋予权重;

其中,R-score=1-1.4-X,X是该基因在所述步骤①数据库中被报道的次数;G-score=与该基因相互作用基因的R-score的平均值;权重=该条边相连两个G-score值加和的倒数;

步骤④:用R语言igraph包中的distances函数根据权重计算构造节点间最短路径矩阵,得到每个节点到任一节点的最短距离;以“游走扩展”法提取初步网络;

步骤⑤:合并所提取的所有节点,用Cytoscape提取最终网络,输出结果。

优选地,步骤①中所述精神***症候选基因从HGMD、SzGene、SZDB、SZGR、PheGenI、SNPedia和Literature数据库取并集获得。

优选地,步骤②中所述人类蛋白质-蛋白质互作网络来源于inBio Map数据库。

优选地,步骤①中使用Cytoscape将上述收集的已知精神***症候选基因映射在人类蛋白质-蛋白质互作网络,转换成以基因命名的相互作用网络。

优选地,所述步骤④中提取初步网络的具体方法为:以每个精神***症候选基因为起点,以步长0.5为半径向外扩展,若每扩大一个0.5步长,候选基因的比例显著减少,则保留内层基因集。

优选地,所述步骤⑤中提取最终网络的具体方法为:按候选基因比例为85~90%,且步长为2.5~4.0的参数提取网络,同时移除仅出现在一个基因集中的基因。

优选地,所述候选基因比例为90%,步长为3.5。

除此之外,本发明另一目的在于提供上述方法构建的精神***症基因-基因互作网络。

与现有技术相比,本发明具有以下有益效果:

与传统方法相比,本发明构建精神***症基因-基因互作网络的方法更具有优势,提取的网络移除了公开的精神***症候选基因中的部分假阳性基因,囊括进来了更多的与精神***症相关的潜在候选基因,富集分析结果表明,保留的基因与精神***症更相关,表明本发明构建的基因互作网络质量更优。

附图说明

图1为以“游走扩展法”提取网络示意图;

图2为保留基因及移除基因富集精神***症差异表达基因的比较结果;

图3为保留基因及移除基因富集精神***症突变基因的比较结果;

图4为保留基因及移除基因富集脑特异表达基因的比较结果;

图5为保留基因及移除基因富集组织特异性基因的比较结果。

具体实施方式

方式

以下通过实施例形式的具体实施方法,对本发明的上述内容作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下实施例。

为了更好地理解本发明,下面提供相关的解释和说明:

HGMD:全称Human Gene Mutation Database,人类基因突变数据库(

Figure BDA0002245899970000031

)包含所有已知(已发表的)导致人类遗传性疾病的基因病变。

SzGene:全称SchizophreniaGene,精神***症遗传相关研究的在线数据库。

SZDB:全称A database for Schizophrenia Genetic Research,精神***症数据库(szdb),是一个用于精神***症研究的综合资源,该数据库整合了与精神***症相关的数据:遗传数据(来自pgc2的snp关联,全基因组意义重大的snps和基因,受cnvs影响的基因,融合功能基因组学(cfg)的基因,夏洛克综合分析的基因,通过关联和连锁研究)、基因表达数据(时空表达模式和差异表达基因)、基于网络的数据(ppi和共表达)、脑eqtl数据、编码数据以及snp功能注释信息。

SZGR:全称Schizophrenia gene resource,精神***症基因库。

PheGenI:Phenotype–Genotype Integrator,该数据库将NHGRI全基因组关联研究(GWAS)目录数据与国家生物技术信息中心(NCBI)的几个数据库合并,包括Gene,dbGaP,OMIM,eQTL和dbSNP。

SNPedia:网址:https://www.snpedia.com/index.php/Schizophrenia。

Literature:Schizophrenia Working Group of the Psychiatric Genomics,C.Biological insights from 108schizophrenia-associated genetic loci.Nature511,421-427,doi:10.1038/nature13595(2014).

实施例中所使用的实验方法如无特殊说明,均为常规方法,所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1、精神***症基因-基因互作网络构建

步骤①:精神***症相关候选基因收集:利用生物信息学方法从数据库HGMD、SzGene、SZDB、SZGR、NCBI PheGenI、SNPedia和Literature中收集精神***症候选基因,并取并集获得3,437个已知精神***症候选基因;

步骤②:将上述收集的精神***症候选基因使用Cytoscape(版本3.4.3)映射在人类蛋白质-蛋白质互作网络(来源于inBio Map数据库),转换成以基因命名的相互作用网络,该网络中每个基因作为一个节点,将每两个具有相互作用的基因用一条线(边)连接起来,最终得到包括17,210个基因,597,859条基因-基因相互作用边的网络,其中,17,210个基因中包含3,265个精神***症候选基因和13,945个非精神***症候选基因;

步骤③:初始赋值:对网络中的所有基因进行R-score赋值,对每个精神***症候选基因根据其在不同数据库中出现的次数赋值R-score,非精神***症候选基因R-score均为0,接着对网络中的所有基因进行G-score赋值,每个精神***症候选基因赋值G-score等于其R-score,每个非精神***症候选基因赋值G-score,对每条边赋予权重;

其中,R-score=1-1.4-X,X是该基因在所述步骤①数据库中被报道的次数;G-score=与该基因相互作用基因的R-score的平均值;权重=该条边相连两个G-score值加和的倒数;

步骤④:用R语言igraph包中的distances函数根据权重计算构造节点间最短路径矩阵,得到每个节点到任一节点的最短距离;以每个精神***症候选基因为起点,以步长0.5为半径向外扩展,若每扩大一个0.5步长,候选基因的比例显著减少,则保留内层基因集(具体如图1所示);

步骤⑤:合并所提取的所有节点,用Cytoscape提取最终网络,提取参数为:候选基因比例为90%,步长为3.5,为尽可能避免假阳性,移除仅出现在一个基因集中的基因,最终得到包含3,975个基因,92,318个基因-基因相互作用的精神***症网络,该网络相较于步骤②中的3,265个精神***症候选基因,移除了392个假阳性基因,新增了1,102个与精神***症更相关的潜在候选基因,移除基因如表1所示,增加的潜在候选基因如表2所示。

表1移除的基因列表

Figure BDA0002245899970000041

Figure BDA0002245899970000051

Figure BDA0002245899970000061

表2增加的潜在候选基因列表

Figure BDA0002245899970000062

Figure BDA0002245899970000071

Figure BDA0002245899970000081

实施例2、富集分析

为了检测本发明是否更优,是否囊括了更多的风险基因并移除了假阳性的候选基因,为此,整合了大规模二代测序研究得到的精神***症差异表达基因、疾病-对照组发现的突变以及人体的组织特异性基因,通过富集分析,使用双尾Fisher精确检验,检验保留基因和移除的基因哪个更富集,富集结果如图2-4所示:

从图2可看出,与移除的基因相比,保留的基因显著富集疾病-对照差异表达基因,双尾Fisher精确检验结果表示,保留与移除节点间P=0.0007302421,保留的候选基因与移除的候选基因间P=0.470523,保留的非候选基因与移除的非候选基因P=0.471481;

从图3可以看出,与移除的基因相比,保留的基因显著富集疾病-对照突变基因,双尾fi sher精确检验结果表示,保留与移除节点间p=5.982661e-98,保留的候选基因与移除的候选基因间p=7.508186e-07,保留的非候选基因与移除的非候选基因间p=0.01830605;

从图4可以看出,与移除的基因相比,保留的基因显著富集脑特异表达基因,双尾fishe r精确检验,保留与移除节点间p=2.328268e-99,保留的候选基因与移除的候选基因间p=1,保留的非候选基因与移除的非候选基因间p=6.082373e-11。

从以上结果可看出,移除的候选基因显示出较低疾病-对照富集差异表达基因以及突变,表明一些假阳性的候选基因被移除了,保留的基因更富集疾病-对照突变以及脑特异表达基因,表明囊括了更多的精神***症风险基因进来。同时组织特异性基因的富集结果表明,与移除的基因相比,保留的基因更多的参与了脑相关功能(图5)。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于SNP鉴定个体肠道菌群类型的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!