IgA肾病诊断标志物组合及其应用

文档序号:252257 发布日期:2021-11-16 浏览:8次 >En<

阅读说明:本技术 IgA肾病诊断标志物组合及其应用 (IgA nephropathy diagnostic marker combination and application thereof ) 是由 饶皑炳 于 2021-08-16 设计创作,主要内容包括:本发明公开了IgA肾病诊断标志物组合及其应用。本申请的第一方面,提供定量检测基因ADIPOR2;CDK14;CYB561D1、CYB561D2中的至少一种;DOCK10;IL33;PCDH18、PCDH17中的至少一种;PLEKHG2、PLEKHG3中的至少一种;RASDRF2、RASGRF1中的至少一种;VIL1的试剂在制备IgA肾病的诊断试剂盒中的应用。本申请从全mRNA基因表达组数据中筛选得到上述9个基因的组合,基于这9个基因对受试者进行定量检测可以高效准确地诊断出是否患有IgA肾病。(The invention discloses an IgA nephropathy diagnostic marker combination and application thereof. In a first aspect of the application, there is provided a quantitative detection gene ADIPOR 2; CDK 14; at least one of CYB561D1, CYB561D 2; DOCK 10; IL 33; at least one of PCDH18, PCDH 17; at least one of PLEKHG2, PLEKHG 3; at least one of RASDRF2, RASDRF 1; use of VIL1 reagent in preparation of IgA nephropathy diagnostic kit. The combination of the above 9 genes is screened from the whole mRNA gene expression group data, and the 9 genes are quantitatively detected to a subject, so that whether the subject suffers from IgA nephropathy can be efficiently and accurately diagnosed.)

IgA肾病诊断标志物组合及其应用

技术领域

本申请涉及肾病检测技术领域,尤其是涉及IgA肾病诊断标志物组合及其应用。

背景技术

免疫球蛋白(IgA)肾病,由IgA复合物在肾脏沉积,导致肾脏局部自身免疫反应,引起肾组织病变,是一种最常见的原发性肾小球疾病。超过30%的患者在发病10-20年后进展至终末期肾脏病(ESRD),使得IgA肾病成为引起尿毒症最常见的病因之一。目前IgA肾病诊断金标准为肾穿刺的病理组织活检,然而有创肾穿刺存在几个缺陷:(1)肾穿刺无法进行早期诊断,只能够检测发病的肾损伤已经形成的病人。(2)肾穿刺存在风险,因为许多病人存在肾穿刺相对禁忌症,或者医院不具备肾穿刺病理诊断的条件,而导致病人无法获得明确诊断并进行针对性的治疗。(3)肾穿刺医疗费用高,相当于一次手术,需要住院一个星期。因此临床上亟需开发有助于IgA肾病诊断或病情判断的无创性生物标志物。

IgA肾病诊断的生物标志物大致可以分为两类:免疫诊断标志物和基因诊断标志物。免疫诊断标志物是指蛋白质或抗体,而基因诊断标志物是指包含遗传性IgA肾病的基因突变和基因分型的DNA检测、mRNA基因表达、调控基因表达的miRNA等。现有的IgA肾病免疫诊断标志物通常特异性介于25%-75%,敏感性介于60%-90%。其中研究较多的有:(1)半乳糖缺陷IgA1(Gd-IgA1)分子;(2)针对Gd-IgA1的抗糖抗体;(3)IgA/C3比例,补体通路的补体C3;(4)所有IgA复合物的总信号。

由于免疫诊断标志物的特异性不高,近年来科研人员逐步在基因诊断领域利用mRNA、lncRNA、miRNA基因表达来建立IgA肾病的基因诊断标志物。例如,Chen利用基因表达综合数据库(GEO)的数据集GSE93789进行生物信息学数据分析,找到6个核心基因:JUN、C3AR1、FN1、AGT、FOS和SUCNR1。其中C3AR1为C3a受体,C3a是关键的炎症调控因子,参与细胞炎症反应;AGT为肾素-血管紧张素系统(RAS)唯一基底(substrate),2012年KDIGO指南把RAS抑制剂作为IgA肾病标准治疗的基石;JUN及FOS属于基因AP-1的转录因子,AP-1调控细胞增殖、死亡、分化和炎症过程中的基因表达;FN1为非胶原糖蛋白和ECM的主要成分;而SUCNR1调控肾脏分泌肾素(renin)。Cui利用GEO数据集GSE37460进行生物信息学数据分析,发现6个核心基因:EGR1、ATF3、NR4A2、NR4A1、MAFF及KLF6与IgA肾病或高血压肾病有关。其中,EGR1是锌指(zinc finger)早期生长反应家族表达因子成员,调节巨核细胞中分化簇40配体(CD40L)表达,而CD40L在慢性肾病的发生发展中起重要作用;ATF3是ATF/CREB家族表达因子成员,通过与c-JUN蛋白作为同二聚体或异二聚体结合到DNA位点来调节转录;EGFR1和ATF3可调节炎症和免疫相关基因的表达。NR4A2和NR4A1是核激素受体亚家族的成员,参与细胞凋亡和癌变;MAFF与细胞应激反应有关;KLF6是一种含有三锌指基序的DNA结合蛋白,在肾集合管系统的发育过程中发挥作用。

然而上述这些研究中往往仅对单一基因诊断标志物进行筛选,而这些基因通常涉及多种生物进程,不足以独立应用于IgA肾病临床诊断,因此,有必要提供一种具有良好诊断价值的标志物组合。

发明内容

本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种具有良好诊断价值的IgA肾病的基因诊断标志物组合,基于该组合的定量检测基因诊断标志物组合的试剂在制备IgA肾病的诊断试剂盒中的应用。

本申请的第一方面,提供定量检测基因(a)~(i)中至少一种的试剂在制备IgA肾病的诊断试剂盒中的应用:

(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4,SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

根据本申请实施例的应用,至少具有如下有益效果:

本申请从全mRNA基因表达组数据中筛选得到上述9组基因,基于这9组基因中任一种对受试者进行定量检测可以高效准确地诊断出是否患有IgA肾病,并且具有良好的特异性和灵敏度。

其中,1)ADIPOR2是脂联素受体(Adiponectin Receptor)家族成员中的一种,而该家族中的其它成员,包括ADIPOR1、ADIPOQ等作为对应的平行基因具有类似的表达,因此可以作为ADIPOR2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

2)CDK14是细胞周期蛋白依赖激酶(Cyclin Dependent Kinase,CDK)家族成员,而CDK家族的其它成员或CDK抑制剂成员,包括CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP等作为对应的平行基因具有类似的表达,因此可以作为CDK14的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

3)CYB561D1是细胞色素(Cytochrome)B561成员,该家族的其它成员,包括CYB561、CYB561A、CYB561D2等作为对应的平行基因具有类似的表达,因此可以作为CYB561D1的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

4)DOCK10和PLEKHG2是Rho GTPase通路成员中的其中两种,具体而言,DOCK10是鸟苷核苷酸交换因子(Rho GEF)成员,PLEKHG2是Pleckstrin同源性含G2的RhoGEF结构域成员,而Rho GTPase通路成成员中的其它成员,包括(4-1)Rho亚家族的小GTPase成员RhoA、CDC42、RAC1;(4-2)鸟苷核苷酸交换因子(Rho GEF)成员DOCK9、DOCK11,及Pleckstrin同源性含G2的RhoGEF结构域成员PLEKHG2、PLEKHG3;(4-3)Rho GTPase激活蛋白(GAP)成员,ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6;(4-4)RhoGDI:Rho GDP分离抑制剂成员ARHGDIA、ARHGDIB等作为对应的平行基因具有类似的表达,因此可以作为DOCK10或PLEKHG2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

5)IL33作为参与T细胞Th2的分化成熟和Th2细胞的化学引诱剂,其它还有像带有序列5′-GAGGAA-3′的内皮转录因子GATA2、GATA3、GATA4,及带有序列5′-GAGGAA-3′的淋巴细胞特异性增强子SPI1、SPIB,与自身性免疫相关;这些同样可以作为IL33的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

6)PCDH18是钙粘蛋白(cadherin)超家族,具体而言是原钙粘蛋白(protocadherin)亚家族成员,该亚家族或超家族的其它成员包括PCDH17、PCDH10等钙依赖性细胞粘附蛋白可以作为PCDH18的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

7)RASGRF2是Ras鸟嘌呤核苷酸释放因子(GRF)成员,而GRF的其它成员,包括RASGRF1等可以作为RASGRF2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

8)VIL1是钙调节肌动蛋白结合蛋白家族成员,钙调节肌动蛋白结合蛋白家族的其它成员如AVIL,以及相关肌动蛋白调控基因SRC、PIP2、LPA,和肌动蛋白聚合抑制剂胸腺肽β家族成员TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B可以作为VIL1的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

9)T细胞免疫过程的B细胞激活及免疫球蛋白合成及转录NF-kB信号通路及MAPK8/JNK激活的TNF受体超家族成员CD27及其配体CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8,TNF受体结合因子(TRAF)家族成员TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1中的至少一种。

在本申请的一些实施方式中,试剂用于定量检测ADIPOR2、CDK14、CYB561D1、CYB561D2、DOCK10、IL33、PCDH18、PCDH17、PLEKHG2、PLEKHG3、RASDRF2、RASGRF1、VIL1中的至少一种。

在本申请的一些实施方式中,试剂用于定量检测ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、、RASDRF2、VIL1中的至少一种。

在本申请的一些实施方式中,试剂在转录水平或蛋白水平上进行检测。

在本申请的一些实施方式中,试剂通过二代测序、三代测序、荧光定量PCR、数字PCR、基因芯片、质谱、电泳、免疫吸附等其中的任一种进行定量检测。

本申请的第二方面,提供IgA肾病的诊断试剂盒,该诊断试剂盒包括定量检测基因(a)~(i)中至少一种的试剂:

(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

本申请的第三方面,提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行以下操作:

步骤1:获取来自受试者样本中的基因(a)~(i)中至少一种的表达水平的信息;

步骤2:对表达水平进行数学关联以获得评分;评分用于指示受试者的IgA肾病的患病风险;

其中,(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

在本申请的一些实施方式中,表达水平为基因的转录水平或蛋白水平。

在本申请的一些实施方式中,步骤1还包括对基因的表达水平进行标准化。

在本申请的一些实施方式中,操作还包括步骤3:根据评分对受试者的IgA肾病的患病风险进行评估。例如,如果受试者的评分达到设定的阈值或比之更高,判断受试者有较大的可能患有IgA肾病。

本申请的第四方面,提供一种电子设备,该电子设备包括处理器和存储器,存储器上存储有可在处理器上运行的计算机程序,所述处理器在运行所述计算机程序时实现以下操作:

(1)获取来自受试者样本中的基因(a)~(i)中至少一种的表达水平的信息;

(2)对所述表达水平进行数学关联以获得评分;所述评分用于指示受试者的IgA肾病风险;

其中,(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

本申请的第五方面,提供一种多基因的标志物筛选方法,该方法包括以下步骤:

S1:测定基因的表达数据,根据样本类型筛选出差异表达的基因;

S2:对差异表达的基因进行关联,得到不同基因之间的关联系数的矩阵;

S3:根据关联系数,对基因进行递归聚类,得到若干聚簇;

S4:选择聚簇内关联系数最大的基因作为聚簇的代表基因;

S5:取代表基因建立回归模型,筛选出标志物。

在本申请的一些实施方式中,S3具体为:

S31:设定关联系数阈值;

S32:从基因中选择候选基因,将基因中与候选基因的关联系数大于关联系数阈值的其它基因以及候选基因归为一个聚簇;

S33:重新设定关联系数阈值,对未归入聚簇的基因重复S32,直至基因全部归入聚簇。

在本申请的一些实施方式中,重新设定关联系数阈值的方法为在S31中的关联系数阈值上递减,得到新的关联系数阈值。

在本申请的一些实施方式中,S4具体为:以一个聚簇内的全部基因建立关联系数子矩阵,对任一基因的所有关联系数求和,将求和后的关联系数值最大的基因作为代表基因。

在本申请的一些实施方式中,S5具体为:

S51:取代表基因按照差异表达情况分组分别建立回归模型,筛选出具有统计学显著性的基因集合;

S52:合并基因集合建立合并回归模型,二次筛选出具有统计学显著性的基因,即得标志物。

本申请的第六方面,提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如前述的标志物筛选方法。

本申请的第七方面,提供一种电子设备,该电子设备包括处理器和存储器,存储器上存储有可在处理器上运行的计算机程序,处理器在运行计算机程序时实现如前述的标志物筛选方法。

本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

图1是本申请的一种多基因的标志物筛选方法的流程示意图。

图2是本申请的实施例1筛选出的9个基因诊断标志物对不同样本类型的箱线图。

图3是本申请的实施例1筛选出的9个基因诊断标志物的组合的ROC曲线。

具体实施方式

以下将结合实施例对本申请的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本申请的目的、特征和效果。显然,所描述的实施例只是本申请的一部分实施例,而不是全部实施例,基于本申请的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本申请保护的范围。

下面详细描述本申请的实施例,描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。

在本申请的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本申请的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本申请中的具体含义。

本申请的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

本申请实施例提供一种多基因的标志物筛选方法,参考图1,该筛选方法包括以下步骤:

S1:测定基因的表达数据,根据样本类型筛选出差异表达的基因;

S2:对差异表达的基因进行关联,得到不同基因之间的关联系数的矩阵;

S3:根据关联系数,对基因进行递归聚类,得到若干聚簇;

S4:选择聚簇内关联系数最大的基因作为聚簇的代表基因;

S5:取代表基因建立回归模型,筛选出标志物。

其中,样本类型是指根据分类依据的不同,对样本所做的分组。分类时具体的依据可以是诸如是否患病,例如,将样本分为某种疾病的患者组和未患有这种疾病的正常人的对照组这两种样本类型;疾病的种类,例如,在分别患有多种疾病的样本,或者疾病的不同分型、不同进程的样本中,根据所患疾病的不同、或者疾病的分型或进程的不同将样本分为不同的类型组;以此筛选出在其中一组中相对于其它组中存在差异表达的基因。对差异表达的基因进行关联是指根据表达数据得到不同基因之间相关关系密切程度的统计指标,并通过矩阵的形式反映。在其中一些实施方式中,可以根据实际的基因差异表达情况分组关联,也可以不分组直接关联。递归聚类是指通过迭代的方式将差异表达的基因分别归入不同的聚簇。

在其中一些具体的实施方式中,基因的表达数据是指基因的转录组数据,可以理解的是,根据样本来源的不同,也可以是蛋白水平的数据。

在其中一些具体的实施方式中,S3为:

S31:设定关联系数阈值;

S32:从基因中选择候选基因,将基因中与候选基因的关联系数大于关联系数阈值的其它基因以及候选基因归为一个聚簇;

S32:重新设定关联系数阈值,对未归入聚簇的基因重复S32,直至基因全部归入聚簇。

其中,关联系数阈值是指根据所有基因对之间的关联系数分布所设定的一个关联系数的值,可以根据关联系数的实际分布情况进行适应性调整,例如,可以设置为0.75。候选基因是指作为一个聚簇的聚类中心的基因,例如,可以将这些差异表达的基因按照两两之间相关性检验的结果(例如T检验的p值)从小到大排序,取第一个没有归入聚簇的基因作为候选基因。在这种情况下,将所有差异表达的基因中与候选基因的关联系数大于关联系数阈值的其它基因以及这一候选基因归为一个聚簇。随后重新设定关联系数阈值,具体可以是将原有的关联系数阈值通过递减的方式不断得到新的关联系数阈值,并根据新的关联系数阈值依次对差异表达的全部基因中未归入前一聚簇或其它所有聚簇的基因进行S31的步骤,直至所有的差异表达基因都分别归入单一聚簇中。例如,将关联系数阈值减小0.05,得到新的关联系数阈值,以此将一部分基因划入另一聚簇;再将新的关联系数阈值迭代减小0.05,对剩下的未划入聚簇的基因进行聚类;以此类推,直至所有的差异表达基因都被归入聚簇中。

在其中一些具体的实施方式中,S4为:以一个聚簇内的全部基因建立关联系数子矩阵,对任一基因的所有关联系数求和,将求和后的关联系数值最大的基因作为代表基因。求和方式可以是将任一基因在矩阵中的一列或一行的全部关联系数相加,得到这一基因与同一聚簇内的其它所有基因的关联系数的总和,根据总和判断出这一聚簇内与其它基因关联性最强的基因作为这一聚簇的代表基因。

在其中一些具体的实施方式中,S5为:

S51:取代表基因按照差异表达情况分组分别建立回归模型,筛选出具有统计学显著性的基因集合;

S52:合并基因集合建立合并回归模型,二次筛选出具有统计学显著性的基因,即得标志物。

其中,差异表达情况是指差异表达的基因相对于另外的样本类型上调或下调这一情况,即根据代表基因的上调或下调对其进行分组,上调的代表基因和下调的代表基因分别建立回归模型。回归模型是指对样本类型和差异表达基因之间的统计关系进行定量描述的数学模型,在其中一些具体的实施方式中,回归模型是指线性回归模型。可以理解的是,也可以本领域熟知的其它类型的回归模型。在其中一些实施方式中,具有统计学显著性是指p值小于0.05。可以理解的是,根据实际筛选的需要,也可以是指p值小于0.01或0.001等。随后将筛选出的具有统计学显著性的基因的集合合并,不再区分基因之间的上下调关系,以筛选出的全部的基因重新构建回归模型,并再一次筛选出其中具有统计学显著性的基因,即为所需的标志物。

可以理解的是,为了进一步增强筛选结果的诊断价值,代表基因在构建回归模型前可以通过对这些代表基因与其聚簇内的其它所有基因的关联性强弱进行预先剔除。例如,设定代表基因与聚簇内的其它基因的平均关联系数需要大于设定阈值T′(该阈值同样可以根据所有基因对之间的关联系数分布进行调整,例如T′=0.65),只有满足该条件(表明该代表基因与聚簇内的其它基因具有较强关联)的代表基因才能够作为候选参与回归模型的构建。

在上述的多基因的标志物筛选方法中,基于不同的基因内部的基因对之间的关联系数进行聚类的逻辑在于,以筛选可能与疾病有关的基因(即按照患者组与健康人的对照组对样本进行分组)为例,同一基因聚类中的基因对在所有正常人的组织中遵循一定的平衡关系,但在患者组织中,这种内在平衡关系被扰乱,所以基于包含健康人及病人样本的基因表达向量,基因对构建的关联系数包含了四种可能性的信息:健康人样本的关联性(有,无)与病人样本的关联性(有,无)的四种组合,这4种组合蕴含把原本在同一分子通道上的基因进行更精细化的聚类。在生物信息学领域,基因表达的标准算法为基因表达差异化分析,但目前基于基因聚类的关联分析方法目前进行的研究不多。而该方法的核心思想为,一个有利于诊断的基因,不仅仅在病人及健康人有差异性表达,而且应该是决定其功能的所有同聚类基因的出色代表,而与该聚类所有成员关联性最强的基因自然是最佳代表,因而将其作为代表基因。

本申请的实施例还提供一种电子设备。在其中一些具体实施例中,该电子设备包括处理器和存储器,存储器存储有可在处理器上运行的计算机程序,而处理器在运行计算机程序时实现上述的标志物筛选方法。处理器与存储器之间通信连接,也可以通过总线或者其他方式连接。

本申请的实施例还提供一种计算机可读存储介质。在一些实施例中,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于执行上述的标志物筛选方法。

在其中一些具体的实施例中,该存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,比如,被上述电子设备中的一个处理器执行,可使得上述一个或多个处理器执行上述的标志物筛选方法。

采用上述的多基因的标志物筛选方法对IgA肾病的数据集进行筛选,本申请的实施例还提供定量检测基因(a)~(i)中至少一种的试剂在制备IgA肾病的诊断试剂盒中的应用:

(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

这些基因主要涉及肾小囊脏上皮细胞,即足细胞(podocyte)的细胞骨架功能及其相关的RhoGTPase通路(DOCK10,PLEKHG2/PLEKHG3,RASDRF2/RASGRF1);细胞骨架或组织质地的钙离子相关的肌动蛋白调控因子或粘附因子(VIL1,PCDH18/PCDH17);调节细胞周期进程和细胞增殖的Wnt信号通路的调节器(CDK14);血红素/金属离子结合及氧化还原酶活性(CYB561D1/CYB561D2);调节糖脂代谢的脂肪细胞分泌的基本激素(ADIPOR2);在组织损伤期间增强免疫反应的Th2细胞的化学引诱剂(IL33);T细胞免疫的B细胞激活及免疫球蛋白合成,转录NF-kB信号通路及MAPK8/JNK激活(CD27、CD70),肿瘤坏死因子(TNF)通路(TNFRSF9)。

在其中一些具体的实施方式中,试剂在转录水平或蛋白水平上进行检测。根据实际样本来源的不同,可以在转录水平或蛋白质水平上对基因的表达进行检测。

在其中一些具体的实施方式中,试剂通过二代测序、三代测序、荧光定量PCR、数字PCR、基因芯片中的任一种进行定量检测。根据不同的检测要求,可以对样本通过不同的检测平台或检测方法进行定量检测。

本申请的实施例还提供一种IgA肾病的诊断试剂盒,该诊断试剂盒包括定量检测基因(a)~(i)中至少一种的试剂:

(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

本申请的实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行以下操作:

(1)获取来自受试者样本中的基因(a)~(i)中至少一种的表达水平的信息;

(2)对表达水平进行数学关联以获得评分;评分用于指示受试者的IgA肾病的患病风险;

其中,(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

其中,受试者是指待评估IgA肾病的患病风险的待测人员,受试者样本是指待测人员的包含基因(a)~(i)中至少一种的表达水平的信息的样本,具体包括但不限于外周血样本、尿样、组织样本等。进行数学关联以获得评分是指通过诸如建模的方式得到患病风险与这些标志物基因的表达水平的关系,而患病风险则以评分的方式体现。

在本申请的一些实施方式中,表达水平为基因的转录水平或蛋白水平。根据实际样本来源的不同,可以在转录水平或蛋白质水平上对基因的表达进行检测。

在本申请的一些实施方式中,步骤1还包括对所述基因的表达水平进行标准化。通过标准化处理以进一步避免可能引起的诊断结果误差。

在本申请的一些实施方式中,操作还包括S3:根据评分对受试者的IgA肾病的患病风险进行评估。具体可以通过患者组与正常人之间评分的差异得到区分正常人和患者的评分阈值,根据受试者的评分与评分阈值之间的关系对IgA肾病的患病风险进行评估。

本申请的第四方面,提供一种电子设备,该电子设备包括处理器和存储器,存储器上存储有可在处理器上运行的计算机程序,所述处理器在运行所述计算机程序时实现以下操作:

(1)获取来自受试者样本中的基因(a)~(i)中至少一种的表达水平的信息;

(2)对所述表达水平进行数学关联以获得评分;所述评分用于指示受试者的IgA肾病风险;

其中,(a)ADIPOR1、ADIPOR2、ADIPOQ;

(b)CDK14、CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP;

(c)CYB561、CYB561A、CYB561D1、CYB561D2;

(d)RhoA、CDC42、RAC1、DOCK10、DOCK9、DOCK11、PLEKHG2、PLEKHG3、ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6、ARHGDIA、ARHGDIB;

(e)IL33、GATA2、GATA3、GATA4、SPI1、SPIB;

(f)PCDH18、PCDH17、PCDH10;

(g)RASGRF2、RASGRF1;

(h)VIL1、AVIL、SRC、PIP2、LPA、TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B;

(i)CD27、CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8、TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1。

其中,存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如本申请实施例描述的标志物筛选方法或对受试者的IgA肾病风险进行评估。处理器通过运行存储在存储器中的非暂态软件程序以及指令,从而实现上述的标志物筛选方法或对受试者的IgA肾病风险进行评估。

存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述标志物筛选方法。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,比如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在其中一些具体的实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述的标志物筛选方法所需的非暂态软件程序以及指令存储在存储器中,当被一个或者多个处理器执行时,执行上述的标志物筛选方法。

以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

实施例1

本实施例提供一种利用mRNA基因的表达数据筛选IgA肾病基因诊断标志物的方法,过程如下:

一、数据集准备

1.从基因表达综合数据库(GEO)下载数据集GSE93798。GSE93798为基因芯片数据(Affymetrix GPL22945平台,Affyme-trix人类基因组U133 Plus 2.0阵列),包含22例健康人及20例IgA肾病病人肾组织样本,超过20000多个基因探针。

2.剔除表达极低的基因转录(其表达非零的样本个数不超过10个)后,余下基因数为19764。

3.数据标准化:对每个样本,分别计算所有基因表达量的中位数,每个样本的标准化标准化表达为:原表达量-样本所有基因表达量中位数,标准化去除了样本mRNA输入量的差异。

二、基因诊断标志物筛选

1.确定和IgA肾病相关的基因。利用t-检验(t-test),寻找能够区分样本类型,即IgA病人样本(IgAN)及正常人(HC)的有统计意义(p<0.05)的基因,最终得到8917个差异表达的基因。

2.对基因进行上调或下调分组。8917个基因分为两组,t-检验结果中t为正数的有3781个,代表表达在病人组织中下调的基因;t为负数的有5136个,代表表达在病人组织中上调的基因。分别对两组基因进行关联系数分析。

3.关联系数分析。每组基因中,基于基因关联系数进行聚类,其目的是每一聚类中的基因需要大致两两相互关联,聚类通过以下迭代进行,设定第一关联系数阈值T1=0.75(注:此阈值可以推过预先看所有基因对之间的关联系数分布进行调整),对关联系数矩阵扫描,把所有大于阈值T的基因进行如下递归聚类:先把这些基因相应的t-检验的结果按照p值从小到大排序,取第一个还没有归类的基因作为候选基因,把所有与之关联系数大于T的基因和该候选基因归为一个聚簇,接着对这个聚簇的基因构成的关联系数子矩阵取行(或列)平均值,按照平均值从大到小排序,取第一个基因(即该聚簇内关联系数最大的基因)为该聚簇的代表基因,即与此聚簇中所有基因最相关的基因;把阈值下调0.05,得到第二关联系数阈值T2=T1-0.05,对未归入聚簇的剩余基因重复上述步骤,直到穷尽所有基因,使这些差异表达的基因全部归入聚簇。

4.所有聚簇的代表基因构成标志物的候选基因。最后选取候选基因中与其代表的聚簇中其它基因的平均关联系数大于阈值T′(比如T′=0.65,此阈值可以推过预先看所有基因对的关联系数分布进行调整)的代表基因作为最后的基因组。如此确定的下调基因有16个:ADIPOR2、ARRDC2、BMP7、C16orf72、CDK14、CLK1、FAM134B、FOSB、FOXQ1、GLS、IER3、MRLN、PIGH、PPP4R3A、SMIM24、VIL1;而确定的上调基因也有16个:ARHGAP45、ATP13A1、C3AR1、CYB561D1、DOCK10、EMILIN1、GPR65、IL33、NPDC1、OSBPL3、PCDH18、PLEKHG2、RASGRF2、SDC3、SPARC、TMEM110。

5.线性回归分析确定基因组。分别用上述上调或下调的16个基因作为因变量对样本类型建立线性回归模型,选择p值小于0.05的基因,上调组得到7个基因:CYB561D1、DOCK10、EMILIN1、IL33、PCDH18、PLEKHG2、RASGRF2,结果见表1;下调组得到4个基因:ADIPOR2、CDK14、FOSB、VIL1,结果见表2。然后合并上调和下调的两个模型选出的11个基因,再次用它们作为因变量对样本类型建立线性回归模型,剔除p值大于0.05的基因后,即剔除FOS及EMILIN1,再次用剩余的9个基因重新建立线性回归模型,发现所有的p值均小于0.05,结果见表3。其结果为9个基因:ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1。其中,6个基因上调:CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2;3个基因下调:ADIPOR2、CDK14、VIL1。

表1.t检验(t>0)中16个基因的回归模型系数

表2.t检验(t<0)中16个基因的回归模型系数

表3.九个基因的线性回归模型及功能标注

上述单一基因的回归膜性p值均小于0.01,甚至为0。另外参考图2,是这9个基因针对样本类型的箱线图,a~i分别是ADIPOR2、CDK14、VIL1、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2的结果,其中,横坐标的0表示正常人的对照组,1表示IgA肾病的患者组,上述箱线图中两组中各个基因的表达均存在显著差异(p<0.05)。结果表明,这9个基因对IgA肾病都具有较好的分离性。

因此,将这9个基因中的至少一种作为IgA肾病的基因诊断标志物,可以对受试者检测其中至少一种基因的表达水平,根据其结果对受试者的IgA肾病的患病风险进行评估。

另外,需要说明的是:

1)ADIPOR2是脂联素受体(Adiponectin Receptor)家族成员中的一种,而该家族中的其它成员,包括ADIPOR1、ADIPOQ等作为对应的平行基因具有类似的表达,因此可以作为ADIPOR2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

2)CDK14是细胞周期蛋白依赖激酶(Cyclin Dependent Kinase,CDK)家族成员,而CDK家族的其它成员或CDK抑制剂成员,包括CDK15、CDK1、CDK10、CDK13、CDK4、CDK2AP1、CDKAL1、CDKL1、CDKN1A、CDKN2C、CDKN2AIP等作为对应的平行基因具有类似的表达,因此可以作为CDK14的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

3)CYB561D1是细胞色素(Cytochrome)B561成员,该家族的其它成员,包括CYB561、CYB561A、CYB561D2等作为对应的平行基因具有类似的表达,因此可以作为CYB561D1的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

4)DOCK10和PLEKHG2是Rho GTPase通路成员中的其中两种,具体而言,DOCK10是鸟苷核苷酸交换因子(Rho GEF)成员,PLEKHG2是Pleckstrin同源性含G2的RhoGEF结构域成员,而Rho GTPase通路成成员中的其它成员,包括(4-1)Rho亚家族的小GTPase成员RhoA、CDC42、RAC1;(4-2)鸟苷核苷酸交换因子(Rho GEF)成员DOCK9、DOCK11,及Pleckstrin同源性含G2的RhoGEF结构域成员PLEKHG2、PLEKHG3;(4-3)Rho GTPase激活蛋白(GAP)成员,ARHGAP1、ARHGAP10、ARHGAP11A、ARHGAP12、ARHGAP15、ARHGAP17、ARHGAP19、ARHGAP22、ARHGAP24、ARHGAP25、ARHGAP26、ARHGAP28、ARHGAP29、ARHGAP4、ARHGAP45、ARHGAP5、ARHGAP6;(4-4)RhoGDI:Rho GDP分离抑制剂成员ARHGDIA、ARHGDIB等作为对应的平行基因具有类似的表达,因此可以作为DOCK10或PLEKHG2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

5)IL33作为参与T细胞Th2的分化成熟和Th2细胞的化学引诱剂,其它还有像带有序列5′-GAGGAA-3′的内皮转录因子GATA2、GATA3、GATA4,及带有序列5′-GAGGAA-3′的淋巴细胞特异性增强子SPI1、SPIB,与自身性免疫相关;这些同样可以作为IL33的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

6)PCDH18是钙粘蛋白(cadherin)超家族,具体而言是原钙粘蛋白(protocadherin)亚家族成员,该亚家族或超家族的其它成员包括PCDH17、PCDH10等钙依赖性细胞粘附蛋白可以作为PCDH18的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

7)RASGRF2是Ras鸟嘌呤核苷酸释放因子(GRF)成员,而GRF的其它成员,包括RASGRF1等可以作为RASGRF2的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

8)VIL1是钙调节肌动蛋白结合蛋白家族成员,钙调节肌动蛋白结合蛋白家族的其它成员如AVIL,以及相关肌动蛋白调控基因SRC、PIP2、LPA,和肌动蛋白聚合抑制剂胸腺肽β家族成员TMSB4X、TMSB4Y、TMSB10、TMSB15A、TMSB1B可以作为VIL1的平行替代,在检测时根据样本的实际情况和检测需求对其中一种或几种进行检测即可。

9)T细胞免疫过程的B细胞激活及免疫球蛋白合成及转录NF-kB信号通路及MAPK8/JNK激活的TNF受体超家族成员CD27及其配体CD70、TNFRSF9、TNFSF11、TNFRSF11A、TNFRSF25、TNFRSF9、TNFSF18、TNFSF4、TNFSF8,TNF受体结合因子(TRAF)家族成员TRAF1、TRAF2、TRAF3、TRAF3IP1、TRAF3IP2、TRAF3IP3、TRAF4、TRAF5、TRAF6、TRAFD1中的至少一种。

模型交叉验证实验

实施例1是利用GSE93798进行的基因发现。为了交叉验证上述基因诊断标志物的组合对预测IgAN与健康人的有效性,再从基因表达综合数据库(GEO)下载数据集GSE35489,其中包含25例IgAN病人穿刺样本及6例健康人肾组织样本的基因芯片数据,同样按照样本中位数进行数据标准化,把两个数据集综合成一个数据集,只选取有共同基因的部分。需要注意的是,上述九个基因中的四个基因,CYB561D1、PCDH18、PLEKHG2、RASGRF2不在GSE35489中,但其中分别有对应的平行基因(Paralog Gene),CYB561D2、PCDH17、PLEKHG3、RASGRF1,因此用相对应的平行基因表达值分别替代。

GSE93798与GSE35489合并后的数据集包含10759个基因及73例样本,其中健康人样本28例,IgAN样本45例。把健康人及IgAN样本分别随机平分,一半用于训练模型,另一半用于验证模型,如此重复N(N=50)次。验证上述9个基因,结果表明,50次曲线下面积(AUC)排序后分别为:0.7、0.8、0.8、0.81、0.81、0.81、0.81、0.81、0.81、0.82、0.82、0.82、0.83、0.83、0.83、0.83、0.84、0.85、0.85、0.85、0.86、0.86、0.86、0.86、0.86、0.87、0.88、0.88、0.88、0.88、0.88、0.88、0.89、0.9、0.9、0.9、0.91、0.91、0.93、0.93、0.93、0.93、0.94、0.94、0.95、0.95、0.96、0.96、0.97、0.98。其中值为0.87,最大值为0.98,最小值为0.70,表明这9个基因用于预测IgAN病人结果良好且稳定,其代表性ROC曲线如图3所示,图3中的a~c分别是最大值、中位值、最小值的AUC曲线结果。该结果表明,上述9个基因作为诊断标志具有良好的诊断价值。

实施例2

本实施例提供一种IgA肾病风险评估的设备,该设备包括处理器和存储器,存储器上存储有可被处理器运行的计算机程序。运用该设备对受试者进行IgA肾病风险的评估的方法如下:

1.选择受试者的外周血样本提取外泌体mRNA。

2.将提取到的mRNA送入检测装置(例如标准qPCR平台)进行实施例1中提供的9个基因诊断标志物的表达的定量数据:ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1。

3.采用该设备利用作为目标变量的临床观察结果(如蛋白尿、eGFR、肾穿刺的病理分级、5年或10年尿毒症风险、药物的有效性预测、耐药性)重新训练线性回归模型,确定针对外周血样本的参数向量wn(n=0~9),并用检验人群数据集的ROC确定门槛值:根据参数向量wn与各个基因表达水平之间的线性公式N=w0+w1×ADIPOR2+w2×CDK14+w3×CYB561D1+w4×DOCK10+w5×IL33+w6×PCDH18+w7×PLEKHG2+w8×RASDRF2+w9×VIL1,计算能够预测IgA肾病的风险分数门槛值;并利用获取到的这些基因诊断标志物的表达水平的信息,计算得到受试者的风险分数。受试者的风险分数大于门槛值的为阳性。完成独立的临床验证实验,从而开展基于外周血的IgA肾病基因诊断。

实施例3

本实施例提供一种试剂盒,包括能够定量ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1的mRNA水平的试剂,该试剂包括逆转录酶、引物、Taq酶、荧光染料等。

实施例4

本实施例提供一种对病人IgA肾病风险评估的设备,该设备包括处理器和存储器,存储器上存储有可被处理器运行的计算机程序。运用该设备对受试者进行IgA肾病风险的评估的方法如下:

1.选择受试者的尿液样本提取外泌体mRNA。

2.将提取到的mRNA送入检测装置(例如基因芯片)进行实施例1中提供的9个基因诊断标志物的表达的定量数据:ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1。

3.采用该设备利用作为目标变量的临床观察结果(如蛋白尿、eGFR、肾穿刺的病理分级、5年或10年尿毒症风险、药物的有效性预测、耐药性)重新训练线性回归模型,确定针对尿液样本的参数向量wn(n=0~9),并用检验人群数据集的ROC确定门槛值:根据参数向量wn与各个基因表达水平之间的线性公式N=w0+w1×ADIPOR2+w2×CDK14+w3×CYB561D1+w4×DOCK10+w5×IL33+w6×PCDH18+w7×PLEKHG2+w8×RASDRF2+w9×VIL1,计算能够预测IgA肾病的风险分数门槛值;并利用获取到的这些基因诊断标志物的表达水平的信息,计算得到受试者的风险分数。受试者的风险分数大于门槛值的为阳性。完成独立的临床验证实验,从而开展基于尿液的IgA肾病基因诊断。

实施例5

本实施例提供一种对病人IgA肾病风险评估的设备,该设备包括处理器和存储器,存储器上存储有可被处理器运行的计算机程序。运用该设备对受试者进行IgA肾病风险的评估的方法如下:

1.选择受试者的穿刺样本提取组织mRNA。

2.将提取到的mRNA送入检测装置(例如二代测序平台)进行实施例1中提供的9个基因诊断标志物的表达的定量数据:ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1。

3.采用该设备利用作为目标变量的临床观察结果(如蛋白尿、eGFR、肾穿刺的病理分级、5年或10年尿毒症风险、药物的有效性预测、耐药性)重新训练线性回归模型,确定针对穿刺样本的参数向量wn(n=0~9),并用检验人群数据集的ROC确定门槛值:根据参数向量wn与各个基因表达水平之间的线性公式N=w0+w1×ADIPOR2+w2×CDK14+w3×CYB561D1+w4×DOCK10+w5×IL33+w6×PCDH18+w7×PLEKHG2+w8×RASDRF2+w9×VIL1,计算能够预测IgA肾病的风险分数门槛值;并利用获取到的这些基因诊断标志物的表达水平的信息,计算得到受试者的风险分数。受试者的风险分数大于门槛值的为阳性。完成独立的临床验证实验,从而开展基于穿刺样本的IgA肾病基因诊断。

实施例6

本实施例提供一种试剂盒,该试剂盒包括一个微流控芯片,该微流控芯片包括储液模块,储液模块中分别装设有能够定量ADIPOR2、CDK14、CYB561D1、DOCK10、IL33、PCDH18、PLEKHG2、RASGRF2、VIL1中至少三种基因的mRNA水平的试剂。利用该试剂盒可以应用到IgA肾病的诊断中,实现较为灵敏准确的诊断。

综合上述实施例可以看到,本申请实施例提供了从全mRNA基因表达组数据中筛选构建预测临床病例指标模型的筛选方法;并利用该方法从IgA肾病的数据库中筛选出能够准确高效预测IgA肾病的9个基因诊断标志物,基于这些诊断标志物建立的线性模型预测IgA病人样本类型,特异性为100%时,敏感度达到100%。在这9个基因中涉及肾小囊脏上皮细胞,即足细胞(podocyte)的细胞骨架功能极其相关的RhoGTPase通路有三个基因DOCK10、PLEKHG2、RASDRF2。这一方面说明足细胞在IgA肾病病人的肾损伤及肾功能受损过程中起着十分重要的作用,另一方面验证了本申请实施例所提供的筛选方法的可靠性。

上面结合实施例对本申请作了详细说明,但是本申请不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种变化。此外,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

25页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于分子标志物的冠状动脉疾病诊断产品及其应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!