一种用于乳腺癌早期筛查和诊断的血清蛋白标志物、试剂盒及检测方法

文档序号:1555663 发布日期:2020-01-21 浏览:8次 >En<

阅读说明:本技术 一种用于乳腺癌早期筛查和诊断的血清蛋白标志物、试剂盒及检测方法 (Serum protein marker, kit and detection method for early screening and diagnosis of breast cancer ) 是由 张建营 叶华 王鹏 王晓 史健翔 代丽萍 邱翠鹏 黎天东 于 2019-10-23 设计创作,主要内容包括:本发明公开一种用于乳腺癌早期筛查和诊断的血清蛋白标志物,属于生物医学技术领域,血清蛋白标志物为CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B或p53基因编码的蛋白中的任意一种或两种以上的联合。同时公开包括上述血清蛋白标志物的试剂盒和检测方法。本发明基于癌症驱动基因在肿瘤发生和发展中所起的作用,定制138个癌症驱动基因编码的人类蛋白质芯片,共包含180个人源重组蛋白质,先通过蛋白质芯片初步筛选出乳腺癌的早期检测血清标志物,再经过ELISA间接法实验进行验证,最终筛选出可用于乳腺癌早期筛查和诊断的一组乳腺癌的血清蛋白标志物,其联合诊断乳腺癌ROC曲线下面积达0.886,95%CI为0.847~0.925,保证特异度92.2%时,灵敏度为67.9%,一致率达到80.1%。(The invention discloses a serum protein marker for early screening and diagnosis of breast cancer, which belongs to the technical field of biomedicine, and the serum protein marker is any one or combination of more than two of proteins encoded by CEBPA, RalA, p62, PTCH1, BRCA2, HRAS, FUBP1, GATA3, FGFR3, ALK, HISTIH3B or p53 genes. Also discloses a kit comprising the serum protein marker and a detection method. Based on the functions of cancer driver genes in tumorigenesis and development, the invention customizes 138 human protein chips coded by the cancer driver genes, which contain 180 human recombinant proteins in total, firstly preliminarily screens out serum markers for early detection of breast cancer through the protein chips, then verifies through ELISA indirect method experiments, and finally screens out a group of serum protein markers of breast cancer for early screening and diagnosis of the breast cancer, wherein the area under a ROC curve for combined diagnosis of the breast cancer reaches 0.886, 95% CI is 0.847-0.925, and when the specificity is 92.2%, the sensitivity is 67.9%, and the consistency rate reaches 80.1%.)

一种用于乳腺癌早期筛查和诊断的血清蛋白标志物、试剂盒 及检测方法

技术领域

本发明属于生物医学技术领域。

背景技术

乳腺癌是世界上最常见的恶性肿瘤之一,在大多数亚洲国家中包括中国,位于女性癌症死亡率的首位,其发病率约占全身其它各类恶性肿瘤的11.6%,而中国乳腺癌的发病率增长明显高于西方国家,严重威胁着人们的生命健康。乳腺癌起病隐匿,大多数患者在初次诊断时,便已进入乳腺癌晚期,因而失去了治疗的机会。其中最主要的原因是乳腺癌早期大多是无痛肿物,不易引起重视且早期不具备典型症状体征,或者是肿物较小影像学检查较难察觉。目前,最新的恶性肿瘤早期检测方法有多肿瘤标志物蛋白芯片检测系统(C12芯片)、肿瘤基因突变检测试剂盒、六项肿瘤标志物测定试剂盒、人恶性肿瘤特异性生长因子(TSGF)酶联免疫分析(ELISA)试剂盒。但是,多肿瘤标志物蛋白芯片检测系统(C12芯片)的检测假阳性较高,且没有具有针对性的乳腺癌检测标志物,检测效率低;肿瘤基因突变检测试剂依靠聚合酶链式反应(PCR)这样繁复的操作,且容易产生假阳性;六项肿瘤标志物测定试剂盒和人恶性肿瘤特异性生长因子(TSGF)酶联免疫分析(ELISA)试剂盒,只能测出患者有肿瘤,但不能判断肿瘤的具体类型。

近年来,在人类肿瘤学的研究领域内,许多研究已经发现癌症患者血清中含有一组独特的诱发自身抗体反应的细胞蛋白,被称为肿瘤相关抗原(tumor-associatedantigen,TAA),其诱导产生的抗体称为抗TAA-抗体(autoantibody)。这一概念的提出对乳腺癌早期诊断研究指引了一个新的方向。其中肿瘤相关抗原p62能够激发人体产生免疫反应,产生自身抗体,具有重要意义的是抗p62自身抗体在肝癌患者循环系统出现的时间:使用从慢性肝炎发展到肝硬化再到肝癌的序列血清,发现抗p62自身抗体在患者的慢性肝炎阶段没有出现,在肝硬化的前期、中期也没有出现,而在肝硬化阶段的晚期肝癌发生前的一段时间含量急剧升高,而此时尚未出现肝癌的临床症状和体征,临床上尚不能发现肝癌,并且这一现象在多个肝癌患者的序列血清中得到重复。这就说明,抗p62自身抗体是一个有潜力的能够早期诊断肝癌的血清学标志物。随后对小样本的肝癌、肝硬化、慢性肝炎患者和正常人的血清检测抗p62自身抗体进行检测,结果显示这种自身抗体的特异度很高,但是灵敏度尚不能达到20%。显然,如果单独以抗p62自身抗体作为诊断肝癌的标志物,诊断价值较低。在2003年的一项使用7种抗TAA自身抗体检测肝癌的研究中,单个指标的灵敏度不超过20%,但是通过并联这7种TAA自身抗体,检测的灵敏度可以达到56.9%,而诊断的特异度仍然很高。说明联合多个TAA自身抗体具有较高的诊断价值,是一种有应用潜力的策略。上述研究为乳腺癌早期诊断提供了思路,所以寻找一组具有较高诊断价值的TAA自身抗体组合用于乳腺癌早期筛查和诊断也是有应用潜力的。

寻找有价值的TAA自身抗体,常用的方法有两种:一是重组cDNA表达文库血清学筛选(serological analysis of recombinant cDNA expression libraries,SEREX);另一种是蛋白质组学技术。与SEREX相比,蛋白组学技术能够对多个肿瘤血清进行筛选,并且能够筛选出具有翻译后修饰的TAA。为了发现对肿瘤具有诊断价值的抗-TAAs自身抗体指标,可以使用蛋白芯片技术,也称蛋白微阵列,在一张芯片上同时对多个肿瘤相关抗原或自身抗体进行快速检测,具有自动化、快速及灵敏度高等优点。蛋白芯片技术主要利用了抗原和抗体高度特异性的结合来进行检测,是一项研究蛋白质组学及蛋白相互作用的新的科研技术,这种高通量的分析技术可以对血液中的蛋白质快速进行分析,大大加速了肿瘤生物标志物研究的进程,已经逐渐成为肿瘤标志物筛选及评价的主流技术。在肿瘤的发生发展过程中,涉及到几十万个基因的突变,但仅有某些关键基因突变才可引起肿瘤的发生发展,这些关键基因被称为癌症驱动基因。研究认为不同类型的肿瘤发生时,一般都包含2-8个驱动基因,正是因为这些基因的突变才可导致肿瘤的优势生长,这些基因可以通过调节细胞周期、细胞生存和基因组维持3个细胞核心过程,被分为12个信号通路。目前在多种肿瘤的全基因组测序研究中共发现138个癌症驱动基因(参见Vogelstein B.Science.(2013)339(6127):1546-1558),包括74个抑癌基因和64个癌症基因。这些基于癌症驱动基因编码的蛋白亦可诱发机体在其循环血液中产生相应的自身抗体,通过对癌症驱动基因编码蛋白及其诱发的血清中的自身抗体的研究可在一定程度上揭示肿瘤的发生发展或预后等。

因此本发明通过蛋白质芯片技术初步对138种相关抗原抗体进行检测,筛选出差异表达蛋白,即潜在TAAs,通过测定这些指标在乳腺癌和正常对照血清中的表达水平设计并优化出可用于乳腺癌诊断的肿瘤相关抗原组合。

发明内容

本发明目的在于提供一种用于乳腺癌早期筛查和诊断的血清蛋白标志物,同时提供包含上述血清蛋白标志物的试剂盒及检测方法是本发明的另一发明目的。

基于上述目的,本发明采取以下技术方案:

一种用于乳腺癌早期筛查和诊断的血清蛋白标志物,血清蛋白标志物为CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B或p53基因编码的蛋白中的任意一种或两种以上的联合。

所述血清蛋白标志物为p62、PTCH1、BRCA2、HRAS、FUBP1或GATA3基因编码的蛋白中的任意一种或两种以上的联合。

所述血清蛋白标志物为p62、PTCH1、BRCA2、HRAS、FUBP1和GATA3基因编码的蛋白的联合。

所述p62基因编码的蛋白具有如SEQ ID NO.3所示的氨基酸序列;所述PTCH1基因编码的蛋白具有如SEQ ID NO.4所示的氨基酸序列;所述BRCA2基因编码的蛋白具有如SEQID NO.5所示的氨基酸序列;所述HRAS基因编码的蛋白具有如SEQ ID NO.6所示的氨基酸序列;所述FUBP1基因编码的蛋白具有如SEQ ID NO.7所示的氨基酸序列;所述GATA3基因编码的蛋白具有如SEQ ID NO.8所示的氨基酸序列。

一种试剂盒,包括用于乳腺癌早期筛查和诊断的血清蛋白标志物。

所述血清蛋白标志物被包被于固相载体上。

所述固相载体的材质为聚氯乙烯、聚苯乙烯、聚丙酰胺或纤维素。

所述试剂盒还包括阳性对照血清、阴性对照血清、封闭液、样本稀释液、第二抗体、第二抗体稀释液、洗涤液、显色液或终止液中的任意一种或两种以上的组合。

使用用于乳腺癌早期筛查和诊断的血清蛋白标志物的检测方法,包括以下步骤:

1)对每种血清蛋白标志物分别进行包被、封闭后,清洗;

2)再与稀释后的待测血清进行一抗孵育,清洗,再进行二抗孵育,清洗;

3)显色系统显色后终止反应,测定吸光度值;

4)以OD450-OD620为相对OD值,然后扣去空白对照,将吸光度值代入以下公式,计算预测概率P值,

P=1/(1+Exp(-(-9.295+16.882×ODp62+6.528×ODPTCH1+8.975×ODBRCA2-29.232×ODHRAS+25.514×ODFUBP1+13.090×ODGATA3)));

式中ODp62、ODPTCH1、ODBRCA2、ODHRAS、ODFUBP1、ODGATA3分别为每种血清蛋白标志物的相对OD值减去空白对照后的吸光度值;

当P值≥0.5时,初步判定为乳腺癌样品;

当P值<0.5时,初步判定为正常样品。

还包括步骤5)计算出每种血清蛋白标志物的阳性率、灵敏度特异度、约登指数、阳性预测值、阴性预测值、阳性似然比、阴性似然比;

步骤6)并联联合检测:利用logistics回归模型构建上述血清蛋白标志物的并联联合检测模型,计算联合诊断结果。

与现有技术相比,本发明具有以下有益效果:

1)本发明基于癌症驱动基因在肿瘤发生和发展中所起的作用,定制138个癌症驱动基因编码的人类蛋白质芯片,共包含180个人源重组蛋白质,用以筛选潜在的可用于诊断或其他表征癌症的标志物,先通过蛋白质芯片初步筛选出乳腺癌的早期检测血清标志物,再经过ELISA间接法实验进行验证,最终筛选出可用于乳腺癌早期筛查和诊断的一组乳腺癌的血清蛋白标志物,尤其是p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3基因编码的蛋白的联合,其联合诊断乳腺癌ROC曲线下面积达0.886,95%CI为0.847~0.925,保证特异度92.2%时,灵敏度为67.9%,一致率达到80.1%,可辅助乳腺癌的临床诊断,具有较好的参考价值;

2)本发明的检测方法具有灵敏度高、特异性强、成本低等特点,且操作简单、快捷,可为乳腺癌的早期诊断提供依据。

附图说明

图1为实验例中基于focused array人蛋白质芯片检测原理图;

图2为实验例中蛋白质芯片筛选出的12个TAA单独诊断乳腺癌ROC曲线分析图;

图3为实验例中蛋白质芯片筛选出的12个TAA的SNR值散点图;

图4为实验例中间接ELISA检测原理图;

图5为实验例中ELISA验证12个TAA单独诊断乳腺癌ROC曲线分析图;

图6为实验例中ELISA验证12个TAA的OD值散点分布图;

图7为实验例中ELISA验证6个TAAs联合诊断乳腺癌在训练集数据中的ROC曲线图;

图8为实验例中ELISA验证6个TAAs联合诊断乳腺癌在验证集数据中的ROC曲线图。

具体实施方式

实验例

1血清样本的准备

1.1用于进行蛋白芯片实验的血清样本

收集在北京佑安医院和郑州大学第一附属医院原发性乳腺癌病人(乳腺癌经病理诊断),病人同意以及机构审查委员会和医院伦理委员会批准。所有标本均用红头采血管采集研究对象全血5~10mL,在室温放置2小时后,1000g离心15分钟,取上清液,每个样本分装若干份贴好标签于-80℃低温冰箱保存,避免反复冻融。

根据流行病学分析,最终收集50例原发性乳腺癌血清以及同时期体检的27例佑安医院正常对照血清进行初步芯片筛选。50例原发性乳腺癌患者均为女性,平均年龄为48.16±10.99岁,年龄范围为29-71岁;27例正常血清均为女性,平均年龄为40.20±10.48岁,年龄范围为21-58岁。所有乳腺癌患者血清都是在患者最初诊断为乳腺癌尚未接受任何放化疗及手术治疗时收集的。正常人血清来自参加年度健康体检,无任何恶性肿瘤症状的体检人群。

1.2用于进行ELISA实验验证的血清样本

(1)收集自北京佑安医院和郑州大学第一附属医院的血清样本(详见上述1.1部分)。

(2)来自郑州大学第一附属医院乳外科(184例原发性乳腺癌)和郑州市金水区心血管调查项目(184例正常人),184例原发性乳腺癌患者均为女性,平均年龄为50.10±10.33岁,年龄范围为29-81岁;184例正常血清均来自女性,平均年龄为49.47±10.98岁,年龄范围为29-81岁。所有乳腺癌患者血清都是在患者最初诊断为乳腺癌尚未接受任何放化疗及手术治疗时收集的。

2用于筛选乳腺癌诊断标志物的蛋白芯片定制

将138个癌症驱动基因(参见Vogelstein B.Science.(2013)339(6127):1546-1558)编码的蛋白(共180个人源重组蛋白质)固定于蛋白芯片上,用于肿瘤标志物的筛选。用于筛选肿瘤标志物的蛋白芯片为在广州博翀生物科技有限公司定制的HuProtTM人类蛋白质芯片。

3蛋白芯片实验

实验原理参见图1。

3.1实验所需试剂:

1)封闭液:3mL 10%BSA,加入7mL 1×PBS溶液,混匀,置于冰上。

2)血清孵育液:1mL 10%BSA,加入9mL 1×PBST溶液溶液,混匀,置于冰上。

3)清洗液:1×PBST溶液,存放于4℃冰箱。

4)二抗孵育液:包括荧光标记抗人IgM二抗(cy5标记,呈现红色)和荧光标记抗人IgG二抗(cy3标记,呈现绿色)。

3.2蛋白芯片具体实验步骤

(a)复温:将芯片从-80℃冰箱取出,于4℃冰箱复温半小时,然后于室温复温15min。

(b)封闭:复温后的芯片,14blocks围栏固定,向每个block中加入封闭液,并放置在侧摆摇床上,室温封闭3小时。

(c)血清样本孵育:封闭完成后,倒尽封闭液体,然后迅速加入预先准备好的血清孵育液,每张芯片孵育14个样本(血清样本先放在4℃层析柜冻融,含1%BSA的1×PBST溶液溶液以1:50比例稀释),每个血清样本的上样体积为200μL,侧摆摇床20rpm,4℃过夜孵育。

(d)清洗:将芯片及芯片夹一同取出,吸去样本,然后迅速加入等体积的1×PBST溶液,如此循环数次,保证在拆除芯片夹时血清样本间无交叉污染。拆除芯片夹后,将芯片置于加有清洗液的芯片清洗盒,水平摇床,室温80rpm,清洗3次,每次10min。

(e)二抗孵育:将芯片转移到加入了3mL二抗孵育液的孵育盒中,侧摆摇床40rpm,避光,室温60min。

(f)清洗:将芯片取出(注意不能触及或划破芯片的上表面),置于加入有清洗液的芯片清洗盒,至于水平摇床上,80rpm清洗3次,每次10min。完成后用ddH2O清洗2次,每次10min。

(g)干燥:将芯片置于芯片干燥机离心干燥。

(h)扫描:按照扫描仪的操作规范和使用说明操作。

(i)数据提取:将芯片图像和结果每个阵列整体对齐,按下自动对齐按钮,提取数据并保存。

(j)进行数据预处理。

(k)进行数据分析,获得最终的乳腺癌血清标志物,该蛋白质芯片实验筛选出以下血清蛋白标志物:癌症驱动基因CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B和p53编码的蛋白(图2为上述蛋白芯片筛选出的12个TAA单独诊断乳腺癌的ROC曲线分析图,图2中1-12依次为CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B和p53编码的蛋白单独诊断乳腺癌的ROC曲线;图3为上述12个TAA的SNR值散点图,图3中N表示Normal,即健康正常血清,B表示即乳腺癌病例(即breastcancer)。其中,CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B和p53基因编码的蛋白依次具有如SEQ ID NO.1~12所示的氨基酸序列。

4ELISA间接法实验验证

实验原理参见图4。

具体实验步骤如下:

a)包被:按照表1中浓度进行包被100μL/孔,4℃过夜。

b)封闭:含2%BSA(索莱宝,北京,分析纯)的1×PBST溶液(PBS,Tween20索莱宝,北京)溶液,200μL/孔,4℃过夜。

c)清洗:350μL/孔1×PBST溶液清洗3次。

d)一抗孵育:血清与含1%BSA的1×PBST溶液1:100稀释后,100μL/孔,37℃半水浴1h。

e)清洗:350μL/孔1×PBST溶液清洗5次。

f)二抗孵育:HRP标记的鼠抗人IgG(奥科,武汉)与含1%BSA的1×PBST溶液1:10000稀释后,100μL/孔,37℃半水浴1h。

g)清洗:350μL/孔1×PBST溶液清洗5次。

h)显色:TMB显色系统,A液(200mgTMB·2HCl溶于1L去离子水,索莱宝,北京,分析纯)与B液(9.2g柠檬酸,37gNa2HPO4·12H2O和8ml0.75%H2O2溶于1L去离子水)1:1混合后100μL/孔,室温避光,达到预期颜色(约需5-15min)。

i)终止:10%的浓硫酸50μL/孔后10min内测吸光度。

j)测吸光度:以OD450-OD620为相对OD值,然后扣去空白对照,调整IgG做归一化处理,然后进行后续数据处理(数据处理方法详见下述“5数据处理”部分b)-d)所示)。

其中,上述经蛋白芯片实验筛选出的12个TAAs进行ELISA实验验证时各自的包被浓度如下表1所示,ELISA实验的96孔板排布表如下表2所示。表2中阳性质控为ELISA实验OD值较高的并经Western Blot实验验证为相应抗体阳性的血清,阴性质控为正常对照人群中ELISA实验OD值处于均值附近的且经Western Blot验证为阴性的血清,空白为血清稀释液,IgG1~IgG8为梯度稀释的人IgG抗体,浓度依次为10、20、50、100、150、200、250、300ng/ml。

表1 12个TAA各自的包被浓度

Figure BDA0002245099260000071

表2ELISA实验的96孔板排布

实验结果:采用ELISA方法对12个TAA进行检测,结果见图5和图6。图5为ELISA验证实验中12个TAA单独诊断乳腺癌的ROC曲线分析图,图中1-12依次为CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B和p53编码的蛋白单独诊断乳腺癌的ROC曲线;图6为ELISA验证实验中12个TAA的OD值散点分布图,图中N表示Normal,即健康正常血清,B表示breast cancer,即乳腺癌病例。

从图5可以看出,单个指标诊断乳腺癌ROC曲线下面积为0.634~0.737,保证特异度最低90%时,灵敏度范围为25.9%~46.2%。其中BRCA2的曲线下面积最大,为0.737,灵敏度达到46.2%,特异度为90.2%;RalA的ROC曲线下面积次之,为0.736,灵敏度达25.9%,特异度为91.7%;ALK的ROC曲线下面积最小,为0.643,灵敏度达28.2%,特异度为90.2%。从图6可以看出,12个指标OD值分布于0~0.8之间,中位OD值基本上均分布于0.2~0.4之间,健康对照与乳腺癌病例之间差异均有统计学意义。

5数据处理

通过使用focused array人蛋白质芯片在乳腺癌组和NC正常对照组,通过统计学数据分析筛选出差异表达蛋白,具体方法如下:

(1)通过Focused Array蛋白质芯片实验获得芯片初筛结果。

(2)稳定性分析:在实验过程中,根据不同时间、不同芯片、不同位置,将测试样本test进行重复,用以评价不同芯片在不同时间的稳定性。

(3)数据分析及结果:剔除高背景、极端样本干扰后的样本,将IgG和IgM响应类型的各180个蛋白进行一致的统计学分析,分析逻辑如下:

a)为消除同一张芯片内不同蛋白点之间由于背景值不一致导致的信号不均一的情况,故通过背景归一化方法进行处理,实现方式为每个蛋白的前景值与背景值比值,即F/B,并此基础上定义SNR(信噪比),即两个重复蛋白的F/B的均值,进行后续统计学分析。

b)假设需要比对的样本分别来自完全相同的两个总体,并通过F检验确定所需比对两组方差是否齐性,然后把F检验结果选择对应t检验,并且t检验结果以P-value进行表征。定义,当p-value<0.05时,拒绝原假设,即两者存在显著性差异。

c)对于任一蛋白,计算癌症组与正常组的组间的差异倍数,即fold change,用以表示两组间差异。

d)对于任一蛋白,根据所比对两组的诊断意义,首先,定义cutoff=1.5为阳性判断阈值,即样本在蛋白上的SNR≥1.5时,该蛋白为阳性蛋白;然后,以对照组为基础,设置合适的cutoff阈值,在此cutoff阈值下计算癌症组与对照组阳性率之差,并且以最大的差值作为该蛋白在所比较的癌症组中的阳性率,用以寻找癌症组针对对照组特异的高响应蛋白,最后,定义阳性率不得低于15%。

e)基于以上逻辑,进行乳腺癌组(收集自北京佑安医院和郑州大学第一附属医院的50例原发性乳腺癌患者血清)和佑安对照组(27例佑安医院正常血清)比对,筛选出乳腺癌组明显高于对照组的差异蛋白作为乳腺癌候选标志物,最终经芯片选定了12种血清蛋白标志物(CEBPA、RalA、p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3、FGFR3、ALK、HISTIH3B和p53)来评价乳腺癌的诊断价值。其中,CEBPA基因编码的蛋白具有如SEQ ID NO.1所示的氨基酸序列,RalA基因编码的蛋白具有如SEQ ID NO.2所示的氨基酸序列,p62基因编码的蛋白具有如SEQ ID NO.3所示的氨基酸序列,PTCH1基因编码的蛋白具有如SEQ ID NO.4所示的氨基酸序列,BRCA2基因编码的蛋白具有如SEQ ID NO.5所示的氨基酸序列,HRAS基因编码的蛋白具有如SEQ ID NO.6所示的氨基酸序列,FUBP1基因编码的蛋白具有如SEQ ID NO.7所示的氨基酸序列,GATA3基因编码的蛋白具有如SEQ ID NO.8所示的氨基酸序列,FGFR3基因编码的蛋白具有如SEQ ID NO.9所示的氨基酸序列,ALK基因编码的蛋白具有如SEQ ID NO.10所示的氨基酸序列,HISTIH3B基因编码的蛋白具有如SEQ ID NO.11所示的氨基酸序列,p53基因编码的蛋白具有如SEQ ID NO.12所示的氨基酸序列。上述12种基因的信息来源见下表3。

表3 12种基因的信息来源

基因名称 Uniprot数据库登录号 NCBI参考序列登录号
CEBPA P49715 NM_004364
RalA P11233 NM_005402
P62 Q9Y6M1-6 NM_006548
PTCH1 Q13635 NM_000264
BRCA2 P51587 NM_000059
HRAS P01112 NM_005343
FUBP1 Q96AE4-2 NM_003902
GATA3 P23771 NM_002051
FGFR3 P22607 NM_000142
ALK Q9UM73 NM_004304
HISTIH3B P68431 NM_003529
TP53 P04637 NM_000546

(4)对经蛋白质芯片筛选出的12种血清蛋白标志物进行ELISA间接法实验验证:包括对送检芯片样本验证以及送检芯片之外重新收集的样本进行验证,既实现了蛋白芯片的验证又保证了推广性。

(5)实验结果:经蛋白质芯片筛选出的12种血清蛋白标志物进行ELISA实验验证,对所有验证人群利用随机抽样的方法,抽取总人群的70%作为训练集,利用二元logistics回归构建疾病预测模型,分别用逐步向前(Forward:conditional)、逐步向后(Backward:conditional)以及直接输入法(Enter)三种方法筛选指标,分别有6种、8种、8种进入模型,其所对应的ROC曲线下面积(AUC)、灵敏度(Se)、特异度(Sp)如下表4所示。

表4不同筛选方法筛选出的模型指标

Figure BDA0002245099260000101

对以上所构建的模型的诊断价值以及经济效益分析,含有6个指标(p62、PTCH1、BRCA2、HRAS、FUBP1、GATA3)的模型效果最佳,在剩余的30%人群(验证集)中进行验证,如图7、8所示,其联合诊断乳腺癌ROC曲线下面积达0.886,95%CI为0.847~0.925,保证特异度92.2%时,灵敏度为67.9%,一致率达到80.1%。

实施例

一种用于乳腺癌早期筛查和诊断的血清蛋白标志物,血清蛋白标志物为p62、PTCH1、BRCA2、HRAS、FUBP1和GATA3基因编码的蛋白的联合。所述p62基因编码的蛋白具有如SEQ ID NO.3所示的氨基酸序列;所述PTCH1基因编码的蛋白具有如SEQ ID NO.4所示的氨基酸序列;所述BRCA2基因编码的蛋白具有如SEQ ID NO.5所示的氨基酸序列;所述HRAS基因编码的蛋白具有如SEQ ID NO.6所示的氨基酸序列;所述FUBP1基因编码的蛋白具有如SEQ ID NO.7所示的氨基酸序列;所述GATA3基因编码的蛋白具有如SEQ ID NO.8所示的氨基酸序列。

一种试剂盒,包括用于乳腺癌早期筛查和诊断的血清蛋白标志物,所述血清蛋白标志物被包被于固相载体上,所述固相载体为由聚氯乙烯制成的凹孔平板。所述试剂盒还包括阳性对照血清、阴性对照血清、封闭液、样本稀释液、第二抗体、第二抗体稀释液、洗涤液、显色液和终止液。

阳性对照血清为ELISA实验OD值较高的并经Western Blot实验验证为相应抗体阳性的血清,阴性对照血清为正常对照人群中ELISA实验OD值处于均值附近的且经WesternBlot验证为阴性的血清,封闭液为含2%BSA的1×PBST溶液,血清稀释液和第二抗体稀释液均为含1%BSA的1×PBST溶液,第二抗体为HRP标记的鼠抗人IgG,洗涤液为1×PBST溶液,显色液为A液(200mgTMB·2HCl溶于1L去离子水,索莱宝,北京,分析纯)与B液(9.2g柠檬酸,37gNa2HPO4·12H2O和8ml0.75%H2O2溶于1L去离子水)1:1体积比例混合的溶液,终止液为10%的浓硫酸。

使用用于乳腺癌早期筛查和诊断的血清蛋白标志物的检测方法,包括以下步骤:

1)对每种血清蛋白标志物分别进行包被(包被浓度见上表1),100μL/孔,4℃过夜,封闭(采用封闭液200μL/孔,4℃过夜)后,350μL/孔洗涤液清洗3次;

2)再与稀释后的待测血清(待测血清与血清稀释液以1:100体积比例稀释)进行一抗孵育(100μL/孔,37℃半水浴1h),350μL/孔洗涤液清洗5次,再进行二抗孵育(第二抗体与第二抗体稀释液以1:10000体积比例稀释后,100μL/孔,37℃半水浴1h),350μL/孔洗涤液清洗5次;

3)显色系统显色:TMB显色系统,显色液100μL/孔,室温避光,达到预期颜色;终止反应:终止液50μL/孔,终止后,10min内测定吸光度值;

4)以OD450-OD620为相对OD值,然后扣去空白对照,将各个指标(即血清蛋白标志物)的吸光度值代入以下公式,计算预测概率P值,

P=1/(1+Exp(-(-9.295+16.882×ODp62+6.528×ODPTCH1+8.975×ODBRCA2-29.232×ODHRAS+25.514×ODFUBP1+13.090×ODGATA3)));

式中ODp62、ODPTCH1、ODBRCA2、ODHRAS、ODFUBP1、ODGATA3分别为每种血清蛋白标志物的相对OD值减去空白对照后的吸光度值;

当P值≥0.5时,初步判定为乳腺癌样品;

当P值<0.5时,初步判定为正常样品;

步骤5)计算出每种血清蛋白标志物的阳性率、灵敏度特异度、约登指数、阳性预测值、阴性预测值、阳性似然比、阴性似然比;

步骤6)并联联合检测:利用logistics回归模型构建上述血清蛋白标志物的并联联合检测模型,计算联合诊断结果。

结果显示,待测血清的P值大于0.5,初步判定为疑似乳腺癌样品。

由于本实施例的方法测定的结果只能作为中间结果的信息,不能直接判定患者是否患有乳腺癌,因此后续还需要结合临床症状、影像学及组织病理学等信息,最终判定患者的患病情况。

<110> 郑州大学

<120> 一种用于乳腺癌早期筛查和诊断的血清蛋白标志物、试剂盒及检测方法

<160> 12

<170> SIPOSequenceListing 1 .0

<211> 358

<212> PRT

<213> 人

<221> CEBPA基因编码的蛋白

<400> 1

MESADFYEAE PRPPMSSHLQ SPPHAPSSAA FGFPRGAGPA QPPAPPAAPE PLGGICEHET 60

SIDISAYIDP AAFNDEFLAD LFQHSRQQEK AKAAVGPTGG GGGGDFDYPG APAGPGGAVM 120

PGGAHGPPPG YGCAAAGYLD GRLEPLYERV GAPALRPLVI KQEPREEDEA KQLALAGLFP 180

YQPPPPPPPS HPHPHPPPAH LAAPHLQFQI AHCGQTTMHL QPGHPTPPPT PVPSPHPAPA 240

LGAAGLPGPG SALKGLGAAH PDLRASGGSG AGKAKKSVDK NSNEYRVRRE RNNIAVRKSR 300

DKAKQRNVET QQKVLELTSD NDRLRKRVEQ LSRELDTLRG IFRQLPESSL VKAMGNCA 358

<211> 206

<212> PRT

<213> 人

<221> RalA基因编码的蛋白

<400> 2

MAANKPKGQN SLALHKVIMV GSGGVGKSAL TLQFMYDEFV EDYEPTKADS YRKKVVLDGE 60

EVQIDILDTA GQEDYAAIRD NYFRSGEGFL CVFSITEMES FAATADFREQ ILRVKEDENV 120

PFLLVGNKSD LEDKRQVSVE EAKNRAEQWN VNYVETSAKT RANVDKVFFD LMREIRARKM 180

EDSKEKNGKK KRKSLAKRIR ERCCIL 206

<211> 598

<212> PRT

<213> 人

<221> p62基因编码的蛋白

<400> 3

MNKLYIGNLS PAVTADDLRQ LFGDRKLPLA GQVLLKSGYA FVDYPDQNWA IRAIETLSGK 60

VELHGKIMEV DYSVSKKLRS RKIQIRNIPP HLQWEVLDGL LAQYGTVENV EQVNTDTETA 120

VVNVTYATRE EAKIAMEKLS GHQFENYSFK ISYIPDEEVS SPSPPQRAQR GDHSSREQGH 180

APGGTSQARQ IDFPLRILVP TQFVGAIIGK EGLTIKNITK QTQSRVDIHR KENSGAAEKP 240

VTIHATPEGT SEACRMILEI MQKEADETKL AEEIPLKILA HNGLVGRLIG KEGRNLKKIE 300

HETGTKITIS SLQDLSIYNP ERTITVKGTV EACASAEIEI MKKLREAFEN DMLAVNQQAN 360

LIPGLNLSAL GIFSTGLSVL SPPAGPRGAP PAAPYHPFTT HSGYFSSLYP HHQFGPFPHH 420

HSYPEQEIVN LFIPTQAVGA IIGKKGAHIK QLARFAGASI KIAPAEGPDV SERMVIITGP 480

PEAQFKAQGR IFGKLKEENF FNPKEEVKLE AHIRVPSSTA GRVIGKGGKT VNELQNLTSA 540

EVIVPRDQTP DENEEVIVRI IGHFFASQTA QRKIREIVQQ VKQQEQKYPQ GVASQRSK 598

<211> 1447

<212> PRT

<213> 人

<221> PTCH1基因编码的蛋白

<400> 4

MASAGNAAEP QDRGGGGSGC IGAPGRPAGG GRRRRTGGLR RAAAPDRDYL HRPSYCDAAF 60

ALEQISKGKA TGRKAPLWLR AKFQRLLFKL GCYIQKNCGK FLVVGLLIFG AFAVGLKAAN 120

LETNVEELWV EVGGRVSREL NYTRQKIGEE AMFNPQLMIQ TPKEEGANVL TTEALLQHLD 180

SALQASRVHV YMYNRQWKLE HLCYKSGELI TETGYMDQII EYLYPCLIIT PLDCFWEGAK 240

LQSGTAYLLG KPPLRWTNFD PLEFLEELKK INYQVDSWEE MLNKAEVGHG YMDRPCLNPA 300

DPDCPATAPN KNSTKPLDMA LVLNGGCHGL SRKYMHWQEE LIVGGTVKNS TGKLVSAHAL 360

QTMFQLMTPK QMYEHFKGYE YVSHINWNED KAAAILEAWQ RTYVEVVHQS VAQNSTQKVL 420

SFTTTTLDDI LKSFSDVSVI RVASGYLLML AYACLTMLRW DCSKSQGAVG LAGVLLVALS 480

VAAGLGLCSL IGISFNAATT QVLPFLALGV GVDDVFLLAH AFSETGQNKR IPFEDRTGEC 540

LKRTGASVAL TSISNVTAFF MAALIPIPAL RAFSLQAAVV VVFNFAMVLL IFPAILSMDL 600

YRREDRRLDI FCCFTSPCVS RVIQVEPQAY TDTHDNTRYS PPPPYSSHSF AHETQITMQS 660

TVQLRTEYDP HTHVYYTTAE PRSEISVQPV TVTQDTLSCQ SPESTSSTRD LLSQFSDSSL 720

HCLEPPCTKW TLSSFAEKHY APFLLKPKAK VVVIFLFLGL LGVSLYGTTR VRDGLDLTDI 780

VPRETREYDF IAAQFKYFSF YNMYIVTQKA DYPNIQHLLY DLHRSFSNVK YVMLEENKQL 840

PKMWLHYFRD WLQGLQDAFD SDWETGKIMP NNYKNGSDDG VLAYKLLVQT GSRDKPIDIS 900

QLTKQRLVDA DGIINPSAFY IYLTAWVSND PVAYAASQAN IRPHRPEWVH DKADYMPETR 960

LRIPAAEPIE YAQFPFYLNG LRDTSDFVEA IEKVRTICSN YTSLGLSSYP NGYPFLFWEQ 1020

YIGLRHWLLL FISVVLACTF LVCAVFLLNP WTAGIIVMVL ALMTVELFGM MGLIGIKLSA 1080

VPVVILIASV GIGVEFTVHV ALAFLTAIGD KNRRAVLALE HMFAPVLDGA VSTLLGVLML 1140

AGSEFDFIVR YFFAVLAILT ILGVLNGLVL LPVLLSFFGP YPEVSPANGL NRLPTPSPEP 1200

PPSVVRFAMP PGHTHSGSDS SDSEYSSQTT VSGLSEELRH YEAQQGAGGP AHQVIVEATE 1260

NPVFAHSTVV HPESRHHPPS NPRQQPHLDS GSLPPGRQGQ QPRRDPPREG LWPPPYRPRR 1320

DAFEISTEGH SGPSNRARWG PRGARSHNPR NPASTAMGSS VPGYCQPITT VTASASVTVA 1380

VHPPPVPGPG RNPRGGLCPG YPETDHGLFE DPHVPFHVRC ERRDSKVEVI ELQDVECEER 1440

PRGSSSN 1447

<211> 3418

<212> PRT

<213> 人

<221> BRCA2基因编码的蛋白

<400> 5

MPIGSKERPT FFEIFKTRCN KADLGPISLN WFEELSSEAP PYNSEPAEES EHKNNNYEPN 60

LFKTPQRKPS YNQLASTPII FKEQGLTLPL YQSPVKELDK FKLDLGRNVP NSRHKSLRTV 120

KTKMDQADDV SCPLLNSCLS ESPVVLQCTH VTPQRDKSVV CGSLFHTPKF VKGRQTPKHI 180

SESLGAEVDP DMSWSSSLAT PPTLSSTVLI VRNEEASETV FPHDTTANVK SYFSNHDESL 240

KKNDRFIASV TDSENTNQRE AASHGFGKTS GNSFKVNSCK DHIGKSMPNV LEDEVYETVV 300

DTSEEDSFSL CFSKCRTKNL QKVRTSKTRK KIFHEANADE CEKSKNQVKE KYSFVSEVEP 360

NDTDPLDSNV ANQKPFESGS DKISKEVVPS LACEWSQLTL SGLNGAQMEK IPLLHISSCD 420

QNISEKDLLD TENKRKKDFL TSENSLPRIS SLPKSEKPLN EETVVNKRDE EQHLESHTDC 480

ILAVKQAISG TSPVASSFQG IKKSIFRIRE SPKETFNASF SGHMTDPNFK KETEASESGL 540

EIHTVCSQKE DSLCPNLIDN GSWPATTTQN SVALKNAGLI STLKKKTNKF IYAIHDETSY 600

KGKKIPKDQK SELINCSAQF EANAFEAPLT FANADSGLLH SSVKRSCSQN DSEEPTLSLT 660

SSFGTILRKC SRNETCSNNT VISQDLDYKE AKCNKEKLQL FITPEADSLS CLQEGQCEND 720

PKSKKVSDIK EEVLAAACHP VQHSKVEYSD TDFQSQKSLL YDHENASTLI LTPTSKDVLS 780

NLVMISRGKE SYKMSDKLKG NNYESDVELT KNIPMEKNQD VCALNENYKN VELLPPEKYM 840

RVASPSRKVQ FNQNTNLRVI QKNQEETTSI SKITVNPDSE ELFSDNENNF VFQVANERNN 900

LALGNTKELH ETDLTCVNEP IFKNSTMVLY GDTGDKQATQ VSIKKDLVYV LAEENKNSVK 960

QHIKMTLGQD LKSDISLNID KIPEKNNDYM NKWAGLLGPI SNHSFGGSFR TASNKEIKLS 1020

EHNIKKSKMF FKDIEEQYPT SLACVEIVNT LALDNQKKLS KPQSINTVSA HLQSSVVVSD 1080

CKNSHITPQM LFSKQDFNSN HNLTPSQKAE ITELSTILEE SGSQFEFTQF RKPSYILQKS 1140

TFEVPENQMT ILKTTSEECR DADLHVIMNA PSIGQVDSSK QFEGTVEIKR KFAGLLKNDC 1200

NKSASGYLTD ENEVGFRGFY SAHGTKLNVS TEALQKAVKL FSDIENISEE TSAEVHPISL 1260

SSSKCHDSVV SMFKIENHND KTVSEKNNKC QLILQNNIEM TTGTFVEEIT ENYKRNTENE 1320

DNKYTAASRN SHNLEFDGSD SSKNDTVCIH KDETDLLFTD QHNICLKLSG QFMKEGNTQI 1380

KEDLSDLTFL EVAKAQEACH GNTSNKEQLT ATKTEQNIKD FETSDTFFQT ASGKNISVAK 1440

ESFNKIVNFF DQKPEELHNF SLNSELHSDI RKNKMDILSY EETDIVKHKI LKESVPVGTG 1500

NQLVTFQGQP ERDEKIKEPT LLGFHTASGK KVKIAKESLD KVKNLFDEKE QGTSEITSFS 1560

HQWAKTLKYR EACKDLELAC ETIEITAAPK CKEMQNSLNN DKNLVSIETV VPPKLLSDNL 1620

CRQTENLKTS KSIFLKVKVH ENVEKETAKS PATCYTNQSP YSVIENSALA FYTSCSRKTS 1680

VSQTSLLEAK KWLREGIFDG QPERINTADY VGNYLYENNS NSTIAENDKN HLSEKQDTYL 1740

SNSSMSNSYS YHSDEVYNDS GYLSKNKLDS GIEPVLKNVE DQKNTSFSKV ISNVKDANAY 1800

PQTVNEDICV EELVTSSSPC KNKNAAIKLS ISNSNNFEVG PPAFRIASGK IVCVSHETIK 1860

KVKDIFTDSF SKVIKENNEN KSKICQTKIM AGCYEALDDS EDILHNSLDN DECSTHSHKV 1920

FADIQSEEIL QHNQNMSGLE KVSKISPCDV SLETSDICKC SIGKLHKSVS SANTCGIFST 1980

ASGKSVQVSD ASLQNARQVF SEIEDSTKQV FSKVLFKSNE HSDQLTREEN TAIRTPEHLI 2040

SQKGFSYNVV NSSAFSGFST ASGKQVSILE SSLHKVKGVL EEFDLIRTEH SLHYSPTSRQ 2100

NVSKILPRVD KRNPEHCVNS EMEKTCSKEF KLSNNLNVEG GSSENNHSIK VSPYLSQFQQ 2160

DKQQLVLGTK VSLVENIHVL GKEQASPKNV KMEIGKTETF SDVPVKTNIE VCSTYSKDSE 2220

NYFETEAVEI AKAFMEDDEL TDSKLPSHAT HSLFTCPENE EMVLSNSRIG KRRGEPLILV 2280

GEPSIKRNLL NEFDRIIENQ EKSLKASKST PDGTIKDRRL FMHHVSLEPI TCVPFRTTKE 2340

RQEIQNPNFT APGQEFLSKS HLYEHLTLEK SSSNLAVSGH PFYQVSATRN EKMRHLITTG 2400

RPTKVFVPPF KTKSHFHRVE QCVRNINLEE NRQKQNIDGH GSDDSKNKIN DNEIHQFNKN 2460

NSNQAAAVTF TKCEEEPLDL ITSLQNARDI QDMRIKKKQR QRVFPQPGSL YLAKTSTLPR 2520

ISLKAAVGGQ VPSACSHKQL YTYGVSKHCI KINSKNAESF QFHTEDYFGK ESLWTGKGIQ 2580

LADGGWLIPS NDGKAGKEEF YRALCDTPGV DPKLISRIWV YNHYRWIIWK LAAMECAFPK 2640

EFANRCLSPE RVLLQLKYRY DTEIDRSRRS AIKKIMERDD TAAKTLVLCV SDIISLSANI 2700

SETSSNKTSS ADTQKVAIIE LTDGWYAVKA QLDPPLLAVL KNGRLTVGQK IILHGAELVG 2760

SPDACTPLEA PESLMLKISA NSTRPARWYT KLGFFPDPRP FPLPLSSLFS DGGNVGCVDV 2820

IIQRAYPIQW MEKTSSGLYI FRNEREEEKE AAKYVEAQQK RLEALFTKIQ EEFEEHEENT 2880

TKPYLPSRAL TRQQVRALQD GAELYEAVKN AADPAYLEGY FSEEQLRALN NHRQMLNDKK 2940

QAQIQLEIRK AMESAEQKEQ GLSRDVTTVW KLRIVSYSKK EKDSVILSIW RPSSDLYSLL 3000

TEGKRYRIYH LATSKSKSKS ERANIQLAAT KKTQYQQLPV SDEILFQIYQ PREPLHFSKF 3060

LDPDFQPSCS EVDLIGFVVS VVKKTGLAPF VYLSDECYNL LAIKFWIDLN EDIIKPHMLI 3120

AASNLQWRPE SKSGLLTLFA GDFSVFSASP KEGHFQETFN KMKNTVENID ILCNEAENKL 3180

MHILHANDPK WSTPTKDCTS GPYTAQIIPG TGNKLLMSSP NCEIYYQSPL SLCMAKRKSV 3240

STPVSAQMTS KSCKGEKEID DQKNCKKRRA LDFLSRLPLP PPVSPICTFV SPAAQKAFQP 3300

PRSCGTKYET PIKKKELNSP QMTPFKKFNE ISLLESNSIA DEELALINTQ ALLSGSTGEK 3360

QFISVSESTR TAPTSSEDYL RLKRRCTTSL IKEQESSQAS TEECEKNKQD TITTKKYI 3418

<211> 189

<212> PRT

<213> 人

<221> HRAS基因编码的蛋白

<400> 6

MTEYKLVVVG AGGVGKSALT IQLIQNHFVD EYDPTIEDSY RKQVVIDGET CLLDILDTAG 60

QEEYSAMRDQ YMRTGEGFLC VFAINNTKSF EDIHQYREQI KRVKDSDDVP MVLVGNKCDL 120

AARTVESRQA QDLARSYGIP YIETSAKTRQ GVEDAFYTLV REIRQHKLRK LNPPDESGPG 180

CMSCKCVLS 189

<211> 653

<212> PRT

<213> 人

<221> FUBP1基因编码的蛋白

<400> 7

MADYSTVPPP SSGSAGGGGG GGGGGGVNDA FKDALQRARQ IAAKIGGDAG TSLNSNDYGY 60

GGQKRPLEDG DQPDAKKVAP QNDSFGTQLP PMHQQQRSVM TEEYKVPDGM VGFIIGRGGE 120

QISRIQQESG CKIQIAPDSG GLPERSCMLT GTPESVQSAK RLLDQIVEKG RPAPGFHHGD 180

GPGNAVQEIM IPASKAGLVI GKGGETIKQL QERAGVKMVM IQDGPQNTGA DKPLRITGDP 240

YKVQQAKEMV LELIRDQGGF REVRNEYGSR IGGNEGIDVP IPRFAVGIVI GRNGEMIKKI 300

QNDAGVRIQF KPDDGTTPER IAQITGPPDR CQHAAEIITD LLRSVQAGNP GGPGPGGRGR 360

GRGQGNWNMG PPGGLQEFNF IVPTGKTGLI IGKGGETIKS ISQQSGARIE LQRNPPPNAD 420

PNMKLFTIRG TPQQIDYARQ LIEEKIGGPV NPLGPPVPHG PHGVPGPHGP PGPPGPGTPM 480

GPYNPAPYNP GPPGPAPHGP PAPYAPQGWG NAYPHWQQQA PPDPAKAGTD PNSAAWAAYY 540

AHYYQQQAQP PPAAPAGAPT TTQTNGQGDQ QNPAPAGQVD YTKAWEEYYK KMGQAVPAPT 600

GAPPGGQPDY SAAWAEYYRQ QAAYYAQTSP QGMPQHPPAP QCRFDPASIE LAL 653

<211>443

<212> PRT

<213> 人

<221> GATA3基因编码的蛋白

<400> 8

MEVTADQPRW VSHHHPAVLN GQHPDTHHPG LSHSYMDAAQ YPLPEEVDVL FNIDGQGNHV 60

PPYYGNSVRA TVQRYPPTHH GSQVCRPPLL HGSLPWLDGG KALGSHHTAS PWNLSPFSKT 120

SIHHGSPGPL SVYPPASSSS LSGGHASPHL FTFPPTPPKD VSPDPSLSTP GSAGSARQDE 180

KECLKYQVPL PDSMKLESSH SRGSMTALGG ASSSTHHPIT TYPPYVPEYS SGLFPPSSLL 240

GGSPTGFGCK SRPKARSSTG RECVNCGATS TPLWRRDGTG HYLCNACGLY HKMNGQNRPL 300

IKPKRRLSAA RRAGTSCANC QTTTTTLWRR NANGDPVCNA CGLYYKLHNI NRPLTMKKEG 360

IQTRNRKMSS KSKKCKKVHD SLEDFPKNSS FNPAALSRHM SSLSHISPFS HSSHMLTTPT 420

PMHPPSSLSF GPHHPSSMVT AMG 443

<211> 391

<212> PRT

<213> 人

<221> FGFR3基因编码的蛋白

<400> 9

MGAPACALAL CVAVAIVAGA SSESLGTEQR VVGRAAEVPG PEPGQQEQLV FGSGDAVELS 60

CPPPGGGPMG PTVWVKDGTG LVPSERVLVG PQRLQVLNAS HEDSGAYSCR QRLTQRVLCH 120

FSVRVTDAPS SGDDEDGEDE AEDTGVDTGA PYWTRPERMD KKLLAVPAAN TVRFRCPAAG 180

NPTPSISWLK NGREFRGEHR IGGIKLRHQQ WSLVMESVVP SDRGNYTCVV ENKFGSIRQT 240

YTLDVLERSP HRPILQAGLP ANQTAVLGSD VEFHCKVYSD AQPHIQWLKH VEVNGSKVGP 300

DGTPYVTVLK TAGANTTDKE LEVLSLHNVT FEDAGEYTCL AGNSIGFSHH SAWLVVLPAE 360

EELVEADEAG SVYAGILSYG VGFFLFILVV AAVTLCRLRS PPKKGLGSPT VHKISRFPLK 420

RQVSLESNAS MSSNTPLVRI ARLSSGEGPT LANVSELELP ADPKWELSRA RLTLGKPLGE 480

GCFGQVVMAE AIGIDKDRAA KPVTVAVKML KDDATDKDLS DLVSEMEMMK MIGKHKNIIN 540

LLGACTQGGP LYVLVEYAAK GNLREFLRAR RPPGLDYSFD TCKPPEEQLT FKDLVSCAYQ 600

VARGMEYLAS QKCIHRDLAA RNVLVTEDNV MKIADFGLAR DVHNLDYYKK TTNGRLPVKW 660

MAPEALFDRV YTHQSDVWSF GVLLWEIFTL GGSPYPGIPV EELFKLLKEG HRMDKPANCT 720

HDLYMIMREC WHAAPSQRPT FKQLVEDLDR VLTVTSTDEY LDLSAPFEQY SPGGQDTPSS 780

SSSGDDSVFA HDLLPPAPPS SGGSRT 806

<211> 1620

<212> PRT

<213> 人

<221> ALK基因编码的蛋白

<400> 10

MGAIGLLWLL PLLLSTAAVG SGMGTGQRAG SPAAGPPLQP REPLSYSRLQ RKSLAVDFVV 60

PSLFRVYARD LLLPPSSSEL KAGRPEARGS LALDCAPLLR LLGPAPGVSW TAGSPAPAEA 120

RTLSRVLKGG SVRKLRRAKQ LVLELGEEAI LEGCVGPPGE AAVGLLQFNL SELFSWWIRQ 180

GEGRLRIRLM PEKKASEVGR EGRLSAAIRA SQPRLLFQIF GTGHSSLESP TNMPSPSPDY 240

FTWNLTWIMK DSFPFLSHRS RYGLECSFDF PCELEYSPPL HDLRNQSWSW RRIPSEEASQ 300

MDLLDGPGAE RSKEMPRGSF LLLNTSADSK HTILSPWMRS SSEHCTLAVS VHRHLQPSGR 360

YIAQLLPHNE AAREILLMPT PGKHGWTVLQ GRIGRPDNPF RVALEYISSG NRSLSAVDFF 420

ALKNCSEGTS PGSKMALQSS FTCWNGTVLQ LGQACDFHQD CAQGEDESQM CRKLPVGFYC 480

NFEDGFCGWT QGTLSPHTPQ WQVRTLKDAR FQDHQDHALL LSTTDVPASE SATVTSATFP 540

APIKSSPCEL RMSWLIRGVL RGNVSLVLVE NKTGKEQGRM VWHVAAYEGL SLWQWMVLPL 600

LDVSDRFWLQ MVAWWGQGSR AIVAFDNISI SLDCYLTISG EDKILQNTAP KSRNLFERNP 660

NKELKPGENS PRQTPIFDPT VHWLFTTCGA SGPHGPTQAQ CNNAYQNSNL SVEVGSEGPL 720

KGIQIWKVPA TDTYSISGYG AAGGKGGKNT MMRSHGVSVL GIFNLEKDDM LYILVGQQGE 780

DACPSTNQLI QKVCIGENNV IEEEIRVNRS VHEWAGGGGG GGGATYVFKM KDGVPVPLII 840

AAGGGGRAYG AKTDTFHPER LENNSSVLGL NGNSGAAGGG GGWNDNTSLL WAGKSLQEGA 900

TGGHSCPQAM KKWGWETRGG FGGGGGGCSS GGGGGGYIGG NAASNNDPEM DGEDGVSFIS 960

PLGILYTPAL KVMEGHGEVN IKHYLNCSHC EVDECHMDPE SHKVICFCDH GTVLAEDGVS 1020

CIVSPTPEPH LPLSLILSVV TSALVAALVL AFSGIMIVYR RKHQELQAMQ MELQSPEYKL 1080

SKLRTSTIMT DYNPNYCFAG KTSSISDLKE VPRKNITLIR GLGHGAFGEV YEGQVSGMPN 1140

DPSPLQVAVK TLPEVCSEQD ELDFLMEALI ISKFNHQNIV RCIGVSLQSL PRFILLELMA 1200

GGDLKSFLRE TRPRPSQPSS LAMLDLLHVA RDIACGCQYL EENHFIHRDI AARNCLLTCP 1260

GPGRVAKIGD FGMARDIYRA SYYRKGGCAM LPVKWMPPEA FMEGIFTSKT DTWSFGVLLW 1320

EIFSLGYMPY PSKSNQEVLE FVTSGGRMDP PKNCPGPVYR IMTQCWQHQP EDRPNFAIIL 1380

ERIEYCTQDP DVINTALPIE YGPLVEEEEK VPVRPKDPEG VPPLLVSQQA KREEERSPAA 1440

PPPLPTTSSG KAAKKPTAAE ISVRVPRGPA VEGGHVNMAF SQSNPPSELH KVHGSRNKPT 1500

SLWNPTYGSW FTEKPTKKNN PIAKKEPHDR GNLGLEGSCT VPPNVATGRL PGASLLLEPS 1560

SLTANMKEVP LFRLRHFPCG NVNYGYQQQG LPLEAATAPG AGHYEDTILK SKNSMNQPGP 1620

<211> 136

<212> PRT

<213> 人

<221>HISTIH3B基因编码的蛋白

<400> 11

MARTKQTARK STGGKAPRKQ LATKAARKSA PATGGVKKPH RYRPGTVALR EIRRYQKSTE 60

LLIRKLPFQR LVREIAQDFK TDLRFQSSAV MALQEACEAY LVGLFEDTNL CAIHAKRVTI 120

MPKDIQLARR IRGERA 136

<211> 393

<212> PRT

<213> 人

<221> p53基因编码的蛋白

<400> 12

MEEPQSDPSV EPPLSQETFS DLWKLLPENN VLSPLPSQAM DDLMLSPDDI EQWFTEDPGP 60

DEAPRMPEAA PPVAPAPAAP TPAAPAPAPS WPLSSSVPSQ KTYQGSYGFR LGFLHSGTAK 120

SVTCTYSPAL NKMFCQLAKT CPVQLWVDST PPPGTRVRAM AIYKQSQHMT EVVRRCPHHE 180

RCSDSDGLAP PQHLIRVEGN LRVEYLDDRN TFRHSVVVPY EPPEVGSDCT TIHYNYMCNS 240

SCMGGMNRRP ILTIITLEDS SGNLLGRNSF EVRVCACPGR DRRTEEENLR KKGEPHHELP 300

PGSTKRALPN NTSSSPQPKK KPLDGEYFTL QIRGRERFEM FRELNEALEL KDAQAGKEPG 360

GSRAHSSHLK SKKGQSTSRH KKLMFKTEGP DSD 393

25页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种用于食管鳞癌早期筛查和诊断的血清蛋白标志物、试剂盒及检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!