一种蛋白质氨基酸序列覆盖度的检测方法

文档序号：1269482 发布日期：2020-08-25 浏览：5次 >En<

阅读说明：本技术 一种蛋白质氨基酸序列覆盖度的检测方法 (Method for detecting coverage of protein amino acid sequence ) 是由张文明杨兵韩继臣于 2019-02-18 设计创作，主要内容包括：本发明提供了一种蛋白质氨基酸序列覆盖度的检测方法。该蛋白质氨基酸序列覆盖度的检测方法包括蛋白还原烷基化、蛋白酶解、多肽脱盐、液质检测和数据分析,其中,蛋白酶解是通过加入弹性蛋白酶进行单酶切获得肽段,弹性蛋白酶与待检测的蛋白质的质量比为1：(20~100)。本发明的蛋白质氨基酸序列覆盖度的检测方法采用弹性蛋白酶实现单酶切,不需要模拟酶切预测来选择对应的酶；不需要多种酶切,只要一种酶；同时采用HLB柱脱盐,不会漏掉亲水性多肽,提高覆盖度；本发明的检测方法的快速简便、工作量少、检测周期短、价格经济,能够达到100%的氨基酸序列覆盖度。(The invention provides a method for detecting the coverage of a protein amino acid sequence. The method for detecting the coverage of the protein amino acid sequence comprises protein reduction alkylation, proteolysis, polypeptide desalination, liquid quality detection and data analysis, wherein the proteolysis is to obtain a peptide segment by adding elastase to carry out single enzyme digestion, and the mass ratio of the elastase to the protein to be detected is 1: (20-100). According to the method for detecting the coverage of the protein amino acid sequence, the single enzyme digestion is realized by adopting the elastase, and the corresponding enzyme is selected without simulating enzyme digestion prediction; multiple enzyme digestion is not needed, and only one enzyme is needed; meanwhile, hydrophilic polypeptide cannot be leaked out by adopting the HLB column for desalination, so that the coverage is improved; the detection method of the invention has the advantages of rapidness, simplicity, convenience, less workload, short detection period and economic price, and can reach 100 percent of amino acid sequence coverage.)

一种蛋白质氨基酸序列覆盖度的检测方法

技术领域

本发明属于蛋白质检测技术领域，涉及一种蛋白质氨基酸序列覆盖度的检测方法。

背景技术

目前，蛋白药物特别是抗体药物是近年来制药领域增长率最快的一类药物。氨基酸序列是蛋白药物的一级结构，是药物研究的基础。

蛋白质的测序方法主要有Edman降解法和质谱法。 Edman降解法最多可以测定N端的50~70个氨基酸，所以长度较短的多肽药物可以通过Edman降解法进行测序，但是对于蛋白质药物来说，氨基酸序列通常长达到100~1500个，Edman降解法一般只用来测定N末端15~30个氨基酸序列，而不适用于做蛋白全序列检测。如果需要进行蛋白序列检测，一般采用基于质谱的方法进行氨基酸序列覆盖度分析，作为蛋白质类药物的质量研究中理化性质的重要组成部分。

Edman降解法采用异硫氰酸苯酯（PITC）与待分析多肽和蛋白的N-端氨基在碱性条件下反应，生成苯氨基硫代甲酰胺（PTC）的衍生物，然后用酸处理，关环，N-端被选择性地切断，得到N-端氨基酸残基的噻唑啉酮苯胺衍生物。接着用有机溶剂将该衍生物萃取出来，酸作用下，形成一个稳定的苯基乙内酰硫脲（PTH）衍生物。通过用HPLC法分析生成的苯乙内酰硫脲（PTH-氨基酸），可以鉴定出是哪一种氨基酸。去掉N-端氨基酸残基的多肽或蛋白，进入下一个循环，继续发生降解。

质谱法一般使用胰蛋白酶Trypsin对蛋白样品进行酶切，脱盐，获得的肽段进入质谱检测得到一级和二级谱图，将谱图与蛋白的理论多肽序列进行比对，得到样品的多肽序列，再将样品检测到的多肽序列与蛋白的理论序列进行比较，一般可以得到理论序列的60~90%的氨基酸序列覆盖度。

为了得到蛋白的全部序列信息，一般需要使用多种蛋白酶（Trypsin、Chymotrypsin、Asp-N、Glu-C、Lys-C等）分别对蛋白进行酶切，使酶切后的多肽长度介于5~50个氨基酸，即具有序列特异性同时产生较好的二级质谱图，最后通过对不同酶切产生的肽段的拼接和分析，实现蛋白质序列的100%的覆盖度。

但是除了Trypsin，其他几种酶如Chymotrypsin、Asp-N、Glu-C、Lys-C都比较昂贵。针对不同的酶需要不同的反应体系，操作繁琐。反应的时间也不一样，2~16个小时不等。有时即便用了多种酶也不一定能达到100%的序列覆盖度。

发明内容

基于现有技术存在的问题，本发明的目的在于提供一种蛋白质氨基酸序列覆盖度的检测方法。该方法采用弹性蛋白酶实现单酶切，不需要模拟酶切预测来选择对应的酶；不需要多种酶切，只要一种酶；同时采用HLB柱脱盐，不会漏掉亲水性多肽，提高覆盖度。

本发明的目的通过以下技术方案得以实现：

本发明提供一种蛋白质氨基酸序列覆盖度的检测方法，该检测方法包括蛋白还原烷基化、蛋白酶解、多肽脱盐、液质检测和数据分析，其中，所述蛋白酶解是通过加入弹性蛋白酶进行单酶切获得肽段，弹性蛋白酶与待检测的蛋白质的质量比为1：（20~100）。

本发明的弹性蛋白酶为市售获得，购买厂商为Promega，型号为V1891。该弹性蛋白酶能够优先在丙氨酸、缬氨酸、丝氨酸、甘氨酸、亮氨酸或异亮氨酸的C末端进行剪切。

上述的检测方法中，优选地，所述多肽脱盐是对蛋白酶解后的肽段进行脱盐处理，具体为：

首先向肽段中加入三氟乙酸，进行上样，缓慢过HLB柱一次，保证样品和柱子充分结合；然后加入三氟乙酸清洗柱子，重复2次；最后用三氟乙酸、水和乙腈的混合液洗脱结合在HLB柱子上的肽段，重复1次，合并洗脱液。

上述的检测方法中，优选地，加入弹性蛋白酶进行单酶切获得肽段的具体步骤为：

还原烷基化后的蛋白质样品离心后加入弹性蛋白酶液，恒温37℃左右、500rpm混匀酶切15min~2h。

上述的检测方法中，优选地，所述弹性蛋白酶液制备方法为：称取1mg的弹性蛋白酶，在0.5mL双蒸水中重悬，BCA定量蛋白浓度后，稀释至最终浓度为1mg/mL。

上述的检测方法中，优选地，所述蛋白还原烷基化的方法包括丙酮沉淀法和稀释法；所述丙酮沉淀法适用于含有去污剂的待测蛋白质样品；所述稀释法适用于不含有去污剂的待测蛋白质样品；所述去污剂包括NP40和吐温80等。

上述的检测方法中，优选地，所述丙酮沉淀法对待检测的蛋白质还原烷基化的具体步骤为：

称取待测蛋白质样品，加入十二烷基硫酸钠（SDS）混匀，然后加入三乙基碳酸氢铵（TEAB）调至pH至为8；向混合物溶液的底部加入三(2-羧乙基)膦（TCEP），瞬时离心后恒温还原反应；待还原反应结束后，加入碘乙酰胺恒温烷基化反应，待烷基化反应结束后，加入丙酮沉淀蛋白质；离心洗涤后加入三乙基碳酸氢铵（TEAB）充分溶解蛋白质沉淀。

上述的检测方法中，优选地，所述稀释法对待检测的蛋白质还原烷基化的具体步骤为：

称取待测蛋白质样品，加入尿素混匀，然后加入三乙基碳酸氢铵（TEAB）调至pH至为8；向混合物溶液的底部加入三(2-羧乙基)膦（TCEP），瞬时离心后恒温还原反应；待还原反应结束后，加入碘乙酰胺恒温烷基化反应，待烷基化反应结束后，加入三乙基碳酸氢铵（TEAB）稀释反应产物。

上述的检测方法中，优选地，进行所述液质检测时，采用的液相色谱-质谱中，液相色谱的检测参数如下：

使用C18柱，单柱模式；A相为0.1%FA水，B相为0.1%FA乙腈；纳升液相流速为0.3微升/分钟，线性梯度为2~20%B，30分钟；20~40%B，10分钟；40~80%B，2分钟；80%B，5分钟；80~2%B，1分钟；2%B，20分钟；常规液相流速为200微升/分钟，线性梯度为2~20%B，30分钟；20~40%B，10分钟；40~80%B，2分钟；80%B,5分钟；80~2%B，1分钟；2%B，20分钟，但不限于此。

上述的检测方法中，优选地，进行所述液质检测时，采用的液相色谱-质谱中，质谱的检测参数如下：

一级扫描范围200~2000，分辨率大于30000，二级的扫描范围100~2000或4000，分辨率大于15000；DDA模式，TOP10或者TOP20，电荷1~6或者2~6，离子检测一次后排除10~15S，但不限于此。

上述的检测方法中，优选地，所述数据分析是采用的蛋白搜库软件对液质检测的数据进行分析从而判断待测蛋白质氨基酸序列的覆盖度，其中，所述蛋白搜库软件包括Proteome Discoverer和/或PEAKS，但不限于此。

上述的检测方法中，优选地，所述数据分析的检测设定为：一级允许误差10~20ppm；二级允许误差0.02~0.1Da；设置酶切位点为非特异；长度5~50氨基酸；可变修饰包括蛋白N端乙酰化和M氧化；固定修饰包括C烷基化；离子为b和y离子。

本发明相比于多酶切质谱法方案，不需要模拟酶切预测来选择对应的酶；不需要多种酶切，只要一种酶，更经济；不需要多种反应体系，只要一只反应体系，省人工和材料；不需要过夜酶切，一般只需1小时，省反应时间；不使用C18 SPE柱脱盐，而使用HLB柱，不会漏掉亲水性多肽，提高覆盖度；或者有的方案是不脱盐的，而本方案脱盐，由于一般样本里面都有盐，如果不脱盐，会干扰同时间段出峰的亲水肽的检测。同时可以减少液相色谱柱的堵塞和质谱的污染。本方案材料更经济，人工工作量更少，整个检测时间更短，覆盖度更好。

本发明相比Edman降解法方案，不需要模拟酶切预测来选择对应的酶；不需要多种酶切，只要一种酶，更经济；不需要样品进行多次HPLC分离，不需要对分离后的多肽峰进行收集，样品需要量少，工作量少。对每一个多肽峰分别进行Edman降解测序，相当于多次检测，工作量大，周期长，成本高。当蛋白质N端发生封闭时， Edman降解法无法检测蛋白N末端肽段或需要加酶处理；而本发明不受N端修饰的限制，而且材料和工作量少，周期短，价格经济。

本发明的有益效果：

本发明的蛋白质氨基酸序列覆盖度的检测方法采用弹性蛋白酶实现单酶切，不需要模拟酶切预测来选择对应的酶；不需要多种酶切，只要一种酶；同时采用HLB柱脱盐，不会漏掉亲水性多肽，提高覆盖度；本发明的检测方法的快速简便、工作量少、检测周期短、价格经济，酶切反应时间一般仅需15~60分钟，能够达到100%的氨基酸序列覆盖度。

附图说明

图1为本发明实施例1中待测蛋白质样品还原烷基化、酶切和脱盐过程示意图；

图2为本发明实施例1中待测蛋白质样品质谱检测的谱图；

图3为本发明实施例1中待测蛋白质样品数据分析的谱图；

图4为本发明实施例1中待测蛋白质样品的蛋白质氨基酸序列覆盖度和修饰位点图。

具体实施方式

为了对本发明的技术特征、目的和有益效果有更加清楚的理解，现对本发明的技术方案进行以下详细说明，但不能理解为对本发明的可实施范围的限定。

以下实施例中所采用的化学试剂等，若无特殊说明，均为市售获得。

实施例1

本实施例提供一种蛋白质氨基酸序列覆盖度的检测方法，其包括以下步骤：

步骤一，对待检测的蛋白质样品（本实施采取的蛋白质样品为重组人生长激素rhGH）还原烷基化；具体为：

采取如下方法对待检测的蛋白质样品还原烷基化：

稀释法（适用于不含有NP40和吐温80等去污剂的蛋白质样品）：

取样：取出100μg待测蛋白质样品于1.5mL Eppendorf离心管中，补加8M尿素至90μL，Vortex混匀后，再加10μL1M TEAB，调至其pH为8左右，溶液总体积为100μL。（待测蛋白质加入量根据后续液相决定，如果是纳升液相，蛋白质样品量可以少些；如果是常规液相，蛋白质样品量可以多些；终体积根据原始样品的浓度来调整）

还原：用移液器移取2μL 0.5M TCEP(保持TCEP终浓度为10mM）置于管底，瞬时离心后置于恒温混匀仪上，37℃左右、500rpm左右孵育1h，观察蛋白溶液应为澄清，无絮状。

烷基化：待还原结束后，将样品恢复至室温，加入2μL 1M 碘乙酰胺，瞬时离心后置于恒温混匀仪上，25℃左右、500rpm左右避光孵育40min。

稀释：待烷基化结束后，用100mM TEAB，将样品稀释8倍。

步骤二，加入弹性蛋白酶（购买厂商为Promega，型号为V1891）进行单酶切获得肽段，其中，弹性蛋白酶与待检测的蛋白质的质量比为1：（20~100）；具体为：

经过还原烷基化的蛋白质样品瞬时离心后（按照酶：蛋白质量=1:20~100比例）加入弹性蛋白酶于样品中，置于恒温混匀仪上，37℃左右 500rpm左右混匀酶切15min到1小时。（称取1mg的弹性蛋白酶在0.5mL双蒸水中重悬，BCA定量蛋白浓度后稀释至至最终浓度为1mg/ml，储存在4℃下长达2周）

在具体的实例中如：20KDa的蛋白如生长激素可以按1:20酶切30min；65KDa的蛋白如HPV蛋白可以按1:20酶切30min，取出一半，用TFA终止，4度放置，剩下一半继续反应30min，合并两次样品；150KD的抗体可以按1:20酶切1小时。

备注：含N糖的蛋白如抗体需要使用PNGase F糖苷酶切除糖链。

步骤三，对肽段进行脱盐处理；具体为：

上样：200μL 0.1% TFA溶解肽段，缓慢过HLB柱(μElution HLB)一次，保证样品和柱子充分结合。HLB柱相比于C18柱，可以保留极性较大的多肽。

清洗：加入200μL 0.1% TFA 清洗柱子，重复2次。

洗脱：用50μL 0.1% TFA，70% ACN洗脱结合在柱子上的肽段，重复一次，合并洗脱液，总计体积100μL，真空浓缩至干燥。

上述步骤一至步骤三的过程示意图如图1所示。

步骤四，利用液相色谱-质谱对脱盐处理后的肽段进行检测，获得检测数据；具体为：

液相色谱：使用C18柱，单柱模式，保证C18色谱柱不能的保留的亲水肽都能检测到。A相一般为0.1%FA水，B相一般为0.1%FA乙腈。纳升液相流速一般为0.3微升/分钟，线性梯度为2~20%B，30分钟；20~40%B，10分钟；40~80%B，2分钟；80%B，5分钟；80~2%B，1分钟；2%B，20分钟。常规液相流速一般为200微升/分钟，线性梯度为2~20%B，30分钟；20~40%B，10分钟；40~80%B，2分钟；80%B，5分钟；80~2%B，1分钟；2%B，20分钟。A相、B相和梯度可以适当调整。

质谱：一级扫描范围200~2000，分辨率大于30000，二级的扫描范围100~2000或4000，分辨率大于15000。DDA模式，TOP10或者TOP20，电荷1~6或者2~6，离子检测一次后排除10~15S。

图2为本发明实施例1中待测蛋白质样品质谱检测的谱图。

步骤五，利用蛋白搜库软件对步骤四的检测数据进行数据分析判断待测蛋白质氨基酸序列的覆盖度。具体为：

采用蛋白搜库软件如Proteome Discoverer，PEAKS等。一级允许误差10~20ppm；二级允许误差0.02~0.1Da；设置酶切位点为非特异；长度5~50氨基酸；可变修饰如，蛋白N端乙酰化，M氧化等；固定修饰如C烷基化。离子为b和y离子。

实验结果如表1、图3和图4所示，表1为本发明实施例1中待测蛋白质样品检测序列覆盖度结果数据表：

表1：

蛋白样品	-10lgP	覆盖度	多肽段	平均质量	PTM修饰位点
						rhGH	682.94	100%	424	22129	C、O

由表1可以看出，蛋白的序列覆盖度为100%。由图3待测蛋白质样品数据分析的谱图中的一张可以看出，二级谱图中的碎片离子与理论序列的b、y离子得到了很好的匹配，其中匹配到y离子的显示为红色并标记为yn，匹配到b离子的显示为蓝色并标记为bn，该二级谱图成功鉴定到了待测蛋白中的氨基酸序列。结合图4蛋白质氨基酸序列覆盖度和修饰位点图，由图4可以看出：加粗的字母表示成功检测到该氨基酸，字母上方橙色背景的O表示该氨基酸发生了氧化，红色背景的C表示该氨基酸发生了烷基化，所有字母变粗表示所有氨基酸都已检测到，序列覆盖度是100%。

本实施例利用弹性蛋白酶，通过其合适的酶切位点，并控制反应浓度和时间等条件，获得合适长度的多肽，和足够多种类的互补的多肽。并且通过能保留亲水肽的材料，回收更全面的多肽，实现蛋白质的100%的序列覆盖度。

以上所述的实施例仅用于说明本发明的技术思想及特点，其目的在于使本领域内的技术人员能够理解本发明的内容并据以实施，不能仅以本实施例来限定本发明的专利范围，即凡本发明所揭示的精神、所作的同等变化或修饰，仍落在本发明的专利范围内。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：基于LC-MS/MS对生物样本中胆红素的降解产物的检测分析方法

一种蛋白质氨基酸序列覆盖度的检测方法

相关技术

网友询问留言