一种改造次级翻译起始位点使蛋白正确表达的方法

文档序号:1402782 发布日期:2020-03-06 浏览:17次 >En<

阅读说明:本技术 一种改造次级翻译起始位点使蛋白正确表达的方法 (Method for modifying secondary translation initiation site to enable protein to be correctly expressed ) 是由 刘伟林 刘姗姗 李千 汤建民 吴昔阳 张高英 赵红洲 于 2019-11-29 设计创作,主要内容包括:本发明属于基因技术和微生物技术领域,具体涉及一种改造次级翻译起始位点使蛋白正确表达的方法。所述方法包括:对目的蛋白的基因序列进行基因序列分析,当存在类似核糖体结合位点序列加上适当间隔序列位于起始密码子上游,则判断存在次级翻译起始位点;将所述类似核糖体结合位点序列进行同义突变、或者直接去掉类似核糖体结合位点序列,获得新的基因序列;将新的基因序列构建到pET表达载体中获得正确表达的蛋白。本发明所述方法将含有次级翻译起始位点的基因序列中的类似核糖体结合位点序列改造,有效的避免了次级翻译起始位点的存在而导致的蛋白表达异常,使目的蛋白表达异常的蛋白实现了正常表达,所表达目的蛋白的分子量大小符合预期大小。(The invention belongs to the technical field of gene technology and microorganisms, and particularly relates to a method for modifying a secondary translation initiation site to ensure that a protein is correctly expressed. The method comprises the following steps: analyzing the gene sequence of the target protein, and judging that a secondary translation initiation site exists when a similar ribosome binding site sequence and a proper spacer sequence are positioned at the upstream of an initiation codon; carrying out synonymous mutation on the similar ribosome binding site sequence or directly removing the similar ribosome binding site sequence to obtain a new gene sequence; and constructing a new gene sequence into a pET expression vector to obtain correctly expressed protein. The method of the invention modifies the similar ribosome binding site sequence in the gene sequence containing the secondary translation initiation site, effectively avoids protein expression abnormality caused by the existence of the secondary translation initiation site, realizes normal expression of the protein with the abnormal expression of the target protein, and ensures that the molecular weight of the expressed target protein conforms to the expected size.)

一种改造次级翻译起始位点使蛋白正确表达的方法

技术领域

本发明属于基因技术和微生物技术领域,具体涉及一种改造次级翻译起始位点使蛋白正确表达的方法。

背景技术

蛋白表达是指利用基因重组技术表达蛋白的过程。影响蛋白表达的因素有很多,有时候表达的目的蛋白的分子量比预期的小,可能存在两种情况,一是蛋白质发生了降解,而另外一种情况是基因序列里存在次级翻译起始位点。

通过对表达异常的蛋白的目的基因序列进行分析,有效的避免次级翻译起始位点的存在就能够有效的避免表达的蛋白被截短。蛋白只有在正确表达形成正确构象后才会发挥其作用。

发明内容

本发明针对现有技术的不足,目的在于提供一种改造次级翻译起始位点使蛋白正确表达的方法。

为实现上述发明目的,本发明所采用的技术方案为:

一种改造次级翻译起始位点使蛋白正确表达的方法,包括如下步骤:

(1)对目的蛋白的基因序列进行基因序列分析,当发现存在类似核糖体结合位点序列加上适当的间隔序列位于起始密码子上游,则判断该基因序列中存在次级翻译起始位点;

(2)将步骤(1)中所述类似核糖体结合位点序列进行同义突变、或者直接去掉类似核糖体结合位点序列,获得新的基因序列;

(3)将步骤(2)所得新的基因序列构建到pET表达载体中,再转化至大肠杆菌中进行蛋白诱导表达,获得正确表达的蛋白。

上述方案中,所述类似核糖体结合位点序列为“AAGGAGG”。

上述方案中,所述适当的间隔序列为5~13个碱基序列。

上述方案中,所述起始密码子为AUG或GUG。

上述方案中,所述同义突变指将碱基序列“CAGGAG”突变成碱基序列“CAAGAA”。

本发明的有益效果:本发明所述方法将含有次级翻译起始位点的基因序列中的类似核糖体结合位点序列改造,有效的避免了次级翻译起始位点的存在而导致的蛋白表达异常,使目的蛋白表达异常的蛋白实现了正常表达,所表达目的蛋白的分子量大小符合预期大小。

附图说明

图1为原始基因构建的重组质粒pET32a-irak1蛋白表达异常的电泳图,其中1:marker,2~4:pET32a-irak1转化大肠杆菌BL21(DE3),5:pET32a转化大肠杆菌BL21(DE3)。

图2为改造后的重组质粒pET32a-irak1蛋白表达正常的电泳图,其中1:marker,2~4:pET32a-irak1转化大肠杆菌BL21(DE3),5:pET32a转化大肠杆菌BL21(DE3)。

图3为原始基因构建的重组质粒pET32a-NT3蛋白表达异常的电泳图,其中1:marker,2:pET32a-NT3转化大肠杆菌BL21(DE3),3:pET32a转化大肠杆菌BL21(DE3)。

图4为改造后构建的重组质粒pET32a-NT3蛋白表达正常的电泳图,其中1:marker,2~4:pET32a-NT3转化大肠杆菌BL21(DE3),5:pET32a转化大肠杆菌BL21(DE3)。

具体实施方式

为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的实施例。

实施例1

Irak1的基因序列如SEQ ID NO.1所示,在原核表达系统中表达鼠源IRAK1蛋白的时候发现蛋白表达的分子量与所选区域蛋白分子量存在明显差异(比预期分子量偏小,如图1所示),核对测序结果与原始序列完全匹配而且能够正常翻译,但是蛋白表达异常,蛋白表达被截短。

分析Irak1基因序列发现:基因序列中存在与pET载体上的核糖体结合位点序列(AGGAG)相同的序列,且在其下游10bp处有甲硫氨酸(Met)密码子ATG,这可能构成次级翻译起始位点,当基因序列中存在次级翻译起始位点时,目的蛋白的表达会被截短。初步推断,Irak1蛋白会从此次级翻译起始位点开始翻译蛋白,其蛋白质序列如下所示,约166个氨基酸,约18KD,再加上酶切位点处8个氨基酸(1.1KD),其重组蛋白约20KD,符合电泳图上的条带。DNAMAN2:DNAMAN1 identity=100.00%(5/5)gap=0.00%(0/5)

Figure BDA0002296969560000031

本实施例设计两对引物(F1/R1、Fm/Rm)通过Overlap PCR技术将基因序列中存在类似核糖体结合位点序列进行同义突变,目的基因序列中存在的类似核糖体结合位点处的碱基(CAG GAG)编码的是Gln Glu,将其进行同义突变后碱基序列为(CAA GAA),然后将突变后基因序片段建到pET32a表达载体,转化至大肠杆菌BL21(DE3)中进行诱导表达蛋白。

具体的操作步骤如下:(1)白细胞介素1受体相关激酶蛋白的原始基因序列如SEQID NO.1所示;

(2)以小鼠肝脏组织或肺组织提取的RNA经反转录制备的cDNA为模板,用两对引物F1/R1和Fm/Rm,通过Overlap PCR扩增技术将原始基因序列中“第115位~第120位”的碱基序列“CAGGAG”进行同义突变,得到新的基因序列如SEQ ID NO.2所示;

所述两对引物F1/R1和Fm/Rm的序列如下:

所述PCR扩增反应的体系为

Figure BDA0002296969560000033

Figure BDA0002296969560000041

所述PCR扩增反应条件为:

Figure BDA0002296969560000042

(3)将步骤(2)所得序列如SEQ ID NO.2所示的基因片段构建到pET 32a表达载体中,再转化至大肠杆菌BL21(DE3)进行蛋白诱导表达,纯化获得目的蛋白,具体构建-转化-诱导表达的操作过程为:(1)以小鼠肝脏组织或肺组织提取的RNA经反转录制备的cDNA为模板,分别用引物F1和Rm,Fm和R1进行PCR扩增得到PCR产物P1,P2;(2)以步骤(1)中得到的PCR产物P1、P2为模板,用引物F1和R1进行PCR扩增得到PCR产物P3;(3)用BamH I和Xho I分别对PCR产物P3、pET32a质粒进行双酶切并对酶切产物进行琼脂糖凝胶电泳检测及回收;(4)用T4 DNA连接酶将回收得到的产物在16℃条件下连接过夜;(5)将连接产物转化至大肠杆菌DH5α感受态细胞并涂布在具有氨苄(amp)抗性LB固体平板上,倒置于37℃培养箱培养12~14h;(6)对固体LB平板上的单菌落进行菌落PCR(使用pET32a载体通用引物),通过琼脂糖凝胶检测筛选出阳性克隆子,将其送测序公司测序,待测序结果出来后与原始序列比对确认测序结果是否正确以及要突变的位点是否突变成功;(7)将测序正确且突变成功的重组质粒pET32a-irak1转化至大肠杆菌BL21(DE3)感受态细胞并涂布在具有氨苄(amp)抗性LB固体平板上,倒置于37℃培养箱培养12~14h;(8)挑取步骤(7)中平板上的单菌落接种至3mL含有氨苄(amp)抗性LB液体培养基中,置于37℃恒温摇床中,200rpm培养至OD600约0.6时加入IPTG使其终浓度为0.5mM/L,于37℃恒温摇床中,200rpm继续培养诱导3h;(9)以5000rpm离心3min,收集菌体,加入100μL 1xSDS-PAGE loading buffer沸水浴10min,SDS-PAGE电泳检测目的蛋白是否表达;(10)对表达的目的蛋白进行纯化。

原始核苷酸序列和突变后的核苷酸序列对比结果如下所示:

Upper line:IRAK1,from 7to 632(如SEQ ID NO.2所示)

Lower line:DNAMAN1,from 1to 626(原始序列,如SEQ ID NO.1所示)

995G:DNAMAN1 identity=99.68%(625/627)gap=0.95%(6/633)

Figure BDA0002296969560000061

*前后两端是载体序列中的酶切位点,黑体加粗部分为突变位点。

将其翻译成氨基酸结果如下(如SEQ ID NO.3所示):

Upper line:DNAMAN4,from 3to 210(Irak1)

Lower line:DNAMAN8,from 1to 208(Origin)

DNAMAN4:DNAMAN8 identity=100.00%(209/209)gap=0.95%(2/211)

Figure BDA0002296969560000062

*前后两端是载体序列中的酶切位点翻译的氨基酸,除去前后4个氨基酸,其余完全匹配。

对本实施例构建所得载体进行测序并与原始序列进行比对(比对结果如上),测序比对分析结果显示:除突变位点外,其余基因序列与原始序列完全匹配,说明了对IRAK1基因序列中存在的类似核糖体结合位点成功进行了同义突变。同时,将原始IRAK1基因序列构建到pET 32a表达载体中,再转化至大肠杆菌进行蛋白诱导表达;以及将经本实施例所述成功进行同义突变的基因序列构建到pET 32a表达载体中,再转化至大肠杆菌进行蛋白诱导表达,分别对诱导表达的蛋白进行电泳分析,结果如图1和图2所示,从图1可知:原始IRAK1基因序列所表达的蛋白分子量在20~21KDa左右,分子量与IRAK1蛋白的分子量存在明显差异;从图2可知:经同义突变的IRAK1基因序列所表达的蛋白分子量在40KDa左右,符合预期蛋白分子量大小(40KDa)。这表明,通过对目的蛋白(IRAK1)基因序列中存在的次级翻译起始位点中类似核糖体结合位点的同义突变,消除了影响蛋白正确表达的次级翻译起始位点,使得目的蛋白正确表达。经本发明所述方法改造次级翻译起始位点后,实现了白细胞介素1受体相关激酶蛋白的正常表达,白细胞介素1受体相关激酶蛋白只有在正确表达形成正确构象后才会发挥其作用,大大提高了白细胞介素1受体相关激酶蛋白的表达产量,其蛋白浓度能达到5mg/mL。

实施例2

NT3蛋白的基因序列如SEQ ID NO.3所示,在原核表达系统中表达鼠源NT3蛋白的时候发现蛋白表达的分子量与所选区域蛋白分子量存在明显差异(比预期分子量偏小,见图3),核对测序结果与原始序列完全匹配而且能够正常翻译,但是蛋白表达异常,蛋白表达被截短。

对NT-3基因序列分析显示,其基因序列的第24~28位为“AGGAG”,与所使用的pET载体上的核糖体结合位点序列(AGGAG)完全相同,且在其下游8bp处有缬氨酸(Val)密码子GUG(也可作为起始密码子),因此,可能构成次级翻译起始位点,从而导致表达的蛋白被截短,影响蛋白的正常表达。初步判断,目的蛋白会从该次级翻译起始位点开始翻译蛋白,翻译的蛋白质序列如下所示,约107个氨基酸,约12.8KDa,再加上酶切位点处8个氨基酸(1.1KDa),其重组蛋白约14KDa,符合电泳图上的条带。

Upper line:DNAMAN2,from 1to 4

Lower line:DNAMAN1,from 24to 27

DNAMAN2:DNAMAN1 identity=100.00%(5/5)gap=82.14%(23/28)

Figure BDA0002296969560000071

分析NT-3基因序列存在类似核糖体结合位点且位于基因序列的24~28位(AGGAG),直接将目的基因序列前30个碱基去掉,也就是直接将类似核糖体结合位点去掉,得到改造后的基因序列如SEQ ID NO.4所示,然后将改造后目的基因片段构建到pET32a表达载体,转化至大肠杆菌BL21(DE3)中进行诱导表达蛋白。

对本实施例构建所得载体进行测序并与原始序列进行比对(比对结果如下),测序比对分析结果显示:除掉前30个碱基,剩下的基因序列与原始序列完全匹配且通读。

测序结果

Upper line:DNAMAN1,from 7to 332(如SEQ ID NO.5所示)

Lower line:DNAMAN2,from 31to 356(Origin,如SEQ ID NO.4所示)

DNAMAN1:DNAMAN2 identity=100.00%(327/327)gap=1.80%(6/333)

Figure BDA0002296969560000081

*前后两端是载体序列中的酶切位点;

将其翻译成氨基酸结果如下(如SEQ ID NO.6所示):

Upper line:DNAMAN14,from 3to 110pET32a-NT3

Lower line:DNAMAN13,from11 to 108ORIGIN

DNAMAN14:DNAMAN13 identity=100.00%(109/109)gap=1.80%(2/111)

Figure BDA0002296969560000082

*前后两端是载体序列中的酶切位点翻译的氨基酸,除去前后4个氨基酸,其余完全匹配。

同时,将原始NT-3基因序列构建到pET32a表达载体中,再转化至大肠杆菌BL21(DE3)进行蛋白诱导表达;以及将经本实施例改造后的基因序列构建到pET 32a表达载体中,再转化至大肠杆菌BL21(DE3)进行蛋白诱导表达,分别对诱导表达的蛋白进行电泳分析,结果如图3和图4所示,结果表明:改造后的基因蛋白表达在35KDa左右,符合预期蛋白分子量大小(32KDa)。这说明了通过将目的蛋白(NT-3)基因序列中存在的次级翻译起始位点中类似核糖体结合位点去除,消除了影响蛋白正确表达的次级翻译起始位点,使得目的蛋白正确表达。

显然,上述实施例仅仅是为清楚地说明所作的实例,而并非对实施方式的限制。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而因此所引申的显而易见的变化或变动仍处于本发明创造的保护范围之内。

序列表

<110>武汉赛维尔生物科技有限公司

<120>一种改造次级翻译起始位点使蛋白正确表达的方法

<160>6

<210> 1

<211> 627bp

<212> DNA

<213>鼠源IRAK1蛋白原始基因序列

<400>1

caccgtcggg ccaagaagag gccccccatg acccaggtat acaagagact agaagggctt 60

caggcagggc ctccctggga gctagaggtt gccggccatg gctccccttc cccacaggag 120

aactcctaca tgtctaccac tggcagtgcc cagagtgggg atgaaccatg gcagcctcta 180

gtagtgacca caagagcccc agcccaggct gcccagcaac tccagagaag tcccaaccag 240

ccagtggaaa gtgatgagag tgttcccggc ctctctgcta ccctgcattc ctggcacttg 300

actccaggtt cccacccaag cccagcgtcc ttcagagagg ctagctgtac ccagggaggc 360

actaccagag aatcaagtgt gaggagtagc ccaggcttcc agcctacaac catggaaggc 420

tcacccacgg gcagctcatc cctgctgtca tcagaaccac cacagatcat catcaaccca 480

gcccgacaga agatggtaca aaagctggct ctttatgaag aaggggtctt ggatagcctg 540

caactgctgt catcaggctt tttcccaggc ttggatttag aacctgaaaa gagccaggga 600

cctgaagaaa gtgatgaatt ccagagc 627

<210> 2

<211> 639bp

<212> DNA

<213>鼠源IRAK1蛋白改造后基因序列

<400>2

ggatcccacc gtcgggccaa gaagaggccc cccatgaccc aggtatacaa gagactagaa 60

gggcttcagg cagggcctcc ctgggagcta gaggttgccg gccatggctc cccttcccca 120

caagaaaact cctacatgtc taccactggc agtgcccaga gtggggatga accatggcag 180

cctctagtag tgaccacaag agccccagcc caggctgccc agcaactcca gagaagtccc 240

aaccagccag tggaaagtga tgagagtgtt cccggcctct ctgctaccct gcattcctgg 300

cacttgactc caggttccca cccaagccca gcgtccttca gagaggctag ctgtacccag 360

ggaggcacta ccagagaatc aagtgtgagg agtagcccag gcttccagcc tacaaccatg 420

gaaggctcac ccacgggcag ctcatccctg ctgtcatcag aaccaccaca gatcatcatc 480

aacccagccc gacagaagat ggtacaaaag ctggctcttt atgaagaagg ggtcttggat 540

agcctgcaac tgctgtcatc aggctttttc ccaggcttgg atttagaacc tgaaaagagc 600

cagggacctg aagaaagtga tgaattccag agcctcgag 639

<210> 3

<211> 209

<212> PRT

<213>鼠源IRAK1蛋白

<400>3

His Arg Arg Ala Lys Lys Arg Pro Pro Met Thr Gln Val Tyr Lys Arg

1 5 10 15

Leu Glu Gly Leu Gln Ala Gly Pro Pro Trp Glu Leu Glu Val Ala Gly

20 25 30

His Gly Ser Pro Ser Pro Gln Glu Asn Ser Tyr Met Ser Thr Thr Gly

35 40 45

Ser Ala Gln Ser Gly Asp Glu Pro Trp Gln Pro Leu Val Val Thr Thr

50 55 60

Arg Ala Pro Ala Gln Ala Ala Gln Gln Leu Gln Arg Ser Pro Asn Gln

65 70 75 80

Pro Val Glu Ser Asp Glu Ser Val Pro Gly Leu Ser Ala Thr Leu His

85 90 95

Ser Trp His Leu Thr Pro Gly Ser His Pro Ser Pro Ala Ser Phe Arg

100 105 110

Glu Ala Ser Cys Thr Gln Gly Gly Thr Thr Arg Glu Ser Ser Val Arg

115 120 125

Ser Ser Pro Gly Phe Gln Pro Thr Thr Met Glu Gly Ser Pro Thr Gly

130 135 140

Ser Ser Ser Leu Leu Ser Ser Glu Pro Pro Gln Ile Ile Ile Asn Pro

145 150 155 160

Ala Arg Gln Lys Met Val Gln Lys Leu Ala Leu Tyr Glu Glu Gly Val

165 170 175

Leu Asp Ser Leu Gln Leu Leu Ser Ser Gly Phe Phe Pro Gly Leu Asp

180 185 190

Leu Glu Pro Glu Lys Ser Gln Gly Pro Glu Glu Ser Asp Glu Phe Gln

195 200 205

Ser

<210> 4

<211> 357bp

<212> DNA

<213>鼠源NT-3蛋白原始基因序列

<400>4

tatgcagaac ataagagtca ccgaggagag tactcagtgt gtgacagtga gagcctgtgg 60

gtgaccgaca agtcctcagc cattgacatt cggggacacc aggtcacagt gctgggggag 120

atcaaaaccg gtaactctcc tgtgaaacaa tatttttatg aaacgagatg taaagaagcc 180

aggccggtca aaaacggttg cagggggatt gatgacaaac actggaactc tcagtgcaaa 240

acttcgcaaa cctatgtccg agcactgact tcagaaaaca acaaactcgt aggctggcgc 300

tggatacgaa tagacacttc ctgtgtgtgt gccttgtcga gaaaaattgg aagaaca 357

<210> 5

<211> 339bp

<212> DNA

<213>鼠源NT-3蛋白改造后的基因序列

<400>5

gaattctact cagtgtgtga cagtgagagc ctgtgggtga ccgacaagtc ctcagccatt 60

gacattcggg gacaccaggt cacagtgctg ggggagatca aaaccggtaa ctctcctgtg 120

aaacaatatt tttatgaaac gagatgtaaa gaagccaggc cggtcaaaaa cggttgcagg 180

gggattgatg acaaacactg gaactctcag tgcaaaactt cgcaaaccta tgtccgagca 240

ctgacttcag aaaacaacaa actcgtaggc tggcgctgga tacgaataga cacttcctgt 300

gtgtgtgcct tgtcgagaaa aattggaaga acactcgag 339

<210> 6

<211> 109

<212> PRT

<213>鼠源NT-3蛋白

<400>6

Tyr Ser Val Cys Asp Ser Glu Ser Leu Trp Val Thr Asp Lys Ser Ser

1 5 10 15

Ala Ile Asp Ile Arg Gly His Gln Val Thr Val Leu Gly Glu Ile Lys

20 25 30

Thr Gly Asn Ser Pro Val Lys Gln Tyr Phe Tyr Glu Thr Arg Cys Lys

35 40 45

Glu Ala Arg Pro Val Lys Asn Gly Cys Arg Gly Ile Asp Asp Lys His

50 55 60

Trp Asn Ser Gln Cys Lys Thr Ser Gln Thr Tyr Val Arg Ala Leu Thr

65 70 75 80

Ser Glu Asn Asn Lys Leu Val Gly Trp Arg Trp Ile Arg Ile Asp Thr

85 90 95

Ser Cys Val Cys Ala Leu Ser Arg Lys Ile Gly Arg Thr

100 105

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种提高纤维堆囊菌埃博霉素产量的TALE-TF载体及其构建方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!