一种融合蛋白及其应用

文档序号:317035 发布日期:2021-11-30 浏览:14次 >En<

阅读说明:本技术 一种融合蛋白及其应用 (Fusion protein and application thereof ) 是由 姚红杰 李尧益 王新秀 黄赛南 于 2020-11-19 设计创作,主要内容包括:本发明涉及一种用于单细胞原位活性R-loop文库制备的融合蛋白及其应用,其中所述融合蛋白涉及到R-loop特异结合蛋白HBD,MNase核酸酶,Tn5转座酶。以上所述融合蛋白主要用于R-loop检测及高通量文库构建。本发明所述融合蛋白用于检测R-loop及高通量文库构建,可以实现原位活性R-loop检测,并可以提高建库效率,降低文库背景,提高R-loop检测技术的准确性,并简化R-loop检测流程。(The invention relates to a fusion protein for preparing a single-cell in-situ active R-loop library and application thereof, wherein the fusion protein relates to R-loop specific binding protein HBD, MNase nuclease and Tn5 transposase. The fusion protein is mainly used for R-loop detection and high-throughput library construction. The fusion protein is used for detecting R-loop and constructing a high-throughput library, can realize in-situ active R-loop detection, can improve library construction efficiency, reduce library background, improve the accuracy of an R-loop detection technology, and simplify an R-loop detection process.)

一种融合蛋白及其应用

技术领域

本发明涉及生物技术领域,具体是涉及一种融合蛋白及其应用。

背景技术

R-loop(R环)是一个三链的核酸结构,即一条RNA链与双链DNA的其中一条链结合,另一条DNA链空出与RNA:DNA杂合链形成一种环状结构。在以前,R-loop长被人们认为对细胞有害,而且受关注度比较少。近年来,作为细胞基因组上的一个重要元件,R-loop参与许多生物学功能,成为表观遗传学的重要研究领域。目前,关于检测R-loop的方法大多基于抗体S9.6的DRIP-seq及DRIP-seq的衍生方法。

DRIP-seq((DNA:RNA hybrid immunoprecipitation and sequencing)是一种基于特异识别 DNA:RNA杂合链抗体的免疫共沉淀及高通量测序分析技术,已被用来检测人、小鼠、酵母等模式生物全基因组水平的R-loop分布。DRIP-seq及DRIP-seq的衍生方法,其流程大致包括:⑴收取细胞及其他生物学样本,提取基因组DNA;⑵用限制性核酸内切酶将基因组 DNA酶切打断成一定大小的DNA片段;⑶用抗体S9.6免疫沉淀并富集含R-loop的DNA片段;⑷纯化回收DNA片段;⑸通过不同的建库方法构建文库。但目前的DRIP-seq及 DRIP-seq的衍生方法都还存在包括检测信号的分辨率有限和S9.6抗体的特异性不足的缺陷。特别是S9.6除了可以识别R-loop还可以识别双链RNA(dsRNA)。而且关于如何检测单细胞水平的活性R-loop手段比较稀缺。

总体而言,目前已有的R-loop检测方法存在一些缺陷,主要包括:1、所用细胞量多;2、不是原位检测;3、缺少链特异性信息;4、流程所需时间长。

但是,因此建立一种新型的单细胞活性R-loop检测方法,对研究R-loop的生物学功能具有重要的意义,而此中关键是需要有一种更适合的多肽使的新型的单细胞活性R-loop检测方法能够建立。

发明内容

本发明的目的之一是提供一种可用于单细胞原位活性R-loop文库制备的融合蛋白,该融合蛋白可以用于新型的单细胞活性R-loop检测方法,具有所需细胞量少,检测时间短等优点。

实现上述目的的技术方案如下。

一种融合蛋白,包括由第一功能区和第二功能区构成的二聚体,其中⑴第一功能区包括R-loop特异结合蛋白HBD;

⑵第二功能区包括MNase核酸酶或Tn5转座酶;

⑶连接第一功能区和第二功能区的的连接结构(linker)。

在其中一些实施例中,所述的HBD为R-loop特异识别蛋白,其氨基酸序列如SEQ IDNO.1 所示,或为在SEQ ID NO.1所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列。

在其中一些实施例中,所述的MNase核酸酶为野生型MNase截短体,进一步优选为氨基酸序列如SEQ ID NO.2所示,或为在SEQ ID NO.2所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列。

在其中一些实施例中,所述的Tn5转座酶为野生型Tn5转座酶突变体,其氨基酸序列如 SEQ ID NO.3所示,或为在SEQ ID NO.3所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列。

在其中一些实施例中,所述的连接结构(linker)的氨基酸序列如SEQ ID NO.4所示。

在其中一些实施例中,还包括蛋白纯化标签,所述的蛋白纯化标签包括His标签、GST 标签、MBP标签、SUMO标签等亲和层析纯化。

在其中一些实施例中,所述蛋白的第二功能区连接在第一功能区的氨基酸功能区的N端 (氮端)。

在其中一些实施例中,所述融合蛋白的单体为HBD-MNase或HBD-Tn5,所述融合蛋白 HBD-MNase的氨基酸序列如SEQ ID NO.5所示,或为在SEQ ID NO.5所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列;所述融合蛋白HBD-Tn5的氨基酸序列如SEQ ID NO.6所示,或为在SEQ ID NO.6所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列。

本发明的另一目的是提供上述融合蛋白在制备生物学样本的R-loop高通量测序文库中的应用。

在其中一些实施例中,所述融合蛋白在制备生物学样本的R-loop高通量测序文库中的应用,所述的生物学样本包括但不限于未经交联、固定或冷冻/经过交联、固定或冷冻处理的培养细胞样本、组织样本;所述的高通量测序文库为检测R-loop高通量测序文库。

本发明的另一目的是提供一种制备生物学样本高通量测序文库的方法。

一种制备生物学样本高通量测序文库的方法,包括以下步骤:

⑴收集并处理生物学样本,获得单细胞悬液;

⑵用缓冲液清洗生物学样本,加入适量的融合蛋白,使融合蛋白充分结合后清洗未结合的蛋白;

⑶激活融合蛋白,充分反应获得被融合蛋白识别并切割得到的小片段DNA或带有标记的DNA片段;

⑷加入终止液终止反应,纯化回收DNA片段;

⑸进行PCR扩增完成文库构建。

本发明涉及的融合蛋白主要用于构建R-loop高通量检测文库,与现有方法相比,本发明涉及的融合蛋白的有益效果为:

⑴本发明创造性地将合适的MNase核酸酶或Tn5转座酶与特异结合蛋白HBD通过连接子 (linker)连接起来,构成一种全新的融合蛋白,该融合蛋白在R-loop高通量检测过程中能够显著降低所需细胞量,甚至达到单细胞水平:基于DRIP-seq等传统方法,细胞需求量须达到千万级别,但是本检测方法最多只需十万个细胞。

⑵本发明构建的融合蛋白可以明显提高对R-loop的检测的特异性,传统的检测方式DRIP-seq 是使用S9.6抗体对片段化基因组中的R-loop进行捕捉,但这种方式中S9.6抗体的特异性不强,它不仅可以对R-loop中的杂合链进行捕捉,还可以结合双链RNA,导致检测到的信号可能并不是真实的R-loop,而RNaseH可以特异性消解R-loop,它对R-loop的特异性结合能力比 S9.6强百倍,我们通过利用RNaseH binding domain HBD对R-loop的特异性结合能力,将其融合到我们的融合蛋白HBD-MNase和HBD-Tn5中,有效提高对R-loop的特异性识别和捕捉。

⑶本发明构建的融合蛋白在R-loop高通量检测过程中可以显著简化实验流程,提高建库效率,降低文库背景:本发明的建库流程最少只需半个小时,且操作时间在五分钟内即可完成,基于Tn5的建库可显著降低文库背景,本发明所涉及的融合蛋白HBD-Tn5中的Tn5在切割基因组的同时可以在切割位点两端加上特定adapters,而增加adapters后的阳性片段被释放后,无需使用常规末端修复加A再加adapters的建库方法,可以直接经PCR高效实现文库制备,显著简化实验流程同时提高建库效率;即本发明涉及的融合蛋白在R-loop高通量检测可以快捷实现高通量的单细胞文库制备:本检测方法的建库流程最多需两小时,而其中基于 HBD-Tn5的建库最少只需半个小时。

⑷本发明涉及的融合蛋白在R-loop高通量检测过程中可以进行原位检测,进而有效保留样本的空间原位信息。本发明的检测无需传统化学试剂处理进行交联,也无需传统酶切或者超声破坏亚细胞结构,经细胞打孔后,将本发明所涉及的融合蛋白与细胞孵育,在Ca2+或Mg2+作用下激活融合蛋白,进行原位切割R-loop并释放基因组,该过程最真实的保留了活性细胞最原始的构造。而传统的DRIP-seq需要对千万级别细胞量的细胞进行交联,且需要利用酶切或者超声使基因组片段化,导致丢失原位的信息。

附图说明

图1:HBD-MNase表达载体构建图谱。

图2:HBD-Tn5表达载体构建图谱。

图3:高纯度HBD-MNase纯化结果。

图4:高纯度HBD-Tn5纯化结果。

图5:HBD-MNase活性检测结果。

图6:HBD-Tn5活性检测结果。

图7:本发明HBD-MNase融合蛋白应用于R-mapping结果分析以及与传统DRIP-seq比较track 图。

图8:本发明HBD-Tn5融合蛋白应用于R-mapping结果分析以及与传统检测方法DRIP-seq比较track图。

具体实施方式

为了便于理解本发明,下面将参照实施例对本发明进行更全面的描述,以下给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。应理解,下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂,均为市售产品。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

以下通过具体实施例对本发明做进一步的阐述,但不用于限制本发明的保护范围。

本发明构成的的融合蛋白可用于以下实施例中高通量检测R-loop。

所述融合蛋白,包括由第一功能区和第二功能区构成的二聚体,其中⑴第一功能区包括R-loop特异结合蛋白HBD,其氨基酸序列如SEQ ID NO.1所示;

⑵第二功能区包括MNase核酸酶(其氨基酸序列如SEQ ID NO.2所示)以及Tn5转座酶(氨基酸序列如SEQ ID NO.3所示);

⑶连接第一功能区和第二功能区的的连接结构(linker),氨基酸序列如SEQ IDNO.4所示,以及蛋白纯化标签6×His Tag。

所述融合蛋白的单体为HBD-MNase或HBD-Tn5,所述融合蛋白HBD-MNase的氨基酸序列如SEQ ID NO.5所示,所述融合蛋白HBD-Tn5的氨基酸序列如SEQ ID NO.6所示。

SEQ ID NO.1

>HBD

>MFYAVRRGRRTGVFLSWSECKAQVDRFPAARFKKFATEDEAWAF

SEQ ID NO.2

>MNase

>ATSTKKLHKEPATLIKAIDGDTVKLMYKGQPMTFRLLLVDTPETKHPKKGVEKYGPEAS AFTKKMVENAKKIEVEFDKGQRTDKYGRGLAYIYADGKMVNEALVRQGLAKVAYVYKP NNTHEQHLRKSEAQAKKEKLNIWSEDNADSGQ

SEQ ID NO.3

>Tn5

>MITSALHRAADWAKSVFSSAALGDPRRTARLVNVAAQLAKYSGKSITISSEGSKAMQEG AYRFIRNPNVSAEAIRKAGAMQTVKLAQEFPELLAIEDTTSLSYRHQVAEELGKLGSIQDKS RGWWVHSVLLLEATTFRTVGLLHQEWWMRPDDPADADEKESGKWLAAAATSRLRMGS MMSNVIAVCDREADIHAYLQDKLAHNERFVVRSKHPRKDVESGLYLYDHLKNQPELGGY QISIPQKGVVDKRGKRKNRPARKASLSLRSGRITLKQGNITLNAVLAEEINPPKGETPLKWL LLTSEPVESLAQALRVIDIYTHRWRIEEFHKAWKTGAGAERQRMEEPDNLERMVSILSFVA VRLLQLRESFTPPQALRAQGLLKEAEHVESQSAETVLTPDECQLLGYLDKGKRKRKEKAG SLQWAYMAIARLGGFMDSKRTGIASWGALWEGWEALQSKLDGFLAAKDLMAQGIKI

>linker1(用于HBD-MNase)

>DDDKEF

>linker2(用于HBD-Tn5)

>DDDKEFGGGGS(SEQ ID NO.4)

>6×His Tag

>HHHHHH

SEQ ID NO.5

>HBD-MNase

>MFYAVRRGRRTGVFLSWSECKAQVDRFPAARFKKFATEDEAWAFDDDKEFGGGGSATS TKKLHKEPATLIKAIDGDTVKLMYKGQPMTFRLLLVDTPETKHPKKGVEKYGPEASAFTK KMVENAKKIEVEFDKGQRTDKYGRGLAYIYADGKMVNEALVRQGLAKVAYVYKPNNTH EQHLRKSEAQAKKEKLNIWSEDNADSGQ

SEQ ID NO.6

>HBD-Tn5

>MFYAVRRGRRTGVFLSWSECKAQVDRFPAARFKKFATEDEAWAFDDDKEFGGGGSMIT SALHRAADWAKSVFSSAALGDPRRTARLVNVAAQLAKYSGKSITISSEGSKAMQEGAYRFI RNPNVSAEAIRKAGAMQTVKLAQEFPELLAIEDTTSLSYRHQVAEELGKLGSIQDKSRGW WVHSVLLLEATTFRTVGLLHQEWWMRPDDPADADEKESGKWLAAAATSRLRMGSMMS NVIAVCDREADIHAYLQDKLAHNERFVVRSKHPRKDVESGLYLYDHLKNQPELGGYQISIP QKGVVDKRGKRKNRPARKASLSLRSGRITLKQGNITLNAVLAEEINPPKGETPLKWLLLTS EPVESLAQALRVIDIYTHRWRIEEFHKAWKTGAGAERQRMEEPDNLERMVSILSFVAVRLL QLRESFTPPQALRAQGLLKEAEHVESQSAETVLTPDECQLLGYLDKGKRKRKEKAGSLQW AYMAIARLGGFMDSKRTGIASWGALWEGWEALQSKLDGFLAAKDLMAQGIKI

实施例1

一、HBD-MNase融合蛋白的设计、表达和纯化

1、构建HBD-MNase融合蛋白表达载体

⑴用引物分别将第一功能区(SEQ ID NO.1)和第二功能区(SEQ ID NO.2)PCR扩增出来。引物如下:

第一功能区正向引物:

ATGGGTCGCGGATCCGAATTCATGTTCTATGCGGTGAGGAG SEQ ID NO.7

第一功能区反向引物:

GAACTCCTTATCGTCATCAAAGGCCCAGGCCTCATCTT SEQ ID NO.8

第二功能区正向引物:

GATGACGATAAGGAGTTCGCAACTTCAACTAAAAAATTACA SEQ ID NO.9

第二功能区反向引物:

GGTGGTGGTGGTGGTGCTCGAGTTATTGACCTGAATCAGCGTTGTC SEQ ID NO.10

⑵用桥式PCR的方式将两个DNA片段扩增成一个片段,即先用第一功能区的正向引物和反向引物扩增出第一功能区,以及第二功能区的正向引物和反向引物扩增出第二功能区;再以第一功能区的PCR产物和第二功能区的PCR产物为模板,用第一功能区的正向引物和第二功能区的反向引物扩增出第一功能区和第二功能区的拼接片段。

克隆第一功能区(模板序列来源:NCBI Reference Sequence:NM_011275.3):

PCR反应体系(50μL)(所用酶KOD-Plus Toyobo Cat#KOD-201):

10×KOD Plus Buffer 5μL,dNTP 4μL,Mg2SO4 2μL,F+R Primer(10mM)2μL,template 1μL (500ng),KOD Plus 1μL,ddH2O 35μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸15s;68℃,延伸5min; 12℃保存;共35个循环。

克隆第二功能区(模板序列来源:GenBank:V01281.1):

PCR反应体系:

10×KOD Plus Buffer 5μL,dNTP 4μL,25mM Mg2SO4 2μL,F+R Primer(10mM)2μL,template 1μL(500ng),KOD-Plus 1μL,ddH2O 35μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸30s;68℃,延伸5min;12℃保存;共35个循环。

1%琼脂糖凝胶电泳检测PCR产物,Biospin Gel Extraction Kit胶回收试剂盒(BIO FLUX, Cat#BSC02M1))回收目的片段。

桥式PCR反应体系:

10×KOD Plus Buffer 5μL,dNTP 4μL,25mM Mg2SO4 2μL,F+R Primer(10mM)2μL,template 2μL(两功能片段摩尔比1:1),KOD-Plus 1μL,ddH2O 34μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸40s;68℃,延伸5min;12℃保存,共35个循环。

1%琼脂糖凝胶电泳检测PCR产物,Biospin Gel Extraction Kit胶回收试剂盒(BIO FLUX,

Cat#BSC02M1))回收目的片段。

(3)将片段克隆进表达载体pET-28a,如图1所示。

采用同源重组的方式,反应体系:

pET-28a((EcoRI+Xhol双酶切产物)20ng;⑵中回收得到的目的片段60ng;5×Ligation-Free Cloning 2μL(ABM);ddH2O补至10μL,冰浴30min。将同源重组产物转化至DH5α(Trans) 中。

⑷Sanger测序确保载体序列的完整性。

单克隆以T7promoter单向测序。

2、HBD-MNase融合蛋白的表达和纯化

⑴将测序正确的HBD-MNase融合蛋白表达质粒转入BL21(DE3)表达菌株中。

⑵在含有卡那霉素的LB培养基中接种一个表达HBD-MNase融合蛋白的单克隆菌株,37℃,220rpm,过夜培养。

⑶将⑵中的培养物接种到100mL的LB培养基中,37℃,220rpm,培养3h至OD=0.6-0.8。⑷将⑶中的培养瓶置于4℃冰箱15min,加入IPTG使其终浓度为0.5mM。

⑸20℃,160rpm,培养2h,收集菌体,超声或高压破碎得到蛋白溶液。

⑹将⑸中得到的蛋白溶液4℃离心机,13000g离心30min,上清得到的蛋白溶液使用PEI (终浓度0.05%)沉淀细菌基因组,于4℃离心机13000g离心30min,上清用0.45μm滤头过滤。

⑺采用Ni柱亲和纯化(Ni-NTA 1ml Pre-Packed Gravity Column生工Cat#C600791-0010) 首先平衡镍柱,待Ni柱中Buffer流完后,加入预冷的20mM imidazole(在50mM Tris-HCl,pH=7.5,0.8M NaCl,0.2%Triton X-100和10%glycerol中配制)平衡镍柱。之后,蛋白溶液重复上柱5次,再用150mL预冷的20mM imidazole分多次洗柱洗去未结合的蛋白,再用10mL 50mM imidazole洗柱,最后用5mL预冷的300mM imidazole 洗脱目的蛋白。洗脱得到的目的蛋白在透析液(20mM Tris-HCl,pH=7.5,150mM NaCl, 10%glycerol)中,4℃过夜透析。用10kDa蛋白浓缩柱浓缩HBD-MNase,浓缩后BCA 法检测蛋白浓度,同时Qubit检测残留的细菌基因组(基因组残留量控制在小于0.5ng/ μL)。

纯化后的蛋白进行SDS-PAGE及考马斯亮蓝染色如图3所示。FT表示上柱蛋白流穿液, imidazole表示不同浓度咪唑洗脱液的洗脱产物(50mM imidazole表示洗去非特异性或者结合不强的蛋白,300mM imidazole表示最终洗脱下来的目的蛋白溶液),M表示蛋白质marker,同时在300mM imidazole泳道里红色星号标注条带即为纯化到的目的蛋白产物。所述 HBD-MNase融合蛋白的氨基酸序列如SEQ ID NO.5所示。本领域的技术人员也可以根据其具备的常识,在SEQ ID NO.5所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列,实现所述HBD-Tn5融合蛋白的功能。

实施例2 HBD-Tn5融合蛋白的设计、表达和纯化

1、构建HBD-Tn5融合蛋白表达载体

⑴用引物分别将第一功能区(SEQ ID NO.1)和第二功能区(SEQ ID NO.3)PCR扩增出来。引物如下:

第一功能区正向引物:

ATGGGTCGCGGATCCGAATTCATGTTCTATGCGGTGAGGAG SEQ ID NO.7

第一功能区反向引物:

GGCTTTAGCCGCTGCCTCCTTTGCGGCAGCAAAGGCCCAGGCCTCATCTT SEQ ID NO.11

第二功能区正向引物:

GCTGCCGCAAAGGAGGCAGCGGCTAAAGCCATGATTACCAGTGCACTGCA SEQ ID NO.12

第二功能区反向引物:

GGTGGTGGTGGTGGTGCTCGAGTTAGATTTTAATGCCCTGCGCCATC SEQ ID NO.13

⑵用桥式PCR的方式将两个DNA片段扩增成一个片段,即先用第一功能区的正向引物和反向引物扩增出第一功能区,以及第二功能区的正向引物和反向引物扩增出第二功能区;再以第一功能区的PCR产物和第二功能区的PCR产物为模板,用第一功能区的正向引物和第二功能区的反向引物扩增出第一功能区和第二功能区的拼接片段。

克隆第一功能区:

PCR反应体系(50μL)模板序列来源:NCBI Reference Sequence:NM_011275.3: 10×KOD Plus Buffer 5μL,dNTP 4μL,25mM Mg2SO4 2μL,F+R Primer(10mM)2μL, template1μL(500ng),KOD Plus 1μL,ddH2O 35μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸15s;68℃,延伸5min;12℃保存,共35个循环。

克隆第二功能区:

PCR反应体系:

10×KOD Plus Buffer 5μL,dNTP 4μL,25mM Mg2SO4 2μL,F+R Primer(10mM)2μL,template 1μL(500ng),KOD-Plus 1μL,ddH2O 35μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸1min30s;68℃,延伸5min;12℃保存,共35个循环。

1%琼脂糖凝胶电泳检测PCR产物,Biospin Gel Extraction Kit胶回收试剂盒(BIO FLUX, Cat#BSC02M1))回收目的片段。

桥式PCR反应体系(所用酶KOD-Plus Toyobo Cat#KOD-201):

10×KOD Plus Buffer 5μL,dNTP 4μL,25mM Mg2SO4 2μL,F+R Primer(10mM)2μL,template 2μL(两功能片段摩尔比1:1),KOD-Plus 1μL,ddH2O 34μL;

程序:95℃,预变性3min;95℃,变性30s;60℃,退火30s;68℃延伸1min 45s;68℃,延伸5min;12℃保存,共35个循环。

1%琼脂糖凝胶电泳检测PCR产物,Biospin Gel Extraction Kit胶回收试剂盒(BIO FLUX, Cat#BSC02M1))回收目的片段。

⑶将片段克隆进表达载体pET-28a,如图2所示。

采用同源重组的方式,反应体系:

pET-28a(EcoRI+Xhol双酶切产物)20ng;⑵中回收得到的目的片段60ng;5×Ligation-Free Cloning 2μL(ABM);ddH2O补至10μL,冰浴30min。将同源重组产物转化至DH5α(TransGen) 中。

⑷Sanger测序确保载体序列的完整性。

单克隆以T7promoter和T7terminator双向测序。

2、HBD-Tn5融合蛋白的表达和纯化

⑴将测序正确的HBD-Tn5融合蛋白表达质粒转入BL21(DE3)表达菌株中。

⑵在含有卡那霉素的LB培养基中接种一个表达HBD-Tn5融合蛋白的单克隆菌株,37℃, 220rpm,过夜培养。

⑶将⑵中的培养物接种到100mL的LB培养基中,37℃,220rpm,培养3h至OD=0.6-0.8。

⑷将⑶中的培养瓶置于4℃冰箱15min,加入IPTG使其终浓度为0.5mM。

⑸37℃,160rpm,培养2h,收集菌体,超声或高压破碎,得到蛋白溶液。

⑹将⑸中得到的蛋白溶液4℃离心机,13000g离心30min,上清得到的蛋白溶液使用PEI(终浓度0.05%)沉淀细菌基因组,4℃离心机13000g离心30min,0.45μm滤头过滤。

⑺采用Ni柱亲和纯化

首先平衡镍柱,待Ni柱中Buffer流完后,再加入预冷的20mM imidazole(在50mMTris-HCl,PH=7.5,0.8M NaCl,0.2%Triton X-100和10%glycerol中配制)平衡镍柱。之后,蛋白重复上柱5次上柱,用150mL预冷的20mM imidazole分多次洗柱,再用10mL 35 mMimidazole洗柱,最后用5mL预冷的300mM imidazole洗脱蛋白。洗脱得到的蛋白直接在buffer(20mM Tris-HCl,PH=7.5,150mM NaCl,10%glycerol)中,4℃过夜透析。用 30kDa蛋白浓缩柱浓缩HBD-Tn5,浓缩后BCA法检测蛋白浓度,同时Qubit检测残留的细菌基因组(基因组残留量控制在小于0.5ng/μL)。

纯化后的蛋白进行SDS-PAGE及考马斯亮蓝染色如图4所示。泳道FT表示流穿液,imidazole表示不同浓度咪唑洗脱液的洗脱产物(35mM imidazole表示洗去未结合的蛋白,300 mM imidazole表示最终洗脱下来的目的蛋白溶液),M表示蛋白质marker,同时在300mMimidazole泳道里红色星号标注条带即为纯化到的目的蛋白产物。

所述HBD-Tn5融合蛋白的氨基酸序列如SEQ ID NO.6所示。本领域的技术人员也可以根据其具备的常识,在SEQ ID NO.6所示序列基础上经取代、缺失或增加一个或多个氨基酸,且具有相同功能的氨基酸序列,实现所述HBD-Tn5融合蛋白的功能。

实施例3 HBD-MNase活性检测

将不同量的HBD-MNase(投入量如图5所示)与550ng基因组DNA混合,加入Ca2+使其终浓度为10mM,冰浴反应10min。琼脂糖凝胶电泳检测显示HBD-MNase可将基因组 DNA酶切成100bp大小的DNA片段,结果如图5所示:在相同基因组的投入量下(550ng),随着本发明融合蛋白HBD-MNase投入量的增加(从0ng增加到578.4ng),可以明显看到基因组条带逐渐变窄甚至消失,同时在泳道的下方会出现逐渐增多弥散的基因组,体外酶切基因的结果显示,本发明的融合蛋白HBD-MNase有较高酶活。

实施例4 HBD-Tn5活性检测

将15pmol的HBD-Tn5与200ng基因组DNA混合,加入Mg2+使其终浓度为10mM, 55℃反应10min,并进行琼脂糖凝胶电泳检测,如图6所示:与不加HBD-Tn5处理的对照组相比,HBD-Tn5的加入可以有效打断基因组DNA,使明显的基因组条带消失,并在泳道下方出现弥散的基因组分布,且片段分布大部分均在1000bp以下,体外酶切基因组实验证实,本发明的融合蛋白HBD-Tn5有较高酶活。

实施例5

将本发明所得HBD-MNase和HBD-Tn5分别应用于自然状态下,非交联的细胞中,进行原位检测R-loop,检测方法包括以下步骤:

⑴收集100000个体外培养的HEK 293T细胞,用PBS(PH=7.2)洗一遍,600g室温离心3 min,去上清,200μL wash buffer(10mM HEPES(4-羟乙基哌嗪乙磺酸),150mM NaCl,0.5mM spermidine(亚精胺);5%Digitonin。)洗一遍;

⑵8μL Con A beads(Bangslabs)经binding buffer(10mM HEPES,10mM KCl,1mMCaCl2,1mM MnCl2)清洗后与⑴中细胞混合孵育15min,4℃离心机100g瞬离,弃上清(磁力架),100μL wash buffer中加入融合蛋白HBD-MNase或HBD-Tn5终浓度为1μM,5%Digitonin(洋地黄皂苷),1μL PIC(100×),4℃孵育2~12h;

⑶200μL wash buffer洗三次,洗去多余蛋白,4℃离心机100g瞬离,弃上清(磁力架);

⑷加入10mM Ca2+或Mg2+激活融合蛋白HBD-MNase或HBD-Tn5切割DNA(R-mapping,其中融合蛋白HBD-MNase反应条件为:0±0.5℃反应30min,融合蛋白HBD-Tn5反应条件为37~55℃反应1h);

⑸加入10mM EDTA终止切割反应后,酚:氯仿:异戊醇提取DNA;

⑹基于HBD-MNase(R-mapping)的建库,将抽提得到的基因组片段,进行末端修复并连接上adapter(Vazyme VAHTS Adapter-S for illumina),并进行PCR建库(Vazymeindex for illumina)。

PCR体系:24μL DNA,1μL i5(10mM),1μL i7(10mM),10μL 5×KAPA HiFi Fidelitybuffer,1μL KAPA HiFi hot start,11.5μL ddH2O,1.5μL dNTP;共50μL。

程序:98℃,预变性45s;98℃,变性15s;60℃,退火30s;72℃,延伸1min;72℃,总延伸1min,12℃,保存,共13个循环;建库产物进行illumina测序。

⑺基于HBD-Tn5(R-mapping)的建库,将纯化得到的基因组进行PCR建库(Vazymeindex for illumina)。

PCR体系:23μL DNA,1μL i5(10mM),1μL i7(10mM),25μL 2×Mix buffer (NEBCat#M0541S);程序:72℃,5min;98℃,预变性30s;98℃,变性15s;60℃,退火30s;72℃,延伸1min;72℃,总延伸5min,16℃,保存,共13个循环;将建库产物进行illumina测序。

本申请融合蛋白用于检测的生物样本可包括但不限于未经交联、固定或冷冻/经过交联、固定或冷冻处理的培养细胞样本、组织样本或其他生物样本。

PCR建库可运用采用市场上现有的试剂盒或方法得到DNA后,用其他的聚合酶,包括等温聚合酶及其他具有链置换特性的聚合酶,RNA或DNA依赖的聚合酶用于PCR扩增及建库。

如图7,8所示:将本发明中的融合蛋白HBD-MNase和HBD-Tn5应用于原位检测 R-loop(R-mapping)所得结果与传统的检测R-loop的方法DRIP-seq(R-loop formation is adistinctive characteristic of unmethylated human CpG island promoters.Ginnoet al.,Mol Cell. 2012Mar 30;45(6):814-25)的结果进行比较。

如图7所示:在相对较少的细胞量下,本发明基于HBD-MNase的R-mapping能捕捉到DRIP-seq相同的阳性信号,且本发明在基因座上的peak信号更集中,DRIP-seq信号相对比较分散,同时本发明R-mapping检测方法信号值也更高,表明本发明(基于融合蛋白 HBD-MNase的R-mapping)相比于传统方法有效提高了信噪比(图7上)。同时track图也显示本发明可以检测到DRIP-seq无法捕捉的信号(图7中),且本发明特异检测到的信号经 RNase H处理后能被消解(图7下),表明是真实的R-loop,证实本发明R-mapping检测方法相对于传统方法,能有效实现对R-loop的准确捕捉;

本发明基于HBD-Tn5融合蛋白的应用,不仅细胞量消耗少,且基于Tn5切割基因组后直接连接adapter的特性然后PCR建库,可以将建库时间大大缩短到半个小时内。

如图8所示:本发明基于HBD-Tn5融合蛋白的R-mapping应用在自然状态非交联细胞中原位检测R-loop(图8上)和传统检测R-loop的DRIP-seq(图8下)结果比较分析,运用本发明所述融合蛋白的R-mapping检测方法所得R-loop peak信号更集中,相对更准确,而DRIP-seq信号相对比较分散,同时本发明所得信号值也更高,即与传统DRIP-seq相比,表明本发明所用HBD-Tn5对原位R-loop的检测能有效提高信噪比。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

序列表

<110> 中国科学院广州生物医药与健康研究院

<120> 一种融合蛋白及其应用

<160> 13

<170> SIPOSequenceListing 1.0

<210> 1

<211> 44

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Met Phe Tyr Ala Val Arg Arg Gly Arg Arg Thr Gly Val Phe Leu Ser

1 5 10 15

Trp Ser Glu Cys Lys Ala Gln Val Asp Arg Phe Pro Ala Ala Arg Phe

20 25 30

Lys Lys Phe Ala Thr Glu Asp Glu Ala Trp Ala Phe

35 40

<210> 2

<211> 149

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Ala Thr Ser Thr Lys Lys Leu His Lys Glu Pro Ala Thr Leu Ile Lys

1 5 10 15

Ala Ile Asp Gly Asp Thr Val Lys Leu Met Tyr Lys Gly Gln Pro Met

20 25 30

Thr Phe Arg Leu Leu Leu Val Asp Thr Pro Glu Thr Lys His Pro Lys

35 40 45

Lys Gly Val Glu Lys Tyr Gly Pro Glu Ala Ser Ala Phe Thr Lys Lys

50 55 60

Met Val Glu Asn Ala Lys Lys Ile Glu Val Glu Phe Asp Lys Gly Gln

65 70 75 80

Arg Thr Asp Lys Tyr Gly Arg Gly Leu Ala Tyr Ile Tyr Ala Asp Gly

85 90 95

Lys Met Val Asn Glu Ala Leu Val Arg Gln Gly Leu Ala Lys Val Ala

100 105 110

Tyr Val Tyr Lys Pro Asn Asn Thr His Glu Gln His Leu Arg Lys Ser

115 120 125

Glu Ala Gln Ala Lys Lys Glu Lys Leu Asn Ile Trp Ser Glu Asp Asn

130 135 140

Ala Asp Ser Gly Gln

145

<210> 3

<211> 476

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val

1 5 10 15

Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val

20 25 30

Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile

35 40 45

Ser Ser Glu Gly Ser Lys Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile

50 55 60

Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met

65 70 75 80

Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu

85 90 95

Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly

100 105 110

Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser

115 120 125

Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His

130 135 140

Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys

145 150 155 160

Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met

165 170 175

Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp

180 185 190

Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val

195 200 205

Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu

210 215 220

Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser

225 230 235 240

Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg

245 250 255

Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu

260 265 270

Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn

275 280 285

Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu

290 295 300

Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr

305 310 315 320

His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala

325 330 335

Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met

340 345 350

Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu

355 360 365

Ser Phe Thr Pro Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu

370 375 380

Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp

385 390 395 400

Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys

405 410 415

Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu

420 425 430

Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala

435 440 445

Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu

450 455 460

Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile

465 470 475

<210> 4

<211> 11

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 4

Asp Asp Asp Lys Glu Phe Gly Gly Gly Gly Ser

1 5 10

<210> 5

<211> 204

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 5

Met Phe Tyr Ala Val Arg Arg Gly Arg Arg Thr Gly Val Phe Leu Ser

1 5 10 15

Trp Ser Glu Cys Lys Ala Gln Val Asp Arg Phe Pro Ala Ala Arg Phe

20 25 30

Lys Lys Phe Ala Thr Glu Asp Glu Ala Trp Ala Phe Asp Asp Asp Lys

35 40 45

Glu Phe Gly Gly Gly Gly Ser Ala Thr Ser Thr Lys Lys Leu His Lys

50 55 60

Glu Pro Ala Thr Leu Ile Lys Ala Ile Asp Gly Asp Thr Val Lys Leu

65 70 75 80

Met Tyr Lys Gly Gln Pro Met Thr Phe Arg Leu Leu Leu Val Asp Thr

85 90 95

Pro Glu Thr Lys His Pro Lys Lys Gly Val Glu Lys Tyr Gly Pro Glu

100 105 110

Ala Ser Ala Phe Thr Lys Lys Met Val Glu Asn Ala Lys Lys Ile Glu

115 120 125

Val Glu Phe Asp Lys Gly Gln Arg Thr Asp Lys Tyr Gly Arg Gly Leu

130 135 140

Ala Tyr Ile Tyr Ala Asp Gly Lys Met Val Asn Glu Ala Leu Val Arg

145 150 155 160

Gln Gly Leu Ala Lys Val Ala Tyr Val Tyr Lys Pro Asn Asn Thr His

165 170 175

Glu Gln His Leu Arg Lys Ser Glu Ala Gln Ala Lys Lys Glu Lys Leu

180 185 190

Asn Ile Trp Ser Glu Asp Asn Ala Asp Ser Gly Gln

195 200

<210> 6

<211> 531

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Met Phe Tyr Ala Val Arg Arg Gly Arg Arg Thr Gly Val Phe Leu Ser

1 5 10 15

Trp Ser Glu Cys Lys Ala Gln Val Asp Arg Phe Pro Ala Ala Arg Phe

20 25 30

Lys Lys Phe Ala Thr Glu Asp Glu Ala Trp Ala Phe Asp Asp Asp Lys

35 40 45

Glu Phe Gly Gly Gly Gly Ser Met Ile Thr Ser Ala Leu His Arg Ala

50 55 60

Ala Asp Trp Ala Lys Ser Val Phe Ser Ser Ala Ala Leu Gly Asp Pro

65 70 75 80

Arg Arg Thr Ala Arg Leu Val Asn Val Ala Ala Gln Leu Ala Lys Tyr

85 90 95

Ser Gly Lys Ser Ile Thr Ile Ser Ser Glu Gly Ser Lys Ala Met Gln

100 105 110

Glu Gly Ala Tyr Arg Phe Ile Arg Asn Pro Asn Val Ser Ala Glu Ala

115 120 125

Ile Arg Lys Ala Gly Ala Met Gln Thr Val Lys Leu Ala Gln Glu Phe

130 135 140

Pro Glu Leu Leu Ala Ile Glu Asp Thr Thr Ser Leu Ser Tyr Arg His

145 150 155 160

Gln Val Ala Glu Glu Leu Gly Lys Leu Gly Ser Ile Gln Asp Lys Ser

165 170 175

Arg Gly Trp Trp Val His Ser Val Leu Leu Leu Glu Ala Thr Thr Phe

180 185 190

Arg Thr Val Gly Leu Leu His Gln Glu Trp Trp Met Arg Pro Asp Asp

195 200 205

Pro Ala Asp Ala Asp Glu Lys Glu Ser Gly Lys Trp Leu Ala Ala Ala

210 215 220

Ala Thr Ser Arg Leu Arg Met Gly Ser Met Met Ser Asn Val Ile Ala

225 230 235 240

Val Cys Asp Arg Glu Ala Asp Ile His Ala Tyr Leu Gln Asp Lys Leu

245 250 255

Ala His Asn Glu Arg Phe Val Val Arg Ser Lys His Pro Arg Lys Asp

260 265 270

Val Glu Ser Gly Leu Tyr Leu Tyr Asp His Leu Lys Asn Gln Pro Glu

275 280 285

Leu Gly Gly Tyr Gln Ile Ser Ile Pro Gln Lys Gly Val Val Asp Lys

290 295 300

Arg Gly Lys Arg Lys Asn Arg Pro Ala Arg Lys Ala Ser Leu Ser Leu

305 310 315 320

Arg Ser Gly Arg Ile Thr Leu Lys Gln Gly Asn Ile Thr Leu Asn Ala

325 330 335

Val Leu Ala Glu Glu Ile Asn Pro Pro Lys Gly Glu Thr Pro Leu Lys

340 345 350

Trp Leu Leu Leu Thr Ser Glu Pro Val Glu Ser Leu Ala Gln Ala Leu

355 360 365

Arg Val Ile Asp Ile Tyr Thr His Arg Trp Arg Ile Glu Glu Phe His

370 375 380

Lys Ala Trp Lys Thr Gly Ala Gly Ala Glu Arg Gln Arg Met Glu Glu

385 390 395 400

Pro Asp Asn Leu Glu Arg Met Val Ser Ile Leu Ser Phe Val Ala Val

405 410 415

Arg Leu Leu Gln Leu Arg Glu Ser Phe Thr Pro Pro Gln Ala Leu Arg

420 425 430

Ala Gln Gly Leu Leu Lys Glu Ala Glu His Val Glu Ser Gln Ser Ala

435 440 445

Glu Thr Val Leu Thr Pro Asp Glu Cys Gln Leu Leu Gly Tyr Leu Asp

450 455 460

Lys Gly Lys Arg Lys Arg Lys Glu Lys Ala Gly Ser Leu Gln Trp Ala

465 470 475 480

Tyr Met Ala Ile Ala Arg Leu Gly Gly Phe Met Asp Ser Lys Arg Thr

485 490 495

Gly Ile Ala Ser Trp Gly Ala Leu Trp Glu Gly Trp Glu Ala Leu Gln

500 505 510

Ser Lys Leu Asp Gly Phe Leu Ala Ala Lys Asp Leu Met Ala Gln Gly

515 520 525

Ile Lys Ile

530

<210> 7

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atgggtcgcg gatccgaatt catgttctat gcggtgagga g 41

<210> 8

<211> 38

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gaactcctta tcgtcatcaa aggcccaggc ctcatctt 38

<210> 9

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gatgacgata aggagttcgc aacttcaact aaaaaattac a 41

<210> 10

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggtggtggtg gtggtgctcg agttattgac ctgaatcagc gttgtc 46

<210> 11

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ggctttagcc gctgcctcct ttgcggcagc aaaggcccag gcctcatctt 50

<210> 12

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

gctgccgcaa aggaggcagc ggctaaagcc atgattacca gtgcactgca 50

<210> 13

<211> 47

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ggtggtggtg gtggtgctcg agttagattt taatgccctg cgccatc 47

25页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种埃博拉病毒包膜糖蛋白的优势表位肽、其编码基因及应用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!