由两个CsgG孔组成的跨膜孔

文档序号:1661312 发布日期:2019-12-27 浏览:25次 >En<

阅读说明:本技术 由两个CsgG孔组成的跨膜孔 (Transmembrane pore composed of two CsgG pores ) 是由 拉科马·尼尚萨·贾亚辛格 伊丽莎白·杰恩·*** 普拉提克·拉吉·辛格 理查德·乔治·汉布利 于 2018-05-03 设计创作,主要内容包括:提供一种使用跨膜孔表征聚核苷酸的方法,其中所述孔是包含第一CsgG孔或其同源物和第二CsgG孔或其同源物的双孔。(A method of characterising a polynucleotide using a transmembrane pore is provided, wherein the pore is a double pore comprising a first CsgG pore or homologue thereof and a second CsgG pore or homologue thereof.)

由两个CsgG孔组成的跨膜孔

技术领域

本发明涉及CsgG孔和使用CsgG孔的分析物检测和表征的方法。

背景技术

纳米孔感测是一种依赖于观测分析物分子与受体之间的个别结合或相互作用事件的感测方法。可通过在绝缘膜中放置纳米尺寸单孔和测量在分析物分子存在下通过孔的电压驱动的离子转运来产生纳米孔传感器。通过分析物的独特电流标志来揭露分析物的特性,值得注意的是,电流块的持续时间和程度以及电流电平的变化。这些纳米孔传感器是可商购的,例如由牛津纳米孔技术有限公司(Oxford Nanopore Technologies Ltd)销售的MinIONTM装置,其包含与电子芯片集成的纳米孔阵列。纳米孔感测具有通过降低核苷酸和所需的试剂的数量来提供快速且廉价的核酸测序的潜能。

使用纳米孔感测进行核酸测序的两个基本组分是(1)控制通过孔的核酸移动和(2)在核酸聚合物通过孔移动时鉴别核苷酸。

CsgG是来自已被提出用作用于检测和表征分析物的纳米孔的大肠杆菌(Escherichia coli)的孔。还公开了在这种情形下改善孔的特性的突变到野生型CgG孔(WO2016/034591)。

发明内容

发明人已证实,由两个串联的CsgG孔组成的双孔可用于检测和表征分析物,例如聚核苷酸。双孔可特别用于促进含有至少一个均聚延伸段,即相同核苷酸的几个连续拷贝的聚核苷酸的表征。提供这些双孔,作为可用于产生用于这些方法中的双孔的新型单体。单体包含在组装成双孔时增强两个孔之间的相互作用的氨基酸残基;在两个孔之间的连接处抑制离子离开孔的氨基酸残基;促进带负电的分析物(例如聚核苷酸)与孔的桶形区域中的一个或两个和/或氨基酸残基的相互作用的氨基酸残基,所述氨基酸残基增加了双孔的两个最窄部分中一个或两个,即双孔的桶形中的收缩部的长度。还提供了包含新型单体的CsgG孔和这些孔在表征分析物的方法中的用途。

以前,CsgG孔中的几个突变使读取器的头更加尖锐,以便使用可用的算法和分析工具准确地调用碱基。算法和分析工具的进步意味着,我们不再局限于尖锐的读取器头。本发明人已经认识到,新算法可以处理更长的读取器头,所述读取器头可提供在短而尖锐的读取器头中可能缺少的额外信息。因此,本发明人认识到,CsgG收缩部延长了读取器头。这也可能有助于调用具有更好准确性的均聚物。

特定来说,提供以下:

-一种使用跨膜孔表征聚核苷酸的方法,其中所述孔是包含第一CsgG孔或其同源物和第二CsgG孔或其同源物的双孔。

-一种双孔,其包含第一CsgG孔或其同源物和第二CsgG孔或其同源物,其中:

(i)所述第一CsgG孔或其同源物是同源寡聚物,且所述第二CsgG孔或其同源物是同源寡聚物,并且所述第一CsgG孔或其同源物包含具有与所述第二CsgG孔或其同源物所包含的单体不同的氨基酸序列的单体;

(ii)所述第一CsgG孔或其同源物是同源寡聚物,且所述第二CsgG孔或其同源物是同源寡聚物,并且所述第一CsgG孔或其同源物和/或所述第二CsgG孔或其同源物不是野生型孔;

(iii)所述第一CsgG孔或其同源物是异源寡聚物,且所述第二CsgG孔或其同源物是同源寡聚物;

(iv)所述第一CsgG孔或其同源物是同源寡聚物,且所述第二CsgG孔或其同源物是异源寡聚物;或

(v)所述第一CsgG孔或其同源物是异源寡聚物,且所述第二CsgG孔或其同源物是异源寡聚物。

-一种CsgG单体或CsgG同源物的单体,其包含:

(i)在对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和或L113的位置处的半胱氨酸残基;

(ii)在对应于SEQ ID NO:2的R97、Q100、I107、R110、E101、N102和L113中的任何一个或多个的位置处的残基,所述残基比存在于SEQ ID NO:2的对应位置处或野生型CsgG同源物的氨基酸序列中的残基更具疏水性,其中对应于R97和/或I107的所述位置处的所述残基是M,对应于R110的所述位置处的所述残基是I、L、V、M、W或Y,和/或对应于E101或N102的所述位置处的所述残基是V或M;

(iii)在对应于SEQ ID NO:2的A98、A99、T104、V105、L113、Q114和S115中的任何一个或多个的位置处的残基,所述残基比存在于SEQ ID NO:2的所述对应位置处或野生型CsgG同源物的所述氨基酸序列中的残基更大,其中对应于T104的所述位置处的所述残基是L、M、F、W、Y、N、Q、D或E,对应于L113的所述位置处的所述残基是M、F、W、Y、N、G、D或E,和/或对应于S115的所述位置处的所述残基是M、F、W、Y、N、Q或E;和/或

(iv)在对应于D149、E185、D195、E210和E203中的任何一个或多个的位置处的孔的桶形区域中的残基,所述残基的负电荷小于存在于野生型CsgG单体或野生型CsgG同源物单体中的对应位置处的残基,其中对应于D149、E185、D195和/或E203的所述位置处的所述残基是K。

-一种构筑体,其包含两个或更多个共价连接的CsgG单体,其中所述单体中的至少一个是如本文所公开的单体;

-一种聚核苷酸,其编码如本文所公开的单体或如本文所公开的构筑体。

-一种孔,其包含如本文所公开的至少一个单体或如本文所公开的构筑体。

-一种用于测定目标分析物的是否存在或其一个或多个特征的方法,其包含:使所述目标分析物与如本文所公开的双孔或如本文所公开的孔接触以使得所述目标分析物相对于所述孔移动;在所述分析物相对于所述孔移动时进行一次或多次测量,且从而测定所述分析物是否存在或其一个或多个特征。

-一种如本文所公开的双孔或如本文所公开的孔的用途,其用于测定目标分析物是否存在或其一个或多个特征。

-一种用于表征目标分析物的试剂盒,其包含(a)如本文所公开的双孔或如本文所公开的孔,和(b)膜组分。

-一种用于表征样本中的目标分析物的设备,其在多个膜中包含如本文所公开的双孔阵列或如本文所公开的孔阵列。

-一种生产如本文所公开的单体或如本文所公开的构筑体的方法,其包含在合适宿主细胞中表达如本文所公开的聚核苷酸,且从而生产如本文所公开的单体或如本文所公开的构筑体。

附图说明

图1显示了在尾部到尾部取向上包含两个CsgG孔的双孔的结构。指示两个读取器头。

图2显示了CsgG双孔的壁上的孔洞。本发明人具有表明双孔电流小于单孔电流的一半(在较高电压下)的所产生的数据。本发明人提出这可能是由于电流从两个孔的界面处的侧袋泄漏造成的。可通过将这个区域中的一个或多个氨基酸残基改变为更大的氨基酸残基来填补这些间隙。

图3显示了双孔(二聚体)中两个CsgG孔之间的界面的部分的结构。突变显示在包含Y51A和F56Q突变的孔中(AQ=CP1-(WT-Y51A/F56Q-StrepII(C))9)。所指示的Cys突变体对可形成S-S键。

图4显示了双孔的部分的结构,其中单链DNA分子***孔中。两个收缩部(读取器头)之间存在大约15个核苷酸。两个读取器头由非DNA相互作用区域间隔开。

图5A显示了CsgG孔的横截面,所述CsgG孔显示了***单链DNA的收缩部(读取器头)。

图5B显示了野生型CsgG孔的横截面,其中指示了三个主要氨基酸残基F56(红色)、N55(蓝色)和Y51(绿色)。收缩部以相对非结构化的环位于桶内(在顶部处)。可以通过在现有位置处进行突变或通过***额外氨基酸残基来延长读取器头。举例来说,可以通过在三个所指示位置中的每一个处进行突变和/或通过在52、53和54位置处进行突变来加宽读取器头。

图5B显示了CsgG孔的单体中从K49到F56的残基的位置。可通过增加在51与55之间的环的长度使51进一步向下移动。可在51与52、52与53、53与54或54与55之间***新的氨基酸残基。举例来说,可***1、2、3或更多个氨基酸残基。为保持环的柔性性质,可***A/S/G/T。为增加扭结,可***环P。新的A氨基酸残基可能有助于信号(例如,S/T/N/Q/M/F/W/Y/V/I)。同样,可以在55与56(1个或2个或更多个)之间***新的氨基酸。其可为以上氨基酸中的任一个。也可通过将氨基酸***到Y51上方的环的两侧使Y51向下移动。举例来说,可以将S或G或SG或SGG或SGS或GS或GSS或GSG或其它合适的氨基酸(1个或2个或更多个)***(i)(49与50)之间和(52与53)之间;(ii)(50与51)之间和(51与52)之间;(iii)1和2的组合;或(iv)(i)到(iii)中的任一个可与其它***(例如,55与56之间的***)组合。

图6显示了用基线孔的尖锐读取器头获得的结果,所述基线孔包含具有SEQ IDNO:2中所示的序列的单体,其中已进行了以下取代:Y51A;F56Q;K94Q;R97W;和R192D,且其中V105到I107已缺失。Y51A和F56Q锐化读取器头。A.碱基相对于读取器头位置的鉴别。当主要电流电平贡献在读取器头内接近5个碱基时,中间碱基(第3个)显示对信号的主要贡献,而第1个、第2个、第4个和第5个碱基以相对较低的水平贡献(第1个碱基朝向孔的反侧且第5个碱基朝向孔的顺侧)。B.当主要电流电平贡献在读取器头内接近5个碱基时,在每个读取器头位置处分离四个核苷酸。C.来自基线孔的实例波浪线。

图7显示了使用含有额外的N55V取代的基线孔的较宽读取器头获得的结果。A.碱基相对于读取器头位置的鉴别。当主要电流电平贡献在读取器头内接近5个碱基时,第3个和第4个碱基显示对信号的主要贡献,而第1个、第2个和第5个碱基以相对较低的水平贡献(第1个碱基朝向反侧且第5个碱基朝向顺侧)。B.当主要电流电平贡献在读取器头内接近5个碱基时,在每个读取器头位置处分离四个核苷酸。C.来自N55V孔的实例波浪线。

图8显示了使用含有A51Q取代的基线孔的较宽读取器头获得的结果。A.碱基相对于读取器头位置的鉴别。当主要电流电平贡献在读取器头内接近5个碱基时,第2个和第3个碱基显示对信号的主要贡献,而第1个、第4个和第5个碱基以相对较低的水平贡献(第1个碱基朝向孔的反侧且第5个碱基朝向孔的顺侧)。B.当主要电流电平贡献在读取器头内接近5个碱基时,在每个读取器头位置处分离四个核苷酸。C.来自A51Q孔的实例波浪线。

图9显示了使用含有Q56V取代的基线孔的较宽读取器头获得的结果。A.碱基相对于读取器头位置的鉴别。当主要电流电平贡献在读取器头内接近5个碱基时,第2个和第3个碱基显示对信号的主要贡献,而第1个、第4个和第5个碱基以相对较低的水平贡献(第1个碱基朝向孔的反侧且第5个碱基朝向孔的顺侧)。B.当主要电流电平贡献在读取器头内接近5个碱基时,在每个读取器头位置处分离四个核苷酸。C.来自Q56V孔的实例波浪线。

图10A是基线孔(图6)与N55V孔(图7)之间的碱基相对于读取器头位置的鉴别的比较。

图10B是使用基线孔(图6)和N55V孔(图7)产生的实例波浪线的比较,且显示突变体将向基线提供不同的波浪线。

图11示出了在实施例(A)中使用的基线CsgG孔的结构和读取器头,具有延长的读取器头的CsgG孔(B)和双CsgG孔(C)。当使用延长的读取器头孔或双孔时,与基线相比,改善了均聚物碱基判读。

图12显示了具有SEQ ID No 2到7和9到23中所示的氨基酸序列的21个CsgG同源物的序列比对。比对中不包括SEQ ID NO:2、3、5、6、7、9和10中的每一个的C末端丝氨酸(S)。

图13显示与图12相同的相对序列比对,其中所预测的α螺旋二级结构区另外加阴影。

图14显示与图12相同的相对序列比对,其中所预测的β折叠二级结构区另外加阴影。

序列表描述

SEQ ID NO:1显示来自大肠杆菌菌株。K-12亚株MC4100的编码野生型CsgG单体的密码子优化聚核苷酸序列这个单体不含信号序列。

SEQ ID NO:2显示来自大肠杆菌菌株K-12亚株MC4100的野生型CsgG单体的成熟形式的氨基酸序列。这个单体不含信号序列。对于此使用的缩写为CsgG=CsgG-Eco。

SEQ ID NO:3显示假定蛋白CKO_02032[差异柠檬酸杆菌属(Citrobacter koseri)ATCC BAA-895]的YP_001453594.1:1-248的氨基酸序列,其与SEQ ID NO:2 99%一致。

SEQ ID NO:4显示卷曲生产组合件/转运组分CsgG、部分[肠道沙门氏菌(Salmonella enterica)]的WP_001787128.1:16-238的氨基酸序列,其与SEQ ID NO:298%。

SEQ ID NO:5显示卷曲生产组合件/转运蛋白CsgG[无丙二酸柠檬酸杆菌属(Citrobacter amalonaticus)]的KEY44978.1|:16-277的氨基酸序列,其与SEQ ID NO:298%一致。

SEQ ID NO:6显示卷曲生产组合件/转运组分[鼠柠檬酸杆菌(Citrobacterrodentium)ICC168]的YP_003364699.1:16-277的氨基酸序列,其与SEQ ID NO:2 97%一致。

SEQ ID NO:7显示卷曲生产组合件/转运组分CsgG[阿氏肠杆菌(Enterobacterasburiae)LF7a]的YP_004828099.1:16-277的氨基酸序列,其与SEQ ID NO:2 94%一致。

SEQ ID NO:8显示转运体[雷金斯堡约克氏菌(Yokenella regensburgei)]的WP_006819418.1:19-280的氨基酸序列,其与SEQ ID NO:2 91%一致。

SEQ ID NO:9显示卷曲生产组合件/转运蛋白CsgG[灰尘粘菌(Cronobacterpulveris)]的WP_024556654.1:16-277的氨基酸序列,其与SEQ ID NO:2 89%一致。

SEQ ID NO:10显示卷曲生产组合件/转运蛋白CsgG[水生拉恩菌(Rahnellaaquatilis)HX2]的YP_005400916.1:16-277的氨基酸序列,其与SEQ ID NO:2 84%一致。

SEQ ID NO:11显示CsgG家族卷曲生产组合件/转运组分[抗坏血酸吕克沃尔菌(Kluyvera ascorbata)ATCC 33433]的KFC99297.1:20-278的氨基酸序列,其与SEQ ID NO:2 82%一致。

SEQ ID NO:12显示CsgG家族卷曲生产组合件/转运组分[蜂房哈夫尼菌(Hafniaalvei)ATCC 13337]的KFC86716.1|:16-274的氨基酸序列,其与SEQ ID NO:2 81%一致。

SEQ ID NO:13显示涉及形成卷曲聚合物[肠杆菌科细菌菌株FGI 57]的未定性蛋白质的YP_007340845.1|:16-270的氨基酸序列,其与SEQ ID NO:2 76%一致。

SEQ ID NO:14显示卷曲生产组合件/转运蛋白CsgG[类志贺邻单胞菌(Plesiomonas shigelloides)]的WP_010861740.1:17-274的氨基酸序列,其与SEQ ID NO:2 70%一致。

SEQ ID NO:15显示卷曲生产组合件/转运外膜脂蛋白组分CsgG[费希弧菌(Vibriofischeri)ES114]的YP_205788.1:23-270的氨基酸序列,其与SEQ ID NO:2 60%一致。

SEQ ID NO:16显示卷曲生产组合件蛋白质CsgG[洛伊氏弧菌(Aliivibriologei)]的WP_017023479.1:23-270的氨基酸序列,其与SEQ ID NO:2 59%一致。

SEQ ID NO:17显示卷曲生产组合件/转运组分CsgG[发光杆菌属(Photobacteriumsp.)AK15]的WP_007470398.1:22-275的氨基酸序列,其与SEQ ID NO:2 57%一致。

SEQ ID NO:18显示卷曲生产组合件蛋白质CsgG[维氏气单胞菌(Aeromonasveronii)]的WP_021231638.1:17-277的氨基酸序列,其与SEQ ID NO:2 56%一致。

SEQ ID NO:19显示卷曲生产组合件/转运蛋白CsgG[希瓦氏菌属(Shewanellasp.)ECSMB14101]的WP_033538267.1:27-265的氨基酸序列,其与SEQ ID NO:2 56%一致。

SEQ ID NO:20显示卷曲生产组合件蛋白质CsgG[恶臭假单胞菌(Pseudomonasputida)]的WP_003247972.1:30-262的氨基酸序列,其与SEQ ID NO:2 54%一致。

SEQ ID NO:21显示卷曲生产组合件/转运组分CsgG[堇色希瓦氏菌(Shewanellaviolacea)DSS12]的YP_003557438.1:1-234的氨基酸序列,其与SEQ ID NO:2 53%一致。

SEQ ID NO:22显示卷曲生产组合件/转运蛋白CsgG[詹氏海杆菌(Marinobacterium jannaschii)]的WP_027859066.1:36-280的氨基酸序列,其与SEQ IDNO:2 53%一致。

SEQ ID NO:23显示卷曲生产组合件/转运组分CsgG[生鲜奶金黄杆菌属(Chryseobacterium oranimense)G311]的CEJ70222.1:29-262的氨基酸序列,其与SEQ IDNO:2 50%一致。

SEQ ID NO:24显示了StrepII(C)的氨基酸序列。

SEQ ID NO:25显示了编码多肽Pro-CP1-Eco-(突变体-StrepII(C))的DNA序列。

SEQ ID NO:26显示了多肽Pro-CP1-Eco-(突变体-StrepII(C))的氨基酸序列。

具体实施方式

应理解,所公开的产物和方法的不同应用可根据所属领域的特定需要来调适。还应理解,本文所用的术语仅出于描述特定实施例的目的,并且不打算是限制性的。

另外除非上下文另外明确规定,否则如本说明书和所附权利要求书中所使用,单数形式“一(a/an)”和“所述(the)”包括多个指示物。因此,举例来说,提及“聚核苷酸”包括两个或更多个聚核苷酸;提及“一聚核苷酸结合蛋白”包括两个或更多个此类蛋白质;提及“一解螺旋酶”包括两个或更多个解螺旋酶;提及“一单体”是指两个或更多个单体;提及“一孔”包括两个或更多个孔和其类似物。

在本文的所有论述中,使用标准的针对氨基酸的一个字母代码。这些如下:丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酸(E)、谷氨酰氨(Q)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、亮氨酸(L)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。也使用标准的取代记法,即Q42R意指位置42处的Q被R置换。

在于特定位置处的不同氨基酸通过/符号分隔的本文段落中,/符号意指“或”。举例来说,Q87R/K意指Q87R或Q87K。

在不同位置处通过/符号分隔的本文段落中,/符号意指“和”以使得Y51/N55是Y51和N55。

除非相反地陈述,否则本文所公开的所有氨基酸取代、缺失和/或添加均是参考包含SEQ ID NO:2中所示序列的变异体的突变CsgG单体。

提到包含SEQ ID NO:2中所示序列的变异体的突变CsgG单体,涵盖包含如在如下文所公开的其它SEQ ID NO中陈述的序列变异体的突变CsgG单体。可对包含除SEQ ID NO:2中所示以外的序列的变异体的CsgG单体进行等效于本文所公开的参考包含SEQ ID NO:2中所示序列的变异体的突变CsgG单体的那些取代、缺失和/或添加的氨基酸取代、缺失和/或添加。

本文中(不论上文或下文)所列举的所有公开、专利和专利申请均以全文引用的方式并入本文中。

双孔

提供一种双孔,其包含第一CsgG孔或其同源物和第二CsgG孔或其同源物。

双孔可包含第一CsgG孔或其同源物,其为同源寡聚物,和第二CsgG孔或其同源物,其为同源寡聚物,其中第一CsgG孔或其同源物包含具有与第二CsgG孔或其同源物所包含的单体不同的氨基酸序列的单体。

双孔可包含第一CsgG孔或其同源物,其为同源寡聚物,和第二CsgG孔或其同源物,其为同源寡聚物,其中第一CsgG孔或其同源物和/或第二CsgG孔或其同源物包含含有非天然存在的氨基酸序列的单体,即其中第一孔和/或第二孔的序列不是野生型序列。

双孔可包含第一CsgG孔或其同源物,其为异源寡聚物,和第二CsgG孔或其同源物,其为同源寡聚物。

双孔可包含第一CsgG孔或其同源物,其为同源寡聚物,和第二CsgG孔或其同源物,其为异源寡聚物。

双孔可包含第一CsgG孔或其同源物,其为异源寡聚物,和第二CsgG孔或其同源物,其为异源寡聚物。

同源寡聚物可含有任何数量的具有相同氨基酸序列的单体。同源寡聚物通常包含至少7个、至少8个、至少9个或至少10个相同的突变单体,例如7个、8个、9个或10个突变单体。同源寡聚物优选地包含八个或九个相同的单体。一个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个或10个单体可如本文所论述进行化学修饰。同源寡聚物可包含修饰的单体中的任一个,例如本发明的单体或野生型单体。单体可以具有SEQ ID NO:2至23中的任一个中所示的氨基酸序列,或可以是这些序列中的任一个的变异体。变异体可以具有本文所描述的突变中的任何一个或多个。当同源寡聚物包含野生型单体时,本文所提供的双孔仅包含一种这类同源寡聚物。同源寡聚物可在双孔中与不同的同源寡聚物配对,其可包含野生型或突变单体,例如修饰的单体,例如本发明的单体。同源寡聚物可在双孔中与异源寡聚物配对。

异源寡聚物可含有足以形成孔的任何数量的单体。孔通常包含至少7个、至少8个、至少9个或至少10个单体,例如7个、8个、9个或10个单体。孔优选地包含八个或九个单体。异源寡聚物可包含2个、3个、4个、5个、6个、7个、8个、9个或10个不同的单体。异源寡聚物中的单体中的至少一个彼此不同。异源寡聚物中的所有单体可以彼此不同。举例来说,每个单体可包含不同的突变或一组突变。

异源寡聚物可包含至少一个修饰的单体,例如本发明的单体。所有单体(例如10个、9个、8个或7个单体)可为本发明的单体,其中所述单体中的至少一个彼此不同。举例来说,异源寡聚物可包含八个或九个本发明的单体,其中其中的至少一个彼此不同。其所有可彼此不同。

单体中的至少一个可不为本发明的单体。举例来说,异源寡聚物中的单体中的至少一个可为突变单体,其包含除存在于本发明的单体中的突变之外的突变。合适的突变单体是所属领域中已知的,例如在WO2016/034591、PCT/GB2017/050569、PCT/GB2017/050570和PCT/GB2017/050571中。WO2016/034591、PCT/GB2017/050569、PCT/GB2017/050570和PCT/GB2017/050571中公开的突变单体并入本文中。

从1、2、3、4、5、6、7、8、9或10个单体开始,孔中的任何数量的单体可不为本发明的单体。构成本发明的双孔的孔中的至少一个中的所有单体可不为本发明的单体。异源寡聚物优选地是九聚体,其包含七个或八个可相同或不同的本发明的单体和一个或两个不为本发明的单体的单体,或是八聚体,其包含六个或七个可相同或不同的本发明的单体和一个或两个不为本发明的单体的单体。

异源寡聚物可包含大致相等数量的第一单体和第二单体,例如一个5个且另一个4个,每个4个,或一个3个且另一个4个。第一单体和第二单体可以是不同的修饰的单体,例如本发明的不同单体,第一单体和第二单体中的仅一个可以是本发明的单体,或者第一单体和第二单体都可以是不为本发明的单体的单体。

异源寡聚物中的单体优选地是大致相同的长度或是相同的长度。孔中的本发明的单体的桶优选地是大致相同的长度或是相同的长度。长度可以氨基酸的数量和/或长度的单位的形式进行测量。

孔可包含不是本发明的单体的一个或多个单体。不为本发明的单体的CsgG单体和CsgG同源物的单体包括野生型单体,其包含SEQ ID NO:2中或SEQ ID NO:3到24中的任一个中所示的氨基酸序列。也可使用SEQ ID NO:2到23的变异体。以氨基酸一致性计,这些变异体在其整个序列内通常与SEQ ID NO:2到23中的一个或多个至少50%同源。更优选地,以氨基酸一致性计,变异体可以在整个序列内可与SEQ ID NO:2到23中的任何一个的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%并且更优选地至少95%、97%或99%同源。

一个或多个,例如2个、3个、4个、5个、6个、7个、8个、9个或10个单体可进行化学修饰。

双孔中的第一孔和第二孔通常都包含相同数量的单体。举例来说,当第一孔是九聚体时,第二孔通常也是九聚体。双孔可包含两个孔,每个孔包含2个、3个、4个、5个、6个、7个、8个、9个或10个单体,优选为7个、8个或10个单体,更优选为9个单体。

双孔通常是跨膜孔。双孔可以与膜相关联,使得第一孔和第二孔形成穿过膜的连续通道。通常,存在于双孔中的第一孔穿过膜,而第二孔位于膜的顺侧或反侧。在这个实施方例中,通常将第一孔的桶***膜中,且使第一孔的尾部从膜突出。第一孔和第二孔可以在相反的方向上取向。第一CsgG孔或其同源物的尾部区域可与第二CsgG孔或其同源物的尾部区域相邻。第一孔的尾部通常与第二孔的尾部缔合。

在双孔中,第一CsgG孔或其同源物可通过疏水相互作用和/或通过一个或多个二硫键连接到第二CsgG孔或其同源物。第一孔和/或第二孔中的一个或多个,例如2个、3个、4个、5个、6个、8个、9个,例如所有的单体可以被修饰以增强这种相互作用。这可以以任何合适的方式来实现。

在第一孔与第二孔之间的界面处的第一孔的氨基酸序列中的至少一个半胱氨酸残基可二硫键结到第一孔与第二孔之间的界面处与第二孔的氨基酸序列中的至少一个半胱氨酸残基。第一孔中的半胱氨酸残基和/或第二孔中的半胱氨酸残基可以是不存在于野生型CsgG单体和/或野生型CsgG同源物单体中的半胱氨酸残基。可在双孔的两个孔之间形成多个二硫键,例如2个、3个、4个、5个、6个、7个、8个或9至16个、18个、24个、27个、32个、36个、40个、45个、48个、54个、56个或63个。第一或第二孔中的一个或两个可包含至少一个单体,例如最多8个、9个或10个单体,其在对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和/或L113的位置处在第一孔与第二孔之间的界面处包含半胱氨酸残基。

第一孔中的至少一个单体和/或第二孔中的至少一个单体可在第一孔与第二孔之间的界面处包含至少一个残基,所述残基比存在于野生型CsgG单体或野生型CsgG同源物单体中的对应位置处的残基更具疏水性。举例来说,第一孔和/或第二孔中的2到10个,例如3个、4个、5个、6个、7个、8个或9个残基可比对应野生型CsgG单体或野生型CsgG同源物中的相同位置处的残基更具疏水性。这些疏水残基增强了双孔中的两个孔之间的相互作用。第一孔与第二孔之间的界面处的至少一个残基可在对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和或L113的位置处。当野生型CsgG单体或野生型CsgG同源物单体的界面处的残基是R、Q、N或E时,疏水残基通常是I、L、V、M、F、W或Y。在野生型CsgG单体或野生型CsgG同源物单体的界面处的残基是I时,疏水残基通常是L、V、M、F、W或Y。在野生型CsgG单体或野生型CsgG同源物单体的界面处的残基是L时,疏水残基通常是I、V、M、F、W或Y。

双孔可以包含在孔之间的界面处包含一个或多个半胱氨酸残基的一个或多个单体和在孔之间的界面处包含一个或多个引入的疏水残基的一个或多个单体,或可以包含含有这些半胱氨酸残基和这些疏水性残基的一个或多个单体。举例来说,对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和或L113处的位置的单体中的位置中的一个或多个(例如任何2个、3个或4个)可包含半胱氨酸(C)残基,且对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和或L113处的位置的单体中的位置中的一个或多个(例如任何2个、3个或4个)可包含疏水残基,例如I、L、V、M、F、W或Y。

本发明人已鉴定出以尾部到尾部取向组装以形成双孔的两个野生型CsgG孔之间的接合处中的孔洞。发明人已认识到,存在于第一孔与第二孔之间的任何间隙可允许电流(即离子)在第一孔与第二孔之间的接合处进入孔或流出孔。当孔用于检测或表征分析物时,这种离子的通过将是有害的。因此,这些孔洞可在双孔中封闭,即双孔通常在第一孔与第二孔之间的接合处不包括任何孔洞。由双孔提供的通道通常不会泄漏离子。其为具有连续壁的通道。双孔的结构在由第一孔和第二孔形成的通道周围提供了坚固的壁。

根据的双孔可在尾部区域中的一个或多个(例如2个、3个、4个、5个、6个或7个)位置处含有大型残基,所述残基通常在第一孔与第二孔之间的界面处且比存在于野生型CsgG单体或野生型CsgG同源物单体中的对应位置处的残基更大。大型的这些残基防止了在双孔中的第一孔与第二孔之间的界面处的孔壁中形成孔洞。在第一孔与第二孔之间的界面处的至少一个大型残基通常在对应于SEQ ID NO:2的A98、A99、T104、V105、L113、Q114或S115的位置处。当野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是A时,大型残基通常是I、L、V、M、F、W、Y、N、Q、S或T。当存在于野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是T时,大型残基通常是L、M、F、W、Y、N、Q、R、D或E。当存在于野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是V时,大型残基通常是I、L、M、F、W、Y、N、Q。当存在于野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是L时,大型残基通常是M、F、W、Y、N、Q、R、D或E。当存在于野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是Q时,大型残基通常是F、W或Y。当存在于野生型CsgG单体或野生型CsgG同源物单体中的界面处的残基是S时,大型残基通常是M、F、W、Y、N、Q、E或R。

特别是当第二孔位于膜的外部时,第二孔和任选地第一孔优选地在孔的桶形区域中包含与野生型CsgG孔或同源物的桶中的电荷相比减少了桶内部的负电荷的残基。这些突变使桶更具亲水性。双孔的第一孔中的至少一个单体和/或第二孔中的至少一个单体可在孔的桶形区域中包含至少一个残基,所述残基的负电荷小于存在于野生型CsgG单体或野生型CsgG同源物单体中的对应位置处的残基。桶内部的电荷足够中性或正性,使得带负电荷的分析物(例如聚核苷酸)不会因静电电荷而排斥进入孔中。在对应于SEQ ID NO:2的D149、E185、D195、E210和/或E203的位置处的孔的桶形区域中的至少一个残基(例如2个、3个、4个或5个残基)可以是中性或带正电荷的氨基酸。在对应于SEQ ID NO:2的D149、E185、D195、E210和/或E203的位置处的孔的桶形区域中的至少一个残基(例如2个、3个、4个或5个残基)优选为N、Q、R或K。

SEQ ID NO:2或SEQ ID NO:26中的电荷去除的突变的特定实例包括以下:E185N/E203N;D149N/E185R/D195N/E201R/E203N、D149N/E185R/D195N/E201N/E203N、D149R/E185N/D195N/E201N/E203N、D149R/E185N/E201N/E203N、D149N/E185N/D195/E201N/E203N、D149N/E185N/E201N/E203N、D149N/E185N/E203N、D149N/E185N/E201N、D149N/E203N、D149N/E201N/D195N、D149N/E201N、D195N/E201N/E203N、E201N/E203N、D195N/E203、E203R、E203N、E201R、E201N、D195R、D195N、E185R、E185N、D149R和D149N。

第一CsgG孔或其同源物中的至少一个单体可在第一孔的桶形区域的收缩部中包含至少一个残基,相较于野生型CsgG孔或野生型CsgG同源物孔,所述残基减少、维持或增加收缩部的长度,和/或第二CsgG孔或其同源物中的至少一个单体可在第二孔的桶形区域的收缩部中包含至少一个残基,相较于野生型CsgG孔或野生型CsgG同源物孔,所述残基减少、维持或增加收缩部的长度。优选地,第一孔中的收缩部的长度和/或第二孔中的收缩部的长度至少与野生型孔中的收缩部一样长,且更优选更长。

可通过将残基***对应于SEQ ID NO:2的位置K49与F56之间的区域的区域中来增加孔的长度。可将1到5个(例如2个、3个或4个)氨基酸残基***在通过参考SEQ ID NO:2定义的以下位置中的任何一个或多个处:K49和P50、P50和Y51、Y51和P52、P52和A53、A53和S54、S54和N55和/或N55和F56。优选将总共1至10个(例如2至8个或3至5个)氨基酸残基***单体的序列中。优选地,第一孔中的所有单体和/或第二孔中的所有单体在这个区域中具有相同数量的***。***的残基可以增加对应于SEQ ID NO:2的Y51和N55的残基之间的环的长度。***的残基可以是以下的任何组合:维持柔性的A、S、G或T;将扭结添加环的P;和/或S有助于在分析物在施加的电势差下与孔的桶相互作用时产生的信号的T、N、Q、M、F、W、Y、V和/或I。***的氨基酸可以是S、G、SG、SGG、SGS、GS、GSS和/或GSG的任何组合。

在双孔中,第一孔和/或第二孔的桶中的收缩部可包含至少一个残基,例如2个、3个、4个或5个残基,与使用具有野生型收缩部的第一孔或第二孔时相比,所述残基在用于检测或表征分析物时影响孔的特性,其中孔的桶形区域的收缩部中的至少一个残基在对应于SEQ ID NO:2的Y51、N55、Y51、P52和/或A53的位置处。至少一个残基可以是对应于SEQ IDNO:2的F56的位置处的Q或V;对应于SEQ ID NO:2的Y51的位置处的A或Q;和/或对应于SEQID NO:2的N55的位置处的V。

双孔可包含第一CsgG孔或其同源物中的至少一个单体和/或在第二CsgG孔或其同源物中的至少一个单体,所述单体包含两个或更多个上文所定义的突变。

突变CsgG单体

提供新颖的突变CsgG单体和CsgG同源物的单体。单体可以是分离的单体。突变CsgG单体可用于形成孔和双孔。突变CsgG单体是其序列不同于野生型CsgG单体的序列且保持形成孔的能力的单体。CsgG同源物的突变单体是其序列不同于野生型CsgG单体的序列且保持形成孔的能力的单体。用于确认突变单体形成孔的能力的方法在所属领域中是众所周知的。举例来说,可以将变异体连同其它适当的亚基一起***到两亲层中,并且可以确定其寡聚以形成孔的能力。用于将亚基***到膜(例如两亲层)中的方法在所属领域中已知。举例来说,可将亚基以纯化形式悬浮于含有三嵌段共聚物膜的溶液中,使得其扩散到膜中且通过结合于膜和组装成功能性状态来***。

提供CsgG单体或CsgG同源物的单体,其在对应于SEQ ID NO:2的R97、I107、R110、Q100、E101、N102和或L113的位置处包含半胱氨酸残基。

提供CsgG单体或CsgG同源物的单体,其在对应于SEQ ID NO:2的R97、Q100、I107、R110、E101、N102和L113中的任何一个或多个的位置处包含残基,所述残基比存在于SEQ IDNO:2的对应位置处或野生型CsgG同源物的氨基酸序列中(例如SEQ ID NO:3到23中的任一个的对应位置)的残基更具疏水性。对应于R97和/或I107的位置处的残基是M,对应于R110的位置处的残基是I、L、V、M、W或Y,和/或对应于E101或N102的位置处的残基是V或M。对应于Q100的位置处的残基通常是I、L、V、M、F、W或Y;和或对应于L113的位置处的残基通常是I、V、M、F、W或Y。

特定单体可具有包含以下的SEQ ID NO 2或SEQ ID NO:26中所示的序列:Y51A、F56Q取代和R97I/V/L/M/F/W/Y、I107L/V/M/F/W/Y、R110I/V/L/M/F/W/Y、Q100I/V/L/M/F/W/Y、E101I/V/L/M/F/W/Y、呈组合的N102I/V/L/M/F/W/Y和L113CI/V/L/M/F/W/Y、呈组合的R97I/V/L/M/F/W/Y和N102I/V/L/M/F/W/Y,和/或呈组合的R97I/V/L/M/F/W/Y和E101I/V/L/M/F/W/Y。I107可能已经在两个孔之间形成疏水相互作用。

提供CsgG单体或CsgG同源物的单体,其在对应于SEQ ID NO:2的A98、A99、T104、V105、L113、Q114和S115中的任何一个或多个的位置处包含残基,所述残基比存在于SEQ IDNO:2的对应位置或野生型CsgG同源物的氨基酸序列中(例如SEQ ID NO:3到23中的任一个的对应位置)的残基更大,其中对应于T104的位置处的残基是L、M、F、W、Y、N、Q、D或E,对应于L113的位置处的残基是M、F、W、Y、N、G、D或E,和/或对应于S115的位置处的残基是M、F、W、Y、N、Q或E。对应于A98或A99的位置处的残基通常是I、L、V、M、F、W、Y、N、Q、S或T。对应于V105否位置处的残基是I、L、M、F、W、Y、N或Q。对应于Q114的位置处的残基是F、W或Y。对应于E210的位置处的残基是N、Q、R或K。

特定单体可具有包含Y51A、F56Q取代和1个、2个、3个、4个、5个、6个或所有的以下取代的SEQ ID NO 2或SEQ ID NO:26中所示的序列:A98I/L/V/M/F/W/Y/N/Q/S/T;A99I/L/V/M/F/W/Y/N/Q/S/T;T104N/Q/L/R/D/E/M/F/W/Y;V105I/L/M/F/W/Y/N/Q;L113M/F/W/Y/N/Q/D/E/L/R;Q114Y/F/W;和S115N/Q/M/F/W/Y/E/R。

提供CsgG单体或CsgG同源物的单体,其在对应于D149、E185、D195、E210和E203的任何一个或多个的位置处的孔的桶形区域中包含残基,所述残基的负电荷小于存在于SEQID NO:2的对应位置或野生型CsgG同源物的氨基酸序列(例如SEQ ID NO:3到23中的任一个的对应位置)的残基,其中对应于D149、E185、D195和/或E203的位置处的残基是K。

提供CsgG单体或CsgG同源物的单体,其中第一CsgG孔或其同源物中的至少一种单体和/或第二CsgG孔或其同源物中的至少一种单体在所述孔的桶形区域的收缩部中包含至少一个残基,相较于野生型CsgG孔或野生型CsgG同源物孔,所述残基增加了收缩部的长度。至少一个残基是除存在于野生型CsgG孔或野生型CsgG同源物孔的收缩部中的残基之外的残基。

可通过将残基***对应于SEQ ID NO:2的位置K49与F56之间的区域的区域中来增加孔的长度。可将1到5个(例如2个、3个或4个)氨基酸残基***在通过参考SEQ ID NO:2定义的以下位置中的任何一个或多个处:K49和P50、P50和Y51、Y51和P52、P52和A53、A53和S54、S54和N55和/或N55和F56。优选将总共1至10个(例如2至8个或3至5个)氨基酸残基***单体的序列中。***的残基可以增加对应于SEQ ID NO:2的Y51和N55的残基之间的环的长度。***的残基可以是以下的任何组合:维持柔性的A、S、G或T;将扭结添加环的P;和/或S有助于在分析物在施加的电势差下与孔的桶相互作用时产生的信号的T、N、Q、M、F、W、Y、V和/或I。***的氨基酸可以是S、G、SG、SGG、SGS、GS、GSS和/或GSG的任何组合。

提供CsgG单体或CsgG同源物的单体,其在对应于SEQ ID NO:2的N55、P52和/或A53的位置处的孔的桶形区域的收缩部中包含至少一个残基,所述残基不同于存在于对应野生型单体中的残基,其中对应于N55的位置处的残基是V。

在同一单体中可以存在任何两个或更多个上文所描述的残基。特定来说,单体可包含至少一个所述半胱氨酸残基、至少一个所述所述疏水残基、至少一个所述大型残基、至少一个所述中性或带正电荷的残基,和/或至少一个增加收缩部的长度的所述残基。

单体可另外包含一个或多个(例如2个、3个、4个或5个)残基,与使用具有野生型收缩部的第一孔或第二孔时相比,所述残基在用于检测或表征分析物时影响孔的特性,其中孔的桶形区域的收缩部中的至少一个残基在对应于SEQ ID NO:2的Y51、N55、Y51、P52和/或A53的位置处。至少一个残基可以是对应于SEQ ID NO:2的F56的位置处的Q或V;对应于SEQID NO:2的Y51的位置处的A或Q;和/或对应于SEQ ID NO:2的N55的位置处的V。

用于引入或取代天然存在的氨基酸的方法在所属领域中是众所周知的。举例来说,可通过在编码突变单体的聚核苷酸中的相关位置处用精氨酸的密码子(CGT)置换甲硫氨酸的密码子(ATG),而用精氨酸(R)来取代甲硫氨酸(M)。接着,可如下文所论述来表达聚核苷酸。

用于引入或取代非天然存在的氨基酸的方法在所属领域中也是众所周知的。举例来说,可通过在用于表达突变单体的IVTT系统中包括合成氨基酰基-tRNA来引入非天然存在的氨基酸。替代地,可通过在特定氨基酸营养缺陷型大肠杆菌中在那些特定氨基酸的合成(即非天然存在的)类似物存在下表达突变单体来引入所述非天然存在的氨基酸。如果突变单体是使用部分肽合成来生产,那么其还可通过裸接合来生产。

变异体

除上文所论述的特定残基之外,单体可包括野生型序列的其它突变。

单体和孔和双孔中的单体中的至少一个可在对应于SEQ ID NO:2的精氨酸(R)192的位置处包含天冬氨酸(D)、谷氨酰胺(Q)、苯丙氨酸(F)、丝氨酸(S)或苏氨酸(T)。这些单体,特别是在这个位置上包含D的单体比在对应于SEQ ID NO:2的192的位置处包含R的单体更容易表达。

单体和孔和双孔中的单体中的至少一个可包含天冬氨酸(N)、谷氨酰胺(Q)、精氨酸(R)、苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、白氨酸(L)或丝氨酸(S),其中赖氨酸(K)在对应于SEQ ID NO:2的赖氨酸(K)192的位置处。这些单体且特定来说在这个位置处包含Q或N的单体比包含对应于SEQ ID NO:2的94的位置处的K的另外相同的单体更少噪声。

单体和孔和双孔中的单体中的至少一个可包含顺式和/或反式环突变。这种突变可能在双孔中起至关重要的作用,例如促进孔-孔相互作用(顺侧)和/或孔-酶相互作用(反侧)。

单体和孔和双孔中的单体中的至少一个可包含以下氨基酸残基中的一个或多个(其中氨基酸残基的位置通过参考SEQ ID NO:2来定义):D43S(对应于SEQ ID NO:2的D43的位置处的丝氨酸残基)、E44S(对应于SEQ ID NO:2的E44的位置处的丝氨酸残基)、F48S/N/Q/Y/W/I/V/H/R/K(对应于SEQ ID NO:2的F48的位置处的S、N、Q、Y、W、I、V、H、R或K残基)、Q87N/R/K(对应于SEQ ID NO:2的Q87的位置处的N、R或K残基)、N91K/R(对应于SEQ ID NO:2的N91的位置处的K或R残基)、K94N/Q/R/F/Y/W/L/S/N(对应于SEQ ID NO:2的K94的N、Q、R、F、Y、W、L、S或N残基)、R97F/Y/W/V/I/K/S/Q/H(对应于SEQ ID NO:2的R97的位置处的F、Y、W、V、I、K、S、Q或H残基)、E101I/L/A/H(对应于SEQ ID NO:2的E101的位置处的L、A或H残基)、N102K/Q/L/I/V/S/H、R110F/G/N(对应于SEQ ID NO:2的N102的位置处的K、Q、L、I、V、S或H残基)、Q114R/K(对应于SEQ ID NO:2的Q114的位置处的R或K残基)、R142Q/S(对应于SEQ IDNO:2的R142的位置处的Q或S残基)、T150Y/A/V/L/S/Q/N(对应于SEQ ID NO:2的T150的位置处的Y、A、V、L、S、Q或N残基)、R192D/Q/F/S/T(对应于SEQ ID NO:2的R192的位置处的D、Q、F、S或T T残基),和/或D248S/N/Q/K/R(对应于SEQ ID NO:2的D248的位置处的S、N、Q、K或R残基)。

单体和孔和双孔中的单体中的至少一个可包含以下缺失中的一个或多个(其中缺失的位置通过参考SEQ ID NO:2来定义):对应于SEQ ID NO:2的R192、F193、I194、D195、Y196、Q197、R198、L199、L200和E201的位置处的残基中的一个或多个;和/或对应于SEQ IDNO:2的V139、G140、D149、T150、V186、Q187、V204和/或G205,SEQ ID NO:2的G137、G138、Q151、Y152、Y184、E185、Y206和/或T207和/或SEQ ID NO:2的A141、R142、G147、A148、A188、G189、G202和/或E203的残基中的一个或多个的缺失。

单体和孔和双孔中的单体中的至少一个可包含:

-对应于SEQ ID NO:2的R97的位置处的W残基;

-对应于SEQ ID NO:2的R192的位置处的D、Q、F、S或T残基;

-对应于SEQ ID NO:2的R97的位置处的Y残基和/或对应于SEQ ID NO:2的R93的位置处的W或Y残基;

-对应于SEQ ID NO:2的K94的位置处的Q或N残基;

-对应于SEQ ID NO:2的G103和/或T104的位置处的K或R残基;和/或

-对应于SEQ ID NO:2的F191的位置处的T残基、对应于SEQ ID NO:2的V105、A106和I107的残基的缺失和/或对应于SEQ ID NO:2的F193、I194、D195、Y196、Q197、R198和L199的残基的缺失。

单体和孔和双孔中的单体中的至少一个可包含对应于SEQ ID NO:2的Y51的位置处的A和/或对应于SEQ ID NO:2的F56Q的位置处的Q。

单体和孔和双孔中的单体中的至少一个可包含对应于SEQ ID NO:2中的以下突变的突变:

(1)Y51A、F56Q和R192D;

(2)Y51A、F56Q和R97W。

(3)Y51A、F56Q、R192D和R97W;

(4)Y51A、F56Q、R192D和R93W;

(5)Y51A、F56Q、R192D、R93Y和R97Y;或

(6)Y51A、F56Q、R192D和R93W。

(7)(1)到(6)中任一项的突变,和:

(a)V105、A106和I107的缺失。

(b)K94Q或K94N;

(c)D195、Y196、Q197、R198和L199的缺失或F193、I194、D195、Y196、Q197、R198和L199的缺失;和/或

(d)F191T。

(8)(1)到(6)中任一项的突变,和:

(i)K94Q和V105、A106和I107的缺失;

(ii)K94N和V105、A106和I107的缺失;

(iii)F191T和V105、A106和I107的缺失;

(iv)K94Q和F191T;

(v)K94N和F191T;

(vi)K94Q、F191T和V105、A106和I107的缺失;或

(vii)K94N、F191T和V105、A106和I107的缺失。

(9)(1)到(8)中任一项的突变,和:

-T104K或T104R;

-L90R;

-N91R;

-I95R;

-A99R;

-E101K、E101N、E101Q、E101T或E101H;

-E44N或E44Q;和/或

-Q42K。

单体可为SEQ ID NO:2到23中的任一个,优选SEQ ID NO:2的变异体。在SEQ IDNO:2到23中的任一个的氨基酸序列的整个长度内,以氨基酸一致性计,变异体将优选地与序列至少50%同源。更优选地,以氨基酸一致性计,变异体可以在整个序列内与SEQ ID NO:2到23中的任一个的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多的延伸段内,例如在125、150、175或200个或更多的邻接氨基酸内,可存在至少80%,例如至少85%、90%或95%的氨基酸一致性(“硬同源性”)。

所属领域中的标准方法可用于测定同源性。举例来说,UWGCG程序包提供BESTFIT程序,其可用于计算同源性,例如用其默认设置(Devereux等人(1984)《核酸研究(NucleicAcids Research)》12,第387到395页)。PILEUP和BLAST算法可用于计算同源性对序列进行排序(例如鉴定等同残基或对应序列(通常用其默认设置)),例如如Altschul S.F.(1993)《分子进化杂志(J Mol Evol)》36:290-300;Altschul,S.F等人(1990)《分子进化杂志》215:403-10中所描述。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(NationalCenter for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)公开获得。

SEQ ID NO:2是来自大肠杆菌菌株K-12亚株MC4100的野生型CsgG单体的氨基酸序列。包含于孔或双孔中的至少一个单体可包含SEQ ID NO:2中所示的氨基酸序列。包含于孔或双孔中的至少一个单体可包含SEQ ID NO:3到23中的任一个中所示的氨基酸序列。

包含于孔或双孔中的单体和单体中的至少一个可包含作为SEQ ID NO:2中所示的氨基酸序列的变异体的氨基酸序列。SEQ ID NO:2的变异体可包含存在于另一CsgG同源物中的取代中的任一个。优选的CsgG同源物示于SEQ ID NO:3到23中。与SEQ ID NO:2相比,变异体可包含存在于SEQ ID NO:3到23中的取代中的一个或多个的组合。例如,可在SEQ IDNO:2中的在SEQ ID NO:2与SEQ ID NO:3到23中的任何一个之间是不同的位置中的任何一个或多个处进行突变。这种突变可为SEQ ID NO:2中的氨基酸被来自SEQ ID NO:3到23中的任一个中的对应位置的氨基酸取代。替代地,在这些位置中的任一个处的突变可为用任何氨基酸进行的取代,或可为缺失或***突变,例如缺失或***1到10个氨基酸,例如缺失或***2到8个或3到6个氨基酸。除本文所公开的突变以外,在SEQ ID NO:2与所有SEQ ID NO:3到23之间是保守的氨基酸优选地存在于变异体中。然而,可在这些位置中的任何一个或多个处进行保守突变,这些位置中的一个或多个在SEQ ID NO:2与所有SEQ ID NO:3到23之间是保守的。

本发明提供一种孔形成CsgG突变单体或CsgG同源物的单体,其包含本文所描述的氨基酸中的任何一个或多个,所述氨基酸在对应于SEQ ID NO:2中的特定位置的单体的结构中的位置处被取代成SEQ ID NO:2的特定位置。可以通过所属领域中的标准技术来测定对应位置。举例来说,上文提到的PILEUP和BLAST算法可用于将CsgG单体或CsgG同源物的单体的序列与SEQ ID NO:2进行比对,且因此鉴定对应残基。

特定来说,提供一种孔形成CsgG突变体单体,其包含以下中的任何一个或多个:

-在对应于SEQ ID NO:2中的R97的位置处的W;

-在对应于SEQ ID NO:2中的R93的位置处的W;

-在对应于SEQ ID NO:2中的R97的位置处的Y;

-在对应于SEQ ID NO:2中的R93的位置处的Y;

-在对应于SEQ ID NO:2中的R93和R97中的每一个的位置处的Y;

-在对应于SEQ ID NO:2中的R192的位置处的D;

-在对应于SEQ ID NO:2中的V105到I107的位置处的残基的缺失;

-在对应于SEQ ID NO:2中的F193到L199的一个或多个位置处的残基的缺失;

-在对应于SEQ ID NO:2中的F195到L199的位置处的残基的缺失;

-在对应于SEQ ID NO:2中的F193到L199的位置处的残基的缺失;

-在对应于SEQ ID NO:2中的F191的位置处的T;

-在对应于SEQ ID NO:2中的K49的位置处的Q;

-在对应于SEQ ID NO:2中的K49的位置处的N;

-在对应于SEQ ID NO:2中的K42的位置处的Q;

-在对应于SEQ ID NO:2中的E44的位置处的Q;

-在对应于SEQ ID NO:2中的E44的位置处的N;

-在对应于SEQ ID NO:2中的L90的位置处的R;

-在对应于SEQ ID NO:2中的L91的位置处的R;

-在对应于SEQ ID NO:2中的I95的位置处的R;

-在对应于SEQ ID NO:2中的A99的位置处的R;

-在对应于SEQ ID NO:2中的E101的位置处的H;

-在对应于SEQ ID NO:2中的E101的位置处的K;

-在对应于SEQ ID NO:2中的E101的位置处的N;

-在对应于SEQ ID NO:2中的E101的位置处的Q;

-在对应于SEQ ID NO:2中的E101的位置处的T;

-在对应于SEQ ID NO:2中的Q114的位置处的K。

CsgG孔形成单体可进一步包含在对应于SEQ ID NO:2中的Y51的位置处的A和/或在对应于SEQ ID NO:2中的F56的位置处的Q。

孔形成突变单体通常保持形成与野生型CsgG单体相同的3D结构的能力,例如与具有SEQ ID NO:2的序列的CsgG单体相同的3D结构。CsgG的3D结构在所属领域中已知且公开于例如Cao等人(2014)《美国国家科学院院刊(PNAS)》E5439-E5444中。可在野生型CsgG序列中进行任何数量的除本文所描述的突变以外的突变,条件是,CsgG突变单体保持通过突变赋予其的改进的特性。

通常,CsgG单体将保持形成包含三个α-螺旋和五个β-折叠的结构的能力。特定来说,本发明人已显示,可至少在CsgG的以下区中进行突变:在第一α螺旋(其开始于SEQ IDNO:2中的S63)的N末端、在第二α螺旋(从SEQ ID NO:2的G85到A99)中、在第二α螺旋与第一β折叠之间的环(从SEQ ID NO:2的Q100到N120)中、在第四和第五β折叠(分别地,SEQ ID NO:2的S173到R192和R198到T107)中和在第四与第五β折叠之间的环(SEQ ID NO:2的F193到Q197)中,而不影响CsgG单体形成跨膜孔的能力,所述跨膜孔能够使多肽移位。因此,可以设想,可在任何CsgG单体中的这些区中的任一个中进行不影响单体形成可使聚核苷酸移位的孔的能力的其它突变。还预期,可在其它区中进行不影响单体形成可使聚核苷酸移位的孔的能力的突变,所述其它区如:在α螺旋中的任一个(SEQ ID NO:2的S63到R76、G85到A99或V211到L236)中;或在β折叠中的任一个(SEQ ID NO:2的I121到N133、K135到R142、I146到R162、S173到R192或R198到T107)中。还预期,可在以下中的任一个中进行不影响单体形成可使聚核苷酸移位的孔的能力的一个或多个氨基酸的缺失:连接α螺旋与β折叠的环区,和/或在CsgG单体的N末端和/或C末端区中。

可以对SEQ ID NO:2的氨基酸序列进行除了上文所论述的取代之外的氨基酸取代,例如最多1个、2个、3个、4个、5个、10个、20个或30个取代。保守取代用具有类似化学结构、类似化学特性或类似侧链体积的其它氨基酸来置换氨基酸。所引入的氨基酸可具有与其置换的氨基酸类似的极性、亲水性、疏水性、碱性、酸性、电中性或电荷。替代地,保守取代可引入代替预先存在的芳族或脂族氨基酸的另一芳族或脂族氨基酸。保守氨基酸改变在所属领域中是众所周知的,且可根据如在下文表2中限定的20中主要氨基酸的特性来选择。当氨基酸具有类似极性时,还可参考表3中的氨基酸侧链的亲水性值来决定这个选择。

表2-氨基酸的化学特性

Ala 脂族的、疏水性的、中性的 Met 疏水性的、中性的
Cys 极性的、疏水性的、中性 Asn 极性的、亲水性的、中性的
Asp 极性的、亲水性的、带电的(-) Pro 疏水性的、中性的
Glu 极性的、亲水性的、带电的(-) Gln 极性的、亲水性的、中性的
Phe 芳族的、疏水性的、中性的 Arg 极性的、亲水性的、带电的(+)
Gly 脂族的、中性的 Ser 极性的、亲水性的、中性的
His 芳族的、极性的、亲水性的、带电的(+) Thr 极性的、亲水性的、中性的
Ile 脂族的、疏水性的、中性的 Val 脂族的、疏水性的、中性的
Lys 极性的、亲水性的、带电的(+) Trp 芳族的、疏水性的、中性的
Leu 脂族的、疏水性的、中性的 Tyr 芳族的、极性的、疏水性的

表3-亲水性值

可从上文所描述的多肽另外缺失SEQ ID NO:2的氨基酸序列的一个或多个氨基酸残基。可缺失最多1个、2个、3个、4个、5个、10个、20个或30个或更多个残基。

单体可以是SEQ ID NO:2的片段,并且孔和双孔可以包含SEQ ID NO:2或SEQ IDNO:2的同源物的片段。这些片段保持孔形成活性。片段的长度可为至少50个、至少100个、至少150个、至少200个或至少250个氨基酸。这些片段可用于产生孔。片段优选地包含对应于SEQ ID NO:2的K135-Q153和S183-S208的跨膜域。

替代地或另外,可向上文所描述的多肽中添加一个或多个氨基酸。可在SEQ IDNO:2或其变异体或片段的氨基酸序列的氨基末端或羧基末端处提供延长物。延长物的长度可以非常短,例如1到10个氨基酸。替代地,延长物可以较长,例如最多50或100个氨基酸。可将载体蛋白与根据本发明的氨基酸序列融合。其它融合蛋白在下文更详细地论述。

SEQ ID NO:2的变异体是具有不同于SEQ ID NO:2的氨基酸序列且保持其形成孔的能力的多肽。变异体通常含有SEQ ID NO:2的引起孔形成的区。CsgG的孔形成能力通过每个亚基中的β-折叠提供,所述CsgG含有β-桶。SEQ ID NO:2的变异体通常包含SEQ ID NO:2中形成β-折叠的区,即K135-Q153和S183-S208。可对SEQ ID NO:2的形成β-折叠的区进行一个或多个修饰,只要所得变异体保持其形成孔的能力即可。SEQ ID NO:2的变异体优选地在其-螺旋和/或环区内包括一个或多个修饰,例如取代、添加或缺失。

衍生自CsgG的单体可经修饰以辅助其鉴定或纯化,例如通过添加抗生蛋白链菌素标签或通过添加信号序列以促进其从其中单体并不天然地含有此类序列的细胞分泌。其它合适的标签在下文更详细地论述。单体可用显露标记来进行标记。显露标记可以是使单体被检测到的任何合适标记。在下文描述合适的标记。

衍生自CsgG的单体还可使用D-氨基酸来产生。举例来说,衍生自CsgG的单体可包含L-氨基酸与D-氨基酸的混合物。这在用于产生此类蛋白质或肽的所属领域中是常规的。

衍生自CsgG的单体含有一个或多个特异性修饰以便于核苷酸鉴别。衍生自CsgG的单体还可含有其它非特异性修饰,只要其不干扰孔形成即可。所属领域中已知多种非特异性侧链修饰,且可对衍生自CsgG的单体的侧链进行所述多种非特异性侧链修饰。这些修饰包括例如,通过与醛反应,随后用NaBH4、用甲基乙酰亚氨酸脒化或用乙酸酐酰化来对氨基酸还原烷化。

可使用所属领域中已知的标准方法来产生衍生自CsgG的单体。可以合成方式或通过重组手段来制备衍生自CsgG的单体。举例来说,可通过活体外转译和转录(IVTT)来合成单体。在WO 2010/004273、WO 2010/004265和WO 2010/086603中论述了用于产生孔和单体的合适方法。论述用于将孔***膜中的方法。

在一些实施例中,可以任选地包含于孔或双孔中的单体被化学修饰。突变单体可以任何方式和在任何位点处进行化学修饰。优选地通过将分子连接到一个或多个半胱氨酸(半胱氨酸连接)、将分子连接到一个或多个赖氨酸、将分子连接到一个或多个非天然氨基酸、表位的酶修饰或末端的修饰而对单体进行化学修饰。用于进行这些修饰的合适方法在所属领域中是众所周知的。突变单体可通过连接任何分子来进行化学修饰。举例来说,突变单体可通过连接染料或荧光团来进行化学修饰。

在一些实施例中,单体用有助于包含单体的孔与目标核苷酸或目标聚核苷酸序列之间的相互作用的分子衔接子来进行化学修饰。衔接子的存在改进孔和核苷酸或聚核苷酸序列的宿主-客体化学,且从而改进由单体形成的孔的测序能力。宿主-客体化学的原理在所属领域中是众所周知的。衔接子对于孔的物理或化学特性具有效果,其改进其与核苷酸或聚核苷酸序列的相互作用。衔接子可改变孔的折叠桶或通道的电荷,或特异性地与核苷酸或聚核苷酸序列相互作用或结合于所述核苷酸或聚核苷酸序列,从而促进其与孔相互作用。

分子衔接子优选地是环状分子、环糊精、能够杂交的物种、DNA结合剂或嵌入剂、肽或肽类似物、合成聚合物、芳族平面分子、能够结合氢的带正电小分子或小分子。

衔接子可为环状的。环状衔接子优选地具有与孔相同的对称性。衔接子优选地具有八重或九重对称性,这是由于CsgG通常围绕中心轴具有八个或九个亚基。这一点在下文更详细论述。

衔接子通常通过宿主-客体化学而与核苷酸或聚核苷酸序列相互作用。衔接子通常能够与核苷酸或聚核苷酸序列相互作用。衔接子包含能够与核苷酸或聚核苷酸序列相互作用的一个或多个化学基团。所述一个或多个化学基团优选地通过非共价相互作用而与核苷酸或聚核苷酸序列相互作用,例如疏水性相互作用、氢结合、范德华力(Van der Waal'sforces)、π-阳离子相互作用和/或静电力。能够与核苷酸或聚核苷酸序列相互作用的一个或多个化学基团优选地带正电。能够与核苷酸或聚核苷酸序列相互作用的一个或多个化学基团优选地包含氨基。氨基可连接于伯、仲或叔碳原子。衔接子甚至更优选地包含氨基的环,例如6个、7个或8个氨基的环。衔接子最优选地包含八个氨基的环。质子化氨基环可与核苷酸或聚核苷酸序列中的带负电磷酸基相互作用。

孔内的衔接子的正确定位可通过衔接子与包含突变单体的孔之间的宿主-客体化学来进行。衔接子优选地包含能够与孔中的一个或多个氨基酸相互作用的一个或多个化学基团。衔接子更优选地包含通过非共价相互作用而能够与孔中的一个或多个氨基酸相互作用的一个或多个化学基团,所述非共价相互作用如疏水性相互作用、氢结合、范德华力、π-阳离子相互作用和/或静电力。能够与孔中的一个或多个氨基酸相互作用的化学基团通常是羟基或胺。羟基可连接于伯、仲或叔碳原子。羟基可与孔中的不带电氨基酸形成氢键。可使用有助于孔与核苷酸或聚核苷酸序列之间的相互作用的任何衔接子。

合适衔接子包括(但不限于)环糊精、环肽和葫芦脲。衔接子优选地是环糊精或其衍生物。环糊精或其衍生物可以是在Eliseev,A.V.和Schneider,H-J.(1994)《美国化学学会杂志(J.Am.Chem.Soc.)》116,6081-6088中所公开的那些环糊精或其衍生物中的任一种。衔接子更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-CD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。gu7-βCD中的胍基具有比am7-βCD中的伯胺高许多的pKa,且因此其带更多的正电。这种gu7-βCD衔接子可用于增加孔中的核苷酸的停留时间,增加所测量的剩余电流的准确度、以及增加在高温或低数据获取速率下的碱基检测速率。

如果如在下文更详细地论述来使用3-(2-吡啶二硫代)丙酸丁二酰亚胺酯(SPDP)交联剂,那么衔接子优选地是七(6-脱氧-6-氨基)-6-N-单(2-吡啶基)二硫代丙酰基-β-环糊精(am6amPDP1-βCD)。

更合适的衔接子包括γ-环糊精,其包含9个糖单元且因此具有九重对称性)。γ-环糊精可含有连接子分子,或可进行修饰以包含所有或更多个在上文所论述的β-环糊精实例中使用的经修饰糖单元。

分子衔接子优选地共价连接于单体。可使用所属领域中已知的任何方法,将衔接子共价连接于孔。通常通过化学连接来连接衔接子。如果通过半胱胺酸连接来连接分子衔接子,那么通过取代优选地将一个或多个半胱氨酸引入到突变中,例如桶中。可通过将分子衔接子连接于单体中的一个或多个半胱氨酸来对单体进行化学修饰。所述一个或多个半胱氨酸可为天然存在的,即在SEQ ID NO:2中的位置1和/或215处。替代地,可通过将分子衔接子连接到在其它位置处所引入的一个或多个半胱氨酸来对突变单体进行化学修饰。在位置215处的半胱氨酸可例如通过取代来去除,以确保分子衔接子并不连接到所述位置,而不是在位置1处的半胱氨酸或在另一位置处引入的半胱氨酸。

可通过修饰相邻残基来增强半胱氨酸残基的反应性。举例来说,侧接精氨酸、组氨酸或赖氨酸残基的碱性基团将改变半胱氨酸巯基的pKa为更具反应性的S-基的pKa。半胱氨酸残基的反应性可通过巯基保护基(如dTNB)来保护。在连接连接子之前,这些可以与单体的一个或多个半胱氨酸残基反应。可以将分子直接连接于单体。优选地,使用例如化学交联剂或肽连接子的连接子将分子连接于单体。

合适的化学交联剂在所属领域中是众所周知的。优选的交联剂包括3-(吡啶-2-基二磺酰基)丙酸2,5-二氧代吡咯烷-1-基酯、4-(吡啶-2-基二磺酰基)丁酸2,5-二氧代吡咯烷-1-基酯和8-(吡啶-2-基二磺酰基)辛酸2,5-二氧代吡咯烷-1-基酯。最优选的交联剂是3-(2-吡啶二硫代)丙酸丁二酰亚胺酯(SPDP)。通常,在分子/交联剂复合体共价连接于单体之前,分子共价连接于双功能交联剂,但也有可能在双功能交联剂/单体复合体连接于分子之前将双功能交联剂共价连接于单体。

连接子优选地对二硫苏糖醇(DTT)具有抗性。合适连接子包括(但不限于)基于碘乙酰胺和基于马来酰亚胺的连接子。

在其它实施例中,单体可连接于聚核苷酸结合蛋白。这形成可在测序方法中使用的模块测序系统。下文论述聚核苷酸结合蛋白。

聚核苷酸结合蛋白优选地共价连接于单体。可使用所属领域中已知的任何方法,将蛋白质共价连接于单体。可对单体和蛋白质进行化学融合或基因融合。如果从单一聚核苷酸序列表达完全构筑体,那么单体和蛋白质是基因融合的。将单体基因融合于聚核苷酸结合蛋白论述于WO 2010/004265中。

如果通过半胱氨酸连接来连接聚核苷酸结合蛋白,那么通过取代优选地将一个或多个半胱氨酸引入到突变中。将一个或多个半胱氨酸优选地引入到在同源物中具有低保守性、指示可容许突变或***的环区中。因此,其适合于连接聚核苷酸结合蛋白。在这些实施例中,可去除在位置251处的天然存在的半胱氨酸。可通过如上文所描述的修饰来增强半胱氨酸残基的反应性。

可以将聚核苷酸结合蛋白直接连接于单体或通过一个或多个连接子连接于单体。可使用在WO 2010/086602中描述的杂交连接子来将分子连接于单体。替代地,可使用肽连接子。肽连接子是氨基酸序列。肽连接子的长度、柔性和亲水性通常被设计为使得其不干扰单体和分子的功能。优选柔性肽连接子是2到20个,例如4个、6个、8个、10个或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性连接子包括(SG)1、(SG)2、(SG)3、(SG)4、(SG)5和(SG)8,其中S是丝氨酸且G是甘氨酸。优选的刚性连接子是2到30个,例如4个、6个、8个、16个或24个脯氨酸的延伸段。更优选的刚性连接子包括(P)12,其中P是脯氨酸。

单体可用分子衔接子和聚核苷酸结合蛋白来进行化学修饰。

可将分子(用所述分子来对单体进行化学修饰)直接连接于单体或通过如WO2010/004273、WO 2010/004265或WO 2010/086603中所公开的连接子来连接。

可以例如通过加入组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、flag标签、SUMO标签、GST标签或MBP标签,或在多肽天然地不含信号序列的情况下通过加入这样的序列以促进其从细胞分泌,来对本文所描述的任一种蛋白质(例如单体和孔)进行修饰以辅助其鉴定或纯化。引入基因标签的替代性方案是将标签化学反应到蛋白质上的原生或经工程改造的位置上。此的实例将为将凝胶移动试剂与蛋白质外上经工程改造的半胱氨酸反应。这已证实为一种用于分离溶血素异源寡聚物的方法(《生物化学(ChemBiol)》.1997年7月;4(7):497-505)。

本文所描述的任一种蛋白质(例如单体和孔)可用显露标记来标记。显露标记可以是使蛋白质被检测到的任何合适标记。合适标记包括(但不限于)荧光分子;放射性同位素,例如125I、35S;酶;抗体;抗原;聚核苷酸;和配体,例如生物素。

本文所描述的任一种蛋白质(例如单体或孔)可以合成方式或通过重组手段来制备。举例来说,可通过活体外翻译和转录(IVTT)来合成蛋白质。蛋白质的氨基酸序列可进行修饰以包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成手段来生产蛋白质时,可在生产期间引入此类氨基酸。还可根据合成或重组生产来改变蛋白质。

还可使用D-氨基酸来生产蛋白质。举例来说,蛋白质可包含L-氨基酸与D-氨基酸的混合物。这在用于产生此类蛋白质或肽的所属领域中是常规的。

蛋白质还可含有其它非特异性修饰,只要其不干扰蛋白质的功能即可。在所属领域中已知多种非特异性侧链修饰,且可对蛋白质的侧链进行所述多种非特异性侧链修饰。这些修饰包括例如,通过与醛反应,随后用NaBH4、用甲基乙酰亚氨酸脒化或用乙酸酐酰化来对氨基酸还原烷化。

可使用所属领域中已知的标准方法来生产本文所描述的任一种蛋白质,包括单体和孔。可使用所属领域中的标准方法来推导编码蛋白质的聚核苷酸序列且进行复制。可使用所属领域中的标准技术在细菌宿主细胞中表达编码蛋白质的聚核苷酸序列。可通过从重组表达载体原位表达多肽来在细胞中产生蛋白质。表达载体任选地携带诱导性启动子以控制多肽的表达。这些方法描述于Sambrook,J.和Russell,D.(2001).《分子克隆实验指南(Molecular Cloning:A Laboratory Manual)》第3版,纽约冷泉港的冷泉港实验室出版社(Cold Spring Harbor Laboratory Press)中。

可在从蛋白质产生生物体通过任何蛋白质液相色谱系统纯化之后或在重组表达之后,大规模生产蛋白质。典型的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad生物系统和Gilson HPLC系统。

构筑体

还提供一种构筑体,其包含两个或更多个共价连接的CsgG单体或CsgG同源物的单体,其中所述单体中的至少一个是修饰的单体,例如本发明的单体。构筑体保留其形成孔的能力。可如上文所论述来测定此。一个或多个构筑体可用于形成用于表征(如测序)聚核苷酸的孔。构筑体可包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个或至少10个单体。构筑体优选地包含两个单体。两个或更多个单体可以相同或不同。

构筑体中的至少一个单体是修饰的单体,例如本发明的单体。构筑体中的两个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个或10个或更多个单体可以是本发明的单体。构筑体中的所有单体优选地是本发明的单体。单体可相同或不同。在一优选实施例中,构筑体包括两个本发明的单体。

构筑体中的单体优选地是大致相同的长度或是相同的长度。构筑体中的单体的桶优选地是大致相同的长度或是相同的长度。长度可以氨基酸的数量和/或长度的单位的形式进行测量。

构筑体可包含不是本发明的单体的一个或多个单体。作为本发明的非突变单体的CsgG单体包括包含SEQ ID NO:2到23中的任一个或SEQ ID NO:2到23中的任一个的变异体的单体,其中上文所论述的氨基酸/位置中无一个突变。构筑体中的至少一个单体可包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23,或SEQ IDNO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23中所示的序列的变异体。以氨基酸一致性计,SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23的变异体在其整个序列内与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23至少50%同源。更优选地,以氨基酸一致性计,比较变异体可在整个序列内与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。

优选地将构筑体中的单体进行基因融合。如果从单一聚核苷酸序列表达完全构筑体,那么单体是基因融合的。可以任何方式来组合单体中的编码序列,以形成编码构筑体的单一聚核苷酸序列。

可以任何构形来将单体基因融合。可通过单体的末端氨基酸来融合单体。举例来说,可将一个单体所述氨基端与另一单体的羧基端融合。构筑体中的第二和随后单体(在氨基到羧基方向上)可在其氨基末端端包含甲硫氨酸(其中的每一个与前一个单体的羧基端融合)。举例来说,如果M是单体(不具有氨基末端甲硫氨酸),且mM是具有氨基末端甲硫氨酸的单体,那么构筑体可包含序列M-mM、M-mM-mM或M-mM-mM-mM。这些蛋氨酸的存在通常由在于编码整个构筑体的聚核苷酸内的编码第二或随后单体的聚核苷酸的5'端处的起始密码子(即ATG)的表达造成。构筑体中的第一单体(在氨基到羧基方向上)还可包含甲硫氨酸(例如mM-mM、mM-mM-mM或mM-mM-mM-mM)。

可将两个或更多个单体直接基因融合在一起。优选地使用连接子来将单体进行基因融合。连接子可设计成限制单体的移动性。优选的连接子是氨基酸序列(即肽连接子)。可使用上文所论述的任一个肽连接子。

在另一优选实施例中,将单体化学融合。如果例如通过化学交联剂将两部分化学连接,那么两个单体是化学融合的。可使用上文所论述的任一种化学交联剂。可将连接子连接于引入到本发明的突变单体中一个或多个半胱氨酸残基。替代地,可将连接子连接于构筑体中的一个单体的末端。

如果构筑体含有不同单体,那么可通过保持连接子的浓度大量过度于单体来预防单体自身的交联。替代地,可在使用两个连接子的情况中使用“锁和钥”排列。每个连接子仅一端可反应在一起,以形成较长连接子,且连接子的另一端各自与不同单体反应。这些连接子描述于WO 2010/086602中。

聚核苷酸

还提供了编码修饰的单体,例如本发明的单体的聚核苷酸序列。以核苷酸一致性计,聚核苷酸序列优选地包含在整个序列上与SEQ ID NO:1的序列至少50%、60%、70%、80%、90%或95%同源的序列。在300个或更多个,例如375个、450个、525个或600个或更多个连续核苷酸的延伸段上,可存在至少80%,例如至少85%、90%或95%核苷酸一致性(“硬同源性”)。可如上文所描述来计算同源性。基于基因密码的简并,聚核苷酸序列可包含不同于SEQ ID NO:1的序列。

还提供了编码遗传融合构筑体中的任一个的聚核苷酸序列。聚核苷酸优选地包含SEQ ID NO:1中所示的序列的两个或更多个变异体。以核苷酸一致性计,聚核苷酸序列优选地包含在整个序列内与SEQ ID NO:1具有至少50%、60%、70%、80%、90%或95%同源性的两个或更多个序列。在600个或更多个,例如750个、900个、1050个或1200个或更多个连续核苷酸的延伸段上,可存在至少80%,例如至少85%、90%或95%核苷酸一致性(“硬同源性”)。可如上文所描述来计算同源性。

可使用所属领域中的标准方法来推导聚核苷酸序列且进行复制。可从生产孔的生物体(如大肠杆菌)提取编码野生型CsgG的染色体DNA。可使用涉及特异性引物的PCR来扩增编码孔亚基的基因。可接着对所扩增的序列进行定点诱变。定点诱变的合适方法在所属领域中已知,且包括例如组合链反应。编码构筑体的聚核苷酸可使用熟知技术来制备,例如在Sambrook,J.和Russell,D.(2001).《分子克隆实验指南》第3版,纽约冷泉港的冷泉港实验室出版社中所描述的那些技术。

可接着将所得聚核苷酸序列并入到重组可复制的载体(例如克隆载体)中。载体可用于在相容的宿主细胞中复制聚核苷酸。因此,可通过将聚核苷酸引入到可复制的载体中,将所述载体引入到相容的宿主细胞中,和在产生载体复制的条件下使宿主细胞生长,来制备聚核苷酸序列。可从宿主细胞回收载体。用于克隆聚核苷酸的合适宿主细胞在所属领域中已知,且在下文更详细地描述。

可将聚核苷酸序列克隆到合适表达载体中。在表达载体中,聚核苷酸序列通常可操作地连接于控制序列,所述控制序列能够通过宿主细胞实现编码序列的表达。这些表达载体可用于表达孔亚基。

术语“可操作地连接”是指所描述的组分处于允许其以其预期方式起作用的关系的并接。“可操作地连接”于编码序列的控制序列是以在与控制序列相容的条件下实现编码序列的表达的方式接合。可将相同或不同聚核苷酸序列的多个拷贝引入到载体中。

可接着将表达载体引入到合适宿主细胞中。因此,可以通过将聚核苷酸序列***表达载体中、将载体引入相容的细菌宿主细胞中以及在引起对聚核苷酸序列的表达的条件下使宿主细胞生长来产生突变单体或构筑体。可将以重组方式表达的单体或构筑体自组装到宿主细胞膜中的孔中。替代地,以此方式生产的重组孔可从宿主细胞去除且***另一膜中。当生产包含至少两个不同单体或构筑体的孔时,不同单体或构筑体可分开地在如上文所描述的不同宿主细胞中表达,从宿主细胞去除且组装到独立膜(如兔细胞膜或合成膜)中的孔中。

载体可例如为质粒、病毒或噬菌体载体,其具备复制起点、任选地用于表达所述聚核苷酸序列的启动子和任选地启动子的调控子。载体可含有一个或多个可选标记基因,例如四环素抗性基因。可选择启动子和其它表达调控信号,以与被设计成表达载体的宿主细胞相容。通常使用T7、trc、lac、ara或λL启动子。

宿主细胞通常以高水平表达单体或构筑体。将选择用聚核苷酸序列转化的宿主细胞,以与用于转化细胞的表达载体相容。宿主细胞通常是细菌并优选地是大肠杆菌。具有λDE3溶源(例如C41(DE3)、BL21(DE3)、JM109(DE3)、B834(DE3)、TUNER、Origami和Origami B)的任何细胞可表达包含T7启动子的载体。除上文所列的条件以外,列举于以下中的任一种方法可用于表达CsgG蛋白:Cao等人,2014,《美国国家科学院院刊》,《九聚体细菌淀粉状蛋白分泌通道的结构(Structure of the nonameric bacterial amyloid secretionchannel)》,doi-1411942111;和Goyal等人,2014,《自然(Nature)》,516,250-253《对细菌淀粉状蛋白分泌通道CsgG的结构性和机制见解(structural and mechanistic insightsinto the bacterial amyloid secretion channel CsgG)》。

本发明还包含一种生产本发明的突变单体或本发明的构筑体的方法。方法包含在合适宿主细胞中表达本发明的聚核苷酸。聚核苷酸优选地是载体的一部分,且优选地可操作地连接于启动子。

除了上文描述的双孔之外,本发明还提供了各种孔。所述孔对于表征(如测序)聚核苷酸序列是理想的,这是因为其可以较高程度的敏感性在不同核苷酸之间进行鉴别。孔可出人意料地区别DNA和RNA中的四种核苷酸。孔可以甚至区别甲基化和未甲基化的核苷酸。孔的基础分辨率出人意料地高。孔显示几乎完全分离所有四种DNA核苷酸。基于孔中的停留时间和流过孔的电流,孔进一步在脱氧胞苷单磷酸酯(dCMP)与甲基-dCMP之间进行鉴别。

提供一种包含至少一种根据本发明的单体或一种根据本发明的构筑体的孔。孔可以是同源寡聚的或异源寡聚的。

孔还可以在一系列条件下在核苷酸之间进行鉴别。特定来说,孔将在有利于表征(如测序)核酸的条件下在核苷酸之间进行鉴别。孔可在不同核苷酸之间进行鉴别的程度可通过改变所施加的电势、盐浓度、缓冲液、温度和添加剂的存在(如脲、甜菜碱和DTT)来控制。这允许对孔的功能进行微调,尤其当测序时。这一点在下文更详细论述。孔还可用于根据与一个或多个单体的相互作用而不是根据核苷酸紧接核苷酸来鉴定聚核苷酸聚合物。

孔可被分离,大体上被分离、被纯化或大体上被纯化。如果孔完全不含任何其它组分(如脂质或其它孔),那么其被分离或纯化。如果孔与将不干扰其既定用途的载体或稀释剂混合,那么其大体上被分离。举例来说,如果孔是以包含小于10%、小于5%、小于2%或小于1%的其它组分(如三嵌段共聚物、脂质或其它孔)的形式存在,那么其大体上被分离或大体上被纯化。替代地,孔可存在于膜中。

孔可以作为个别孔或单个孔存在。替代地,孔可存在于两个或更多个孔的同源或异源群体中。

术语孔在本公开中的用途意图涵盖孔和双孔。

同源寡聚孔

还提供了包含如本文所公开的相同单体的同源寡聚孔。同源寡聚孔可包含本发明的单体中的任一个。同源寡聚孔对于表征(如测序)聚核苷酸是理想的。

同源寡聚孔可含有任何数量的单体。孔通常包含至少7个、至少8个、至少9个或至少10个相同突变单体,例如7个、8个、9个或10个突变单体。孔优选地包含八个或九个相同的单体。一个或多个(例如2个、3个、4个、5个、6个、7个、8个、9个或10个)单体优选地如上文所论述进行化学修饰。

提供同源寡聚双孔。

异源寡聚孔

还提供了包含至少一个如本文所公开的单体的异源寡聚孔。本发明的异源寡聚孔对于表征(如测序)聚核苷酸是理想的。异源寡聚孔可使用所属领域中已知的方法来制备(例如,《蛋白质科学(Protein Sci.)》2002年7月;11(7):1813-24)。

异源寡聚孔含有足够的单体来形成孔。单体可具有任何类型。孔通常包含至少7个、至少8个、至少9个或至少10个单体,例如7个、8个、9个或10个单体。孔优选地包含八个或九个单体。

在一优选实施例中,所有单体(如10个、9个、8个或7个单体)均是本发明的单体,且其中的至少一个不同于另外的单体。在一更优选实施例中,孔包含八个或九个本发明的单体,且其中的至少一个不同于另外的单体。其所有可彼此不同。

孔中的本发明的单体优选地是大致相同的长度或是相同的长度。孔中的本发明的单体的桶优选地是大致相同的长度或是相同的长度。长度可以氨基酸的数量和/或长度的单位的形式进行测量。

在另一优选实施例中,单体中的至少一个不是本发明的单体。在这个实施例中,剩余单体优选地是本发明的单体。因此,孔可包含9个、8个、7个、6个、5个、4个、3个、2个或1个本发明的单体。孔中的任何数量的单体可以不是本发明的单体。孔优选地包含七或八个本发明的单体和不是本发明的单体的单体。本发明的单体可相同或不同。

孔中的单体(例如本发明的单体)优选地是大致相同的长度或是相同的长度。孔中的单体的桶优选地是大致相同的长度或是相同的长度。长度可以氨基酸的数量和/或长度的单位的形式进行测量。

孔可包含不是本发明的单体的一个或多个单体。不是本发明的单体的CsgG单体包括:包含SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23或SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23的变异体的单体,其中上文关于本发明所论述的氨基酸/位置无一个突变/取代。以氨基酸一致性计,SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23的比较变异体通常在其整个序列内与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23至少50%同源。更优选地,以氨基酸一致性计,比较变异体可在整个序列内与SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22或23的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。

在所有上文所论述的实施例中,一个或多个(例如2个、3个、4个、5个、6个、7个、8个、9个或10个)突变单体优选地如上文所论述进行化学修饰。

提供异源寡聚双孔。

含构筑体的孔

还提供一种孔,其包括至少一个本发明的构筑体。孔可以是双孔。构筑体包含两个或更多个共价连接的衍生自CsgG的单体,其中所述单体中的至少一个是本发明的单体。换句话说,构筑体必须含有超过一个单体。孔含有足够的构筑体和(视需要)单体,以形成孔。举例来说,八聚体孔可包含:(a)四个构筑体,其各自包含两个构筑体;(b)两个构筑体,其各自包含四个单体,或(b)一个构筑体,其包含两个单体和六个不形成构筑体的部分的单体。举例来说,九聚体孔可包含:(a)四个构筑体,其各自包含两个构筑体和一个不形成构筑体的部分的单体;(b)两个构筑体,其各自包含四个单体和一个不形成构筑体的部分的单体,或(b)一个构筑体,其包含两个单体和七个不形成构筑体的部分的单体。构筑体和单体的其它组合可由所属领域的技术人员来设想。

孔中的至少两个单体可呈本发明的构筑体形式。构筑体且因此孔包含至少一个本发明的单体。孔通常总共包含至少7个、至少8个、至少9个或至少10个单体,例如7个、8个、9个或10个单体(其中的至少两个必须呈构筑体形式)。孔优选地包含八个或九个单体(其中的至少两个必须呈构筑体形式)。

含有构筑体的孔可为同源寡聚物(即包括相同的构筑体)或为异源寡聚物(即其中至少一个构筑体不同于另外的构筑体)。

孔通常含有:(a)一个构筑体,其包含两个单体;和(b)5个、6个、7个或8个单体。构筑体可以是上文所论述的那些构筑体中的任一个。单体可以是上文所论述的那些单体中的任一个,包括本发明的单体,包含SEQ ID NO:2到23的单体和包含SEQ ID NO:2到23的变异体的单体。

另一典型孔包含超过一个构筑体,例如超过一个本发明的构筑体,例如两个、三个或四个本发明的构筑体。视需要,这些孔进一步包含足够的额外单体或构筑体来形成孔。额外的单体可以是上文所论述的那些单体中的任一个,包括本发明的单体,包含SEQ ID NO:2到23的单体和包含如上文所论述的SEQ ID NO:2到23的变异体的单体。额外的构筑体可以是上文所论述的那些构筑体中的任一个或可为包含两个或更多个共价连接的CsgG单体的构筑体,所述两个或更多个共价连接的CsgG单体各自包含含有SEQ ID NO:2到23或SEQ IDNO:2到23的变异体的单体。

其它孔仅包含含有2个单体的构筑体,例如孔可包含含有2个单体的4个、5个、6个、7个或8个构筑体。孔中的至少一个构筑体是本发明的构筑体,即至少一个构筑体中的至少一个单体,并优选地至少一个构筑体中的每个单体是本发明的单体。包含2个单体的所有构筑体均可为本发明的构筑体。

特定孔包含四个本发明的构筑体,其各自包含两个单体,其中每个构筑体中的至少一个单体,并优选地每个构筑体中的每个单体是本发明的单体。构筑体可寡聚成孔,所述孔具有使得仅每个构筑体的一个单体造成孔的通道的结构。通常,构筑体的其它单体将在孔的通道外部上。举例来说,孔可包含7个、8个、9个或10个构筑体,所述构筑体包含2个单体,其中通道包含7个、8个、9个或10个单体。

可将突变引入到如上文所描述的构筑体中。突变可为交替的,即突变对于两个单体构筑体内的每个单体是不同的,且构筑体组装为同源寡聚物,从而产生交替的修饰。换句话说,将包含MutA和MutB的单体融合和组装,以形成A-B:A-B:A-B:A-B孔。替代地,突变可为相邻的,即将相同突变引入构筑体中的两个单体中,且这接着与不同突变单体或构筑体寡聚。换句话说,将包含MutA的单体融合,随后与含MutB的单体寡聚反应,以形成A-A:B:B:B:B:B:B。

含构筑体的孔中的单体中的一个或多个可如上文所论述进行化学修饰。

还提供了生产根据本发明的单体或根据本发明的构筑体的方法,其包含在合适的宿主细胞中表达根据本发明的聚核苷酸,且从而生产所述单体或所述构筑体。

分析物表征

双孔尤其适合于表征(例如测序)聚核苷酸。包含两个野生型CsgG或两个CsgG同源物的双孔也可用于表征分析物(例如聚核苷酸)的方法中。双孔具有两个收缩部,其可在表征聚核苷酸的方法中,特别是在对聚核苷酸进行测序时用作读取头。当对聚核苷酸的均聚区域进行测序时,具有两个读取头是特别有益的。

因此,提供了一种使用跨膜孔表征聚核苷酸的方法,其中孔是包含第一CsgG孔或其同源物和第二CsgG孔或其同源物的双孔。在一优选实施例中,聚核苷酸包含均聚区域。还提供了本文公开的双孔或孔确定目标分析物是否存在或其一个或多个特征的用途。

提供一种对聚核苷酸中的一系列相同核苷酸进行测序的方法,所述方法包含使聚核苷酸与如本文所公开的双孔或孔接触,以使得目标分析物相对于孔移动;且在分析物相对于孔移动时进行一次或多次测量,且从而测定聚核苷酸中相同核苷酸的一致性和数量。

与在现有技术中用于测序的CsgG孔相比,特别是与包含具有Y51A和F56Q取代的SEQ ID NO:2的CsgG孔相比,孔可以是具有长的读取头(桶形收缩部)的孔。读取头可与包含SEQ ID NO:2的野生型CsgG孔中的收缩部相当(相同或大致相同的长度)或更长。可充当读取头的延长的收缩部在表征聚核苷酸的方法中,特别是在对聚核苷酸进行测序时是有利的。当对聚核苷酸的均聚区域进行测序时,具有较长读取头是特别有益的。

在所述方法中,双孔可以是双孔中的任一个,或第一CsgG孔或其同源物和第二CsgG孔或其同源物可以是任何同源寡聚物,包括野生型同源寡聚物,且第一CsgG孔或其同源物和第二CsgG孔或其同源物可以彼此相同。

提供一种用于测定目标分析物是否存在或其一个或多个特征的方法,其包含:

(a)使目标分析物与如本文所公开的双孔或孔接触,使得目标分析物相对于孔移动;和(b)在所述分析物相对于所述孔移动时进行一次或多次测量,且从而测定所述分析物是否存在或其一个或多个特征。

在一优选实施例中,分析物是聚核苷酸。在一更优选实施例中,聚核苷酸是包含均聚区域的聚核苷酸。

方法可包含测定选自以下的一个或多个特征:(i)聚核苷酸的长度;(ii)聚核苷酸的一致性;(iii)聚核苷酸的序列;(iv)聚核苷酸的二级结构;和(v)聚核苷酸是否被修饰。通常通过电学测量和/或光学测量来测量分析物的一个或多个特征。

提供一种测定目标分析物是否存在或其一个或多个特征的方法。方法涉及:使目标分析物与如本文所公开的孔接触,使得目标分析物相对于(如通过)孔移动,和在分析物相对于孔移动时进行一次或多次测量,且从而测定分析物是否存在或其一个或多个特征。目标分析物还可被称为模板分析物或所关注的分析物。

步骤(a)和(b)优选地在孔两端施加电势的情况下实行。如下文更详细地论述,所施加的电势通常使得在孔与聚核苷酸结合蛋白之间形成复合体。所施加的电势可为电压电势。替代地,所施加的电势可为化学电势。此的实例为在两亲层两端使用盐梯度。盐梯度公开于Holden等人《美国化学学会杂志》2007年7月11日;129(27):8650-5中。

方法是用于测定目标分析物是否存在或其一个或多个特征。方法可用于测定至少一种分析物是否存在或其一个或多个特征。方法可涉及测定两种或更多种分析物是否存在或其一个或多个特征。方法可包含测定任何数量的分析物(例如2种、5种、10种、15种、20种、30种、40种、50种、100种或更多种分析物)是否存在或其一个或多个特征。可测定一种或多种分析物的任何数量的特征,例如1个、2个、3个、4个、5个、10个或更多个特征。

目标分析物优选地是金属离子、无机盐、聚合物、氨基酸、肽、多肽、蛋白质、核苷酸、寡核苷酸、聚核苷酸、染料、漂白剂、药物、诊断剂、娱乐性药物、***性或环境污染物。方法可涉及测定两种或更多种相同类型的分析物(例如两种或更多种蛋白质、两种或更多种核苷酸或两种或更多种药物)是否存在或其一个或多个特征。替代地,方法可涉及测定两种或更多种不同类型的分析物(例如一种或多种蛋白质、一种或多种核苷酸和一种或多种药物)是否存在或其一个或多个特征。

可从细胞分泌目标分析物。替代地,目标分析物可为存在于细胞内部以使得必须从细胞提取分析物的分析物。

分析物优选地是氨基酸、肽、多肽和/或蛋白质。氨基酸、肽、多肽或蛋白质可为天然存在的或非天然存在的。多肽或蛋白质可包括在其合成或修饰氨基酸内。对于氨基酸的多种不同类型修饰在所述领域中已知。合适氨基酸和其修饰如上文。应理解,可通过所属领域中可用的任何方法来修饰目标分析物。

蛋白质可为酶、抗体、激素、生长因子或生长调控蛋白,例如细胞因子。细胞因子可选自:白介素,优选地IFN-1、IL-1、IL-2、IL-4、IL-5、IL-6、IL-10、IL-12和IL-13;干扰素,优选地IL-γ;和其它细胞因子,例如TNF-α。蛋白质可为细菌蛋白质、真菌蛋白质、病毒蛋白质或寄生虫来源的蛋白质。

目标分析物优选地是核苷酸、寡核苷酸或聚核苷酸。下文论述核苷酸和聚核苷酸。寡核苷酸是短核苷酸聚合物,其通常具有50个或更少个核苷酸,例如40个或更少个、30个或更少个、20个或更少个、10个或更少个或5个或更少个核苷酸。寡核苷酸可包含下文论述的任一个核苷酸,包括无碱基和修饰的核苷酸。

聚核苷酸优选是包含均聚区域的聚核苷酸,即聚核苷酸包含一系列重复的核苷酸,例如两个或更多个相邻的A、G、C、T或U碱基,例如3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、100个或更多个连续的A、G、C、T或U。双孔和孔(特别是其中孔的最窄部分的长度与野生型CsgG孔中的孔相同或更长的孔)特别适合于测定这些均聚聚核苷酸序列的序列。

例如目标聚核苷酸的目标分析物可存在于任何合适的样本中。在下文讨论合适样本的实例。

孔通常存在于如下文所论述的膜中。可使用下文论述的方法,来将目标分析物偶联或递送到膜。

下文论述中的任一个测量可用于测定目标分析物是否存在或其一个或多个特征。方法优选地包含:使目标分析物与孔接触,使得目标分析物相对于(如移动通过)孔移动,和在分析物相对于孔移动时测量穿过孔的电流,且从而测定分析物是否存在或其一个或多个特征。

如果电流以对分析物具有特异性的方式流过孔(即如果检测到与分析物相关的流过孔的独特电流),那么目标分析物存在。如果电流并不以对核苷酸具有特异性的方式流过孔,那么分析物缺失。可在分析物的存在下实行对照实验,以测定如果影响流过孔的电流的方式。

方法可基于分析物对于穿过孔的电流具有不同效果,而用于区分具有类似结构的分析物。个别分析物可根据当其与孔相互作用时的其电流幅度来在单分子水平下进行鉴定。方法还可用于测定样本中是否存在特定分析物。方法还可用于测量样本中的特定分析物的浓度。使用除CsgG以外的孔来进行分析物表征在所属领域中已知。

可实行使用跨膜孔表征(例如测序),例如WO2013/041878中所公开。由于目标聚核苷酸相对于孔移动或移动通过孔,可通常通过测量流过孔的离子电流来从所产生的独特离子电流标志来表征分析物。在任何特定时间测量的电流电平通常取决于多个聚合物(例如核苷酸)单元。在任何时间对电流产生贡献的聚合物单元的数量将取决于聚合物的结构,特别是取决于桶形收缩部的结构。举例来说,约3至约20个,例如5个、6个、7个、8个、9个、10个、12个、13个、14个或15个聚合物单元可在任何时间处影响电流电平。

表征聚核苷酸的分析技术可例如涉及使用HMM、神经网络和例如前向-后向算法或维特比算法(Viterbi algorithm)来测定对应于特定序列的一系列测量的可能性。替代地,聚核苷酸可通过测定特征向量和将特征向量与另一特征向量进行比较来表征,所述另一特征向量可为已知的,例如WO 2013/121224中所公开。然而,用于表征聚核苷酸的分析技术不必限于以上实例。

聚核苷酸表征

提供一种表征目标聚核苷酸,例如测序聚核苷酸的方法。对于使用纳米孔表征或测序聚核苷酸存在两种主要策略,即链表征/测序和核酸外切酶表征/测序。方法可以涉及任一种方法。

在链测序中,通过所施加的电势或抵抗所施加的电势,DNA通过纳米孔易位。可在孔的顺侧上使用渐进地或逐渐地对双链DNA起作用的核酸外切酶,以在所施加的电势下馈送剩余单链,或在逆转电势下在反侧上。同样,使双链DNA解旋的解螺旋酶也可以类似的方式使用。还可使用聚合酶。需要链抵抗施加的电势而易位的测序应用也有可能,但DNA必须首先在逆转或无电势下由酶“捕获”。随着电势接着切换回后续结合,链应以顺式到反式的方式穿过孔,且通过电流保持为延长的构形。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。

在一个实施例中,表征目标聚核苷酸的方法涉及使目标序列与如本文所公开的孔和解螺旋酶接触。方法中可以使用任何解螺旋酶。下文论述合适的解螺旋酶。解螺旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解螺旋酶实行方法,使得其在由所施加电压造成的场的情况下控制目标序列移动通过孔。在这种模式中,DNA的5'端首先在孔中被捕获,且酶控制DNA移动到孔中,使得目标序列在场的情况下通过孔,直到其最终易位通过到双层的反侧为止。替代地,优选地实行方法,使得解螺旋酶在抵抗由所施加电压造成的场的情况下控制目标序列移动通过孔。在这种模式中,DNA的3'端首先在孔中被捕获,且酶控制DNA移动到孔中,使得目标序列抵抗所施加场的情况下牵拉出孔,直到其最终推回到双层的顺侧为止。

在核酸外切酶测序中,核酸外切酶从目标聚核苷酸的一端释放个别核苷酸,且如下文所论述来鉴定这些个别核苷酸。在另一实施例中,表征目标聚核苷酸的方法涉及使目标序列与孔和核酸外切酶接触。可在方法中使用下文论述中的任一个核酸外切酶。酶可共价连接于孔,如下文所论述。

核酸外切酶是通常扣在聚核苷酸的一端且从所述末端一次一个核苷酸来消化序列的酶。核酸外切酶可在5′到3′方向或3′到5′方向上消化聚核苷酸。通常通过选择所使用的酶和/或使用所属领域中已知的方法,来决定与核酸外切酶结合的聚核苷酸的末端。在聚核苷酸的任一端处的羟基或帽结构可通常用于防止或促进核酸外切酶结合于聚核苷酸的特定末端。

方法涉及使聚核苷酸与核酸外切酶接触,使得如上文所论述,以允许表征或鉴定一定比例的核苷酸的速率从聚核苷酸的末端消化核苷酸。进行此的方法在所属领域中是众所周知的。举例来说,Edman降解用于从多肽的末端连续地消化单一氨基酸,使得可使用高效液相色谱(HPLC)来鉴定其。可使用同源方法。

核酸外切酶起作用的速率通常比野生型核酸外切酶的最优速率慢。方法中的核酸外切酶的活性的合适速率包括以下的消化速率:0.5到1000个核苷酸/秒、0.6到500个核苷酸/秒、0.7到200个核苷酸/秒、0.8到100个核苷酸/秒、0.9到50个核苷酸/秒或1到20个或10个核苷酸/秒。速率优选地是1个、10个、100个、500个或1000个核苷酸/秒。核酸外切酶活性的合适速率可以不同方式来实现。举例来说,可使用具有降低的最优活性速率的变异体核酸外切酶。

在链表征实施例中,方法包含:使聚核苷酸与如本文所公开的孔接触,使得聚核苷酸相对于(如通过)孔移动,和在聚核苷酸相对于孔移动时进行一次或多次测量,其中测量指示聚核苷酸的一个或多个特征,且从而表征目标聚核苷酸。

在核酸外切酶表征实施例中,方法包含:使聚核苷酸与如本文所公开的孔和核酸外切酶接触,使得核酸外切酶从目标聚核苷酸的一端消化个别核苷酸,和个别核苷酸相对于(如通过)孔移动,和在个别核苷酸相对于孔移动时进行一次或多次测量,其中测量指示个别核苷酸的一个或多个特征,且从而表征目标聚核苷酸。

个别核苷酸是单核苷酸。个别核苷酸是不通过核苷酸键结合于另一核苷酸或聚核苷酸的核苷酸。核苷酸键涉及结合于另一核苷酸的糖基团的核苷酸的一个磷酸基。个别核苷酸通常是通过核苷酸键结合于另一聚核苷酸的核苷酸,所述聚核苷酸具有至少5个、至少10个、至少20个、至少50个、至少100个、至少200个、至少500个、至少1000个或至少5000个核苷酸。举例来说,已从目标聚核苷酸序列(如DNA或RNA链)消化个别核苷酸。核苷酸可为下文论述的那些中的任一个。

个别核苷酸可以任何方式且在任何位点处与孔相互作用。核苷酸优选地通过如上文所论述的衔接子或结合衔接子而可逆地结合于孔。在核苷酸穿过跨膜的孔时,核苷酸最优选地通过衔接子或结合衔接子而可逆地结合于孔。在核苷酸穿过跨膜的孔时,核苷酸还可通过衔接子或结合衔接子而可逆地结合于孔的桶或通道。

在个别核苷酸与孔之间的相互作用期间,核苷酸通常以对所述核苷酸具有特异性的方式影响流过孔的电流。举例来说,特定核苷酸将减少在特定平均时段流过孔的电流,且减少到特定程度。换句话说,对于特定核苷酸,流过孔的电流是独特的。可实行对照实验,以测定特定核苷酸对于流过孔的电流的影响。接着,可将在测试样本上进行所述方法的结果与来自这个对照实验的结果进行比较,以鉴定样本中的特定核苷酸或测定在样本中是否存在特定核苷酸。在所述频率下以指示特定核苷酸的方式影响流过孔的电流的频率,可用于测定样本中的所述核苷酸的浓度。还可计算样本内不同核苷酸的比率。举例来说,可计算dCMP与甲基-dCMP的比率。

方法涉及测量目标聚核苷酸的一个或多个特征。目标聚核苷酸还可被称为模板聚核苷酸或所关注的聚核苷酸。

这个实施例也使用如本文所公开的孔。可使用上文关于目标分析物所论述的孔和实施例中的任一个。

聚核苷酸

聚核苷酸(例如核酸)是包含两个或更多个核苷酸的大分子。聚核苷酸或核酸可包含任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。聚核苷酸中的一个或多个核苷酸可以是氧化或甲基化的。聚核苷酸中的一个或多个核苷酸可以是受损的。举例来说,聚核苷酸可以包含嘧啶二聚体。这些二聚体通常与紫外光的损坏相关,且是皮肤黑色素瘤的主要病因。聚核苷酸中的一个或多个核苷酸可例如用标记或标签修饰。在下文描述合适的标记。聚核苷酸可包含一个或多个间隔子。

核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。

核碱基通常是杂环的。核碱基包括(但不限于)嘌呤和嘧啶,且更详细地说腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。

糖通常是戊糖。核苷酸糖包括(但不限于)核糖和脱氧核糖。糖优选地是脱氧核糖。

聚核苷酸优选地包含以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。

核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。核苷酸可包含超过三个磷酸,例如4个或5个磷酸。磷酸可连接在核苷酸的5'或3'侧上。核苷酸包括(但不限于):单磷酸腺苷(AMP)、单磷酸鸟苷(GMP)、单磷酸胸苷(TMP)、单磷酸尿苷(UMP)、单磷酸5-甲基胞啶、单磷酸5-羟基甲基胞苷、单磷酸胞嘧啶核苷(CMP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸脱氧胸苷(dTMP)、单磷酸脱氧尿苷(dUMP)、单磷酸脱氧胞苷(dCMP)和单磷酸脱氧甲基胞苷。核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP、dCMP和dUMP。

核苷酸可以无碱基(即缺乏核碱基)。核苷酸还可缺乏核碱基和糖(即是C3间隔子)。

聚核苷酸中的核苷酸可以任何方式彼此连接。如在核酸中,核苷酸通常通过其糖和磷酸基连接。如在嘧啶二聚体中,核苷酸可通过其核碱基连接。

聚核苷酸可以是单链或双链。聚核苷酸优选地是单链。在实例中,单链聚核苷酸表征是被称作1D。聚核苷酸的至少部分可以是双链。

聚核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。聚核苷酸可以包含与一条DNA链杂交的一条RNA链。聚核苷酸可以是所属领域中已知的任何合成核酸,例如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其它合成聚合物。PNA主链由通过肽键连接的N-(2-氨基乙基)-甘氨酸重复单元构成。GNA主链由通过磷酸二酯键连接的乙二醇重复单元构成。TNA主链由通过磷酸二酯键连接在一起的重复苏糖构成。LNA是由如上文所论述的具有将核糖部分中的2'氧和4'碳连接的额外桥的核糖核苷酸形成。桥接核酸(BNA)是经修饰的RNA核苷酸。其还可被称为受限或不可接近的RNA。BNA单体可含有五元、六元或甚至七元桥接结构,其具有“固定”的C3’-内糖褶皱。在核糖的2’,4’-位置处合成地并入桥,产生2’,4’-BNA单体。

聚核苷酸最优选地是核糖核酸(RNA)或脱氧核糖核酸(DNA)。

聚核苷酸可以是任何长度的。举例来说,聚核苷酸的长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸或核苷酸对。聚核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对,或100000个或更多个核苷酸或核苷酸对。

可研究任何数量的聚核苷酸。举例来说,方法可涉及表征2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个或更多个聚核苷酸。如果表征两个或更多个聚核苷酸,那么其可以是不同的聚核苷酸或两个相同聚核苷酸的例子。

聚核苷酸可以是天然存在的或人工的。举例来说,方法可用于验证所制造寡核苷酸的序列。通常在活体外实行方法。

样本

聚核苷酸通常存在于任何合适样本中。通常在已知含有或疑似含有聚核苷酸的样本实行方法。替代地,可在确认聚核苷酸的一致性的样本上实行方法,已知或预期所述聚核苷酸存在于样本中。

样本可以是生物样本。可使用从任何生物体或微生物获得或提取的样本在活体外实行方法。生物体或微生物通常是古细菌、原核或真核微生物,且通常属于以下五界中的一个:植物界、动物界、真菌界、原核生物界和原生生物界。可在从任何病毒获得或提取的样本上在活体外实行方法。样本优选地是流体样本。样本通常包含患者的体液。样本可以是尿液、淋巴液、唾液、粘液或羊膜液,但优选地是血液、血浆或血清。

通常,样本是人类来源的;但替代地其可来自另一哺乳动物,例如来自商业养殖动物,例如马、牛、绵羊、鱼、鸡或猪;或替代地可以是宠物,例如猫或狗。替代地,样本可以是植物来源的,例如从经济作物获得的样本,例如谷物、豆科植物、果实或植物,例如小麦、大麦、燕麦、芥花、玉米、大豆、稻谷、大黃、香蕉、苹果、蕃茄、马铃薯、葡萄、烟草、菜豆、小扁豆、甘蔗、可可、棉花。

样本可以是非生物样本。非生物样本优选地是流体样本。非生物样本的实例包括手术液、水(例如饮用水、海水或河水)和实验室测试用试剂。

样本通常在用于方法中之前进行处理,例如通过离心或通过穿过滤出不需要的分子或细胞(例如红细胞)的膜。可紧接着在获取后进行测量。还可通常在分析之前存储样本,优选地低于-70℃。

表征

方法可涉及测量聚核苷酸的两个、三个、四个或五个或更多个特征。一个或多个特征优选地选自:(i)聚核苷酸的长度;(ii)聚核苷酸的一致性;(iii)聚核苷酸的序列;(iv)聚核苷酸的二级结构;和(v)聚核苷酸是否被修饰。可根据方法来测量(i)到(v)的任何组合,例如:{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}或{i,ii,iii,iv,v}。可针对与第二聚核苷酸进行比较的第一聚核苷酸来测量(i)到(v)的不同组合,包括上文所列的那些组合中的任一个。

对于(i),可例如通过测定聚核苷酸与孔之间的相互作用的数量或聚核苷酸与孔之间的相互作用的持续时间,来测量聚核苷酸的长度。

对于(ii),可以多种方式来测量聚核苷酸的一致性。可结合测量聚核苷酸的序列或不测量聚核苷酸的序列,来测量聚核苷酸的一致性。前者是直接了当的;测序聚核苷酸且从而进行鉴定。可以若干方式来进行后者。举例来说,可测量聚核苷酸中的特定基序的存在(而不测量聚核苷酸的剩余序列)。替代地,方法中的特定电子和/或光学信号的测量可鉴定来自特定来源的聚核苷酸。

对于(iii),可如先前所描述来测定聚核苷酸的序列。合适测序方法,尤其使用电学测量的那些测序方法,描述于以下中:Stoddart D等人,《美国国家科学院院刊》,12;106(19):7702-7,Lieberman KR等人,《美国化学学会杂志》2010;132(50):17961-72,和国际申请WO 2000/28312。

对于(iv),可以多种方式来测量二级结构。举例来说,如果方法涉及电学测量,那么可使用停留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链和双链聚核苷酸的区。

对于(v),可测量是否存在任何修饰。方法优选地包含,用一个或多个蛋白质或用一个或多个标记、标签或间隔子,测定聚核苷酸是否通过甲基化、通过氧化、通过损坏来修饰。特异性修饰将引起与可使用以下所描述的方法测量的孔的特异性相互作用。举例来说,可基于在孔与每个核苷酸相互作用期间流过孔的电流,将甲基胞嘧啶与胞嘧啶区别开。

使目标聚核苷酸与如本文所公开的孔接触。孔通常存在于膜中。下文论述合适膜。可使用适合于研究膜/孔系统的任何设备来实行方法,其中孔存在于膜中。可使用适合于跨膜孔感测的任何设备来实行方法。举例来说,设备包含含有水溶液的腔室和将腔室分隔为两个部分的屏障。屏障通常具有开孔,在开孔中形成含有孔的膜。替代地,屏障形成其中存在孔的膜。

可使用描述于WO 2008/102120中之设备来实行方法。

可进行各种不同类型的测量。这包括(但不限于)电学测量和光学测量。可能的电学测量包括:电流测量、阻抗测量、隧道测量(Ivanov AP等人,《纳米快报(Nano Lett.)》2011年1月12日;11(1):279-85)和FET测量(WO 2005/124888)。可将光学测量与电学测量组合(Soni GV等人,《科学仪器综述(Rev Sci Instrum.)》2010年1月;81(1):014301)。测量可以是跨膜电流测量,例如流过孔的离子电流的测量。

可使用标准单通道记录装置来进行电学测量,如Stoddart D等人,《美国国家科学院院刊》,12;106(19):7702-7,Lieberman KR等人,《美国化学学会杂志》2010;132(50):17961-72,和WO 2000/28312中所描述。替代地,可使用多通道系统来进行电学测量,例如如WO 2009/077734和WO 2011/067559中所描述。

优选地通过在膜两端施加的电势来实行所述方法。所施加的电势可为电压电势。替代地,所施加的电势可为化学电势。此的实例是在膜(例如两亲层)两端使用盐梯度。盐梯度公开于Holden等人《美国化学学会杂志》2007年7月11日;129(27):8650-5中。在一些例子中,在聚核苷酸相对于孔移动时穿过孔的电流用于评估或测定聚核苷酸的序列。这是链测序。

方法可涉及在聚核苷酸相对于孔移动时测量穿过孔的电流。因此,在方法中使用的设备还可包含能够施加电势和测量膜和孔两端的电信号的电路。可使用贴片钳或电压钳来实行方法。方法优选地涉及使用电压钳。

方法可涉及在聚核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的合适条件是所属领域中已知的,且公开于实例中。通常通过在膜和孔两端施加的电压来实行所述方法。所用电压通常是+5V到-5V,例如+4V到-4V、+3V到-3V,或+2V到-2V。所用电压通常是-600mV到+600mV或-400mV到+400mV。所用电压优选地在具有下限和上限的范围内,下限选自:-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,上限独立地选自:+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所用电压更优选地在100mV到240mV的范围内,并且最优选在120mV到220mV的范围内。有可能通过使用增大的所施加电势来增大通过孔对不同核苷酸之间的鉴别。

通常在存在任何电荷载流子的情况下实行方法,电荷载流子如金属盐,例如碱金属盐、卤盐,例如氯化物盐,例如碱金属氯化物盐。电荷载体可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵,或1-乙基-3-甲基氯化咪唑。在下文论述的示范性设备中,盐在腔室中的水溶液中存在。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl),或亚铁***和铁***的混合物。优选的是KCl、NaCl,以及亚铁***和铁***的混合物。电荷载流子可以是跨膜不对称的。举例来说,电荷载流子的类型和/或浓度可在膜的每侧上不同。

盐浓度可以是饱和的。盐浓度可以是3M或更低,且通常0.1到2.5M、0.3到1.9M、0.5到1.8M、0.7到1.7M、0.9到1.6M或1M到1.4M。盐浓度优选地是150mM到1M。优选地使用至少0.3M的盐浓度来进行方法,例如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M。高盐浓度提供高信噪比且允许在正常电流波动的背景下鉴定指示核苷酸存在的电流。

通常在缓冲液存在下实行方法。在下文论述的示范性设备中,缓冲液在腔室中的水溶液中存在。在本发明的方法中可使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液是HEPES和Tris-HCl缓冲液。通常在以下的pH下来实行方法:4.0到12.0、4.5到10.0、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。所用pH优选地是约7.5。

可在以下温度下来实行方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。通常在室温下实行方法。任选地在支持酶功能的温度(如约37℃)下实行方法。

聚核苷酸结合蛋白

链表征方法优选地包含使聚核苷酸与聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动。

更优选地,方法包含:(a)使聚核苷酸与如本文所公开的孔和聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动;和(b)在聚核苷酸相对于孔移动时进行一次或多次测量,其中测量指示聚核苷酸的一个或多个特征,且从而表征聚核苷酸。

更优选地,方法包含:(a)使聚核苷酸与如本文所公开的孔和聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动;和(b)在聚核苷酸相对于孔移动时测量通过孔的电流,其中电流指示聚核苷酸的一个或多个特征,且从而表征聚核苷酸。

聚核苷酸结合蛋白可以是能够结合于聚核苷酸且控制其移动通过孔的任何蛋白质。在所属领域中测定蛋白质是否结合于聚核苷酸是直接了当的。蛋白质通常与聚核苷酸相互作用,且修改其的至少一个特性。蛋白质可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(例如二核苷酸或三核苷酸)来修改聚核苷酸。白质可通过将聚核苷酸定位或移动到特异性位置(即控制其移动)来修改聚核苷酸。

聚核苷酸结合蛋白优选地衍生自聚核苷酸操作酶。聚核苷酸操作酶是能够与聚核苷酸相互作用且修改其的至少一个特性的多肽。酶可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(如二核苷酸或三核苷酸)来修改聚核苷酸。酶可通过将聚核苷酸定位或移动到特异性位置来修改聚核苷酸。聚核苷酸操作酶并不需要显示酶促活性,只要其能够结合聚核苷酸且控制其移动通过孔即可。举例来说,酶可进行修饰以去除其酶促活性,或可在防止其充当酶的条件下使用。在下文更详细地论述这些条件。

聚核苷酸操作酶优选地衍生自核分解酶。酶的构筑体中所用的聚核苷酸操作酶更优选地是衍生自以下酶分类(EC)组中的任一个的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。酶可以是在WO 2010/086603中所公开任一种酶。

优选的酶是聚合酶、核酸外切酶、解螺旋酶和拓扑异构酶,例如回旋酶合适酶包括(但不限于)来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自极端嗜热菌的RecJ和噬菌体λ核酸外切酶、TatD核酸外切酶和其变异体。聚合酶可以是3173DNA聚合酶(其可购自公司)、SD聚合酶(可购自)或其变异体。酶优选地是Phi29 DNA聚合酶或其变异体。拓扑异构酶优选地是酶分类(EC)组5.99.1.2和5.99.1.3中的任一个的成员。

酶最优选地衍生自解螺旋酶,例如Hel308 Mbu、Hel308 Csy、Hel308 Tga、Hel308Mhu、TraI Eco、XPD Mbu或其变异体。可使用任何解螺旋酶。解螺旋酶可以是或衍生自Hel308解螺旋酶、RecD解螺旋酶(例如Tral解螺旋酶或TrwC解螺旋酶)、XPD解螺旋酶或Dda解螺旋酶。解螺旋酶可以是以下中所公开的任何解螺旋酶、修饰的解螺旋酶或解螺旋酶构筑体:WO 2013/057495;WO 2013/098562;WO2013098561;WO 2014/013260;WO 2014/013259;WO 2014/013262;和WO2015/055981。

可使用任何数量的解螺旋酶。举例来说,可使用1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个解螺旋酶。在一些实施例中,可使用不同数量的解螺旋酶。

方法优选地包含使聚核苷酸与两个或更多个解螺旋酶接触。两个或更多个解螺旋酶通常是相同的解螺旋酶。两个或更多个解螺旋酶可以是不同的解螺旋酶。

两个或更多个解螺旋酶可以是上文提到的解螺旋酶的任何组合。两个或更多个解螺旋酶可以是两个或更多个Dda解螺旋酶。两个或更多个解螺旋酶可以是一个或多个Dda解螺旋酶和一个或多个TrwC解螺旋酶。两个或更多个解螺旋酶可以是相同解螺旋酶的不同变异体。

两个或更多个解螺旋酶优选地彼此连接。两个或更多个解螺旋酶更优选地彼此共价连接。解螺旋酶可以按任何次序和使用任何方法来连接。优选的解螺旋酶构筑体描述于WO 2014/013260、WO 2014/013259、WO 2014/013262和WO2015/055981中。

可使用保留聚核苷酸结合能力的天然存在的解螺旋酶的变异体。可使用所属领域中已知的任何方法来测量聚核苷酸结合能力。举例来说,可使变异体与聚核苷酸接触,且可测量其结合于聚核苷酸和沿所述聚核苷酸移动的能力。变异体可包括便于聚核苷酸结合和/或便于其在高盐浓度和/或室温下活性的修饰。变异体可进行修饰,使得其结合聚核苷酸(即保持聚核苷酸结合能力)但不充当解螺旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时不沿聚核苷酸移动)。这些修饰是所属领域中已知的。举例来说,解螺旋酶中的Mg2+结合域的修饰通常产生不充当解螺旋酶的变异体。这些变异体类型可充当分子制动器(参见下文)。优选的分子制动器是TrwC Cba-Q594A。变异体并不充当解螺旋酶(即当具备所有便于移动的必需组分(例如ATP和Mg2+)时,结合聚核苷酸但并不沿其移动)。

酶可共价连接于孔。任何方法可用于将酶共价连接于孔。

在链测序时,通过所施加的电势或抵抗所施加的电势,聚核苷酸通过纳米孔易位。可在孔的顺侧上使用渐进地或逐渐地对双链聚核苷酸起作用的核酸外切酶,以在所施加的电势下馈送剩余单链,或在逆转电势下在反侧上。同样,使双链DNA解旋的解螺旋酶也可以类似的方式使用。还可使用聚合酶。需要链抵抗施加的电势而易位的测序应用也有可能,但DNA必须首先在逆转或无电势下由酶“捕获”。随着电势接着切换回后续结合,链应以顺式到反式的方式穿过孔,且通过电流保持为延长的构形。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。

方法中可以使用任何解螺旋酶。解螺旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解螺旋酶来实行方法,使得在由所施加电压造成的场的情况下,解螺旋酶使聚核苷酸通过孔移动。在这种模式中,聚核苷酸的5'端首先在孔中被捕获,且解螺旋酶使聚核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反侧为止。替代地,优选地实行方法,使得抵抗由所施加电压造成的场的情况下,解螺旋酶使聚核苷酸移动通过孔。在这种模式中,聚核苷酸的3'端首先在孔中被捕获,且解螺旋酶使聚核苷酸移动到孔中,使得其抵抗所施加场的情况下牵拉出孔,直到其最终推回到膜的顺侧为止。

还可在相反的方向上进行方法。聚核苷酸的3'端可首先在孔中被捕获,且解螺旋酶可使聚核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反侧为止。

当解螺旋酶不具备便于移动的必需组分,或进行修饰以阻止或防止其移动时,当其通过所施加的场牵拉到孔中时,其可结合于聚核苷酸,且充当减缓聚核苷酸移动的制动器。在非活动模式中,是3'还是5'向下捕获聚核苷酸是不重要的,是所施加的场,通过充当制动器的酶,朝向反式侧而将聚核苷酸牵拉到孔中。当在非活动模式中时,通过解螺旋酶对聚核苷酸的移动控制可以多种方式(包括棘轮、滑动和制动)描述。还可以这种方式来使用缺乏解螺旋酶活性的解螺旋酶变异体。

可按任何次序使聚核苷酸与聚核苷酸结合蛋白和孔接触。优选的是,当使聚核苷酸与聚核苷酸结合蛋白(例如解螺旋酶)和孔接触时,聚核苷酸首先与蛋白质形成复合体。当在孔两端施加电压时,接着聚核苷酸/蛋白质复合体与孔形成复合体,且控制聚核苷酸通过孔的移动。

通常在游离核苷酸或游离核苷酸类似物和有助于聚核苷酸结合蛋白作用的酶辅因子存在下,实行方法中使用聚核苷酸结合蛋白的任何步骤。游离核苷酸可以是上文所论述的任一个个别核苷酸中的一中或多个。游离核苷酸包括(但不限于):单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。游离核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选地是三磷酸腺苷(ATP)。酶辅因子是一种允许构筑体起作用的因子。酶辅因子优选地是二价金属阳离子。二价金属阳离子优选地是Mg2+、Mn2+、Ca2+或Co2+。酶辅因子最优选地是Mg2+

解螺旋酶和分子制动器

在一优选实施例中,方法包含:提供聚核苷酸与一个或多个解螺旋酶以及连接于聚核苷酸的一个或多个分子制动器;使聚核苷酸与如本文所公开的孔接触,且在孔两端施加电势,使得一个或多个解螺旋酶和一个或多个分子制动器带到一起,且均控制聚核苷酸相对于(例如通过)孔的移动;在所述聚核苷酸相对于所述孔移动时,进行一次或多次测量,其中测量指示聚核苷酸的一个或多个特征,且从而表征聚核苷酸。这个类型的方法公开于WO2015/110777中。

一个或多个解螺旋酶可以是上文所论述的那些解螺旋酶中的任一个。一个或多个分子制动器可以是结合于聚核苷酸且减缓聚核苷酸通过孔的移动的任何化合物或分子。一个或多个分子制动器优选地包含结合于聚核苷酸的一种或多种化合物。一种或多种化合物优选地是一种或多种巨环化合物。合适的巨环化合物包括(但不限于)环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱状芳烃、其衍生物或其组合。环糊精或其衍生物可以是在Eliseev,A.V.和Schneider,H-J.(1994)《美国化学学会杂志》116,6081-6088中所公开那些环糊精或其衍生物中的任一种。药剂更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。

一个或多个分子制动器优选地是一个或多个单链结合蛋白(SSB)。一个或多个分子制动器更优选地是:单链结合蛋白(SSB),其包含并不具有净负电荷的羧基末端(C末端)区;或(ii)经修饰SSB,其包含在其C末端区中减少C末端区的净负电荷的一个或多个修饰。一个或多个分子制动器最优选地是WO 2014/013259中所公开的SSB中的一个。

一个或多个分子制动器优选地是一个或多个聚核苷酸结合蛋白。聚核苷酸结合蛋白可以是能够结合于聚核苷酸且控制其移动通过孔的任何蛋白质。在所属领域中测定蛋白质是否结合于聚核苷酸是直接了当的。蛋白质通常与聚核苷酸相互作用,且修改其的至少一个特性。蛋白质可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(例如二核苷酸或三核苷酸)来修改聚核苷酸。所述部分可通过将聚核苷酸定位或移动到特异性位置(即控制其移动)来修改聚核苷酸。

聚核苷酸结合蛋白优选地衍生自聚核苷酸操作酶。一个或多个分子制动器可衍生自上文所论述的聚核苷酸操作酶中的任一个。充当分子制动器的Phi29聚合酶的经修饰型式公开于美国专利第5,576,204号中。一个或多个分子制动器优选地是衍生自解螺旋酶。

可使用任何数量的衍生自解螺旋酶的分子制动器。举例来说,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个解螺旋酶可用作分子制动器。如果两个或更多个解螺旋酶用作分子制动器,那么所述两个或更多个解螺旋酶通常是相同的解螺旋酶。两个或更多个解螺旋酶可以是不同的解螺旋酶。

两个或更多个解螺旋酶可以是上文提到的解螺旋酶的任何组合。两个或更多个解螺旋酶可以是两个或更多个Dda解螺旋酶。两个或更多个解螺旋酶可以是一个或多个Dda解螺旋酶和一个或多个TrwC解螺旋酶。两个或更多个解螺旋酶可以是相同解螺旋酶的不同变异体。

两个或更多个解螺旋酶优选地彼此连接。两个或更多个解螺旋酶更优选地彼此共价连接。解螺旋酶可以按任何次序和使用任何方法来连接。衍生自解螺旋酶的一个或多个分子制动器优选地进行修饰,以降低聚核苷酸结合域中的开口的大小,通过所述开口,在至少一个构形状态中,聚核苷酸可与解螺旋酶解结合。这公开于WO 2014/013260中。

优选的解螺旋酶构筑体描述于WO 2014/013260、WO 2014/013259、WO 2014/013262和WO2015/055981中。

如果以主动模式使用一个或多个解螺旋酶(即当一个或多个解螺旋酶具备便于移动的所有必需组分(例如ATP和Mg2+)时),那么一个或多个分子制动器优选地是:(a)以非活动模式使用(即在不存在便于移动的必需组分下使用,或不能主动移动),(b)以主动模式使用,其中一个或多个分子制动器在与一个或多个解螺旋酶相反的方向上移动,或(c)以主动模式使用,其中一个或多个分子制动器在与一个或多个解螺旋酶相同的方向上移动,且比一个或多个解螺旋酶更缓慢。

如果以非活动模式使用一个或多个解螺旋酶(即当一个或多个解螺旋酶不具备便于移动的所有必需组分(例如ATP和Mg2+)时,或不能主动移动),那么一个或多个分子制动器优选地是:(a)以非活动模式使用(即在不存在便于移动的必需组分下使用,或不能主动移动),或(b)以主动模式使用,其中一个或多个分子制动器在与聚核苷酸相同的方向上沿聚核苷酸移动通过孔。

一个或多个解螺旋酶和一个或多个分子制动器可在任何位置处连接于聚核苷酸,使得其带到一起且均控制聚核苷酸通过孔的移动。一个或多个解螺旋酶和一个或多个分子制动器相隔至少一个核苷酸,例如相隔至少5个、至少10个、至少50个、至少100个、至少500个、至少1000个、至少5000个、至少10,000个、至少50,000个核苷酸或更多个。如果方法涉及表征在一端具备Y衔接子且在另一端具备发夹环衔接子的双链聚核苷酸,那么一个或多个解螺旋酶优选地连接于Y衔接子,且一个或多个分子制动器优选地连接于发夹环衔接子。在这个实施例中,一个或多个分子制动器优选地是进行修饰使得其结合聚核苷酸但不充当解螺旋酶的一个或多个解螺旋酶。连接于Y衔接子的一个或多个解螺旋酶优选地在间隔子处停止,如下文更详细地论述。连接于发夹环衔接子的一个或多个分子制动器优选地不在间隔子处停止。当一个或多个解螺旋酶达到发夹环时,一个或多个解螺旋酶和一个或多个分子制动器优选地带到一起。在Y衔接子连接于聚核苷酸之前或在Y衔接子连接于聚核苷酸之后,一个或多个解螺旋酶可连接于Y衔接子。在发夹环衔接子连接于聚核苷酸之前或在发夹环衔接子连接于聚核苷酸之后,一个或多个分子制动器可连接于发夹环衔接子。

一个或多个解螺旋酶和一个或多个分子制动器优选地不彼此连接。一个或多个解螺旋酶和一个或多个分子制动器更优选地不彼此共价连接。一个或多个解螺旋酶和一个或多个分子制动器优选地不连接,如以下中所描述:WO 2014/013260、WO 2014/013259、WO2014/013262和WO2015/055981。

间隔子

一个或多个解螺旋酶可在一个或多个间隔子处停止,如WO2014/135838中所论述。可使用在WO2014/135838中所公开的一个或多个解螺旋酶和一个或多个间隔子的任何构形。

一个或多个间隔子优选地是聚核苷酸的部分,例如其中断聚核苷酸序列。一个或多个间隔子优选地不是与聚核苷酸杂交的一个或多个阻断分子(例如减速带)的部分。

在聚核苷酸中可存在任何数量的间隔子,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个间隔子。在聚核苷酸中优选地存在两个、四个或六个间隔子。在聚核苷酸的不同区中可存在一个或多个间隔子,例如Y衔接子和/或发夹环衔接子中的一个或多个间隔子。

一个或多个间隔子可包含使一个或多个解螺旋酶停止的任何分子或所述分子的组合。一个或多个间隔子可包含防止一个或多个解螺旋酶沿聚核苷酸移动的任何分子或所述分子的组合。测定一个或多个解螺旋酶是否在不存在跨膜孔和所施加的电势下在一个或多个间隔子处停止是直接了当的。举例来说,可通过PAGE来测量解螺旋酶移动通过间隔子和使DNA互补链移位的能力。

一个或多个间隔子通常包含线性分子,例如聚合物。一个或多个间隔子通常具有与聚核苷酸不同的结构。举例来说,如果聚核苷酸是DNA,那么一个或多个间隔子通常不是DNA。特定来说,如果聚核苷酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),那么一个或多个间隔子优选地包含肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或与核苷酸侧链的合成聚合物。一个或多个间隔子可包含在距聚核苷酸的相反的方向上的一个或多个核苷酸。举例来说,当聚核苷酸是在5'到3'方向上时,一个或多个间隔子在3'到5'方向上可包含一个或多个核苷酸。核苷酸可以是上文所论述的那些核苷酸中的任一个。

一个或多个间隔子优选地包含:一个或多个硝基吲哚,例如一个或多个5-硝基吲哚;一个或多个肌苷;一个或多个吖啶;一个或多个2-氨基嘌呤;一个或多个2-6-二氨基嘌呤;一个或多个5-溴-脱氧尿苷;一个或多个反向胸苷(反向dT);一个或多个反向双脱氧胸苷(ddT);一个或多个双脱氧胞苷(ddC);一个或多个5-甲基胞苷;一个或多个5-羟甲基胞苷;一个或多个2’-O-甲基RNA碱基;一个或多个异脱氧胞苷(Iso-dC);一个或多个异脱氧鸟苷(Iso-dG);一个或多个iSpC3基团(即缺乏糖和碱基的核苷酸);一个或多个可光分解(PC)基团;一个或多个基团;一个或多个间隔子9(iSp9)基团;一个或多个间隔子18(iSp18)基团;聚合物或一个或多个巯基连接。一个或多个间隔子可包含这些基团的任何组合。许多这些基团可购自(Integrated DNA)。

一个或多个间隔子可含有任何数量的这些基团。举例来说,对于2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向dT、ddT、ddC、5-甲基胞苷、5-羟甲基胞苷、2’-O-甲基RNA碱基、Iso-dC、Iso-dG、iSpC3基团、PC基团、己二醇基团和巯基连接,一个或多个间隔子优选地包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个。一个或多个间隔子优选地包含2个、3个、4个、5个、6个、7个、8个或更多个iSp9基团。一个或多个间隔子优选地包含2个、3个、4个、5个或6个或更多个iSp18基团。最优选的间隔子是四个iSp18基团。

聚合物优选地是多肽或聚乙二醇(PEG)。多肽优选地包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个氨基酸。PEG优选地包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个单体单元。

一个或多个间隔子优选地包含一个或多个无碱基核苷酸(即缺乏核碱基的核苷酸),例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个无碱基核苷酸。在无碱基核苷酸中,核碱基可被-H(idSp)或-OH置换。可通过从一个或多个相邻核苷酸去除核碱基,将无碱基间隔子***到聚核苷酸中。举例来说,聚核苷酸可进行修饰,以包括3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N6-亚乙烯基腺嘌呤肌苷或次黄嘌呤,且可使用人类烷基腺嘌呤DNA糖基化酶(hAAG)来从这些核苷酸去除核碱基。替代地,聚核苷酸可进行修饰,以包括尿嘧啶且用尿嘧啶-DNA糖基化酶(UDG)去除核碱基。在一个实施例中,一个或多个间隔子不包含任何无碱基核苷酸。

如果使用线性分子间隔子,那么聚核苷酸具备与一个或多个解螺旋酶待移动的每个间隔子的末端相邻的聚核苷酸的双链区。双链区通常有助于使一个或多个解螺旋酶在相邻间隔子上停止。如果在约100mM或更低的盐浓度下实行方法,那么双链区的存在是特别优选的。每个双链区的长度通常是至少10个,例如至少12个核苷酸。如果聚核苷酸是单链,那么可通过将较短聚核苷酸与同间隔子相邻的区杂交来形成双链区。较短聚核苷酸通常由与聚核苷酸相同的核苷酸来形成,但可由不同核苷酸来形成。举例来说,较短聚核苷酸可由LNA来形成。

如果使用线性分子间隔子,那么聚核苷酸在与一个或多个解螺旋酶待移动的每个间隔子的末端相反的每个间隔子的末端具备阻断分子。这可有助于确保一个或多个解螺旋酶仍在每个间隔子上停止。在其于溶液中扩散开的情况下,其还可有助于将一个或多个解螺旋酶保持在聚核苷酸上。阻断分子可以是下文论述、物理地引起一个或多个解螺旋酶停止的任何化学基团。阻断分子可以是聚核苷酸的双链区。

一个或多个间隔子优选地包含物理地引起一个或多个解螺旋酶停止的一个或多个化学基团。一个或多个化学基团优选地是一个或多个侧链(pendant)化学基团。一个或多个化学基团可连接于聚核苷酸中的一个或多个核碱基。一个或多个化学基团可连接于聚核苷酸主链。可存在任何数量的这些化学基团,例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个。合适的基团包括(但不限于)荧光团、抗生蛋白链菌素和/或生物素、胆固醇、亚甲基蓝、二硝基苯酚(DNP)、地高辛和/或抗地高辛和二苯基环辛炔基团。

聚核苷酸中的不同间隔子可包含不同停止分子。举例来说,一个间隔子可包含上文所论述的一个线性分子,且另一间隔子可包含物理地引起一个或多个解螺旋酶停止的一个或多个化学基团。间隔子可包含上文所论述中的任一个线性分子和物理地引起一个或多个解螺旋酶停止的一个或多个化学基团(例如一个或多个无碱基基团和荧光团)。

可取决于聚核苷酸的类型和实行方法的条件来设计合适的间隔子。大部分解螺旋酶结合DNA且沿DNA移动,且因此可使用不是DNA的任何东西来使其停止。合适分子在上文论述。

优选地在存在游离核苷酸和/或存在解螺旋酶辅因子下来实行方法。这一点在下文更详细论述。在不存在跨膜孔和所施加的电势的下,一个或多个间隔子优选地能够在存在游离核苷酸和/或存在解螺旋酶辅因子下,使一个或多个解螺旋酶停止。

如果如下文所论述在存在游离核苷酸和解螺旋酶辅因子下实行方法(使得更多解螺旋酶中的一个是在主动模式中),那么一个或多个较长间隔子通常用于确保在使一个或多个解螺旋酶与跨膜孔接触和施加电势之前,所述一个或多个解螺旋酶在聚核苷酸上停止。可在不存在游离核苷酸和解螺旋酶辅因子下使用一个或多个较短间隔子(使得一个或多个解螺旋酶是在非活动模式中)。

盐浓度还影响一个或多个间隔子使一个或多个解螺旋酶停止的能力。在不存在跨膜孔施加的电势下,一个或多个间隔子优选地能够在约100mM或更低的盐浓度下使一个或多个解螺旋酶停止。在方法中所用的盐浓度越高,通常使用的一个或多个间隔子越短,且反之亦然。

优选的特征组合显示于下表中。

方法可涉及移动两个或更多个解螺旋酶通过间隔子。在这些情况下,通常增加间隔子的长度,以防止在不存在孔和施加的电势下后置解螺旋酶牵拉前导解螺旋酶通过间隔子。如果方法涉及移动两个或更多个解螺旋酶通过一个或多个间隔子,那么可将上文所论述的间隔子长度增加至少1.5倍,例如2倍、2.5倍或3倍。举例来说,如果方法涉及移动两个或更多个解螺旋酶通过一个或多个间隔子,那么可增加以上表4第三列中的间隔子长度1.5倍、2倍、2.5倍或3倍。

如本文所公开的双孔或孔可存在于膜中。在方法中,聚核苷酸通常与膜中的双孔或孔接触。可使用任何膜。合适的膜在所属领域中是众所周知的。膜优选地是两亲层。两亲层是由两亲分子形成的层,所述两亲分子如磷脂,其具有亲水性和亲脂性特性两种。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,且包括例如嵌段共聚物(Gonzalez-Perez等人,《朗缪尔(Langmuir)》,2009,25,10447-10450)。嵌段共聚物是聚合在一起的两个或更多个单体子单元产生单一聚合物链的聚合材料。嵌段共聚物通常具有通过每个单体子单元提供的特性。然而,嵌段共聚物可具有由个别子单元形成的聚合物不拥有的独特特性。嵌段共聚物可进行工程改造,使得单体子单元中的一个在水性介质中是疏水性的(即亲脂性),而其它子单元是亲水性的。在这种情况下,嵌段共聚物可拥有两亲特性,且可形成模拟生物膜的结构。嵌段共聚物可以是二嵌段的(其由两个单体子单元组成),但也可由超过两个的单体子单元来构筑,形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选地是三嵌段共聚物膜。

古细菌双极四醚脂质是进行构筑使得脂质形成单层膜的天然存在的脂质。这些脂质一般发现于存活于苛刻生物环境中的极端条件的生物、嗜热菌、嗜盐菌和嗜酸菌中。认为其稳定性是源于最终双层的融合性质。通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构筑模拟这些生物实体的嵌段共聚物材料是直接了当的。这种材料可形成表现类似于脂质双层且涵盖囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜在生物脂质膜上保持若干优势。因为合成三嵌段共聚物,所以可小心地控制准确的构筑,以提供形成膜和与孔和其它蛋白质相互作用所需的正确链长度和特性。

还可由不分类为脂质亚材料的子单元来构筑嵌段共聚物,例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性小节还可拥有很低的蛋白质结合特性,这允许产生当暴露于原始生物样本时具有高度抗性的膜。这种头基单元还可来源于非经典的脂质头基。

与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或pH范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。

膜最优选地是国际申请第WO2014/064443号或第WO2014/064444号中所公开的膜中的一个。

两亲分子可进行化学修饰或官能化,以便于偶联聚核苷酸。两亲层可以是单层或双层。两亲层通常是平坦的。两亲层可以是弯曲的。两亲层可以是支撑式的。

两亲膜通常天然地是流动的,基本上以大致10-8cm s-1的脂质扩散速率充当二维液体。这意味着孔和偶联的聚核苷酸可通常在两亲膜内移动。

膜可以是脂质双层。脂质双层是细胞膜的模型,且用作一系列实验研究的极佳平台。举例来说,脂质双层可用于通过单通道记录对膜蛋白的活体外研究。替代地,脂质双层可用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。合适的脂质双层包括(但不限于)平坦脂质双层、支撑式双层或脂质体。脂质双层优选地是平坦脂质双层。合适脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484中。

用于形成脂质双层的方法在所属领域中是已知的。脂质双层通常通过Montal和Mueller的方法(《美国国家科学学院院报(Proc.Natl.Acad.Sci.USA.)》,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,且接着使在开孔两侧上的水溶液的表面上蒸发一滴溶剂,来将脂质添加到水性电解质溶液的表面。一旦有机溶剂已蒸发,那么开孔两侧上的溶液/空气界面来回物理地移动通过开孔,直到形成双层为止。可跨越膜中的开孔或跨越凹槽中的开口形成平坦脂质双层。

Montal和Mueller的方法是常用的,这是因为是节约成本的,且是形成适合于蛋白孔***的良好品质脂质双层的相对直接了当的方法。双层形成的其它常见方法包括脂质体双层的尖端浸没、双层涂刷和贴片夹持。

尖端浸没双层形成需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,通过将溶解于有机溶剂中的一滴脂质在溶液表面处蒸发来首先在溶液/空气界面处产生脂质单层。接着,通过朗缪尔-沙佛(Langmuir-Schaefer)过程形成双层,且需要机械自动以使开孔相对于溶液表面移动。

对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接应用于开孔,所述开孔浸没在水性测试溶液中。使用笔刷或等效物,使脂质溶液稀薄地扩散在开孔内。溶剂的薄化使得形成脂质双层。然而,从双层完全去除溶剂是非常困难的,且因此通过这种方法形成的双层较不稳定且更倾向于在电化学测量期间具有噪声。

贴片夹持是在生物细胞膜研究中常用的。通过抽汲将细胞膜夹持到移液管的末端,且膜贴片变为连接在开孔内。所述方法适用于通过夹持接着爆裂以离开密封在移液管的开孔内的脂质双层的脂质体来产生脂质双层。所述方法需要稳定的、巨大的且单层脂质体和在具有玻璃表面的材料中制造小开孔。

可通过超声处理、挤压或Mozafari方法来形成脂质体(Colas等人(2007)《Micron》38:841-847)。

在一优选实施例中,如国际申请第WO 2009/077734号中所描述形成脂质双层。在此方法中有利的是,由干燥脂质形成脂质双层。在一最优选实施例中,跨越开口形成脂质双层,如WO2009/077734中所描述。

由脂质的两个相对层形成脂质双层。两个脂质层被布置成使得其疏水尾部基团面朝彼此,形成疏水性的内部。脂质的亲水性头基朝外面向双层每侧上的水性环境。双层可存在于多种脂质阶段中,所述阶段包括(但不限于)液体无序阶段(液体片层)、液体有序阶段、固体有序阶段(片层凝胶阶段、交错结合的凝胶阶段)和平坦双层晶体(片层亚凝胶阶段、片层结晶阶段)。

可使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得脂质双层具有所需的特性,例如表面电荷、支持膜蛋白的能力、充填密度或所形成的机械特性。脂质组合物可包含一种或多种不同脂质。举例来说,脂质组合物可含有最多100种脂质。脂质组合物优选地含有1到10种脂质。脂质组合物可包含天然存在的脂质和/或人工脂质。

脂质通常包含头基、界面部分和可相同或不同的两个疏水尾部基团。合适的头基包括(但不限于):中性头基,例如二酰基甘油酯(DG)和脑酰胺(CM);两性离子头基,例如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电头基,例如磷脂酰甘油(PG)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)和心磷脂(CA);和带正电头基,例如三甲基铵丙烷(TAP)。合适界面部分包括(但不限于)天然存在的界面部分,例如基于甘油或基于脑酰胺的部分。合适的疏水尾部基团包括(但不限于):饱和烃链,例如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,例如油酸(顺-9-十八烷酸);和分支链烃链,例如植烷酰基。链的长度和不饱和烃链中的双键的位置与数量可变化。链的长度和分支链烃链中的分支(如甲基)的位置和数量可变化。疏水尾部基团可作为醚或酯连接于界面部分。脂质可以是分枝菌酸。

脂质还可以进行化学修饰。脂质的头基或尾部基团可以进行化学修饰。头基已进行化学修饰的合适脂质包括(但不限于):PEG修饰的脂质,例如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];官能化的PEG脂质,例如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];和针对结合修饰的脂质,例如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(丁二酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾部基团已进行化学修饰的合适脂质包括(但不限于):可聚合脂质,例如1,2-双(10,12-三辅二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,例如1-软脂酰基-2-(16-氟软脂酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,例如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,例如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或官能化,以便于偶联聚核苷酸。

两亲层,例如脂质组合物,通常包含将影响层的特性的一种或多种添加剂。合适的添加剂包括(但不限于):脂肪酸,例如棕榈酸、肉豆蔻酸和油酸;脂肪醇,例如棕榈醇、肉豆蔻醇和油醇;固醇,例如胆固醇、麦角固醇、羊毛固醇、谷固醇和豆固醇;溶血磷脂,例如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和脑酰胺。

在另一优选实施例中,膜包含固态层。固态层可由两个有机和无机材料形成,所述材料包括(但不限于):微电子材料;绝缘材料,例如Si3N4、A12O3和SiO;有机和无机聚合物,例如聚酰胺;塑料,例如或弹性体,例如二组分加成固化的聚硅氧橡胶;和玻璃。固态层可由石墨烯形成。合适石墨烯层公开于WO 2009/035647中。如果膜包含固态层,那么孔通常存在于两亲膜或层中,所述两亲膜或层含于固态层内,例如在固态层内的孔洞、孔、空隙、通道、沟槽或缝隙内。所属领域的技术人员可制备合适的固态/两亲性杂合系统。合适的系统公开于WO 2009/020682和WO 2012/005857中。可使用上文所论述的两亲膜或层中的任一个。

通常使用以下来实行方法:(i)人工两亲层,其包含孔,(ii)分离包含孔的天然存在的脂质双层,或(iii)其中***有孔的细胞。通常使用人工两亲层(例如人工三嵌段共聚物层)来实行方法。层可包含其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文论述合适设备和条件。通常在活体外实行方法。

偶联

聚核苷酸优选地与包含孔的膜偶联。方法可包含将聚核苷酸与包含孔的膜偶联。使用一个或多个锚,聚核苷酸优选地与膜偶联。使用任何已知的方法,聚核苷酸可与膜偶联。

每个锚包含与聚核苷酸偶联(或结合)的基团和与膜偶联(或结合)的基团。每个锚可与聚核苷酸和/或膜共价偶联(或结合)。如果使用Y衔接子和/或发夹环衔接子,那么使用衔接子,聚核苷酸优选地与膜偶联。

使用任何数量的锚,例如2个、3个、4个或更多个锚,聚核苷酸可与膜偶联。举例来说,使用两个锚,聚核苷酸可与膜偶联,所述两个锚中的每一个分别地与聚核苷酸和膜两个偶联(或结合)。

一个或多个锚可包含一个或多个解螺旋酶和/或一个或多个分子制动器。

如果膜是两亲层,例如共聚物膜或脂质双层,那么一个或多个锚优选地包含存在于膜中的多肽锚和/或存在于膜中的疏水性锚。疏水性锚优选地是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸或生育酚。在优选的实施例中,一个或多个锚不是孔。

膜的组分(例如两亲分子、共聚物或脂质)可进行化学修饰或官能化,以形成一个或多个锚。膜的组分的合适化学修饰和合适官能化方式的实例在下文更详细地论述。可对任何比例的膜组分进行官能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。

聚核苷酸可直接与膜偶联。用于将聚核苷酸与膜偶联的一个或多个锚优选地包含连接子。一个或多个锚可包含一个或多个连接子,例如2个、3个、4个或更多个。可使用一个连接子来将超过一个聚核苷酸与膜偶联,例如2个、3个、4个或更多个。

优选的连接子包括(但不限于)聚合物,例如聚核苷酸、聚乙二醇(PEG)、多糖和多肽。这些连接子可以是线性、分支链或环状的。举例来说,连接子可以是环状聚核苷酸。聚核苷酸可与环状聚核苷酸连接子上的互补序列杂交。

一个或多个锚或一个或多个连接子可包含可进行剪切分解的组分,例如限制位点或光不稳定性基团。

官能化连接子和其可偶联分子的方式在所属领域中是已知的。举例来说,用马来酰亚胺基团官能化的连接子将与蛋白质中的半胱氨酸残基反应且连接。在本上下文中,蛋白质可存在于膜中,或可用于与聚核苷酸偶联(或结合)。这一点在下文更详细论述。

可使用“锁和钥”排列来避免聚核苷酸的交联。每个连接子的仅一端可一起反应形成较长连接子,且连接子的另一端各自分别与聚核苷酸或膜反应。这些连接子描述于WO2010/086602中。

在下文论述的测序实施例中,使用连接子是优选的。如果在当与孔相互作用时聚核苷酸并不解偶联(即在步骤(b)或(e)中不解偶联)的意义上,聚核苷酸永久性直接与膜偶联,那么在归因于膜与孔之间的距离而测序操作不能持续到聚核苷酸的末端时,将丢失一些序列数据。如果使用连接子,那么聚核苷酸可进行处理完全。

偶联可以是永久性或稳定的。换句话说,偶联可以使得当聚核苷酸与孔相互作用时其仍与膜偶联。

偶联可以是暂时的。换句话说,偶联可以使得当聚核苷酸与孔相互作用时其可与膜解偶。

对于某些应用,例如适体检测,暂时性质的偶联是优选的。如果永久性或稳定连接子直接连接于聚核苷酸的5'或3'端,且连接子比膜与跨膜孔的通道之间的距离短,那么在测序操作不能持续到聚核苷酸的末端时,一些序列数据将丢失。如果偶联是暂时的,接着当偶联的末端随机变为不含膜时,那么聚核苷酸可以进行处理完全。形成永久性/稳定或暂时连接的化学基团在下文更详细地论述。使用胆固醇或脂肪酰基链,聚核苷酸可以与两亲层或三嵌段共聚物膜暂时偶联。可使用长度为6到30个碳原子的任何脂肪酰基链,例如十六烷酸。

在优选实施例中,聚核苷酸(例如核酸)与两亲层(例如三嵌段共聚物膜或脂质双层)偶联。先前已用各种不同网络共享的策略进行核酸与合成脂质双层的偶联。这些概述于下表5中。

表5

合成聚核苷酸和/或连接子可在合成反应中使用修饰的胺基磷酸酯来官能化,所述修饰的胺基磷酸酯容易地与直接添加合适锚定基团相容,所述锚定基团如,胆固醇、生育酚、棕榈酸、巯基、脂质和生物素基团。这些不同的连接化学,产生一套用于与聚核苷酸连接的选项。每个不同修饰基团以稍微不同的方式偶联聚核苷酸,且偶联未必总是永久性的,因此对于聚核苷酸与膜,得到不同的停留时间。暂时偶联的优势在上文论述。

聚核苷酸与连接子或与官能化膜的偶联还可可通过多种其它手段来实现,其限制条件为可向聚核苷酸中添加互补反应性基团或锚定基团。向聚核苷酸的任一端添加反应性基团,先前已有报导。可使用T4聚核苷酸激酶和ATPγS向ssDNA或dsDNA的5'中添加巯基(Grant,G.P.和P.Z.Qin(2007).“《一种用于连接在核酸的5'端处的氮氧化物自旋标记的便捷方法(A facile method for attaching nitroxide spin labels at the 5'terminusof nucleic acids)》”.《核酸研究》35(10):e77)。可使用T4聚核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP,向ssDNA或dsDNA的5'-磷酸中添加叠氮基团。使用巯基或点击化学,含有巯基、碘乙酰胺OPSS或马来酰亚胺基团(与巯基具有反应性)或DIBO(二苯并环氧磷)或炔基(与叠氮化物具有反应性)中的任一个的系链可共价连接于聚核苷酸。可使用末端转移酶将修饰寡核苷酸并入到ssDNA的3'中来添加更多样的化学基团选择(例如生物素、巯基和荧光团)(Kumar,A.、P.Tchen等人(1988).“《通过末端脱氧核苷酸转移酶对合成寡核苷酸探针进行非放射性标记(Nonradioactive labeling of syntheticoligonucleotide probes with terminal deoxynucleotidyl transferase)》”.《分析生 物化学》169(2):376-82)。抗生蛋白链菌素/生物素和/或抗生蛋白链菌素/脱硫生物素偶联可用于任何其它聚核苷酸。以下实例描述聚核苷酸可如何使用抗生蛋白链菌素/生物素和抗生蛋白链菌素/脱硫生物素来与膜偶联。也有可能,可使用末端转移酶(例如胆固醇或棕榈酸)向具有合适修饰的核苷酸的聚核苷酸中直接添加锚。

一个或多个锚优选地通过杂交将聚核苷酸与膜偶联。一个或多个锚中的杂交允许以如上文所论述的暂时方式偶联。杂交可存在于一个或多个锚的任何部分中,例如在一个或多个锚与聚核苷酸之间,在一个或多个锚内或在一个或多个锚与膜之间。举例来说,连接子可包含两个或更多个杂交在一起的聚核苷酸,例如3个、4个或5个聚核苷酸。一个或多个锚可与聚核苷酸杂交。一个或多个锚可直接与聚核苷酸或直接与Y衔接子和/或连接于聚核苷酸的前导序列或直接与连接于聚核苷酸的发夹环衔接子杂交(如下文所论述)。替代地,一个或多个锚可与一个或多个(例如2个或3个)中间聚核苷酸(或“夹板”)杂交,所述中间聚核苷酸与聚核苷酸、与连接于聚核苷酸的Y衔接子和/或前导序列或与连接于聚核苷酸的发夹环衔接子杂交(如下文所论述)。

一个或多个锚可包含单链或双链聚核苷酸。锚的一个部分可与单链或双链聚核苷酸接合。已报导使用T4 RNA接合酶I对ssDNA的短碎片的接合(Troutt,A.B.、M.G.McHeyzer-Williams等人(1992).“《接合锚定的PCR:具有单侧特异性的简单扩增技术(Ligation-anchored PCR:a simple amplification technique with single-sidedspecificity)》”.《美国国家科学院院刊》89(20):9823-5)。替代地,单链或双链聚核苷酸可与双链聚核苷酸接合,且接着两个链通过热或化学变性分开。对于双链聚核苷酸,有可能,向双螺旋的一个或两个端中添加一片单链聚核苷酸,或向一个或两个端中添加双链聚核苷酸。对于向双链聚核苷酸中添加单链聚核苷酸,这可使用T4 RNA接合酶I来实现,例如与单链聚核苷酸的其它区的接合。对于向双链聚核苷酸中添加双链聚核苷酸,那么分别通过聚核苷酸上的互补3'dA/dT尾和所添加聚核苷酸(如对于许多样本制备型应用常规地进行,以防止多联体或二聚体形成),或使用通过限制性消化聚核苷酸和相容衔接子的接合而产生的“粘稠端”,接合可以是“平末端”的。接着,如果单链聚核苷酸用于在5'端、3'端或两端(当双链聚核苷酸用于接合时)处的接合或修饰,那么当双螺旋熔融时,每个单链将具有5'或3'修饰。

如果聚核苷酸是合成链,那么可在化学合成聚核苷酸期间并入一个或多个锚。举例来说,可使用具有连接于其的反应性基团的引物来合成聚核苷酸。

腺苷酸化聚核苷酸是接合反应中的中间物,其中单磷酸腺苷连接于聚核苷酸的5'-磷酸。用于产生这种中间物的各种试剂盒是可获得的,例如来自NEB的5′DNA腺苷酰化试剂盒。通过在反应中对于修饰核苷酸三磷酸进行取代ATP,那么可以向聚核苷酸的5'中添加反应性基团(例如巯基、胺、生物素、叠氮化物等)。也有可能的是,可使用5'DNA腺苷酰化试剂盒向具有合适修饰的核苷酸的聚核苷酸中直接添加锚。

用于扩增基因组DNA片段的常见技术是使用聚合酶链式反应(PCR)。此处,使用两个合成寡核苷酸引物,可产生大量相同DNA片段的拷贝,其中对于每个拷贝,双螺旋中的每个链的5'将是合成聚核苷酸。可通过使用聚合酶向单链或双链DNA的3'端中添加单个或多个核苷酸。可使用的聚合酶的实例包括(但不限于)末端转移酶、Klenow和大肠杆菌Poly(A)聚合酶)。通过在反应中对于修饰核苷酸三磷酸取代ATP,那么可将锚(如胆固醇、巯基、胺、叠氮化物、生物素或脂质)并入到双链聚核苷酸中。因此,所扩增聚核苷酸的每个拷贝将含有锚。

理想地,聚核苷酸与膜偶联而无须使聚核苷酸官能化。这可通过将一个或多个锚(如聚核苷酸结合蛋白或化学基团)与膜偶联和使一个或多个锚与聚核苷酸相互作用或通过使膜官能化来实现。一个或多个锚可通过本文所描述的任一个方法来与膜偶联。特定来说,一个或多个锚可包含一个或多个连接子,例如马来酰亚胺官能化连接子。

在这个实施例中,聚核苷酸通常是RNA、DNA、PNA、TNA或LNA,且可以是双或单链。这个实施例尤其适合于基因组DNA聚核苷酸。

一个或多个锚可包含与单链或双链聚核苷酸、聚核苷酸内的特异性核苷酸序列或聚核苷酸内的修饰核苷酸的图案或存在于聚核苷酸上的任何其它配体偶联、结合或与相互作用的任何基团。

用于锚中的合适结合蛋白包括(但不限于):大肠杆菌单链结合蛋白、P5单链结合蛋白、T4 gp32单链结合蛋白、TOPO V dsDNA结合区、人类组蛋白、大肠杆菌HU DNA结合蛋白,和其它古细菌、原核或真核单链或双链聚核苷酸(或核酸)结合蛋白,包括下文所列的那些。

特异性核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶或复制起始因子识别的序列。修饰的核苷酸的图案可以是甲基化或损坏图案。

一个或多个锚可包含与聚核苷酸偶联、结合、***或相互作用的任何基团。基团可通过静电、氢结合或范德华力相互作用***聚核苷酸中或与其相互作用。这些基团包括赖氨酸单体、聚赖氨酸(其将与ssDNA或dsDNA相互作用)、溴化乙锭(其将***dsDNA)、通用碱基或通用核苷酸(其可与任何聚核苷酸杂交)和锇络合物(其可与甲基化碱基反应)。因此,聚核苷酸可使用连接于膜的一个或多个通用核苷酸而与膜偶联。每个通用核苷酸可使用一个或多个连接子而与膜偶联。通用核苷酸优选地包含以下核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6-芳环)。通用核苷酸更优选地包含以下核苷中的一个:2'-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-O’-甲基肌苷、4-硝基吲哚2'-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2'-脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2'-脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2'-脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2'-脱氧核苷、硝基咪唑核苷、4-硝基吡唑2'-脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2'-脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2'-脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2'-脱氧核苷、4-氨基苯并咪唑核苷、苯基C-核苷、苯基C-2’-脱氧核糖基核苷、2'-脱氧烟云杯伞素、2'-脱氧异鸟苷、K-2'-脱氧核苷、P-2'-脱氧核苷和吡咯烷。通用核苷酸更优选地包含2'-脱氧肌苷。通用核苷酸更优选地是IMP或dIMP。通用核苷酸最优选地是dPMP(2'-脱氧-P-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。

一个或多个锚可通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向Hoogsteen氢键(其中一个核碱基相对于其它核碱基旋转180°)与聚核苷酸偶联(或结合)。举例来说,一个或多个锚可包含与聚核苷酸形成Hoogsteen氢键或反向Hoogsteen氢键的一个或多个核苷酸、一个或多个寡核苷酸或一个或多个聚核苷酸。这些氢键类型允许第三聚核苷酸链卷绕双链螺旋于周围,且形成三链螺旋。通过与双链双螺旋形成三链螺旋,一个或多个锚可与双链聚核苷酸偶联(或结合)。

在这个实施例中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可进行官能化。

在一个或多个锚包含蛋白质时,所述一个或多个锚可以能够直接锚定到膜中而无需进一步官能化,例如当其已具有与膜相容的外部疏水区时。这些蛋白质的实例包括(但不限于)跨膜蛋白质、膜内蛋白质和膜蛋白。替代地,可表达具有与膜相容的基因融合疏水区的蛋白质。这些疏水性蛋白质区在所属领域中是已知的。

一个或多个锚优选地在与膜接触之前与聚核苷酸混合,但一个或多个锚可与膜接触且随后与聚核苷酸接触。

在另一方面中,聚核苷酸可使用上文所描述的方法来官能化,使得其可由特异性结合基团识别。具体地说,聚核苷酸可用配体进行官能化,所述配体例如生物素(用于结合于抗生蛋白链菌素)、直链淀粉(用于结合于麦芽糖结合蛋白或融合蛋白)、Ni-NTA(用于结合于聚组氨酸或聚组氨酸标签的蛋白质)或肽(例如抗原)。

根据一优选实施例,一个或多个锚可用于当聚核苷酸连接于前导序列时将聚核苷酸与膜偶联,所述前导序列优选地螺旋到孔中。前导序列在下文更详细地论述。较佳地,聚核苷酸连接(例如接合)于优选地螺旋到孔中的前导序列。这些前导序列可包含均聚聚核苷酸或无碱基区。前导序列通常设计成直接与一个或多个锚杂交,或通过一个或多个中间聚核苷酸(或夹板)与所述一个或多个锚杂交。在这种情况下,一个或多个锚通常包含与前导序列中的序列或一个或多个中间聚核苷酸(或夹板)中的序列互补的聚核苷酸序列。在这种情况下,一个或多个夹板通常包含与前导序列中的序列互补的聚核苷酸序列。

化学连接中使用的分子的实例是EDC(1-乙基-3-[3-二甲基氨基丙基]碳化二亚胺盐酸盐)。还可使用可商购的试剂盒(Thermo Pierce,产品号22980)来向聚核苷酸的5'中添加反应性基团。合适的方法包括(但不限于)使用组氨酸残基和Ni-NTA的暂时亲和力连接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳固共价连接。

双链聚核苷酸

聚核苷酸可以是双链。如果聚核苷酸是双链,那么在接触步骤之前,方法优选地进一步包含使桥接部分(例如发夹环)与聚核苷酸的一端接合。可接着在使聚核苷酸与孔接触时或之前,将聚核苷酸的两条链分开。在聚核苷酸通过孔移动受聚核苷酸结合蛋白(如解螺旋酶或分子制动器)控制时,可将两条链分开。

以此方式连接和询问双链上的两条链增加表征的效率和准确度。

桥接部分能够连接目标聚核苷酸的两条链。桥接部分通常共价连接目标聚核苷酸的两条链。桥接部分可以是能够连接目标聚核苷酸的两条链的任何东西,其限制条件为桥接部分不干扰单链聚核苷酸通过跨膜孔的移动。

桥接部分可通过在所属领域中已知的任何合适手段连接于目标聚核苷酸。桥接部分可分开地合成,且化学连接或酶促接合于目标聚核苷酸。替代地,桥接部分可以是在目标聚核苷酸加工中产生。

桥接部分连接于在目标聚核苷酸的一端处或附近的目标聚核苷酸。桥接部分优选地连接于在目标聚核苷酸的末端的10个核苷酸内的目标聚核苷酸。

合适的桥接部分包括(但不限于)聚合物连接子、化学连接子、聚核苷酸或多肽。优选地,桥接部分包含DNA、RNA、修饰DNA(例如无碱基DNA)、RNA、PNA、LNA或PEG。桥接部分更优选地是DNA或RNA。

桥接部分最优选地是发夹环或发夹环衔接子。可使用所属领域中已知的方法来设计合适发夹衔接子。发夹环可以是任何长度。发夹环的长度通常是110个或更少个核苷酸,例如100个或更少个核苷酸、90个或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、20个或更少个核苷酸,或10个或更少个核苷酸。发夹环的长度优选地是约1到110个、2到100个、5到80个或6到50个核苷酸。如果环涉及不同的衔接子的选择能力,那么较长长度的发夹环(例如50到110个核苷酸)是优选的。类似地,如果环不涉及如下文所论述的可选择结合,那么较短长度的发夹环(例如1到5个核苷酸)是优选的。

发夹衔接子可接合于第一和/或第二聚核苷酸的任一端,即5'或3'端。使用所属领域中已知的方法,将发夹衔接子接合于第一和/或第二聚核苷酸。可使用接合酶,例如T4DNA接合酶、大肠杆菌DNA接合酶、Taq DNA接合酶、Tma DNA接合酶和9oN DNA接合酶,来接合发夹衔接子。

可使用所属领域中已知的任何方法来将聚核苷酸的两条链分开。举例来说,可通过聚核苷酸结合蛋白或使用有利于解杂交的条件,来将其分开(有利于解杂交的条件的实例包括(但不限于)高温、高pH和添加可破坏氢结合或碱基配对的药剂,例如甲酰胺和脲)。

发夹衔接子优选地包含可选择结合部分。这允许纯化或分离第一和/或第二聚核苷酸。可选择结合部分是可基于其结合特性而选择的部分。因此,可选择结合部分优选地是特异性结合于表面的部分。如果可选择结合部分以比在所使用的任何其它部分高许多的程度结合于表面,那么其特异性结合于表面。在优选的实施例中,部分结合于无其它部分与其结合的表面。

合适选择性结合部分在所属领域中是已知的。优选的选择性结合部分包括(但不限于):生物素;聚核苷酸序列;抗体;抗体片段,例如Fab和scFv;抗原;聚核苷酸结合蛋白;聚组氨酸尾部和GST标签。最优选的选择性结合部分是生物素和可选择的聚核苷酸序列。生物素特异性结合于涂布有抗生物素蛋白的表面。可选择的聚核苷酸序列特异性地结合(即杂交)于涂布有同源序列的表面。替代地,可选择聚核苷酸序列特异性结合于涂布有聚核苷酸结合蛋白的表面。

发夹衔接子和/或可选择结合部分可包含可进行剪切、切割、裂解或水解的区。这个区可设计成允许从其在纯化或分离后结合于其的表面去除第一和/或第二聚核苷酸。合适的区在所属领域中是已知的。合适的区包括(但不限于)RNA区、包含脱硫生物素和抗生蛋白链菌素的区、二硫键和可光裂解区。

双链目标聚核苷酸优选地包含在桥接部分(例如发夹环或发夹环衔接子)相对端处的前导序列。前导序列在下文更详细地论述。

进行转角测序

在一优选实施例中,目标双链聚核苷酸在一端具备桥接部分,例如发夹环或发夹环衔接子,且方法包含使聚核苷酸与孔接触,使得聚核苷酸的两条链移动通过孔,且在聚核苷酸的两条链相对于孔移动时进行一次或多次测量,其中测量指示聚核苷酸的链的一个或多个特征,且从而表征目标双链聚核苷酸。在另一优选实施例中,目标双链聚核苷酸在一端具备桥接部分,例如发夹环或发夹环衔接子,且方法包含使聚核苷酸与孔和核酸外切酶接触,使得消化聚核苷酸的两条链,以形成个别核苷酸。上文所论述的实施例中的任一个同样适用于这个实施例。

前导序列

在链表征/测序方法中的接触步骤之前,方法优选地包含将聚核苷酸连接于优选地螺旋到孔中的前导序列。前导序列有助于本发明的方法。前导序列设计成优选地螺旋到孔中,且从而有助于聚核苷酸通过孔的移动。前导序列还可用于将聚核苷酸连接于如上文所论述的一个或多个锚。

前导序列通常包含聚合物。聚合物优选地是带负电的。聚合物优选地是:聚核苷酸,例如DNA或RNA;修饰的聚核苷酸(例如无碱基DNA);PNA;LNA;聚乙二醇(PEG)或多肽。前导优选地包含聚核苷酸,并且更优选地包含单链聚核苷酸。前导序列可包含上文所论述的聚核苷酸中的任一个。单链前导序列最优选地包含DNA的单链,例如聚dT区段。前导序列优选地包含一个或多个间隔子。

前导序列可以是任何长度,但其长度通常是10到150个核苷酸,例如20到150个核苷酸。前导的长度通常取决于方法中使用的跨膜孔。

前导序列优选地是如下文所定义的Y衔接子的部分。

双重偶联

方法可涉及双链聚核苷酸的双重偶联。在一优选实施例中,方法包含:

(a)提供在一端处具有Y衔接子且在另一端处具有桥接部分衔接子(例如发夹环衔接子)的双链聚核苷酸,其中Y衔接子包含用于将聚核苷酸与膜偶联的一个或多个第一锚,其中桥接部分衔接子包含用于将聚核苷酸与膜偶联的一个或多个第二锚,且其中桥接部分衔接子与膜偶联的强度大于Y衔接子与膜偶联的强度;

(b)使步骤(a)中提供的聚核苷酸与如本文所公开的孔(例如双孔)接触,使得聚核苷酸相对于(例如通过)孔移动;和

(c)在聚核苷酸相对于孔移动时,进行一次或多次测量,其中测量指示聚核苷酸的一个或多个特征,且从而表征目标聚核苷酸。

这种类型的方法在英国申请第1406147.7号中详细论述。

双链聚核苷酸在一端处具备Y衔接子且在另一端处具备桥接部分衔接子。Y衔接子和/或桥接部分衔接子通常是聚核苷酸衔接子。其可由上文所论述的聚核苷酸中的任一个形成。

Y衔接子通常包含(a)双链区和(b)单链区或在另一端处不互补的区。如果Y衔接子包含单链区,那么其可被描述为具有悬突。Y衔接子中非互补区的存在给予衔接子其Y形状,这是由于不同于双链部分,两条链通常不彼此杂交。Y衔接子包含一个或多个第一锚。锚在上文更详细地论述。

Y衔接子优选地包含优选地螺旋到孔中的前导序列。这一点在上文论述。

桥接部分衔接子优选地包含如上文所论述的可选择结合部分。桥接部分衔接子和/或可选择结合部分可包含可如上文所论述进行剪切、切割、裂解或水解的区。

如果一个或多个解螺旋酶和一个或多个分子制动器如上文所论述来使用,那么Y衔接子优选地包含一个或多个解螺旋酶,且桥接部分衔接子优选地包含一个或多个分子制动器。

使用所属领域中已知的方法,将Y衔接子和/或桥接部分衔接子接合于聚核苷酸。可使用接合酶,例如T4 DNA接合酶、大肠杆菌DNA接合酶、Taq DNA接合酶、Tma DNA接合酶和9°N DNA接合酶,来接合衔接子中的一个或两个。替代地,可使用下文论述的方法,向聚核苷酸中添加衔接子。

在一优选实施例中,方法的步骤a)包含修饰双链聚核苷酸,使得其包含在一端处的Y衔接子和在另一端处的桥接部分衔接子。可使用任何修饰方式。方法优选地包含修饰双链聚核苷酸。这一点在下文更详细论述。可以任何方式对修饰和表征方法进行组合。

桥接部分衔接子与膜偶联(或结合)的强度大于Y衔接子与膜偶联(或结合)的强度。这可以任何方式来测量。用于测量偶联(或结合)的强度的合适方法公开于英国申请第1406147.7号的实例中。

桥接部分衔接子偶联(或结合)的强度优选地是Y衔接子偶联(或结合)的强度的至少1.5倍,例如锚衔接子偶联(或结合)的强度的至少两倍、至少三倍、至少四倍、至少五倍或至少十倍。桥接部分衔接子对于膜的亲和力常数(Kd)优选地是Y衔接子的亲和力常数的至少1.5倍,例如Y衔接子的偶联的强度的至少两倍、至少三倍、至少四倍、至少五倍或至少十倍。

存在若干种使桥接部分衔接子比Y衔接子更强烈地与膜偶联(或结合)的方式。举例来说,桥接部分衔接子可包含比Y衔接子更多的锚。举例来说,桥接部分衔接子可包含2个、3个或更多个第二锚,而Y衔接子可包含一个第一锚。

一个或多个第二锚与膜的偶联(或结合)的强度可大于一个或多个第一锚与膜的偶联(或结合)的强度。一个或多个第二锚与桥接部分衔接子的偶联(或结合)的强度可大于一个或多个第一锚与Y衔接子的偶联(或结合)的强度。一个或多个第一锚和一个或多个第二锚可通过杂交而连接于其相应衔接子,且一个或多个第二锚中的杂交的强度比一个或多个第一锚中的杂交的强度高。还可使用这些实施例的任何组合。可使用所属领域中的已知技术来测量偶联(或结合)的强度。

一个或多个第二锚优选地包含以比一个或多个第一锚中的一个或多个基团与膜偶联(或结合)更高的强度与膜偶联(或结合)的一个或多个基团。在优选的实施例中,桥接部分衔接子/一个或多个第二锚使用胆固醇与膜偶联(或结合),且Y衔接子/一个或多个第一锚使用棕榈酸与膜偶联(或结合)。胆固醇比棕榈酸更强烈地结合于三嵌段共聚物膜和脂质膜。在一替代实施例中,桥接部分衔接子/一个或多个第二锚使用单酰基物种(例如棕榈酸)与膜偶联(或结合),且Y衔接子/一个或多个第一锚使用二酰基物种(例如二棕榈酰基磷脂酰胆碱)与膜偶联(或结合)。

添加发夹环和前导序列

在提供之前,可使双链聚核苷酸与MuA转座酶和双链MuA底物群体接触,其中群体中的一部分底物是包含前导序列的Y衔接子,且其中群体中的一部分底物是发夹环衔接子。转座酶将双链聚核苷酸分析物分段,且将MuA底物与片段的一个或两个端接合。这产生包含在一端处的前导序列和在另一端处的发夹环的多个修饰双链聚核苷酸。可接着使用方法来研究修饰的双链聚核苷酸。

群体中的每个底物优选地包含至少一个通用核苷酸的悬突,使得转座酶将模板聚核苷酸分段,且将底物与双链片段的一个或两个端接合,且从而产生多个片段/底物构筑体,且其中方法进一步包含使悬突与构筑体中的片段接合,且从而生产多个修饰的双链聚核苷酸。合适的通用核苷酸在上文论述。悬突的长度优选地是五个核苷酸。

替代地,群体中的每个底物优选地包含:(i)至少一个悬突;和(ii)在与包含不存在于模板聚核苷酸中的核苷的至少一个悬突相同的链中的至少一个核苷酸,使得转座酶将模板聚核苷酸分段,且使底物与双链片段的一个或两个端接合,且从而产生多个片段/底物构筑体,且其中方法进一步包含(a)通过选择性地去除至少一个核苷酸来从构筑体去除悬突,且从而生产包含单链间隙的多个双链构筑体,和(b)修复构筑体中的单链间隙,且从而生产多个修饰双链聚核苷酸。聚核苷酸通常包含以下核苷:脱氧腺苷(dA)、脱氧尿苷(dU)和/或胸苷(dT)、脱氧鸟苷(dG)和脱氧胞苷(dC)。不存在于聚核苷酸中的核苷优选地是无碱基核苷、腺苷(A)、尿苷(U)、5-甲基尿苷(m5U)、胞苷(C)或鸟苷(G),或包含脲、5,6二羟基胸苷、胸苷乙二醇、5-羟基-5甲基乙内酰脲、尿嘧啶乙二醇、6-羟基-5,6-二羟基胸苷、甲基酒石酰脲、7,8-二氢-8-氧代鸟嘌呤(8-氧代鸟嘌呤)、8-氧代腺嘌呤、fapy-鸟嘌呤、甲基-fapy-鸟嘌呤、fapy-腺嘌呤、黄霉毒素B1-fapy-鸟嘌呤、5-羟基-胞嘧啶、5-羟基-尿嘧啶、3-甲基腺嘌呤、7-甲基鸟嘌呤、1,N6-亚乙烯基腺嘌呤、次黄嘌呤、5-羟基尿嘧啶、5-羟甲基尿嘧啶、5-甲酰基尿嘧啶或顺-syn-环丁烷嘧啶二聚体。至少一个核苷酸优选地是来自悬突的10个核苷酸或更少个。至少一个核苷酸是悬突中的第一个核苷酸。悬突中的所有核苷酸优选地包含不存在于模板聚核苷酸中的核苷。

这些基于MuA的方法公开于国际申请第PCT/GB2014/052505号中。其还在英国申请第1406147.7号中详细论述。

在一个或多个解螺旋酶与双链聚核苷酸和MuA转座酶接触之前,所述一个或多个解螺旋酶可连接于穆阿底物Y衔接子。替代地,在一个或多个解螺旋酶与双链聚核苷酸和MuA转座酶接触之前,所述一个或多个解螺旋酶可连接于MuA底物Y衔接子。

在一个或多个分子制动器与双链聚核苷酸和MuA转座酶接触之前,所述一个或多个分子制动器可连接于MuA底物发夹环衔接子。替代地,在一个或多个分子制动器与双链聚核苷酸和MuA转座酶接触之前,所述一个或多个分子制动器可连接于MuA底物发夹环衔接子。

解偶联

方法可涉及表征多个目标聚核苷酸和解偶联至少第一目标聚核苷酸。

在一优选实施例中,本发明涉及表征两个或更多个目标聚核苷酸。方法包含:

(a)在第一样本中提供第一聚核苷酸;

(b)在第二样本中提供第二聚核苷酸;

(c)使用一个或多个锚,将第一样本中的第一聚核苷酸与膜偶联;

(d)使第一聚核苷酸与如本文所公开的孔接触,使得聚核苷酸相对于(例如通过)孔移动;

(e)在第一聚核苷酸相对于所述孔移动时,进行一次或多次测量,其中测量指示第一聚核苷酸的一个或多个特征,且从而表征第一聚核苷酸;

(f)将第一聚核苷酸从膜解偶联;

(g)使用一个或多个锚,将第二样本中的第二聚核苷酸与膜偶联;

(h)使第二聚核苷酸与如本文所公开的孔接触,使得第二聚核苷酸相对于(例如通过)孔移动;和

(i)在第二聚核苷酸相对于孔移动时,进行一次或多次测量,其中测量指示第二聚核苷酸的一个或多个特征,且从而表征第二目标聚核苷酸。

这种类型的方法在英国申请第1406155.0号中详细论述。

可以在步骤(g)(即在使第二聚核苷酸与膜偶联之前)之前执行步骤(f)(即将第一聚核苷酸解偶联)。可以在步骤(f)之前执行步骤(g)。如果在第一聚核苷酸解偶联之前,第二聚核苷酸与膜偶联,那么步骤(f)优选地包含选择性地将第一聚核苷酸从膜解偶联(即从膜解偶联第一聚核苷酸但不解偶联第二聚核苷酸)。所属领域的技术人员可设计其中实现选择性解偶联的系统。可同时执行步骤(f)和(g)。这一点在下文更详细论述。

在步骤(f)中,至少10%的第一聚核苷酸优选地从膜解偶联。举例来说,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的第一聚核苷酸可以从膜解偶联。优选地,所有的第一聚核苷酸均从膜解偶联。可使用孔来测定从膜解偶联的第一聚核苷酸的量。这公开于实例中。

第一聚核苷酸和第二聚核苷酸可彼此不同。替代地,第一和第二聚核苷酸可以是不同的聚核苷酸。在这种情况下,不需要在添加第二聚核苷酸之前去除第一样本的至少部分。这一点在下文更详细论述。如果方法涉及研究三个或更多个聚核苷酸,那么其所有均可以彼此不同,或其中一些可以彼此不同。

第一聚核苷酸和第二聚核苷酸可以是相同聚核苷酸的两个例子。第一聚核苷酸可以与第二聚核苷酸相同。这允许校对。如果方法涉及研究三个或更多个聚核苷酸,那么其所有均可以所有相同聚核苷酸的三个或更多个例子,或其中一些可以是相同聚核苷酸的独立例子。

第一样本和第二样本可以彼此不同。举例来说,第一样本可来源于人类,且第二样本可来源于病毒。如果第一样本和第二样本彼此不同,那么其可含有或疑似含有相同的第一聚核苷酸和第二聚核苷酸。如果方法涉及研究三个或更多个样本,那么其所有均可以彼此不同,或其中一些可以彼此不同。

第一样本和第二样本优选地是相同样本的两个例子。第一样本优选地与第二样本相同。这允许校对。如果方法涉及研究三个或更多个样本,那么其所有均可以是相同样本的三个或更多个例子,或其中一些可以是相同样本的独立例子。

可研究任何数量的聚核苷酸。举例来说,方法可涉及表征3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、50个、100个或更多个聚核苷酸。如果使用方法研究三个或更多个聚核苷酸,那么第二聚核苷酸也从膜解偶联,且对于第三聚核苷酸添加必需的步骤数。对于四个或更多个聚核苷酸来说,也是如此。

方法涉及从膜解偶联第一聚核苷酸。如果研究三个或更多个聚核苷酸,那么方法可涉及从膜解偶联第二聚核苷酸。

可使用任何已知方法,从膜解偶联第一聚核苷酸。优选地在步骤(f)中使用跨膜孔,不从膜解偶联第一聚核苷酸。优选地使用电压或施加的电势,不从膜解偶联第一聚核苷酸。

步骤(f)优选地包含通过从膜去除一个或多个锚而从膜解偶联第一聚核苷酸。如果去除锚,那么使用其它(或独立)锚将第二聚核苷酸与膜偶联。用于偶联第二聚核苷酸的锚可以是与偶联第一聚核苷酸相同的锚类型或不同的锚类型。

步骤(f)更优选地包含使一个或多个锚与对于所述一个或多个锚具有比膜对于锚具有的亲和力更高的亲和力的药剂接触。用于竞争性结合或免疫放射分析以测定分子的特异性结合能力的各种方案在所属领域中是众所周知的(参见例如Maddox等人,《实验医学杂志(J.Exp.Med.)》158,1211-1226,1993)。药剂将锚从膜去除,且从而解偶联第一聚核苷酸。药剂优选地是糖。可使用以比一个或多个锚对于膜具有的亲和力更高的亲和力结合于一个或多个锚的任何糖。糖可以是如下文所论述的环糊精或其衍生物。

如果一个或多个锚包含疏水性锚(例如胆固醇),那么药剂优选地是环糊精或其衍生物或脂质。环糊精或其衍生物可以是在Eliseev,A.V.和Schneider,H-J.(1994)《美国化学学会杂志》116,6081-6088中所公开那些环糊精或其衍生物中的任一种。药剂更优选地是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。可使用本文所公开的脂质中的任一个。

如果锚包含抗生蛋白链菌素、生物素或脱硫生物素,那么药剂优选地是生物素、脱硫生物素或抗生蛋白链菌素。生物素和脱硫生物素两个均以比抗生蛋白链菌素结合于膜更高的亲和力结合于抗生蛋白链菌素,且反之亦然。生物素对于抗生蛋白链菌素比脱硫生物素具有更强的亲和力。因此,可使用生物素或抗生蛋白链菌素从膜去除包含抗生蛋白链菌素的锚,且反之亦然。

如果锚包含蛋白质,那么药剂优选地是特异性结合于蛋白质的抗体或其片段。如果抗体以优先或高亲和力结合于蛋白质,但并不结合或仅以很低的亲和力结合于其它或不同蛋白质,那么抗体特异性结合于蛋白质。如果抗体以1×10-6M或更少,更优选1×10-7M或更少、5×10-8M或更少,更优选1×10-8M或更少或更优选5×10-9M或更少的Kd结合,那么所述抗体以优先或高亲和性结合。如果抗体以1×10-6M或更多,更优选1×10-5M或更多,更优选1×10-4M或更多,更优选1×10-3M或更多,甚至更优选1×10-2M或更多的Kd结合,那么所述抗体以很低的亲和力结合。任何方法可用于检测结合或特异性结合。定量测量抗体与蛋白质的结合的方法在所属领域中是众所周知的。抗体可以是单克隆抗体或多克隆抗体。合适的抗体片段包括(但不限于)Fv、F(ab’)和F(ab’)2片段以及单链抗体。此外,抗体或其片段可以是嵌合抗体或其片段、CDR-接枝抗体或其片段或人源化抗体或其片段。

步骤(f)优选地包含使一个或多个锚与药剂接触,所述药剂降低所述一个或多个锚与膜偶联的能力。举例来说,药剂可干扰一个或多个锚的结构和/或疏水性,且从而降低其与膜偶联的能力。如果锚包含胆固醇,那么药剂优选地是胆固醇脱氢酶。如果锚包含脂质,那么药剂优选地是磷脂酶。如果锚包含蛋白质,那么药剂优选地是蛋白酶或脲。合适锚与药剂的其它组合对于所属领域的技术人员将是清楚的。

步骤(f)优选地包含通过从一个或多个锚分离第一聚核苷酸而从膜解偶联第一聚核苷酸。这可以任何手段来进行。举例来说,可以在包含连接子的锚中剪切连接子。这个实施例特别适用于涉及通过杂交连接的锚。此类锚在上文论述。

步骤(f)更优选地包含通过使第一聚核苷酸和一个或多个锚与药剂接触而从膜解偶联第一聚核苷酸,所述药剂与第一聚核苷酸竞争与一个或多个锚结合。用于测定和测量竞争性结合的方法在所属领域中是已知的。药剂优选地是与第一聚核苷酸竞争与一个或多个锚杂交的聚核苷酸。举例来说,如果使用涉及杂交的一个或多个锚来使第一聚核苷酸与膜偶联,那么可通过使一个或多个锚与也与杂交位点杂交的聚核苷酸接触来解偶联聚核苷酸。通常以高于第一聚核苷酸和一个或多个锚的浓度的浓度来添加聚核苷酸药剂。替代地,聚核苷酸药剂可比第一聚核苷酸更强烈地与一个或多个锚杂交。

步骤(f)更优选地包含:(i)使第一聚核苷酸和一个或多个锚与脲、三(2-羧乙基)膦(TCEP)、二硫苏糖醇(DTT)、抗生蛋白链菌素或生物素、UV光、酶或结合剂接触;(ii)将第一聚核苷酸和一个或多个锚加热;或(iii)改变pH。脲、三(2-羧乙基)膦(TCEP)或二硫苏糖醇(DTT)能够破坏锚且从膜分离第一聚核苷酸。如果锚包含抗生蛋白链菌素-生物素连接,那么抗生蛋白链菌素药剂将竞争与生物素结合。如果锚包含抗生蛋白链菌素-脱硫生物素连接,那么生物素药剂将竞争与抗生蛋白链菌素结合。UV光可用于分解光不稳定性基团。酶和结合剂可用于剪切、分解或拆开锚。优选酶包括(但不限于)核酸外切酶、核酸内切酶或解螺旋酶。优选结合剂包括(但不限于)酶、抗体或其片段或单链结合蛋白(SSB)。可使用下文论述的酶或上文所论述的抗体中的任一个。加热和pH可用于破坏杂交和其它连接。

如果通过从一个或多个锚分离第一聚核苷酸来从膜解偶联第一聚核苷酸,那么一个或多个锚将残留在膜中。步骤(g)优选地包含使用从第一聚核苷酸分离的一个或多个锚来使第二聚核苷酸与膜偶联。举例来说,第二聚核苷酸还可具备与残留于膜中的一个或多个锚杂交的一个或多个聚核苷酸。替代地,步骤(g)优选地包含使用来自从第一聚核苷酸分离的一者(即一个或多个其它锚)的一个或多个独立锚来使第二聚核苷酸与膜偶联。所述一个或多个独立锚可以是与用于使第一聚核苷酸与膜偶联的锚相同的锚类型,或可以是不同的锚类型。步骤(g)优选地包含使用来自从第一聚核苷酸分离的一个或多个锚的一个或多个不同锚来使第二聚核苷酸与膜偶联。

在一优选实施例中,步骤(f)和(g)包含通过使膜与第二聚核苷酸接触,来从膜解偶联第一聚核苷酸,使得第二聚核苷酸与第一聚核苷酸竞争与一个或多个锚结合,且置换第一聚核苷酸。举例来说,如果使用涉及杂交的一个或多个锚来使第一聚核苷酸与膜偶联,那么可通过使锚与连接于同样与一个或多个锚中的杂交位点杂交的聚核苷酸的第二聚核苷酸接触,来解偶联第一聚核苷酸。通常以高于第一聚核苷酸和一个或多个锚的浓度的浓度来添加第二聚核苷酸。替代地,第二聚核苷酸可比第一聚核苷酸更强烈地与一个或多个锚杂交。

去除或洗涤

尽管在步骤(f)中从膜解偶联第一聚核苷酸,但不必去除或洗掉。如果第二聚核苷酸可容易地区别于第一聚核苷酸,那么不需要去除第一聚核苷酸。

在步骤(f)与(g)之间,方法优选地进一步包含从膜去除至少一些第一样本。可去除至少10%的第一样本,例如可去除至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的第一样本。

方法更优选地进一步包含从膜去除所有的第一样本。这可以任何方式来进行。举例来说,可在已解偶联第一聚核苷酸之后,用缓冲液来洗涤膜。合适缓冲液在下文论述。

修饰的聚核苷酸

在表征之前,可通过在使用目标聚核苷酸作为模板,聚合酶形成修饰的聚核苷酸的条件下,使聚核苷酸与聚合酶和游离核苷酸群体接触来对目标聚核苷酸进行修饰,其中当形成修饰的聚核苷酸时,聚合酶用不同核苷酸物种置换目标聚核苷酸中的一个或多个核苷酸物种。接着,修饰的聚核苷酸可具备连接于聚核苷酸的一个或多个解螺旋酶和连接于聚核苷酸的一个或多个分子制动器。这种类型的修饰描述于英国申请第1403096.9号中。可使用上文所论述的聚合酶中的任一个。聚合酶优选地是Klenow或9o North。

在使用模板聚核苷酸作为模板,聚合酶形成修饰的聚核苷酸的条件下,使模板聚核苷酸与聚合酶接触。这些条件是所属领域中已知的。举例来说,通常使聚核苷酸与含聚合酶的可商购的聚合酶缓冲液接触,所述缓冲液例如来自New England的缓冲液。对于Klenow的温度优选地是20到37℃,或对于9o North的是60到75℃。引物或3'发夹通常用作聚合酶延伸的成核点。

使用跨膜孔表征(例如测序)聚核苷酸通常涉及分析由k个核苷酸构成的聚合物单元,其中k是正整数(即'k-聚体’)。这一点在国际申请第PCT/GB2012/052343号(公开为WO2013/041878)号中论述。尽管期望在不同聚体的电流测量之间具有清楚的分隔,但这些测量中的一些重叠是常见的。尤其在k聚体中用高数量的聚合物单元,即高的k值,可能变得难以解析由不同k聚体产生的测量,损害关于聚核苷酸的推导信息,例如聚核苷酸的潜在序列的评估。

通过用修饰的聚核苷酸中的不同核苷酸物种来置换目标聚核苷酸中的一个或多个核苷酸物种,修饰的聚核苷酸含有不同于目标聚核苷酸中的那些k聚体的k聚体。修饰的聚核苷酸中的不同k聚体能够从目标聚核苷酸中的k聚体产生不同的电流测量,且因此修饰的聚核苷酸提供来自目标聚核苷酸的不同信息。来自修饰的聚核苷酸的额外信息可使得其更容易表征目标聚核苷酸。在一些例子中,修饰的聚核苷酸自身可以更容易进行表征。举例来说,修饰的聚核苷酸可以设计成包括在其电流测量之间具有增加的分隔或清楚的分隔的k聚体,或具有噪声减少的k聚体。

当形成修饰的聚核苷酸时,聚合酶优选地用不同核苷酸物种置换目标聚核苷酸中的两个或更多个核苷酸物种。聚合酶可用独特的核苷酸物种置换目标聚核苷酸中的两个或更多个核苷酸物种中的每一个。聚合酶可用相同的核苷酸物种置换目标聚核苷酸中的两个或更多个核苷酸物种中的每一个。

如果目标聚核苷酸是DNA,那么修饰的聚核苷酸中的不同核苷酸物种通常包含不同于腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶或甲基胞嘧啶的核碱基,和/或包含不同于脱氧腺苷、脱氧鸟苷、胸苷、脱氧胞苷或脱氧甲基胞苷的核苷。如果目标聚核苷酸是RNA,那么修饰的聚核苷酸中的不同核苷酸物种通常包含不同于腺嘌呤、鸟嘌呤、尿嘧啶、胞嘧啶或甲基胞嘧啶的核碱基,和/或包含不同于腺苷、鸟苷、尿苷、胞苷或甲基胞苷的核苷。不同核苷酸物种可以是上文所论述的通用核苷酸中的任一个。

聚合酶可用不同核苷酸物种来置换一个或多个核苷酸物种,所述不同核苷酸物种包含一个或多个核苷酸物种缺乏的化学基团或原子。化学基团可以是丙炔基、硫基、氧代基、甲基、羟甲基、甲酰基、羧基、羰基、苯甲基、炔丙基或炔丙胺基。

聚合酶可用不同核苷酸物种来置换一个或多个核苷酸物种,所述不同核苷酸物种缺乏一个或多个核苷酸物种中存在的化学基团或原子。聚合酶可用具有电负性改变的不同核苷酸物种来置换核苷酸物种中的一个或多个。具有电负性改变的不同核苷酸物种优选地包含卤素原子。

方法优选地进一步包含从修饰的聚核苷酸中的一个或多个不同核苷酸物种选择性地去除核碱基。

分析物递送

目标分析物优选地连接于将分析物递送向膜的微粒。这种类型的递送公开于英国申请第1418469.1号中。可使用任何类型的微粒和连接方法。

其它表征方法

在另一实施例中,利用聚合酶通过检测向目标聚核苷酸中添加的标记物种,来表征聚核苷酸,且接着释放。聚合酶使用聚核苷酸作为模板。每个各标记的物种对每个核苷酸具有特异性。使聚核苷酸与如本文所公开的孔(例如双孔)、聚合酶和标记的核苷酸接触,使得磷酸标记的物种通过聚合酶依序添加到聚核苷酸中,其中磷酸物种含有对每个核苷酸具有特异性的标记。可在从核苷酸释放标记物种之前(即在目标聚核苷酸向中添加其时),或在从核苷酸释放其之后,使用孔来检测标记物种。

聚合酶可以是上文所论述的那些聚合酶中的任一个。使用孔检测磷酸标记物种,且从而表征聚核苷酸。这种类型的方法公开于EP-A-2682460中。上文所论述的实施例中的任一个同样适用于这种方法。

标记物种的实例包括(但不限于)聚合物、聚乙二醇、糖、环糊精、荧光团、药物、代谢物、肽。这些标签的非限制性实例可在Kumar等人《科学研究(Sci Rep.)》2012;2:684.电子版2012年9月21的研究中找到。

形成传感器的方法

还提供一种形成用于表征目标聚核苷酸的传感器的方法。方法包含在如本文所公开的孔与聚核苷酸结合蛋白(例如解螺旋酶或核酸外切酶)之间形成复合体。可通过在存在目标聚核苷酸下使孔和蛋白质接触且接着在孔两端施加电势来形成复合体。所施加的电势可以是如上文所描述的化学势或电压电势。替代地,可通过将孔共价连接于蛋白质来形成复合体。用于共价连接的方法在所属领域中是已知的且公开于例如WO 2010/004265和WO2010/086603中。复合体是用于表征目标聚核苷酸的传感器。方法优选地包含在如本文所公开的孔与解螺旋酶之间形成复合体。上文所论述的实施例中的任一个同样适用于这种方法。

还提供一种用于表征目标聚核苷酸的传感器。传感器包含在如本文所公开的孔与聚核苷酸结合蛋白之间的复合体。上文所论述的实施例中的任一个同样适用于传感器。

试剂盒

还提供一种用于表征目标聚核苷酸的试剂盒。试剂盒包含如本文梭公开的双孔和/或孔以及膜组分。膜优选地由组分形成。孔优选地存在于膜中。试剂盒可包含上文所公开的任一个膜(例如两亲层或三嵌段共聚物膜)的组分。

试剂盒可进一步包含聚核苷酸结合蛋白。可使用上文所论述的任一个聚核苷酸结合蛋白。

试剂盒可进一步包含用于使聚核苷酸与膜偶联的一个或多个锚。

试剂盒优选地是用于表征双链聚核苷酸,并优选地包含Y衔接子和发夹环衔接子。Y衔接子优选地具有所连接的一个或多个解螺旋酶,且发夹环衔接子优选地具有所连接的一个或多个分子制动器。Y衔接子优选地包含用于使聚核苷酸与膜偶联的一个或多个第一锚,发夹环衔接子优选地包含用于使聚核苷酸与膜偶联的一个或多个第二锚,且发夹环衔接子与膜偶联的强度优选地大于Y衔接子与膜偶联的强度。

试剂盒可另外包含使得能够进行上文提到的任一个实施例的一个或多个其它试剂或仪器。这些试剂或仪器包括以下中的一个或多个:合适缓冲液(水性溶液)、从个体获得样本的装置(例如包含针的容器或仪器)、用于扩增和/或表达聚核苷酸的装置,或电压或贴片钳设备。试剂可以干态形式存在于试剂盒中,使得流体样本再悬浮试剂。试剂盒还可任选地包含使得能够在如本文所公开的方法中使用试剂盒的说明书或关于何种生物体可使用所述方法的详情。

设备

本发明还提供一种用于表征目标分析物(例如目标聚核苷酸)的设备。设备包含如本文所公开的多个孔和多个膜。多个孔优选地存在于多个膜中。孔和膜的数量优选地是相等的。优选地,各膜中存在单一孔。

用于表征目标分析物的设备可在多个膜中包含如本文所公开的孔阵列,例如双孔阵列。

设备优选地进一步包含用于实行方法的说明书。设备可以是用于分析物分析的任何常规设备,例如阵列或芯片。上文参考方法所论述的任一个实施例同样适用于本发明的设备。设备可进一步包含存在于如本文所公开的试剂盒中的任一个特征。

设备优选地安设成实行如本文所公开的方法。

设备优选地包含:

传感器装置,其能够支撑多个孔和膜且能够操作以使用孔和膜来执行分析物表征;和

至少一个通口,其用于递送执行表征用的材料。

替代地,设备优选地包含:

传感器装置,其能够支撑多个孔和膜,所述传感器装置能够操作以使用孔和膜来执行分析物表征;和

至少一个储槽,其用于盛放执行表征用的材料。

设备更优选地包含:

传感器装置,其能够支撑多个孔和膜,所述传感器装置能够操作以使用孔和膜来执行分析物表征;

至少一个储槽,其用于盛放执行表征用的材料;

流控系统,其被配置成可控地将材料从所述至少一个储槽供应到所述传感器装置;和

一个或多个容器,其用于容纳相应样本,所述流控系统配置成选择性地将样本从一个或多个容器供应到传感器装置。

设备可以是在WO 2009/077734、WO 2010/122293、WO 2011/067559或WO 00/28312中描述的那些装置中的任一个。

实例1:双孔生产

将编码多肽促-CP1-Eco-(突变体-StrepII(C))(SEQ ID NO:26)的DNA(SEQ IDNO:25)克隆到含有氨苄青霉素(ampicillin)抗性基因的pT7载体中。将DNA溶液的浓度调整到400μg/uL。1μl DNA用于转化细胞系ONT001,所述细胞系是Lemo BL21 DE3细胞系,其中编码CsgG蛋白的基因被负责卡那霉素(kanamycin)抗性的DNA置换。接着将细胞向外涂铺在含有氨苄青霉素(0.1mg/ml)和卡那霉素(0.03mg/ml)的LB琼脂上,且在37℃下培育大约16小时。

可以假定在含有氨苄青霉素和卡那霉素的LB板上生长的细细菌菌落并入了CP1质粒,而无内源性产生。一个这种菌落用于接种含有羧苄青霉素(0.1mg/ml)和卡那霉素(0.03mg/ml)两者的LB培养基的起子培养物(100mL)。使起子培养物在37℃下在搅动下生长,直到OD600达到1.0-1.2为止。起子培养物用于接种新鲜的500ml培养物且OD600为0.1。LB培养基含有以下添加剂:羧苄青霉素(0.1mg/ml)、卡那霉素(0.03mg/ml)、500μM鼠李糖、15mM MgSO4和3mM ATP。培养物在37℃下在搅动下生长直到固定相输入并保持另外一小时,固定相通过所测量OD600的平稳段来确定。接着将培养物的温度调整到18℃且添加葡萄糖到0.2%的最终浓度。一旦将培养稳定在18℃,通过添加乳糖到1%的最终浓度来开始诱导。在18℃下在搅动下,实行诱导大约18小时。

在诱导之后,通过在6,000g下离心30分钟来集结培养物。将集结粒再悬浮于50mMTris、300mM NaCl、含有蛋白酶抑制剂(默克密理博公司539138)、benzonase核酸酶(西格玛公司E1014)和1×Bugbuster(默克密理博公司70921)和0.1%Brij 58pH8.0(每克集结粒大约10ml缓冲液)中。将悬浮液充分混合,直到其完全均匀为止,接着将样本转移到4℃下的辊式混合器大约5小时。通过在20,000g下离心45分钟来使裂解物集结,且通过0.22μM PES针筒过滤器来过滤上清液。获取含有CP1的上清液以用于通过柱色谱纯化。

样本应用于5ml Strep Trap柱(通用电气医疗集团(GE Healthcare))。用25mMTris、150mM NaCl、2mM EDTA、0.1%Brij 58pH8来洗涤柱,直到维持10柱体积的稳定基线为止。接着,在返回到150mM缓冲液之前,用25mM Tris、2M NaCl、2mM EDTA、0.1%Brij 58pH8来洗涤柱。用10mM脱硫生物素实行洗脱。合并洗脱峰并在1ml Q HP柱(通用电气医疗集团)上,使用25mM Tris、150mM NaCl、2mM EDTA、0.1%Brij 58pH 8作为结合缓冲液和25mMTris、500mM NaCl、2mM EDTA、0.1%Brij 58pH8作为洗脱缓冲液实行离子交换纯化。观察到流通峰含有二聚体和单体蛋白两者,洗脱峰在大约400ms/sec下观察到含有单体孔。通过vivaspin柱(100kd MWCO)浓缩流通峰,并在24ml S200增加柱(通用电气医疗集团)上使用缓冲液25mM Tris、150mM NaCl、2mM EDTA、0.1%Brij 58、0.1%SDS pH 8实行尺寸排阻色谱。二聚体(双)孔在9ml下洗脱,而单体孔在10.5ml下洗脱。

实例2:CsgG孔中收缩部(读取头)的延长

材料和方法

从***在含嵌段共聚物的缓冲液(25mM K磷酸盐缓冲液,150mM亚铁***(II),150mM铁***(III),pH 8.0)中的各种单一CsgG纳米孔获得电学测量。在达到***在嵌段共聚物中的单一孔之后,接着缓冲液(1mL 25mM K磷酸钾缓冲液,150mM亚铁***(II),150mM铁***(III),pH 8.0)流过系统,以去除任何过量的CsgG纳米孔。接着运行平台QC控制以确定含有单一纳米孔的通道数。为此,使含有240nM TBA的1mL缓冲液(25mM K磷酸盐缓冲液,150mM亚铁***(II),150mM铁***(III),pH 8.0)流过入口。在进行平台QC时,使用无核酸酶水将RBF1(940mM KCL、50mM HEPES、20mM MgCl2和22mM ATP)稀释到1×。接着通过入口冲洗800μl的1×RBF1。10分钟后,SpotON阀打开且200μL的1×RBF1流过入口。系统现在已准备好测序。

同时,使用以下方法制备DNA样本以用于测序:将1μg DNA分析物与40nM衔接子混合物(含有与衔接子预结合的T4 Dda解螺旋酶)和平头TA接合酶一起培育10分钟。接着,使用Spri纯化,纯化接合反应混合物,以去除未接合的游离衔接子。在含有40mM CAPS(pH10)、40mM KCl和400nM胆固醇系链的25μL洗脱缓冲液中洗脱最终接合的混合物。对于每个芯片,将12μl DNA-衔接子接合的混合物与37.5μL RBF1和25.5μL水(最终体积为75μL)混合,并通过SpotON端口添加到Flow Cell中以进行测序。接着,在180mV下运行实验6小时。

结果

针对每个孔突变体组装波浪线的列表,并使用这些波浪线建立隐式马尔可夫模型(Hidden Markov Model,HMM)模型,所述模型描述了在DNA分析物中观察到的所有序列上下文的信号特征。使用这些模型,我们能够深入了解读取头的长度和形状。图6到9的左侧绘图显示了电流电平相较于读取头位置(按碱基分组)。举例来说,在读取头位置3处,将在第3位置处具有A或C或G或T的所有序列上下文的中值电流平均化。图6到9中的右侧绘图显示相较于读取头位置的鉴别,其中鉴别被定义为在所有序列上下文中平均的由于所述位置处的碱基变化而导致的电流变化。

图6显示了基线孔的鉴别概况,所述基线孔包含具有SEQ ID NO:2所示的序列的单体,其中已进行了以下取代:Y51A;F56Q;K94Q;R97W;和R192D,且其中V105到I107已缺失。当在给定时间孔读取头中存在5个碱基时,这个孔在第3位置处在读取头中具有一个主要位置。图7到9显示孔的鉴别概况,所述孔包含SEQ ID NO:2中的上述基线孔突变和以下额外取代中的一个:N55V、A51Q和Q56V。与基线孔相比,这些突变体均显示出读取头的延长,其中读取头中的两个位置现在对信号产生贡献。

序列表

<110> 牛津纳米孔技术公司

<120> 孔

<130> N410779WO

<150> GB1707122.6

<151> 2017-05-04

<160> 26

<170> PatentIn version 3.5

<210> 1

<211> 786

<212> DNA

<213> 大肠杆菌(Escherichia coli)

<400> 1

tgtctgaccg caccgccgaa agaagcggca cgtccgaccc tgatgccgcg tgcacagtct 60

tataaagatc tgacccatct gccggctccg acgggcaaaa tttttgttag cgtctataac 120

atccaggacg aaaccggtca atttaaaccg tacccggcga gtaatttctc cacggccgtt 180

ccgcagagtg caaccgctat gctggtcacg gcactgaaag attcccgttg gttcattccg 240

ctggaacgcc agggcctgca aaacctgctg aatgaacgta aaattatccg cgcagctcag 300

gaaaacggta ccgtggccat taacaatcgt attccgctgc aaagcctgac cgccgcaaac 360

atcatggttg aaggctctat catcggttac gaatcaaacg tcaaatcggg cggtgtgggc 420

gcacgttatt ttggcattgg tgctgatacc cagtaccaac tggaccagat cgcagttaac 480

ctgcgcgtgg ttaatgtcag caccggcgaa attctgagct ctgtgaatac cagcaaaacg 540

atcctgtctt acgaagtgca ggctggtgtt tttcgtttca ttgattatca acgcctgctg 600

gaaggcgaag tcggttacac ctcaaacgaa ccggtgatgc tgtgtctgat gtcggcgatt 660

gaaacgggtg ttattttcct gatcaatgat ggcatcgacc gtggtctgtg ggatctgcag 720

aacaaagccg aacgtcaaaa tgacattctg gtgaaatacc gccacatgag tgttccgccg 780

gaatcc 786

<210> 2

<211> 262

<212> PRT

<213> 大肠杆菌(Escherichia coli)

<400> 2

Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Arg Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ala Pro Thr Gly

20 25 30

Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro

100 105 110

Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Val Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln

225 230 235 240

Asn Lys Ala Glu Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg His Met

245 250 255

Ser Val Pro Pro Glu Ser

260

<210> 3

<211> 248

<212> PRT

<213> 差异柠檬酸杆菌属(Citrobacter koseri)

<400> 3

Met Pro Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Met Pro

1 5 10 15

Thr Gly Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly

20 25 30

Gln Phe Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln

35 40 45

Ser Ala Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe

50 55 60

Ile Pro Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys

65 70 75 80

Ile Ile Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg

85 90 95

Ile Pro Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser

100 105 110

Ile Ile Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg

115 120 125

Tyr Phe Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala

130 135 140

Val Asn Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser

145 150 155 160

Val Asn Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val

165 170 175

Phe Arg Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr

180 185 190

Thr Ser Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr

195 200 205

Gly Val Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp

210 215 220

Leu Gln Asn Lys Ala Glu Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg

225 230 235 240

His Met Ser Val Pro Pro Glu Ser

245

<210> 4

<211> 223

<212> PRT

<213> 肠道沙门氏菌(Salmonella enterica)

<400> 4

Cys Leu Thr Ala Pro Pro Lys Gln Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ala Pro Thr Gly

20 25 30

Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Met Asn Asn Arg Ile Pro

100 105 110

Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly

210 215 220

<210> 5

<211> 262

<212> PRT

<213> 无丙二酸柠檬酸杆菌属(Citrobacter amalonaticus)

<400> 5

Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ile Pro Thr Gly

20 25 30

Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Val Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro

100 105 110

Leu Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln

225 230 235 240

Asn Lys Ala Asp Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg His Met

245 250 255

Ser Val Pro Pro Glu Ser

260

<210> 6

<211> 262

<212> PRT

<213> 鼠柠檬酸杆菌(Citrobacter rodentium)

<400> 6

Cys Leu Thr Thr Pro Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Val Pro Thr Gly

20 25 30

Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro

100 105 110

Leu Pro Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Ala Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln

225 230 235 240

Asn Lys Ala Asp Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg Gln Met

245 250 255

Ser Val Pro Pro Glu Ser

260

<210> 7

<211> 262

<212> PRT

<213> 阿氏肠杆菌(Enterobacter asburiae)

<400> 7

Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Arg Asp Leu Thr His Leu Pro Ala Pro Thr Gly

20 25 30

Lys Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser His Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Asn Asn Asn Arg Met Pro

100 105 110

Leu Gln Ser Leu Ala Ala Ala Asn Val Met Ile Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Met Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln

225 230 235 240

Asn Lys Ala Asp Ala Gln Asn Pro Val Leu Val Lys Tyr Arg Asp Met

245 250 255

Ser Val Pro Pro Glu Ser

260

<210> 8

<211> 262

<212> PRT

<213> 雷金斯堡约克氏菌(Yokenella regensburgei)

<400> 8

Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Arg Asp Leu Thr His Leu Pro Leu Pro Ser Gly

20 25 30

Lys Val Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Val Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Asp Asn Asn Arg Ile Pro

100 105 110

Leu Gln Ser Leu Thr Ala Ala Asn Val Met Ile Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Val Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ser

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Tyr Leu Ile Asn Asp Gly Ile Glu Arg Gly Leu Trp Asp Leu Gln

225 230 235 240

Gln Lys Ala Asp Val Asp Asn Pro Ile Leu Ala Arg Tyr Arg Asn Met

245 250 255

Ser Ala Pro Pro Glu Ser

260

<210> 9

<211> 262

<212> PRT

<213> 灰尘粘菌(Cronobacter pulveris)

<400> 9

Cys Leu Thr Ala Pro Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Arg Asp Leu Thr Asn Leu Pro Asp Pro Lys Gly

20 25 30

Lys Leu Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ser Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Glu Asn Asn Arg Met Pro

100 105 110

Leu Gln Ser Leu Val Ala Ala Asn Val Met Ile Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Gly Asp Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Ala

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile His Leu Ile Asn Asp Gly Ile Asn Arg Gly Leu Trp Glu Leu Lys

225 230 235 240

Asn Lys Gly Asp Ala Lys Asn Thr Ile Leu Ala Lys Tyr Arg Ser Met

245 250 255

Ala Val Pro Pro Glu Ser

260

<210> 10

<211> 262

<212> PRT

<213> 水生拉恩菌(Rahnella aquatilis)

<400> 10

Cys Leu Thr Ala Ala Pro Lys Glu Ala Ala Arg Pro Thr Leu Leu Pro

1 5 10 15

Arg Ala Pro Ser Tyr Thr Asp Leu Thr His Leu Pro Ser Pro Gln Gly

20 25 30

Arg Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Cys Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Ser Ala Leu Lys Asp Ser Lys Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Ser Val Ala Ile Asn Asn Gln Arg Pro

100 105 110

Leu Ser Ser Leu Val Ala Ala Asn Ile Leu Ile Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Ser Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Ala Val Asp Val Asn Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Leu Gly Tyr Thr Thr

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Ser Gly Val

210 215 220

Ile Tyr Leu Val Asn Asp Gly Ile Glu Arg Asn Leu Trp Gln Leu Gln

225 230 235 240

Asn Pro Ser Glu Ile Asn Ser Pro Ile Leu Gln Arg Tyr Lys Asn Asn

245 250 255

Ile Val Pro Ala Glu Ser

260

<210> 11

<211> 259

<212> PRT

<213> 抗坏血酸吕克沃尔菌(Kluyvera ascorbata)

<400> 11

Cys Ile Thr Ser Pro Pro Lys Gln Ala Ala Lys Pro Thr Leu Leu Pro

1 5 10 15

Arg Ser Gln Ser Tyr Gln Asp Leu Thr His Leu Pro Glu Pro Gln Gly

20 25 30

Arg Leu Phe Val Ser Val Tyr Asn Ile Ser Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ser Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Ser Ala Leu Lys Asp Ser Asn Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Val Ala Val Asn Asn Arg Thr Gln

100 105 110

Leu Pro Ser Leu Val Ala Ala Asn Ile Leu Ile Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Ala Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Ala Ser Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asn Val Ser Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Phe Gln Ala Gly Val Phe Arg

180 185 190

Tyr Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Val Gly Tyr Thr Val

195 200 205

Asn Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Tyr Leu Val Asn Asp Gly Ile Ser Arg Asn Leu Trp Gln Leu Lys

225 230 235 240

Asn Ala Ser Asp Ile Asn Ser Pro Val Leu Glu Lys Tyr Lys Ser Ile

245 250 255

Ile Val Pro

<210> 12

<211> 259

<212> PRT

<213> 蜂房哈夫尼菌(Hafnia alvei)

<400> 12

Cys Leu Thr Ala Pro Pro Lys Gln Ala Ala Lys Pro Thr Leu Met Pro

1 5 10 15

Arg Ala Gln Ser Tyr Gln Asp Leu Thr His Leu Pro Glu Pro Ala Gly

20 25 30

Lys Leu Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Lys Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Ser Ala Leu Lys Asp Ser Gly Trp Phe Ile Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Glu Asn Gly Thr Ala Ala Val Asn Asn Gln His Gln

100 105 110

Leu Ser Ser Leu Val Ala Ala Asn Val Leu Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Glu Ser Asn Val Lys Ser Gly Gly Ala Gly Ala Arg Phe Phe

130 135 140

Gly Ile Gly Ala Ser Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn

145 150 155 160

Leu Arg Val Val Asp Val Asn Thr Gly Gln Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Val Gln Ala Gly Val Phe Arg

180 185 190

Tyr Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ile Gly Tyr Thr Thr

195 200 205

Asn Glu Pro Val Met Leu Cys Val Met Ser Ala Ile Glu Thr Gly Val

210 215 220

Ile Tyr Leu Val Asn Asp Gly Ile Asn Arg Asn Leu Trp Thr Leu Lys

225 230 235 240

Asn Pro Gln Asp Ala Lys Ser Ser Val Leu Glu Arg Tyr Lys Ser Thr

245 250 255

Ile Val Pro

<210> 13

<211> 255

<212> PRT

<213> 肠杆菌科细菌菌株FGI 57(Enterobacteriaceae bacterium strain FGI 57)

<400> 13

Cys Ile Thr Thr Pro Pro Gln Glu Ala Ala Lys Pro Thr Leu Leu Pro

1 5 10 15

Arg Asp Ala Thr Tyr Lys Asp Leu Val Ser Leu Pro Gln Pro Arg Gly

20 25 30

Lys Ile Tyr Val Ala Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe

35 40 45

Gln Pro Tyr Pro Ala Ser Asn Phe Ser Thr Ser Val Pro Gln Ser Ala

50 55 60

Thr Ala Met Leu Val Ser Ser Leu Lys Asp Ser Arg Trp Phe Val Pro

65 70 75 80

Leu Glu Arg Gln Gly Leu Asn Asn Leu Leu Asn Glu Arg Lys Ile Ile

85 90 95

Arg Ala Ala Gln Gln Asn Gly Thr Val Gly Asp Asn Asn Ala Ser Pro

100 105 110

Leu Pro Ser Leu Tyr Ser Ala Asn Val Ile Val Glu Gly Ser Ile Ile

115 120 125

Gly Tyr Ala Ser Asn Val Lys Thr Gly Gly Phe Gly Ala Arg Tyr Phe

130 135 140

Gly Ile Gly Gly Ser Thr Gln Tyr Gln Leu Asp Gln Val Ala Val Asn

145 150 155 160

Leu Arg Ile Val Asn Val His Thr Gly Glu Val Leu Ser Ser Val Asn

165 170 175

Thr Ser Lys Thr Ile Leu Ser Tyr Glu Ile Gln Ala Gly Val Phe Arg

180 185 190

Phe Ile Asp Tyr Gln Arg Leu Leu Glu Gly Glu Ala Gly Phe Thr Thr

195 200 205

Asn Glu Pro Val Met Thr Cys Leu Met Ser Ala Ile Glu Glu Gly Val

210 215 220

Ile His Leu Ile Asn Asp Gly Ile Asn Lys Lys Leu Trp Ala Leu Ser

225 230 235 240

Asn Ala Ala Asp Ile Asn Ser Glu Val Leu Thr Arg Tyr Arg Lys

245 250 255

<210> 14

<211> 258

<212> PRT

<213> 类志贺邻单胞菌(Plesiomonas shigelloides)

<400> 14

Ile Thr Glu Val Pro Lys Glu Ala Ala Lys Pro Thr Leu Met Pro Arg

1 5 10 15

Ala Ser Thr Tyr Lys Asp Leu Val Ala Leu Pro Lys Pro Asn Gly Lys

20 25 30

Ile Ile Val Ser Val Tyr Ser Val Gln Asp Glu Thr Gly Gln Phe Lys

35 40 45

Pro Leu Pro Ala Ser Asn Phe Ser Thr Ala Val Pro Gln Ser Gly Asn

50 55 60

Ala Met Leu Thr Ser Ala Leu Lys Asp Ser Gly Trp Phe Val Pro Leu

65 70 75 80

Glu Arg Glu Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile Arg

85 90 95

Ala Ala Gln Glu Asn Gly Thr Val Ala Ala Asn Asn Gln Gln Pro Leu

100 105 110

Pro Ser Leu Leu Ser Ala Asn Val Val Ile Glu Gly Ala Ile Ile Gly

115 120 125

Tyr Asp Ser Asp Ile Lys Thr Gly Gly Ala Gly Ala Arg Tyr Phe Gly

130 135 140

Ile Gly Ala Asp Gly Lys Tyr Arg Val Asp Gln Val Ala Val Asn Leu

145 150 155 160

Arg Ala Val Asp Val Arg Thr Gly Glu Val Leu Leu Ser Val Asn Thr

165 170 175

Ser Lys Thr Ile Leu Ser Ser Glu Leu Ser Ala Gly Val Phe Arg Phe

180 185 190

Ile Glu Tyr Gln Arg Leu Leu Glu Leu Glu Ala Gly Tyr Thr Thr Asn

195 200 205

Glu Pro Val Met Met Cys Met Met Ser Ala Leu Glu Ala Gly Val Ala

210 215 220

His Leu Ile Val Glu Gly Ile Arg Gln Asn Leu Trp Ser Leu Gln Asn

225 230 235 240

Pro Ser Asp Ile Asn Asn Pro Ile Ile Gln Arg Tyr Met Lys Glu Asp

245 250 255

Val Pro

<210> 15

<211> 248

<212> PRT

<213> 费希弧菌(Vibrio fischeri)

<400> 15

Pro Glu Thr Ser Glu Ser Pro Thr Leu Met Gln Arg Gly Ala Asn Tyr

1 5 10 15

Ile Asp Leu Ile Ser Leu Pro Lys Pro Gln Gly Lys Ile Phe Val Ser

20 25 30

Val Tyr Asp Phe Arg Asp Gln Thr Gly Gln Tyr Lys Pro Gln Pro Asn

35 40 45

Ser Asn Phe Ser Thr Ala Val Pro Gln Gly Gly Thr Ala Leu Leu Thr

50 55 60

Met Ala Leu Leu Asp Ser Glu Trp Phe Tyr Pro Leu Glu Arg Gln Gly

65 70 75 80

Leu Gln Asn Leu Leu Thr Glu Arg Lys Ile Ile Arg Ala Ala Gln Lys

85 90 95

Lys Gln Glu Ser Ile Ser Asn His Gly Ser Thr Leu Pro Ser Leu Leu

100 105 110

Ser Ala Asn Val Met Ile Glu Gly Gly Ile Val Ala Tyr Asp Ser Asn

115 120 125

Ile Lys Thr Gly Gly Ala Gly Ala Arg Tyr Leu Gly Ile Gly Gly Ser

130 135 140

Gly Gln Tyr Arg Ala Asp Gln Val Thr Val Asn Ile Arg Ala Val Asp

145 150 155 160

Val Arg Ser Gly Lys Ile Leu Thr Ser Val Thr Thr Ser Lys Thr Ile

165 170 175

Leu Ser Tyr Glu Val Ser Ala Gly Ala Phe Arg Phe Val Asp Tyr Lys

180 185 190

Glu Leu Leu Glu Val Glu Leu Gly Tyr Thr Asn Asn Glu Pro Val Asn

195 200 205

Ile Ala Leu Met Ser Ala Ile Asp Ser Ala Val Ile His Leu Ile Val

210 215 220

Lys Gly Val Gln Gln Gly Leu Trp Arg Pro Ala Asn Leu Asp Thr Arg

225 230 235 240

Asn Asn Pro Ile Phe Lys Lys Tyr

245

<210> 16

<211> 248

<212> PRT

<213> 洛伊氏弧菌(Aliivibrio logei)

<400> 16

Pro Asp Ala Ser Glu Ser Pro Thr Leu Met Gln Arg Gly Ala Thr Tyr

1 5 10 15

Leu Asp Leu Ile Ser Leu Pro Lys Pro Gln Gly Lys Ile Tyr Val Ser

20 25 30

Val Tyr Asp Phe Arg Asp Gln Thr Gly Gln Tyr Lys Pro Gln Pro Asn

35 40 45

Ser Asn Phe Ser Thr Ala Val Pro Gln Gly Gly Thr Ala Leu Leu Thr

50 55 60

Met Ala Leu Leu Asp Ser Glu Trp Phe Tyr Pro Leu Glu Arg Gln Gly

65 70 75 80

Leu Gln Asn Leu Leu Thr Glu Arg Lys Ile Ile Arg Ala Ala Gln Lys

85 90 95

Lys Gln Glu Ser Ile Ser Asn His Gly Ser Thr Leu Pro Ser Leu Leu

100 105 110

Ser Ala Asn Val Met Ile Glu Gly Gly Ile Val Ala Tyr Asp Ser Asn

115 120 125

Ile Lys Thr Gly Gly Ala Gly Ala Arg Tyr Leu Gly Ile Gly Gly Ser

130 135 140

Gly Gln Tyr Arg Ala Asp Gln Val Thr Val Asn Ile Arg Ala Val Asp

145 150 155 160

Val Arg Ser Gly Lys Ile Leu Thr Ser Val Thr Thr Ser Lys Thr Ile

165 170 175

Leu Ser Tyr Glu Leu Ser Ala Gly Ala Phe Arg Phe Val Asp Tyr Lys

180 185 190

Glu Leu Leu Glu Val Glu Leu Gly Tyr Thr Asn Asn Glu Pro Val Asn

195 200 205

Ile Ala Leu Met Ser Ala Ile Asp Ser Ala Val Ile His Leu Ile Val

210 215 220

Lys Gly Ile Glu Glu Gly Leu Trp Arg Pro Glu Asn Gln Asn Gly Lys

225 230 235 240

Glu Asn Pro Ile Phe Arg Lys Tyr

245

<210> 17

<211> 254

<212> PRT

<213> 发光杆菌属AK15(Photobacterium sp. AK15)

<400> 17

Pro Glu Thr Ser Lys Glu Pro Thr Leu Met Ala Arg Gly Thr Ala Tyr

1 5 10 15

Gln Asp Leu Val Ser Leu Pro Leu Pro Lys Gly Lys Val Tyr Val Ser

20 25 30

Val Tyr Asp Phe Arg Asp Gln Thr Gly Gln Tyr Lys Pro Gln Pro Asn

35 40 45

Ser Asn Phe Ser Thr Ala Val Pro Gln Gly Gly Ala Ala Leu Leu Thr

50 55 60

Thr Ala Leu Leu Asp Ser Arg Trp Phe Met Pro Leu Glu Arg Glu Gly

65 70 75 80

Leu Gln Asn Leu Leu Thr Glu Arg Lys Ile Ile Arg Ala Ala Gln Lys

85 90 95

Lys Asp Glu Ile Pro Thr Asn His Gly Val His Leu Pro Ser Leu Ala

100 105 110

Ser Ala Asn Ile Met Val Glu Gly Gly Ile Val Ala Tyr Asp Thr Asn

115 120 125

Ile Gln Thr Gly Gly Ala Gly Ala Arg Tyr Leu Gly Val Gly Ala Ser

130 135 140

Gly Gln Tyr Arg Thr Asp Gln Val Thr Val Asn Ile Arg Ala Val Asp

145 150 155 160

Val Arg Thr Gly Arg Ile Leu Leu Ser Val Thr Thr Ser Lys Thr Ile

165 170 175

Leu Ser Lys Glu Leu Gln Thr Gly Val Phe Lys Phe Val Asp Tyr Lys

180 185 190

Asp Leu Leu Glu Ala Glu Leu Gly Tyr Thr Thr Asn Glu Pro Val Asn

195 200 205

Leu Ala Val Met Ser Ala Ile Asp Ala Ala Val Val His Val Ile Val

210 215 220

Asp Gly Ile Lys Thr Gly Leu Trp Glu Pro Leu Arg Gly Glu Asp Leu

225 230 235 240

Gln His Pro Ile Ile Gln Glu Tyr Met Asn Arg Ser Lys Pro

245 250

<210> 18

<211> 261

<212> PRT

<213> 维氏气单胞菌(Aeromonas veronii)

<400> 18

Cys Ala Thr His Ile Gly Ser Pro Val Ala Asp Glu Lys Ala Thr Leu

1 5 10 15

Met Pro Arg Ser Val Ser Tyr Lys Glu Leu Ile Ser Leu Pro Lys Pro

20 25 30

Lys Gly Lys Ile Val Ala Ala Val Tyr Asp Phe Arg Asp Gln Thr Gly

35 40 45

Gln Tyr Leu Pro Ala Pro Ala Ser Asn Phe Ser Thr Ala Val Thr Gln

50 55 60

Gly Gly Val Ala Met Leu Ser Thr Ala Leu Trp Asp Ser Gln Trp Phe

65 70 75 80

Val Pro Leu Glu Arg Glu Gly Leu Gln Asn Leu Leu Thr Glu Arg Lys

85 90 95

Ile Val Arg Ala Ala Gln Asn Lys Pro Asn Val Pro Gly Asn Asn Ala

100 105 110

Asn Gln Leu Pro Ser Leu Val Ala Ala Asn Ile Leu Ile Glu Gly Gly

115 120 125

Ile Val Ala Tyr Asp Ser Asn Val Arg Thr Gly Gly Ala Gly Ala Lys

130 135 140

Tyr Phe Gly Ile Gly Ala Ser Gly Glu Tyr Arg Val Asp Gln Val Thr

145 150 155 160

Val Asn Leu Arg Ala Val Asp Ile Arg Ser Gly Arg Ile Leu Asn Ser

165 170 175

Val Thr Thr Ser Lys Thr Val Met Ser Gln Gln Val Gln Ala Gly Val

180 185 190

Phe Arg Phe Val Glu Tyr Lys Arg Leu Leu Glu Ala Glu Ala Gly Phe

195 200 205

Ser Thr Asn Glu Pro Val Gln Met Cys Val Met Ser Ala Ile Glu Ser

210 215 220

Gly Val Ile Arg Leu Ile Ala Asn Gly Val Arg Asp Asn Leu Trp Gln

225 230 235 240

Leu Ala Asp Gln Arg Asp Ile Asp Asn Pro Ile Leu Gln Glu Tyr Leu

245 250 255

Gln Asp Asn Ala Pro

260

<210> 19

<211> 239

<212> PRT

<213> 希瓦氏菌属ECSMB14101(Shewanella sp. ECSMB14101)

<400> 19

Ala Ser Ser Ser Leu Met Pro Lys Gly Glu Ser Tyr Tyr Asp Leu Ile

1 5 10 15

Asn Leu Pro Ala Pro Gln Gly Val Met Leu Ala Ala Val Tyr Asp Phe

20 25 30

Arg Asp Gln Thr Gly Gln Tyr Lys Pro Ile Pro Ser Ser Asn Phe Ser

35 40 45

Thr Ala Val Pro Gln Ser Gly Thr Ala Phe Leu Ala Gln Ala Leu Asn

50 55 60

Asp Ser Ser Trp Phe Ile Pro Val Glu Arg Glu Gly Leu Gln Asn Leu

65 70 75 80

Leu Thr Glu Arg Lys Ile Val Arg Ala Gly Leu Lys Gly Asp Ala Asn

85 90 95

Lys Leu Pro Gln Leu Asn Ser Ala Gln Ile Leu Met Glu Gly Gly Ile

100 105 110

Val Ala Tyr Asp Thr Asn Val Arg Thr Gly Gly Ala Gly Ala Arg Tyr

115 120 125

Leu Gly Ile Gly Ala Ala Thr Gln Phe Arg Val Asp Thr Val Thr Val

130 135 140

Asn Leu Arg Ala Val Asp Ile Arg Thr Gly Arg Leu Leu Ser Ser Val

145 150 155 160

Thr Thr Thr Lys Ser Ile Leu Ser Lys Glu Ile Thr Ala Gly Val Phe

165 170 175

Lys Phe Ile Asp Ala Gln Glu Leu Leu Glu Ser Glu Leu Gly Tyr Thr

180 185 190

Ser Asn Glu Pro Val Ser Leu Cys Val Ala Ser Ala Ile Glu Ser Ala

195 200 205

Val Val His Met Ile Ala Asp Gly Ile Trp Lys Gly Ala Trp Asn Leu

210 215 220

Ala Asp Gln Ala Ser Gly Leu Arg Ser Pro Val Leu Gln Lys Tyr

225 230 235

<210> 20

<211> 233

<212> PRT

<213> 恶臭假单胞菌(Pseudomonas putida)

<400> 20

Gln Asp Ser Glu Thr Pro Thr Leu Thr Pro Arg Ala Ser Thr Tyr Tyr

1 5 10 15

Asp Leu Ile Asn Met Pro Arg Pro Lys Gly Arg Leu Met Ala Val Val

20 25 30

Tyr Gly Phe Arg Asp Gln Thr Gly Gln Tyr Lys Pro Thr Pro Ala Ser

35 40 45

Ser Phe Ser Thr Ser Val Thr Gln Gly Ala Ala Ser Met Leu Met Asp

50 55 60

Ala Leu Ser Ala Ser Gly Trp Phe Val Val Leu Glu Arg Glu Gly Leu

65 70 75 80

Gln Asn Leu Leu Thr Glu Arg Lys Ile Ile Arg Ala Ser Gln Lys Lys

85 90 95

Pro Asp Val Ala Glu Asn Ile Met Gly Glu Leu Pro Pro Leu Gln Ala

100 105 110

Ala Asn Leu Met Leu Glu Gly Gly Ile Ile Ala Tyr Asp Thr Asn Val

115 120 125

Arg Ser Gly Gly Glu Gly Ala Arg Tyr Leu Gly Ile Asp Ile Ser Arg

130 135 140

Glu Tyr Arg Val Asp Gln Val Thr Val Asn Leu Arg Ala Val Asp Val

145 150 155 160

Arg Thr Gly Gln Val Leu Ala Asn Val Met Thr Ser Lys Thr Ile Tyr

165 170 175

Ser Val Gly Arg Ser Ala Gly Val Phe Lys Phe Ile Glu Phe Lys Lys

180 185 190

Leu Leu Glu Ala Glu Val Gly Tyr Thr Thr Asn Glu Pro Ala Gln Leu

195 200 205

Cys Val Leu Ser Ala Ile Glu Ser Ala Val Gly His Leu Leu Ala Gln

210 215 220

Gly Ile Glu Gln Arg Leu Trp Gln Val

225 230

<210> 21

<211> 234

<212> PRT

<213> 堇色希瓦氏菌(Shewanella violacea)

<400> 21

Met Pro Lys Ser Asp Thr Tyr Tyr Asp Leu Ile Gly Leu Pro His Pro

1 5 10 15

Gln Gly Ser Met Leu Ala Ala Val Tyr Asp Phe Arg Asp Gln Thr Gly

20 25 30

Gln Tyr Lys Ala Ile Pro Ser Ser Asn Phe Ser Thr Ala Val Pro Gln

35 40 45

Ser Gly Thr Ala Phe Leu Ala Gln Ala Leu Asn Asp Ser Ser Trp Phe

50 55 60

Val Pro Val Glu Arg Glu Gly Leu Gln Asn Leu Leu Thr Glu Arg Lys

65 70 75 80

Ile Val Arg Ala Gly Leu Lys Gly Glu Ala Asn Gln Leu Pro Gln Leu

85 90 95

Ser Ser Ala Gln Ile Leu Met Glu Gly Gly Ile Val Ala Tyr Asp Thr

100 105 110

Asn Ile Lys Thr Gly Gly Ala Gly Ala Arg Tyr Leu Gly Ile Gly Val

115 120 125

Asn Ser Lys Phe Arg Val Asp Thr Val Thr Val Asn Leu Arg Ala Val

130 135 140

Asp Ile Arg Thr Gly Arg Leu Leu Ser Ser Val Thr Thr Thr Lys Ser

145 150 155 160

Ile Leu Ser Lys Glu Val Ser Ala Gly Val Phe Lys Phe Ile Asp Ala

165 170 175

Gln Asp Leu Leu Glu Ser Glu Leu Gly Tyr Thr Ser Asn Glu Pro Val

180 185 190

Ser Leu Cys Val Ala Gln Ala Ile Glu Ser Ala Val Val His Met Ile

195 200 205

Ala Asp Gly Ile Trp Lys Arg Ala Trp Asn Leu Ala Asp Thr Ala Ser

210 215 220

Gly Leu Asn Asn Pro Val Leu Gln Lys Tyr

225 230

<210> 22

<211> 245

<212> PRT

<213> 詹氏海杆菌(Marinobacterium jannaschii)

<400> 22

Leu Thr Arg Arg Met Ser Thr Tyr Gln Asp Leu Ile Asp Met Pro Ala

1 5 10 15

Pro Arg Gly Lys Ile Val Thr Ala Val Tyr Ser Phe Arg Asp Gln Ser

20 25 30

Gly Gln Tyr Lys Pro Ala Pro Ser Ser Ser Phe Ser Thr Ala Val Thr

35 40 45

Gln Gly Ala Ala Ala Met Leu Val Asn Val Leu Asn Asp Ser Gly Trp

50 55 60

Phe Ile Pro Leu Glu Arg Glu Gly Leu Gln Asn Ile Leu Thr Glu Arg

65 70 75 80

Lys Ile Ile Arg Ala Ala Leu Lys Lys Asp Asn Val Pro Val Asn Asn

85 90 95

Ser Ala Gly Leu Pro Ser Leu Leu Ala Ala Asn Ile Met Leu Glu Gly

100 105 110

Gly Ile Val Gly Tyr Asp Ser Asn Ile His Thr Gly Gly Ala Gly Ala

115 120 125

Arg Tyr Phe Gly Ile Gly Ala Ser Glu Lys Tyr Arg Val Asp Glu Val

130 135 140

Thr Val Asn Leu Arg Ala Ile Asp Ile Arg Thr Gly Arg Ile Leu His

145 150 155 160

Ser Val Leu Thr Ser Lys Lys Ile Leu Ser Arg Glu Ile Arg Ser Asp

165 170 175

Val Tyr Arg Phe Ile Glu Phe Lys His Leu Leu Glu Met Glu Ala Gly

180 185 190

Ile Thr Thr Asn Asp Pro Ala Gln Leu Cys Val Leu Ser Ala Ile Glu

195 200 205

Ser Ala Val Ala His Leu Ile Val Asp Gly Val Ile Lys Lys Ser Trp

210 215 220

Ser Leu Ala Asp Pro Asn Glu Leu Asn Ser Pro Val Ile Gln Ala Tyr

225 230 235 240

Gln Gln Gln Arg Ile

245

<210> 23

<211> 234

<212> PRT

<213> 生鲜奶金黄杆菌属(Chryseobacterium oranimense G311)

<400> 23

Pro Ser Asp Pro Glu Arg Ser Thr Met Gly Glu Leu Thr Pro Ser Thr

1 5 10 15

Ala Glu Leu Arg Asn Leu Pro Leu Pro Asn Glu Lys Ile Val Ile Gly

20 25 30

Val Tyr Lys Phe Arg Asp Gln Thr Gly Gln Tyr Lys Pro Ser Glu Asn

35 40 45

Gly Asn Asn Trp Ser Thr Ala Val Pro Gln Gly Thr Thr Thr Ile Leu

50 55 60

Ile Lys Ala Leu Glu Asp Ser Arg Trp Phe Ile Pro Ile Glu Arg Glu

65 70 75 80

Asn Ile Ala Asn Leu Leu Asn Glu Arg Gln Ile Ile Arg Ser Thr Arg

85 90 95

Gln Glu Tyr Met Lys Asp Ala Asp Lys Asn Ser Gln Ser Leu Pro Pro

100 105 110

Leu Leu Tyr Ala Gly Ile Leu Leu Glu Gly Gly Val Ile Ser Tyr Asp

115 120 125

Ser Asn Thr Met Thr Gly Gly Phe Gly Ala Arg Tyr Phe Gly Ile Gly

130 135 140

Ala Ser Thr Gln Tyr Arg Gln Asp Arg Ile Thr Ile Tyr Leu Arg Ala

145 150 155 160

Val Ser Thr Leu Asn Gly Glu Ile Leu Lys Thr Val Tyr Thr Ser Lys

165 170 175

Thr Ile Leu Ser Thr Ser Val Asn Gly Ser Phe Phe Arg Tyr Ile Asp

180 185 190

Thr Glu Arg Leu Leu Glu Ala Glu Val Gly Leu Thr Gln Asn Glu Pro

195 200 205

Val Gln Leu Ala Val Thr Glu Ala Ile Glu Lys Ala Val Arg Ser Leu

210 215 220

Ile Ile Glu Gly Thr Arg Asp Lys Ile Trp

225 230

<210> 24

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> StrepII(C)

<400> 24

Ser Ala Trp Ser His Pro Gln Phe Glu Lys

1 5 10

<210> 25

<211> 861

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Pro-CP1-Eco-(WT-Y51A/F56Q/D149N/E185N/E201N/E203N-StrepII(C))

的DNA序列

<400> 25

atgcagcgtc tgtttctgct ggtcgcggtg atgctgctga gcggttgtct gaccgcaccg 60

ccgaaagaag cggcacgtcc gaccctgatg ccgcgtgcac agagctataa agatctgacc 120

catctgccgg ctccgacggg caaaatcttc gtttctgtct acaacatcca ggacgaaacc 180

ggtcaattta aaccagctcc tgcgtcaaat caatcgactg ccgttccgca gtcagcaacc 240

gctatgctgg tcacggcact gaaagattcg cgttggttca ttccgctgga acgccagggc 300

ctgcaaaacc tgctgaatga acgtaaaatt atccgcgcag ctcaggaaaa cggtaccgtg 360

gccattaaca atcgcatccc gctgcaaagt ctgacggcgg ccaacatcat ggttgaaggc 420

tccattatcg gttatgaaag caatgtcaaa tctggcggtg tgggcgcacg ttatttcggc 480

attggtgcta atacccagta ccaactggac cagatcgcag ttaacctgcg cgtggttaat 540

gtcagcaccg gcgaaattct gagctctgtg aataccagta aaacgatcct gtcctacaac 600

gtgcaggctg gtgtttttcg tttcattgat tatcaacgcc tgctgaatgg caacgtcggt 660

tacaccagca acgaaccggt gatgctgtgt ctgatgtctg cgattgaaac gggtgttatt 720

tttctgatca atgatggcat cgaccgtggt ctgtgggatc tgcagaacaa agcggaacgt 780

caaaatgaca ttctggtgaa ataccgccac atgtcagttc cgccggaaag ttccgcatgg 840

agccacccgc agttcgaaaa a 861

<210> 26

<211> 287

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Pro-CP1-Eco-(WT-Y51A/F56Q/D149N/E185N/E201N/E203N-StrepII(C))

的氨基酸序列

<400> 26

Met Gln Arg Leu Phe Leu Leu Val Ala Val Met Leu Leu Ser Gly Cys

1 5 10 15

Leu Thr Ala Pro Pro Lys Glu Ala Ala Arg Pro Thr Leu Met Pro Arg

20 25 30

Ala Gln Ser Tyr Lys Asp Leu Thr His Leu Pro Ala Pro Thr Gly Lys

35 40 45

Ile Phe Val Ser Val Tyr Asn Ile Gln Asp Glu Thr Gly Gln Phe Lys

50 55 60

Pro Ala Pro Ala Ser Asn Gln Ser Thr Ala Val Pro Gln Ser Ala Thr

65 70 75 80

Ala Met Leu Val Thr Ala Leu Lys Asp Ser Arg Trp Phe Ile Pro Leu

85 90 95

Glu Arg Gln Gly Leu Gln Asn Leu Leu Asn Glu Arg Lys Ile Ile Arg

100 105 110

Ala Ala Gln Glu Asn Gly Thr Val Ala Ile Asn Asn Arg Ile Pro Leu

115 120 125

Gln Ser Leu Thr Ala Ala Asn Ile Met Val Glu Gly Ser Ile Ile Gly

130 135 140

Tyr Glu Ser Asn Val Lys Ser Gly Gly Val Gly Ala Arg Tyr Phe Gly

145 150 155 160

Ile Gly Ala Asn Thr Gln Tyr Gln Leu Asp Gln Ile Ala Val Asn Leu

165 170 175

Arg Val Val Asn Val Ser Thr Gly Glu Ile Leu Ser Ser Val Asn Thr

180 185 190

Ser Lys Thr Ile Leu Ser Tyr Asn Val Gln Ala Gly Val Phe Arg Phe

195 200 205

Ile Asp Tyr Gln Arg Leu Leu Asn Gly Asn Val Gly Tyr Thr Ser Asn

210 215 220

Glu Pro Val Met Leu Cys Leu Met Ser Ala Ile Glu Thr Gly Val Ile

225 230 235 240

Phe Leu Ile Asn Asp Gly Ile Asp Arg Gly Leu Trp Asp Leu Gln Asn

245 250 255

Lys Ala Glu Arg Gln Asn Asp Ile Leu Val Lys Tyr Arg His Met Ser

260 265 270

Val Pro Pro Glu Ser Ser Ala Trp Ser His Pro Gln Phe Glu Lys

275 280 285

110页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:抗原受体及其用途

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!