在体外克隆中分选核酸和多重制备物的方法

文档序号:966188 发布日期:2020-11-03 浏览:1次 >En<

阅读说明:本技术 在体外克隆中分选核酸和多重制备物的方法 (Method for sorting nucleic acids and multiplex preparations in vitro cloning ) 是由 J·雅各布森 M·J·戈德伯格 L-Y·A·昆 D·辛德勒 M·E·赫德森 于 2013-04-24 设计创作,主要内容包括:方法和组合物涉及使用高通量测序进行的高保真核酸的分选和克隆。具体地,可从包含具有正确和错误序列的多种核酸的集合中分选具有需要的预定序列的核酸分子。(Methods and compositions relate to high fidelity sorting and cloning of nucleic acids using high throughput sequencing. In particular, nucleic acid molecules having a desired predetermined sequence can be sorted from a collection comprising a plurality of nucleic acids having correct and incorrect sequences.)

在体外克隆中分选核酸和多重制备物的方法

相关申请

本申请要求2013年3月13日提交的美国临时申请系列号61/851,774、2013年1月16日提交的美国临时申请系列号61/848,961、2012年4月24日提交的美国临时申请系列号61/637,750、2012年4月25日提交的美国临时申请系列号61/638,187和2013年4月24日提交的题为“在体外克隆中分选核酸和多重制备物的方法”,代理人案卷号为127662-013702/US,快递邮件标签号为EV 426282790 US的美国申请,其各自的全文通过引用纳入本文。

技术领域

本发明的方法和组合物涉及核酸组装,并且具体涉及分选和克隆具有预定序列的核酸的方法。

背景

重组和合成核酸在研究、工业、农业和医学中有许多应用。可以使用重组和合成核酸来表达和获得大量的多肽,包含酶、抗体、生长因子、受体和其它可用于多种医学、工业或农业目的的多肽。也可以使用重组和合成核酸来产生遗传修饰的生物体,包含修饰的细菌、酵母、哺乳动物、植物和其它生物体。遗传修饰的生物体可以用于研究(例如,疾病的动物模型、理解生物过程的工具等)、工业(例如,作为蛋白质表达的宿主生物体、用于产生工业产物的生物反应器、环境补救的工具、分离或修饰具有工业应用的天然化合物等)、农业(例如,具有增加的产率或增加的对疾病或环境压力的抗性的修饰的作物)和用于其它应用。重组和合成核酸也可以用作治疗组合物(例如,用于修饰基因表达、用于基因治疗等)或用作诊断工具(例如,病症的探针等)。

已经开发了多种技术用于修饰存在的核酸(例如,天然存在的核酸)来产生重组核酸。例如,可以使用核酸扩增、诱变、核酸酶消化、连接、克隆和其它技术来产生许多不同的重组核酸。经常使用化学合成的多核苷酸作为用于核酸扩增、诱变和克隆的引物或衔接子。

也发展了用于从头核酸组装的技术,其中制备(例如,化学合成)和组装核酸来产生较长的感兴趣的目标核酸。例如,已经开发了不同的多重组装技术用于将寡核苷酸组装成能用于研究、工业、农业和/或医学的较大的合成核酸。然而,现有可用的组装技术的一个限制是相对高的错误率。因此,需要高保真、低成本的组装方法。

发明内容

本发明的方面涉及分选和克隆具有需要的或预定的序列的核酸分子的方法。在一些实施方式中,该方法包括提供包含至少两个目标核酸分子群的核酸分子的一个或多个集合(各核酸分子群具有独特的目标核酸序列),用非目标寡核苷酸标签序列对核酸分子的5’末端和3’末端加标签,其中寡核苷酸标签序列包含独特的核苷酸标签和引物区,稀释带标签的核酸分子,对带标签的核酸分子进行从两端开始的测序反应以得到成对末端读取,并且按照它们相应的独特寡核苷酸标签对的相同性分选具有需要的序列的核酸分子。在另一些实施方式中,该方法包括提供包含至少两个核酸分子群的核酸分子的一个或多个集合,各核酸分子群具有独特的内部核酸序列,以及在其5’末端和3’末端的寡核苷酸标签序列,其中寡核苷酸标签序列包含独特的核苷酸标签和引物区,对带标签的核酸分子进行从两端开始的测序反应以得到成对末端读取,并且按照它们相应的独特寡核苷酸标签对的相同性分选具有需要的序列的核酸分子。在一些实施方式中,各核酸分子群具有不同的需要的核酸序列。

在一些实施方式中,独特的核苷酸标签可以连接到核酸分子的5’末端和3’末端。在其他实施方式中,可通过PCR在核酸分子的各末端连接独特的寡核苷酸标签。在一些实施方式中,独特的核苷酸标签可包括完全简并序列、部分简并序列或非简并序列。在一些实施方式中,独特的寡核苷酸标签可包括编码的条形码。例如,独特的核苷酸标签可包括以下的序列:CCWSWDHSHDBVHDNNNNMM或CCSWSWHDSDHVBDHNNNNMM。

在一些实施方式中,该方法还包括扩增具有需要序列的核酸分子。在一些实施方式中,该方法包括使用与引物区和标签核苷酸序列互补的引物扩增具有需要序列的构建体。在一些实施方式中,该方法包括使用与寡核苷酸标签序列互补的引物扩增具有需要序列的构建体。在其他实施方式中,可使用与目标核酸序列互补的引物来扩增具有需要序列的构建体。

在一些实施方式中,该方法还包括汇集多种核酸分子以形成核酸分子的集合,其中多种核酸分子各包含具有需要序列的核酸序列群(即,无错核酸序列)和与需要的序列不同的核酸序列群(即,含错核酸序列)。在一些实施方式中,核酸分子可以从头组装。在一些实施方式中,可在汇集步骤之前或在汇集步骤之后稀释多种核酸分子以形成核酸分子的标准化集合。

在一些实施方式中,寡核苷酸标签可在稀释来自集合的核酸分子之前连接到核酸分子。在一些实施方式中,该方法还可包括在稀释步骤之后扩增带标签的核酸分子。在其他实施方式中,寡核苷酸标签可在稀释来自集合的核酸分子之后连接到核酸分子。

在一些实施方式中,各核酸分子包含5’末端共同衔接子序列和3’末端共同衔接子序列并且寡核苷酸标签序列还包含共同的衔接子序列。在一些实施方式中,设计各核酸分子以具有5’末端共同衔接子序列和3’末端共同衔接子序列。在其他实施方式中,通过连接反应将5’末端共同衔接子序列和3’末端共同衔接子序列添加到各核酸分子。

本发明的一些方面涉及设计多种寡核苷酸来组装成具有预定序列的感兴趣的核酸序列的方法。在一些实施方式中,该方法包括通过计算机将各感兴趣核酸序列分为部分重叠的构建寡核苷酸序列;选择第一构建寡核苷酸序列组,使得每两个相邻的构建寡核苷酸序列互相重叠N个碱基,其中各N-碱基序列长度为至少4个碱基;互相比较N-碱基序列来满足以下的一种或多种约束条件:N-碱基序列互相差异至少2个碱基,或N-碱基序列在5’末端或3’末端的最后3个碱基中互相差异至少1个碱基;从第一构建寡核苷酸序列组识别满足该约束条件的第二构建寡核苷酸序列组;确定第二寡核苷酸组中寡核苷酸的数量;对满足或超出约束条件的来自第二寡核苷酸组的寡核苷酸并基于寡核苷酸的数量进行分级;并且使用该分级来设计令人满意的部分重叠的构建寡核苷酸的集。在分级步骤中,可选择具有较小数量的寡核苷酸的组,和/或可选择在N-碱基序列中具有较高数量的碱基差异的组。在一些实施方式中,可通过计算机将非目标侧接序列加到所述构建寡核苷酸的至少部分的末端。非目标侧接序列可包含引物结合位点。该方法还包括合成令人满意的部分重叠的构建寡核苷酸的集,例如,在固体支持物上,并且将构建寡核苷酸组装成感兴趣的核酸。

在一些方面,本发明涉及分离具有预定序列的核酸的方法,该方法包括:提供至少一个核酸分子群;在表面上分离核酸分子的克隆群,确定核酸分子的克隆群的序列,将具有预定序列的克隆群定位,并且扩增具有预定序列的核酸分子。在一些实施方式中,分离步骤可以是通过稀释进行并且表面可以是流动池(flow cell)。

在本发明的其他方面,分离具有预定序列的核酸的方法包括提供包含无错和含错核酸分子的核酸分子集合,对核酸分子进行加标签,任选地将核酸分子片段化,确定核酸分子的序列,定位无错和含错核酸分子,并且分离无错核酸分子。在一些实施方式中,分离步骤包括以下的一种或多种:融除含错核酸分子,选择性扩增无错核酸分子,和/或将无错核酸分子固定在表面上以及从含错核酸分子分离无错核酸分子。在一些实施方式中,核酸分子的集合包括至少2个核酸群并且各核酸群可固定在不同珠群上。在一些实施方式中,该方法还包括分选不同的珠群。

在本发明的一些方面,提供了分选具有预定序列的分子的方法。在一些实施方式中,该方法包括(a)提供核酸分子集合,其包含至少2个核酸分子群,各核酸分子群具有独特的目标核酸序列,该目标核酸序列具有5’末端和3’末端,(b)用一对非目标寡核苷酸标签序列对目标核酸分子的5’末端和3’末端加标签,其中寡核苷酸标签序列包含独特的核苷酸标签,(c)稀释该带标签的目标核酸,(d)扩增带标签的核酸,(e)将扩增的带标签的核酸分成两个集合,(f)对包含带标签的目标核酸分子的第一集合进行从两端开始的测序反应以得到成对末端读取;(g)使包含带标签的目标核酸分子的第二个集合经过连接反应形成环状核酸分子,从而产生紧邻的标签对,(h)对标签对进行测序,(i)按照它们相应的独特的寡核苷酸标签对的相同性分选具有预定序列的目标核酸分子。在一些实施方式中,可在测序之前扩增标签对。在一些实施方式中,可在测序之前,例如使用限制性酶切下标签对。

附图简要说明

图1A显示了按照一些实施方式的制备性克隆的非限制性示例方法的步骤I、II和III。图1B显示了按照一些实施方式的制备性克隆的非限制性示例方法的步骤IV和V。图1C显示了按照一些实施方式的制备性克隆的非限制性示例方法的步骤VI,正确克隆的制备性回收。星号表示不正确的或不需要的序列位点。

图2A显示了按照一些实施方式的制备性体外克隆样品制备的非限制示例性方法。图2B显示了按照一些实施方式的制备性体外克隆测序的非限制示例性方法。图2C显示了按照一些实施方式的体外克隆制备性分离的非限制示例性方法。

图3显示了从核酸构建体(C2G构建体)到体外克隆构建体(IVC构建体)的非限制示例性样品处理。

图4显示了测序数据分析的非限制示例性流程图。

图5显示了基于质粒的条形码化的非限制示例性代替方案。

图6显示了非限制示例性解析和评分解析。

图7A显示了分离源分子的非限制性实施方式。图7B显示了分离源分子的非限制性实施方式。

图8显示了使用简并条形码非限制示例性分离目标核酸。

图9显示了使用条形码从构建体的集合中非限制示例性分离核酸克隆。

图10显示了使用条形码从构建体的集合中非限制示例性分离核酸克隆。

图11显示了基于珠的回收方法的非限制示例性实施方式。

图12显示了采用组装的体外克隆整合的非限制性示例。

图13A显示了反向体外克隆的非限制性示例。图13B显示了反向体外克隆的非限制性示例。

图14A-C显示了按照测定条形码对信息的非限制性实施方式的方法。图14A显示了按照一个实施方式的通路,通过该通路,分子的条形码化末端通过构建体的钝末端连接结合到一起形成环。图14B显示了按照另一个实施方式的通路,通过该通路,分子的条形码化末端通过构建体的钝末端连接结合到一起形成环。图14C显示了按照将条形码连接到合成的构建体的非限制性实施方式的方法。图14D显示了如何对构建体进行平行测序并且可以使用分离的条形码对来识别正确的分子以用于通过扩增的后续捕获。序列中的X表示分子中的错误。

图15显示了用于确定条形码对信息的非限制性实施方式。

发明详述

已经开发了用于从头核酸组装的技术,由此制备(例如,化学合成)和组装核酸来产生较长的感兴趣的目标核酸。例如,正在开发不同的多重组装技术来将寡核苷酸组装成较大的合成核酸。然而,现有可用的组装技术的一个限制是相对高的错误率。因此存在分离具有预定序列的核酸构建体并弃去具有核酸错误的构建体的需要。

可使用本发明的方面来从大量的核酸片段中高效分离核酸分子,和/或减少产生大核酸产物所需的步骤的数量,同时降低错误率。本发明的方面也可纳入核酸组装过程来增加组装保真度、通量和/或效率,减少成本,和/或缩短组装时间。在一些实施方式中,本发明的方面可以自动化和/或在高通量组装环境下进行来促进平行产生许多不同的目标核酸产物。在一些实施方式中,可以使用从一个或多个不同来源(例如,合成或天然多核苷酸、核酸扩增产物、核酸降解产物、寡核苷酸等)得到的起始核酸来组装核酸构建体。本发明的方面涉及使用对核酸如组装的核酸构建体进行测序的高通量平台来以较低的成本识别高保真核酸。这样的平台的优势在于可放大,允许进行多重处理,产生大量的序列读取,具有快速的周转时间并且节省成本。

本发明的一些方面涉及制备用于高保真核酸组装的构建寡核苷酸。本发明内容可用于增加核酸组装过程的生产速率和/或减少用于生成正确组装的核酸的步骤数目或试剂用量。在某些实施方式中,本发明各方面可以用于自动核酸组装的环境下以减少各正确核酸组装所需的时间、步骤数目、试剂量,和其他因素。因此,本发明的这些和其他方面可以用于降低一个或多个核酸组装过程的成本和时间。

本文所述的方法可用于任何核酸分子、核酸文库或核酸集合。例如,可使用本发明的方法来产生具有预定序列的核酸构建体、寡核苷酸或核酸文库。在一些实施方式中,可从市售来源得到核酸文库或可在固体支持物(例如,阵列)上设计和/或合成核酸文库。

解析

在一些实施方式中,感兴趣的核酸序列可被解析成一组构建寡核苷酸,这些寡核苷酸一起组成感兴趣的核酸序列。例如,在第一步骤中,可得到序列信息。序列信息可以是待组装的感兴趣核酸的序列。在一些实施方式中,可以来自客户的指令的形式接受序列。在一些实施方式中,可以接受序列为核酸序列(例如,DNA或RNA)。在一些实施方式中,可以接受序列为蛋白质序列。该序列可转化为DNA序列。例如,如果所得的序列是RNA序列,可以用T来代替U以得到相应的DNA序列。如果所得的序列是蛋白质序列,其可以使用合适的氨基酸密码子转化为DNA序列。

在一些实施方式中,可根据以下的一种或多种来分析序列信息以确定组装策略,从而产生感兴趣的预定核酸序列:接头的数量、接头的长度、接头的序列、片段的数量、片段的常数、待通过粘性末端连接组装的片段的序列。在一些实施方式中,可通过粘性末端连接或通过聚合酶链组装来组装片段。

在一些实施方式中,组装设计基于构建寡核苷酸的长度和/或接头的数量。例如,按照一些实施方式,片段的长度可具有98至104bp或89至104bp的平均长度范围。在一些实施方式中,可选择产生更小数量的片段或接头的设计。

在一些实施方式中,序列分析可包括扫描接头并且选择具有一个或多个以下特征的接头:各接头长度为4个或更多核苷酸,各接头与其他接头有至少2个核苷酸的差异,和/或各接头与其他接头在接头序列的最后3个核苷酸中有一个或多个核苷酸的差异。然后可按照接头序列中的接头距离(本文中也称为Levenshtein距离)对接头进行评分。如本文所用,接头距离或Levenshtein距离相应于两段序列之间差异的测量。因此,第一和第二接头序列之间的接头距离或Levenshtein距离相应于将第一序列变为第二序列所需的单核苷酸变化的数量。例如,4个核苷酸的序列中1个核苷酸的差异相应于接头距离为1,4个核苷酸的序列中2个核苷酸的差异相应于接头距离为2。接头距离可以取平均。在一些实施方式中,设计接头以具有2或更高的平均接头距离。在一些实施方式中,可选择导致更大接头距离的设计。

在一些实施方式中,分析了满足预定约束条件的所有可能的解析。如果没有发现有效的解析,可放松约束条件以发现一组可能的寡核苷酸序列和接头。例如,对寡核苷酸长度的约束条件可放松至包括具有更短或更长的长度的寡核苷酸。

在一些实施方式中,基于本文提供的任何度量对满足预定约束条件的所有可能的解析分级。例如,各解析可基于平均接头距离度量(如图6所示)、GC含量、寡核苷酸序列的复杂性和/或任何其他合适的度量来分级。

在一些实施方式中,序列分析可包括扫描一种或多种干扰序列特征的存在,其已知或预计干扰寡核苷酸合成、扩增或组装。例如,干扰序列结构可以是在至少10个碱基(例如,10-20个碱基、20-50个碱基、50-100个碱基或超过100个碱基)的长度上具有低GC含量(例如,低于30%GC、低于20%GC、低于10%GC等)的序列,或者可以形成二级结构或茎环结构的序列。

在一些实施方式中,在构建体定量和解析步骤之后,可设计合成的用于组装的构建寡核苷酸(例如,序列、大小和数量)。可使用标准DNA合成化学(例如,亚磷酰胺方法)来产生合成寡核苷酸。可使用本领域已知的任何合适技术在固体支持物(例如微阵列)上合成合成的寡核苷酸。可在扩增之前将寡核苷酸从微阵列上洗脱下来或在微阵列上扩增寡核苷酸。

如本文所用,寡核苷酸可以是包括至少两个共价结合的核苷酸残基的核酸分子。在一些实施方式中,寡核苷酸长度可以是10-1000个核苷酸。例如,寡核苷酸长度可以是10-500个核苷酸,或500-1000个核苷酸。在一些实施方式中,寡核苷酸长度可以是约20-约300个核苷酸(例如,约30-250、40-220、50-200、60-180,或约65或约150个核苷酸)、约100-约200个核苷酸、约200-约300个核苷酸、约300-约400个核苷酸,或约400-约500个核苷酸。然而,可以使用更短或更长的寡核苷酸。寡核苷酸可以是双链或单链核酸。本文使用的术语“核酸”、“多核苷酸”、“寡核苷酸”可互换使用,并且指核苷酸的天然产生或合成的聚合物形式。本发明所述寡核苷酸和核酸分子可以从天然产生的核苷酸形成,例如形成脱氧核糖核酸(DNA)或核糖核酸(RNA)分子。或者,所述天然产生的寡核苷酸可以包含改变其性质的结构修饰,例如肽核酸(PNA)或锁定核酸(LNA)。有天然产生碱基或人工碱基的寡核苷酸和核酸分子的固相合成为本领域熟知。应该理解所述术语包含从核苷酸类似物中生成的RNA或DNA的等同物、类似物,和应用于要描述的实施方式时的单链或双链多核苷酸。本发明有用的核苷酸包含例如天然产生的核苷酸(例如核糖核苷酸或脱氧核糖核苷酸),或者核苷酸的天然或合成修饰、或者人工碱基。本文使用的术语单体指小分子组成员,其是并且能结合在一起以形成低聚物、聚合物或由两个或更多成员构成的化合物。聚合物中所述单体的特定顺序在本文中称为聚合物的“序列”。所述单体组包含但不限于例如常见L-氨基酸组、D-氨基酸组、合成和/或天然氨基酸组、核苷酸组及戊糖和己糖组。本文所述的本发明的方面主要关于制备寡核苷酸,但是易于应用于制备其他聚合物例如肽或多肽、多糖、磷脂、杂聚物、聚酯、聚碳酸酯、聚脲、聚酰胺、聚乙烯亚胺、聚亚芳基硫醚、聚硅氧烷、聚酰亚胺、聚乙酸酯或任何其他聚合物。

通常通过磷酸二酯键连接核苷。当用字母序列表示核酸时,应理解核苷从左至右是5’至3’的顺序。按照IUPAC符号,“A”表示脱氧腺苷、“C”表示脱氧胞苷、“G”表示脱氧脱氧鸟苷、“T”表示脱氧胸苷、“U”表示核糖核苷,尿苷。另外,也存在当超过一种核苷酸可能出现在该位置时使用的字母:“W”(即,弱键)表示A或T,“S”(强键)表示G或C,“M”(对于氨基)表示A或C,“K”(对于酮)表示G或T,“R”(对于嘌呤)表示A或G,“Y”(对于嘧啶)表示C或T,“B”表示C、G或T,“D”表示A、G或T,“H”表示A、C或T,“V”表示A、C或G并且“N”表示任何碱基A、C、G或T(U)。应理解核酸序列并不限于4种天然的脱氧核苷酸,但也可包括核糖核苷或非天然核苷酸。

在一些实施方式中,本文提供的方法和装置可使用固定于表面或基质(例如,支持物结合的寡核苷酸)上的寡核苷酸,其中寡核苷酸的3’或5’末端与该表面结合。支持物结合的寡核苷酸包括,例如,与构建寡核苷酸互补的寡核苷酸、锚定寡核苷酸和/或间隔子寡核苷酸。本文使用的术语“支持物”、“底物”和“表面”可互换使用,并且指聚合物例如核酸在上面合成或固定的多孔或非多孔溶剂不溶性材料。本文使用的“多孔”指所述材料包含有基本一致直径(例如nm范围)的孔。多孔材料包括纸、合成过滤器、聚合物基质等。在这种多孔材料中,所述反应可以在孔或基质中进行。所述支持物能具有很多形状中的任何一种,例如销型、条、板、平盘、杆状、弯曲、圆柱形结构、颗粒(包含珠、纳米颗粒)等。所述支持物能具有可变宽度。支持物可以是亲水性的或能够呈现出亲水性的。所述支持物可以包含无机粉末如二氧化硅、硫酸镁、和氧化铝;天然聚合材料,特别是纤维素材料和纤维素衍生材料,例如包含纤维的纸,如滤纸、色谱纸等;合成或改性天然产生的聚合物,如硝酸纤维素、乙酸纤维素、聚(氯乙烯)、聚丙烯酰胺、交联的葡聚糖、琼脂糖、聚丙烯酸酯、聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二酯)、尼龙、聚(丁酸乙烯酯)、聚偏二氟乙烯(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金属等;或者单独使用或与其他材料联用。在一些实施方式中,在阵列形式上合成寡核苷酸。例如,在常见支持物上原位合成单链寡核苷酸,其中各寡核苷酸在底物的单独或不连续特征(或点)上合成。在一些实施方式中,单链寡核苷酸可结合到所述支持物的表面或特征上。本文所用的术语“阵列”是指用于存储、扩增和释放寡核苷酸或互补寡核苷酸用于进一步反应的离散特征的排列。在一些实施方式中,所述支持物或阵列是可寻址的:所述支持物包含在所述支持物上特定预定位置(即“地址”)上的两个或更多离散的可寻址特征。因此,阵列上的各寡核苷酸分子位于所述支持物上已知和确定的位置。各寡核苷酸序列能从所述支持物上其位点处测定。

在一些实施方式中,寡核苷酸在表面或阵列的离散特征上连接、点样、固定、表面结合、支持或合成。寡核苷酸可以共价连接到表面或在表面上沉积。阵列可以构建、定制购买或购自商业销售商(如安捷伦公司(Agilent)、昂飞公司(Affymetrix)、Nimblegen公司)。各种构建方法为本领域熟知,如无掩膜阵列合成器、利用掩膜的光导向方法、流动通道方法、点样法等。在一些实施方式中,构建和/或选择寡核苷酸可以使用无掩膜阵列合成器(MAS)在固体支持物上合成。无掩膜阵列合成器在例如PCT申请号WO99/42813和相应的美国专利号6,375,903中描述。其他示例为已知的无掩膜设备,其能制造定制的DNA微阵列,其中所述阵列中的各特征中有所需序列的单链DNA分子。其他合成寡核苷酸的方法包括例如利用掩模的光定向方法、流动通道方法、点样法、销型方法(pin-based method),和利用多个支持物的方法。用于合成寡核苷酸的利用掩模的光导向的方法(例如,VLSIPSTM方法)在美国专利号5,143,854、5,510,270和5,527,681中描述。这些方法涉及活化固体支持物上的预定区域,并且然后使所述支持物接触预选择的单体溶液。选定区域能用通过掩模的光源辐射来活化,方法大多按照集成电路制造中使用的光刻法技术。所述支持物的其他区域保持失活,因为照射被掩模封闭并且其仍保持化学保护。因此,光模式定义所述支持物上的哪个区域与给定的单体反应。通过重复活化不同预定区域组和使不同单体溶液接触所述支持物,在所述支持物上生产聚合物的不同阵列。该方法也可通过使用与生长表面结合分子相容的光致抗蚀剂和涉及的合成化学来产生效果。能任选使用其他步骤,例如从所述支持物上洗涤未反应的单体溶液。其他可应用方法包括机械技术如描述于美国专利号5,384,261中的那些。可用于在单个支持物上合成寡核苷酸的其他方法描述于例如美国专利号5,384,261。例如,试剂可以通过(1)在预定区域上确定的通道中流动,或者(2)预定区域上的“点样”递送到所述支持物上。也可以使用其他方法以及点样和流动的组合。在各示例中,当所述单体溶液递送到多个反应位点时,所述支持物上的某些活化区域与其他区域机械分开。流动通道方法包括,例如微流体系统以控制在固体支持物上寡核苷酸的合成。例如,不同的聚合物序列可以在固体支持物的选定区域上合成,所述合成是通过形成合适试剂流过或合适试剂置于其中的所述支持物表面上的流动通道。制备固体支持物上寡核苷酸的点样法涉及通过直接置于选定区域而递送相对少量的反应物。在一些步骤中,所述整体支持物表面能用溶液喷洒或被覆,如果这样做更有效的话。精确测量的单体溶液等分样品可以通过从一个区域到另一个区域移动的分配器逐滴置入。用于在固体支持物上合成寡核苷酸的销型方法在例如美国专利号5,288,514中描述。销型方法利用有多个销型或其他延伸的支持物。所述销型各自同时***到浅盘的单个试剂容器中。96销型的阵列通常利用96容器的浅盘,例如96孔微量滴定皿。各个浅盘填充有在单个销型上特定化学反应中偶联的特定试剂。因此,所述浅盘会经常包含不同试剂。由于优化所述化学反应从而各反应能在相对相似的反应条件组下进行,可同时进行多个化学偶联的步骤。

在另一个实施方式中,可在多个支持物上合成或固定多个寡核苷酸。一个示例是描述于例如美国专利号5,770,358;5,639,603;和5,541,061的基于珠的合成方法。为了在珠上合成分子例如寡核苷酸,大量的珠悬浮于容器中的合适运载体(如水)中。提供了带有可选间隔子分子的珠,所述分子有其复合的活性位点,可选为保护基团。在合成的各步骤中,分开所述珠以供偶联到多种容器中。新生寡核苷酸链脱保护后,不同单体溶液加入到各容器中,从而在给定容器内的所有珠上,发生相同的核苷酸加成反应。所述珠随后用过量试剂洗涤,收集入单个容器中,混合并重新分布到另一种容器以准备下一轮合成。应注意到由于在开始利用的大量珠,在容器内同样会随机分布大量珠,在多轮随机加入碱基后,各自在其表面具有合成的独特寡核苷酸序列。可以用序列来对单个珠加标签,所述序列对其上的双链寡核苷酸是唯一的,使得可在应用中识别。

预合成的寡核苷酸和/或多核苷酸序列可以连接到支持物上或使用下列方法原位合成:光导向方法、流动通道和点样法、喷墨法、销型方法和珠基方法,示于下列参考文献中:McGall等,(1996)Proc.Natl.Acad.Sci.U.S.A.93:13555;《在基因工程操作中合成DNA阵列》(Synthetic DNA Arrays In Genetic Engineering),卷20:111,普莱南出版社(Plenum Press)(1998);Duggan等,(1999)Nat.Genet.S21:10;《微阵列:在微阵列生物信息学中制作和使用》(Microarrays:Making Them and Using Them In MicroarrayBioinformatics),剑桥大学出版社(Cambridge University Press),2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;和PCT公开号WO 04/031399、WO 04/031351、WO 04/029586、WO 03/100012、WO 03/066212、WO 03/065038、WO 03/064699、WO 03/064027、WO03/064026、WO 03/046223、WO 03/040410和WO 02/24597;所述公开内容通过引用全文纳入本文以用于所有目的。在一些实施方式中,预合成的寡核苷酸连接到支持物上或使用点样方法合成,其中单体溶液通过从一个区域到另一个区域移动的分配器(如喷墨)逐滴置入。在一些实施方式中,使用例如机械波驱动的分配器在支持物上点样寡核苷酸。

在一些实施方式中,组装的核酸片段或构建体(本文中也称为感兴趣核酸)各自可以是约100个核苷酸-约1000个核苷酸长(例如,约200、约300、约400、约500、约600、约700、约800、约900个)。然而,可以使用组装技术(例如,鸟枪法组装进入质粒载体)组装较长(例如,约2500或更多个核苷酸长、约5000或更多个核苷酸长、约7500或更多个核苷酸长、约10000或更多个核苷酸长等)或较短的核酸片段。应理解每个核酸片段的大小独立于加入组装的其它核酸片段的大小。然而,在一些实施方式中,各核酸片段大小可以大约相同。

本发明的方面涉及用于选择性分离具有预定感兴趣序列的核酸构建体的方法和组合物。本文使用的术语“预定序列”指在所述聚合物合成或组装前已知并选择的聚合物的序列。具体地,本文所述本发明的方面主要关于核酸分子的制备,在所述核酸分子合成或组装前已知并选择的寡核苷酸或多核苷酸的序列。在本文所提供技术的一些实施方式中,固定的寡核苷酸或多核苷酸用作材料来源。在多个实施方式中,本文所述的方法使用多种构建寡核苷酸,各寡核苷酸具有基于待合成的最终核酸构建体的序列(本文也称为感兴趣核酸)确定的目标序列。在一个实施方式中,寡核苷酸是短核酸分子。例如,寡核苷酸长度可以是10至约300个核苷酸、20至约400个核苷酸、30至约500个核苷酸、40至约600个核苷酸,或超过约600个核苷酸。然而,可以使用更短或更长的寡核苷酸。寡核苷酸可设计成具有不同长度。在一些实施方式中,多核苷酸构建体的序列可以分成多种更短的序列(例如,构建寡核苷酸),所述序列能使用本文所述方法平行合成并组装成单个或多个所需多核苷酸构建体。在加工(例如,加标签、稀释、扩增、测序、分离、组装等)之前,可从一个或多个阵列中收集核酸,如构建寡核苷酸,以形成核酸文库或集合。

按照本发明的一些方面,各待组装的核酸序列(本文中也称为核酸源分子)可包括具有5’末端和3’末端以及在该内部目标序列的5’末端和/或3’末端处的额外侧接序列的内部预定的目标序列。在一些实施方式中,可将内部目标序列或包含该内部目标序列和额外的5’和3’侧接序列的核酸合成至本文所述的固体支持物上。

在一些实施方式中,合成核酸序列包含内部目标序列和该目标序列上游和下游的非目标序列。在一些实施方式中,非目标序列可包括在目标序列的3’末端(下游)和5’末端(上游)处用于识别类似的目标序列的序列ID(SeqID)以及在目标序列的3’末端和5’末端处用于多重样品制备的测序柄(sequencing handle)(H)。测序柄可位于序列ID的3’末端和5’末端。在一些实施方式中,序列ID长度为10个核苷酸。在一些实施方式中,测序柄H长度为20个核苷酸。然而,可使用更短或更长的序列ID和/或测序柄。在一些实施方式中,可用额外的序列,如寡核苷酸标签序列,来合成核酸序列。例如,可设计核酸序列,使得它们包含选自如本文所述的寡核苷酸标签序列文库的寡核苷酸标签序列。在一些实施方式中,可设计核酸序列以使其具有在一组核酸构建体之间包含共同的序列的寡核苷酸标签序列。术语“共同序列”表示该序列是相同的。在一些实施方式中,共同序列可以是通用序列。在其他实施方式中,设计5’寡核苷酸标签序列以在其3’末端处具有共同序列并且设计该3’寡核苷酸标签序列以在其5’末端具有共同序列。例如,可设计核酸以在其5’寡核苷酸标签的3’末端处以及3’寡核苷酸标签的5’末端处具有共同序列。寡核苷酸标签序列的文库可用于待从单个阵列组装的核酸构建体。在其他实施方式中,寡核苷酸标签的文库可重新用于从不同的阵列产生的不同构建体。在一些实施方式中,可将寡核苷酸标签序列的文库设计成通用的。在一些实施方式中,设计核酸或寡核苷酸标签以具有额外的序列。额外的序列可包括适于集合中的核酸测序、扩增、分离或组装的任何核苷酸序列。

制备性体外克隆(IVC)方法

本文提供了用于从头合成高保真核酸的制备性体外克隆方法或策略。在一些实施方式中,体外克隆方法可使用寡核苷酸标签。在其他实施方式中,体外克隆方法并不需要使用寡核苷酸标签。

在一些实施方式中,本文所述的方法允许从核酸分子集合中克隆具有需要或预定序列的核酸序列。在一些实施方式中,该方法可包括分析用于多种目标核酸的平行制备性克隆的目标核酸的序列。例如,本文所述的方法可包括质量控制步骤和/或质量控制读取以识别具有正确序列的核酸分子。图1A-C显示用于分离和克隆具有预定序列的核酸分子的示例性方法。在一些实施方式中,可首先将核酸合成或组装至支持物上。例如,可以每孔具有一种构建体的方式在96-孔板中组装核酸分子。在一些实施方式中,各核酸构建体(C1到CN,图1A-C)具有不同的核苷酸序列。例如,核酸构建体可以是非同源核酸序列或具有一定同源度的核酸序列。在其他实施方式中,可以在固体支持物的不同位置或孔上沉积具有预定序列的多种核酸分子,例如C1到CN。在一些实施方式中,核酸构建体的长度限制可取决于通过高通量成对末端测序对全长目标核酸的5’末端和3’末端的测序效率。本领域技术人员会理解本文所述的方法可绕开对通过用繁殖载体中的核酸构建体转化细胞来进行克隆(即体内克隆)的需要。另外,本文所述的方法消除了在识别具有需要的序列的目标核酸之前单独扩增候选构建体的需要。

本领域技术人员会理解在寡核苷酸组装之后,组装产物可能含有含正确和错误组装产物的序列集合。例如,参考图1A,板的各孔(核酸构建体C1到CN)可以是具有正确或错误序列(用星号表示错误的序列位点)的核酸分子的混合物。错误可能由在寡核苷酸合成期间,或在寡核苷酸组装成较长的核酸期间引入的序列错误所致。在一些情况中,高达90%的核酸序列可能是不需要的序列。本文提供了从错误的核酸序列选择性分离正确的核酸序列的装置和方法。可通过从其他错误的序列选择性分离正确的序列,如通过将预定序列的需要的组装多核苷酸选择性移动或转移至支持物的不同特征,或转移至另一块板上来分离正确的序列。或者,可从包含感兴趣多核苷酸的特征中选择性去除具有错误序列的多核苷酸。根据本发明的一些方法,可以首先在固体支持物中稀释组装核酸分子以得到核酸分子的标准化群。本文使用的术语“标准化”或“标准化集合”表示核酸集合已经过处理,以使集合中核酸分子成员之间丰度的相对变化降低至不超过约1000倍、不超过约100倍、不超过约10倍、不超过约5倍、不超过约4倍、不超过约3倍或不超过约2倍。在一些实施方式中,通过稀释使核酸分子标准化。例如,核酸分子可经标准化,使得核酸分子的数量为约5、约10、约20、约30、约40、约50、约60、约60、约70、约80、约90、约100、约1000或更高。在一些实施方式中,可通过在收集核酸分子之前进行有限的稀释来标准化各核酸分子群以减少集合的复杂性。在一些实施方式中,为了确保在集合中存在目标核酸的至少一个拷贝,稀释被限制为提供超过一个核酸分子。在一些实施方式中,可连续稀释寡核苷酸。在一些实施方式中,该装置(例如,阵列或微孔平板,如96孔板)可整合连续稀释功能。在一些实施方式中,可连续稀释组装产物以产生核酸的标准化群。可在稀释步骤之前评估分子的浓度和数量并且计算稀释率以产生标准化的群。在示例性的实施方式中,通过至少2、至少3、至少4、至少5、至少6、至少7、至少10、至少20、至少50、至少100、至少1000等的倍数稀释组装产物。在一些实施方式中,在测序之前,可稀释目标核酸序列并且放置在例如不同的孔中或固体支持物的不同位置上或不同支持物上。

在一些实施方式中,可汇集核酸分子的标准化群以产生具有不同预定序列的核酸分子的集合。在一些实施方式中,集合中的各核酸分子可以处于相对低的复杂度。在其他实施方式中,可在混合以高浓度存在的核酸分子的不同群之后进行核酸分子的标准化。

在其他实施方式中,本发明的方法包括图2A所示的以下步骤:(a)提供不同核酸构建体(本文中也称为源分子)的集合;(b)提供寡核苷酸标签的库,各寡核苷酸标签包含独特的核苷酸标签序列或条形码;(c)在5’末端和3’末端将寡核苷酸标签(K和L)与核酸分子集合中的各源分子连接,使得集合中基本所有的不同分子具有与之相连的不同寡核苷酸标签对(K,L)从而将条形码连接到特定源分子,和(d)稀释带标签的核酸序列;(e)得到各核酸分子的成对末端读取;以及(f)按照条形码的相同性分选具有需要的预定序列的核酸分子。本文使用的术语“条形码”是指允许识别相应的核酸序列的独特寡核苷酸标签序列。通过设计条形码的库或文库来形成相对于核酸分子的数量足够大的条形码文库,各不同核酸分子可具有独特的条形码对。在一些实施方式中,条形码的文库包含多种5’末端条形码和多种3’末端条形码。可设计文库的各5’末端条形码以使其具有与文库的各成员共同的3’末端或内部序列。可设计文库的各3’末端条形码以使其具有与文库的各成员共同的5’末端或内部序列。

在一些实施方式中,该方法还包括使用NexteraTM标签化来消化带标签的源分子和使用或更高通量的新一代测序平台的测序。NexteraTM标签化的成对读取通常产生一条带有用于识别的寡核苷酸标签序列的序列,以及另一条构建体目标区内部的序列(如图2C所示)。用高通量测序,可产生足够的覆盖度来重构各标签对构建体的共有序列并且确定该序列是否正确(即,无错序列)。

在一些实施方式中,可从一个或多个固体支持物汇集核酸分子用于多重加工。可以稀释核酸分子以保持每个目标核酸分子有易处理数量的克隆。可通过向核酸分子的各末端添加独特的条形码或独特的条形码对来使所述各分子带标签。在连接寡核苷酸标签之前稀释核酸分子可允许降低核酸分子集合的复杂性,从而允许使用降低复杂性的条形码文库。然后可扩增带标签的分子。在一些实施方式中,寡核苷酸标签序列可包括用于扩增的引物结合位点(图2C)。在一些实施方式中,可使用寡核苷酸标签序列作为引物结合位点。扩增的带标签的分子可经过标签化并且经过成对读取测序来将条形码与需要的目标序列相关联。可使用条形码作为引物来回收具有需要序列的序列克隆。扩增方法是本领域众所周知的。可用于通过PCR的扩增的具有聚合酶活性的酶的示例是NA聚合酶(克列诺片段,T4 DNA聚合酶)、来自多种热稳定细菌的热稳定DNA聚合酶(Taq、VENT、Pfu或Tfl DNA聚合酶)以及它们的遗传修饰衍生物(TaqGold、VENTexo、Pfu exo)或KOD Hifi DNA聚合酶。在一些实施方式中,通过嵌合PCR的扩增可降低条形码相关的信噪比。

在其他实施方式中,可从一个或多个阵列汇集核酸分子用于多重加工。如本文所述,可设计核酸分子以使其在5’和3’末端处包含条形码。在一些实施方式中,条形码在构建体内和一组构建体之间具有共同序列。例如,条形码可以是对从单个阵列中组装的各构建体通用的。在一些实施方式中,条形码可具有共同的接头序列或共同的引物结合位点序列。

在一些实施方式中,可向核酸分子添加条形码并且可在经扩增之前稀释带标签的核酸分子。扩增的带标签分子可经过标签化并测序以将条形码对与各核酸分子相关联。在一些实施方式中,使用各读取对的一个读取用于对条形码化末端进行测序。不含任何条形码的读取对可被滤去。可通过共有判定(calling)来去除测序错误率。例如可使用条形码作为引物来分离具有需要的序列的核酸分子。

按照本发明的一些方法,可首先稀释核酸序列(构建寡核苷酸、组装中间体或组装的感兴趣核酸)以得到目标多核苷酸的克隆群(即,含单个目标多核苷酸序列的群)。本文使用的“克隆核酸”或“克隆群”或“克隆多核苷酸”可互换使用并且指核酸的克隆分子群,即互相之间基本或完全相同的核酸。因此,基于稀释的方法提供互相之间基本相同或相同的核酸分子群。在一些实施方式中,可连续稀释多核苷酸。可在稀释步骤之前评估分子的浓度和数量,从而可计算稀释率以产生克隆群。

在一些实施方式中,下一代测序(NGS)点位置或微流体通道位置可用作消除对设计构建体特异性条形码的需要的核酸构建体标识物。

在一些实施方式中,当使用具有多个流动池(例如,2000)的NGS时,可能得到平均各基因1个克隆/流动池。如泊松分布所确定,有限的稀释会产生一次击中(single-hit),例如每孔一个克隆。泊松统计学表明如果各基因的平均克隆数是1个/流动池,则大约1/3的流动池将有0个克隆,1/3的流动池将有1个克隆而1/3的流动池将有2个克隆。因此,如果错误率需要N个克隆来产生完美或无错的全长构建体,则将需要3*N个流动池以得到至少一个流动池会含有完美构建体的克隆代表的高度可能性。例如,如果N=4,则将需要12个流动池。在一些实施方式中,在对流动池内的克隆进行测序之后,可提供将各流动池的流出物收集到分开的孔中的手段。然后可使用测序数据来识别含有具有预定序列的核酸的收集孔。在确定那些具有预定序列的核酸在那些收集孔中之后,可使用对具有预定序列的核酸具有特异性的引物来从它们的合适孔中扩增具有预定序列的核酸。在这类实施方式中,引物可与感兴趣的核酸序列和/或寡核苷酸标签互补。

标签寡核苷酸

在一些实施方式中,可用一对标签寡核苷酸序列来使集合内的各核酸分子的5’末端和3’末端带标签。在一些实施方式中,标签寡核苷酸序列可以由共同的DNA引物区和独特的“条形码”区如特定核苷酸序列组成。在一些实施方式中,标签核苷酸序列的数量可以大于每个构建体的分子数量(即,在稀释中10-1000个分子)。

在一些实施方式中,条形码序列也可作用为引物结合位点来扩增条形码化的核酸分子或分离具有需要预定序列的核酸分子。在这类实施方式中,术语条形码和寡核苷酸标签可互换使用。在这类实施方式中,术语“条形码化的核酸”和“带标签的核酸”可互换使用。应理解寡核苷酸标签可以具有任何合适的长度和组成。在一些实施方式中,可以设计寡核苷酸标签来(a)产生足够大的条形码库以允许用独特的条形码对各核酸分子的各末端加标签;并且(b)最小化不同条形码之间的交叉杂交。在一些实施方式中,各条形码的核苷酸序列与库中的任何其他条形码差异足够大,从而在使用的反应条件,如杂交条件下,没有条形码库的成员可形成二聚体。

在一些实施方式中,条形码序列的长度可以是6bp、7bp、8bp、9bp、10bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp或超过30bp。在一些实施方式中,5’末端条形码序列和3’末端条形码序列长度可以不同。例如,5’条形码长度可以是14个核苷酸而3’条形码长度可以是20个核苷酸。在一些实施方式中,出于引物能力(primability)的考虑,可选择条形码的长度来使条形码的空间减小最小化,使3’末端处的条形码空间最大化,允许校正条形码错误,和/或使条形码解链温度之间的变化最小化。例如,在组内的条形码解链温度可以互相差距在10℃以内,互相差距在5℃以内或互相差距在2℃以内。

各条形码序列可包括完全简并序列、部分简并序列或非简并序列。

例如,可使用6bp、7bp、8bp或更长的核苷酸标签。在一些实施方式中,可使用简并序列NNNNNNNN(8个简并碱基,其中各N可以是任何天然或非天然核苷酸)并产生65536种独特的条形码。在一些实施方式中,可选择核苷酸标签的长度来限制各核酸构建体的具有共同标签序列的标签对的数量。

本领域技术人员应理解,完全简并的序列可产生高数量的不同条形码,但也可产生引物解链温度Tm的更高幅变化。解链温度是双链核酸分子群一半解离为单链时的温度。计算核酸的Tm的公式为本领域熟知。例如,当核酸在1M NaCl的水性溶液中时,可通过公式Tm=81.5±0.41(%G+C)计算来简单估计Tm值。在一些实施方式中,条形码序列是编码的条形码并且可包括与固定或恒定核苷酸组合的部分简并序列。在一些实施方式中,所述条形码可包括一种或多种以下物质:(a)在3’末端的简并碱基N;(b)在5’末端的一个或多个C(为了限制Tm);(c)包含W、D、H、S、B、V和M的延伸。

在一些实施方式中,条形码是编码的条形码并且可包括,但不限于,具有以下序列的条形码文库:

条形码1:CCWSWDHSHDBVHDNNNNMM。这20个碱基的条形码具有与13N相同的条形码简并空间。

条形码2:CCSWSWHDSDHVBDHNNNNMM。与条形码1相比,这21个碱基的条形码具有一些在位置上转换的简并碱基。应注意到可在条形码1和条形码2之间区分引物。

在一些实施方式中,可以设计、分析和分级条形码序列以产生一列分级的核苷酸标签,其根据完美的序列和引物性能而富集。应理解编码的条形码提供了用于产生具有较高Tm范围的引物的方法。

在一些实施方式中,标签寡核苷酸序列或条形码可与各核酸分子连接以形成在其5’和3’末端包含标签寡核苷酸序列的核酸分子。在一些实施方式中,可使用连接酶将标签寡核苷酸序列或条形码连接到钝末端核酸分子。例如,连接酶可以是T7连接酶或能够将标签寡核苷酸序列连接到核酸分子的任何其他连接酶。可在适于避免核酸构建体的多联化的条件下进行连接。在其他实施方式中,设计核酸分子以使其在其5’和3’末端具有与标签寡核苷酸序列共同或互补的序列。在一些实施方式中,标签寡核苷酸序列和具有共同序列的核酸分子可通过聚合酶链反应,如适配子(adaptamer)那样连接。如图2A所示,条形码可在测序柄H的5’末端和3’末端连接(A和B),其侧接内部目标序列。在一些实施方式中,在第一固体支持物上合成的各源分子在其5’和3’末端具有共同的测序柄对。例如,在第一固体支持物上合成的寡核苷酸具有第一对测序柄(A1,B1),而在第二固体支持物上合成的寡核苷酸具有第二对测序柄(A2,B2)等。

在其他实施方式中,可通过与核酸分子的5’末端和3’末端连接且不添加序列识别物SeqID和/或测序柄H来引入条形码。因此,构建体引物仍然是完整的并且可作用为序列识别物。该方法可具有的优势在于使用合成至阵列上的具有内部目标序列和在该目标序列的5’末端和3’末端处的引物区的核酸构建体,并且具有更大的控制来使构建体标准化。在一些实施方式中,可使用图4所示的基于质粒的方法来导入条形码,所述方法包括以下步骤:(1)提供条形码化的载体(例如,pUC19载体),(2)提供核组装构建体或寡核苷酸,(3)使核酸构建体磷酸化;(4)连接条形码化的载体和核组装构建体,和(5)汇集连接产物;以及(6)对连接产物进行稀释和/或扩增。例如,线性化的载体包括5’和3’侧接区。在一些实施方式中,可设计侧接区以使其具有外部条形码和内部序列衔接子。例如,侧接区可包括条形码、标签化衔接子和M13序列。应理解该替代性条形码化方案不必是基于质粒的并且可使用在其5’末端和3’末端具有条形码的任何线性核酸片段。

图3显示了用寡核苷酸标签对目标核酸序列群加标签、对分子进行测序以得到寡核苷酸标签和内部目标测序信息,并且回收需要的带标签的构建体序列的上述方法的工作流程。该工作流程/发明的流程可简化为:目标分子群(A)=>标签(B)=>测序(C)=>回收需要的目标核酸序列(D)。

在其他实施方式中,并且参考图12A-B,可从多种内部目标序列片段和独特条形码序列组装核酸构建体。可设计独特的条形码序列以同时在内部目标序列的5’末端和3’末端与目标序列组装,以产生具有独特侧接条形码序列和感兴趣的内部目标区的分子群。在一些实施方式中,设计5’末端内部目标序列片段以在其5’末端具有序列识别物SeqID和/或测序柄H并且设计3’末端内部目标序列片段以在其3’末端具有序列识别物SeqID和/或测序柄H。该方法的优势在于将体外克隆方法(IVC方法)与组装方法(本文中也称为C2G组装方法)整合。如图12A-B所示,具有感兴趣的内部目标的各组装的分子具有不同的序列对(Ki,Li),如(Ki1,Li1)、(Ki2,Li2)等,以使其与核酸构建体的集合中的其他分子相区分。在一些实施方式中,可在集合中混合具有不同感兴趣内部目标序列的多种构建体(例如CA1、CB1和CC1)(图12C)。可以如本文所述和图12D所示对不同的构建体进行稀释、扩增和测序。可按照相应的独特条形码对的相同性来分选具有需要的序列的核酸分子。

本领域技术人员会理解前述方法的优势在于不用对构建体进行加标签处理,由于分子的核心群已经基本等同于上述工作流程中的加工点B。然后可如下描述工作流程:独特的目标分子群(A’)=>测序(C)=>回收需要的目标核酸序列(D)。

测序

在一些实施方式中,可从核酸序列的集合分离目标核酸序列或目标核酸序列的拷贝,它们中的一些含有一个或多个序列错误。如本文所述,目标核酸序列的拷贝是指使用模板依赖性方法如PCR的拷贝。在一些实施方式中,可使用对个体分子进行测序(如单一分子测序)或对目标核酸序列的扩增群的测序(如聚合酶克隆测序)来实施目标核酸序列的序列测定。在一些实施方式中,核酸分子集合经过高通量成对末端测序反应,如使用

Figure BDA0002623180040000221

(亿明达公司(Illumina))等或任何合适的下一代测序系统(NGS)。

在一些实施方式中,使用在各标签寡核苷酸序列上的共同引物序列来扩增核酸分子。在一些实施方式中,引物可以是通用引物或独特的引物序列。扩增允许制备用于测序的目标核酸,以及在测序之后取回具有需要的序列的目标核酸。在一些实施方式中,核酸分子的样品经过转座子-介导的片段化和衔接子连接以能够使用高通量测序系统来快速制备成对末端读取。例如,可制备经过NexteraTM标签化(亿明达公司)的样品。

本领域技术人员会理解控制片段化的程度和核酸片段的大小对于使测序成对读取中读取的数量最大化从而能够对片段的需要长度进行测序的重要性。在一些实施方式中,成对末端读取可产生一条带有用于识别的标签的序列,以及另一条构建体目标区内部的序列。用高通量测序,可产生足够的覆盖度来重构各标签对构建体的共有序列并且确定构建体序列是否正确。在一些实施方式中,优选将断开的数量限制在少于2、少于3或少于4。在一些实施方式中,可使用合适的反应条件如通过使用合适的转座酶浓度并控制孵育的温度和时间来控制片段化的程度和/或片段的大小。可通过使用已知量的测试文库并滴定酶和时间来建立实际样品文库的标准曲线以得到合适的反应条件。在一些实施方式中,不用于片段化的样品的部分可再与片段化的样品混合并加工用于测序。

然后可在产生成对末端读取的平台上对样品进行测序。根据个体DNA构建体的大小、混合在一起的构建体的数量和群的估计错误率,可选择合适的平台来使需要的读取的数量最大化并且使每个构建体的成本最小化。

对核酸分子的测序导致成对末端读取中来自各分子的两个标签的读取。可使用成对末端读取来识别连接或PCR结合的是哪个标签对以及分子的相同性。

数据分析

在一些实施方式中,按照图5的方案分析测序数据或读取。读取可表示与核酸的序列相关的连续碱基判定。应理解读取可包括样品核酸模板的全长序列或其部分如包含条形码序列、序列识别物和目标序列的部分的序列。读取可包含小数量的碱基判定,如约8个核苷酸(碱基判定)但也含有较大数量的碱基判定,如16或更多个碱基判定、25或更多个碱基判定、50或更多个碱基判定、100或更多个碱基判定,或者200或更多个核苷酸或碱基判定。

对于数据分析,弃去一个标签与相同构建体的多个其他标签配对的读取,因为这会导致对于数据来源的克隆的模糊性。

然后可分析测序结果以确定各构建体的各克隆的序列。对于各成对读取,其中一个读取含有标签序列,已知各测序读取来源的分子的相同性,并且可使用构建体序列本身来区分具有相同标签的构建体。可使用来自成对读取的其它读取来构建分子的内部区的共有序列。从这些结果中,可生成对应于各构建体的正确目标序列的标签对的图。

根据一个实施方式,该分析可包括以下的一种或多种:(1)特征注释;(2)特征校正;(3)相同性分配和置信;(4)共有判定和置信;以及(5)制备性分离。

本发明的方面提供了生成各核酸构建体的共有序列的能力。在序列中的各碱基判定可基于特定位置的共有碱基判定,该共有碱基判定是基于该位置处的多个读取。然后组装或比较这些多个读取以提供在给定位置处的给定碱基的共有确定,并且因此得到具体序列构建体的共有序列。应理解本发明设想并包括了从对序列的该位置的多个读取分配具体碱基判定的共有确定的任何方法。本领域已知确定这类判定的方法。这类方法可包括多序列比对的探试法、多序列比对的最优方法或本领域已知的任何方法。在一些实施方式中,将序列读取与参照序列(例如,预定的感兴趣序列)对比。高通量测序需要用于对多个查询序列进行作图的高效算法,如序列识别物或条形码的短读取对这类参比序列。

按照本发明的一些方面,特征注释包括寻找主要特征和次要特征。例如,使用在读取对中序列识别物SeqID的两个读取的比对能滤去在构建体的5’末端和3’末端处没有正确识别物或在序列识别物的5’末端和3’末端处没有正确条形码序列的构建体。在一些实施方式中,可使用Levenshtein距离来聚集克隆,从而校正特征。然后可基于相同性分配中的置信度来对克隆分级。

目标核酸序列的分离

本发明的方面特别用于从包含含有序列错误的核酸序列的集合中分离感兴趣的核酸序列。本文提供的技术可包含任何非破坏性测序方法。非破坏性测序的非限制性示例包括焦磷酸测序,如Hyman等(1988,Anal.Biochem.74:324-436)最初描述,和珠基测序,例如由Leamon等(2004,Electrophoresis 24:3769-3777)所述。非破坏性测序也包括使用可切割标记的寡核苷酸的方法,如Mitra等(2003,Anal.Biochem.320:55-62)所述,和光可切割接头(Seo等,2005,PNAS 102:5926-5933)。本文提供的技术也包括使用可逆终止子的方法(Metzker等,1994,NAR 22:4259-4267)。非破坏性测序的其他方法(包括单分子测序)见述于美国专利号7,133,782和7,169,560,其通过引用纳入本文。

本文提供了从错误序列选择性提取或分离正确序列的方法。本文使用的术语“选择性分离”可包括通过需要的核酸分子的选择性物理移动从其他核酸分子中对需要的核酸分子进行的物理分离,对感兴趣的核酸分子以外的其他核酸分子的选择性失活、破坏、释放或去除。应理解核酸分子或核酸构建体的文库可能包括一些错误,其可能归因于在寡核苷酸合成、组装核酸的合成期间引入的序列错误,和/或归因于组装反应期间的组装错误。可能在一些实施方式中存在不想要的核酸。例如,0%至50%(例如,低于45%、低于40%、低于35%、低于30%、低于25%、低于20%、低于15%、低于10%、低于5%或低于1%)的文库中序列可能是不想要的序列。

在一些实施方式中,可使用用于回收标注的本文所述的正确目标序列的方法来回收具有需要序列的目标。在一些实施方式中,可使用各正确目标序列的标签序列对来通过PCR扩增来自样品集合的构建体(如图1C所示,步骤IV)。应注意到由于多个分子使用相同对的可能性是极低的,分离具有正确序列的核酸分子的可能性是高的。在其他实施方式中,可从测序仪中直接回收具有需要的序列的核酸。在一些实施方式中,一旦识别出标签对,即可确定全长构建体的相同性。原理上,可在原测序流动池上测定全长读取的位置(相应于含5’和3’标签成对末端读取)。在将集簇定位于流动池表面上后,可洗脱或者从表面上捕获分子。

在一些实施方式中,可在测序通道中对核酸进行测序。在一些实施方式中,可使用基因合成的固体支持物上及其衍生的再用/再循环的固体支持物上对核酸构建体进行原位测序。对来自寡核苷酸的序列信息的分析允许识别似乎具有需要序列和不具有需要序列的那些核酸分子。这种序列信息分析可以是定性的,例如,提供了关于一种或多种感兴趣序列存在(例如,在10至120个核苷酸的延伸中)的肯定或否定答案。在一些实施方式中,然后可从群的其余部分中选择性分离感兴趣的目标核酸分子。可通过使用可固定核酸分子的一种或多种固体支持物(例如,珠、不溶性聚合材料、平坦表面、膜、多孔或无孔表面、芯片或任何合适的支持物等)来促进对于个体核酸分子的分选。例如,核酸分子可固定于多孔表面,如玻璃表面或玻璃珠。在其他示例中,核酸可固定于流通系统,如多孔膜等。可选择性释放或选择性复制确定具有正确的需要的序列的核酸分子。

如果核酸分子位于不同的位置,例如,在基材的分开的孔中,则可从经识别含有具有所需序列的核酸分子的孔中选择性提取核酸分子。例如,在Margulies等的设备中,聚合酶克隆珠位于光纤片的单独孔中。从设备的合适孔中物理提取珠使得能随后扩增或纯化不含其他污染核酸分子的需要的核酸分子。或者,如果核酸分子与使用可选择性切割的接头的珠连接,则可利用对接头的切割(例如,通过增加孔中的pH来切割碱不稳定接头),之后提取孔中的溶剂来选择性分离核酸分子而不需要对珠进行物理操作。相似地,如果使用Shendure等的方法,则可利用对含有感兴趣核酸分子的珠或凝胶的部分的物理提取来选择性分离需要的核酸分子。

选择性分离的某些其他方法包括靶向核酸分子而不需要对于固体支持物的物理操作。这类方法可包含使用光学系统来对个体核酸分子进行特异性靶向辐射。在一些实施方式中,破坏性辐射可选择性地靶向不需要的核酸分子(例如,使用微镜技术)来破坏它们或使其失活,留下富集的需要的核酸分子的群。然后可从固体支持物上释放和/或扩增(例如通过PCR)该富集的群。

选择性分离需要的产物(例如,感兴趣的核酸)的方法和系统的示例可使用激光镊或光学镊。激光镊已经在生物技术、医学和分子生物学领域使用了约20年来定位并操作微米大小的和亚微米大小的颗粒(A.Ashkin,Science,(210),第1081-1088页,1980)。通过将激光束聚焦于包含需要的感兴趣核酸分子需要的位置(例如,珠、孔等),需要的容器保持光学捕获而不需要的核酸序列被洗脱。一旦洗去所有不需要的材料,可以关闭光学镊来释放需要的核酸分子。

另一个捕获需要的产物的方法是通过融除不需要的核酸。在一些实施方式中,可使用高功率激光来产生足够的能量以使存在不需要材料的区域中的核酸分子失效、降解或破坏。存在需要的核酸的区域不会受到任意的破坏性能量,因此保持其内容。

在一些实施方式中,可消除含错核酸构建体。按照一些实施方式,该方法包括产生在其5’末端和3’末端处具有寡核苷酸标签的核酸。例如,在目标序列(例如,全长核酸构建体)组装之后,可对目标序列进行条形码化或者,可从多个经设计使得在目标序列的5’末端和3’末端处具有条形码的寡核苷酸组装目标序列。可以对带标签的目标序列进行片段化并使用例如本文所述的下一代测序进行测序。在识别无错目标序列之后,可从下一代测序板上直接回收无错目标序列。在一些实施方式中,可使用激光融除或能够消除不需要的核酸序列的任何合适的方法来消除含错核酸。可从测序板上洗脱无错核酸序列。可使用对目标序列有特异性的引物来扩增洗脱的核酸序列。

在一些实施方式中,可在得到克隆群之后扩增目标多核苷酸。在一些实施方式中,所述目标多核苷酸可以包含5’末端或3’末端或两个末端上的通用(对所有寡核苷酸而言共同)、半通用(至少对部分寡核苷酸而言共同)或者个体或独特引物(对各寡核苷酸特异)结合位点。本文使用的术语“通用”引物或引物结合位点指用于扩增所述寡核苷酸的序列对所有寡核苷酸是常见的,从而所有这种寡核苷酸能使用单组通用引物来扩增。在其他环境下,寡核苷酸包含独特引物结合位点。本文使用的术语“独特引物结合位点”指选择性扩增寡核苷酸亚组的一组引物识别序列。在其他环境下,目标核酸包含通用和独特扩增序列,其可任选地依次使用。

在本发明的一些方面,可将能够结合无错核酸分子的结合标签或包含结合标签的固体支持物加入到无错核酸序列中。例如,可将结合标签、包含结合标签的固体支持物或能够结合核酸的固体支持物加入到经识别包含无错核酸序列的测序板或流动池的位置上。在一些实施方式中,结合标签具有与目标核酸序列互补的序列。在一些实施方式中,结合标签是设计为杂交或连接捕获感兴趣核酸的双链序列。

在一些实施方式中,固体支持物可以是珠。在一些实施方式中,可以在基材上沉积珠。可以多种方式将珠沉积在基材上。珠或颗粒可沉积在基材如孔或流动池的表面上并且可暴露于多种试剂和条件,这些试剂和条件允许检测标签或标记物。在一些实施方式中,可通过在测序板的特定位置喷墨来沉积结合标签或珠。

在一些实施方式中,可以用与条形码或吸附于核酸的额外序列互补的结合标签原位衍生珠来捕获,和/或富集,和/或扩增经识别具有正确核酸序列的目标核酸(例如,无错核酸)。可通过杂交、共价连接、磁性连接、亲和连接等将核酸固定于珠上。通常在严谨条件下进行杂交。在一些实施方式中,结合标签可以是与非目标序列(例如全条形码)或吸附的额外序列互补的通用或普通引物。在一些实施方式中,各珠可具有能够结合在目标分子的5’末端和3’末端存在的序列的结合标签。在结合目标分子后,产生了环状结合。在其他实施方式中,珠可具有能够结合在目标分子的3’末端处存在的序列的结合标签。在其他实施方式中,珠可具有能够结合在目标分子的5’末端处存在的序列的结合标签。

可向各孔中加入珠,如磁珠或顺磁珠或将其在固体支持物上排列。例如,可使用来自贝克曼库尔特公司(Beckman Coulter)的固相可逆固定(SPRI)珠。在一些实施方式中,构建体的集合可分布于含珠的单独孔中。可使用额外的热循环来增强捕获特异性。使用标准磁性捕获,然后可去除溶液,随后洗涤偶联的珠。可在珠上或在捕获的克隆释放之后对需要的构建体克隆进行扩增。在一些实施方式中,珠可设置为用于使用珠上的双链序列进行的基于杂交或连接的捕获。

多种基于珠的方法可包括一组可流动分选的编码的珠。基于珠的方法可采用核酸与捕获探针杂交或连接至不同的捕获珠群的表面。可在构建体的集合上使用这类编码的珠,然后分选至单独的孔用于下游扩增、分离和清洁。虽然上述的磁珠用途可能是特别有用的,但是在本发明的一些方面中可设想其他分离珠的方法。可用使得目标捕获珠与荧光复合的荧光部分来标记捕获珠。例如,可用荧光团浸渍珠从而产生珠的不同群,其可按照荧光波长分选。可通过流式细胞术或荧光细胞分选仪来分离目标捕获珠复合物。在其他实施方式中,珠可在尺寸上变化,或在任何合适的特征上变化,从而能够对不同的珠群进行分选。例如,使用具有不同尺寸的捕获珠会使得能够通过过滤或其他颗粒尺寸分离技术来分离。

在一些实施方式中,可使用可流动分选编码的珠来在合成后释放之前或之后分离核酸构建体。这类过程允许通过构建体尺寸、用户等进行分选。

图11显示了非限制示例性基于珠的回收方法的示意图。在一些实施方式中,可在通用的珠,例如磁珠上加载引物。各珠可经多次衍生以使多种引物与之结合。在一些实施方式中,衍生使得各珠有两个或更多不同的结合引物,或各珠有相同的结合引物。可在多孔板的各孔中分布这类珠。可用能够捕获特定核酸分子的条形码加载在珠上,例如通过将包含条形码的核酸序列和与加载在通用珠上的引物互补的序列杂交。包含双链汇集的核酸的样品可经过合适的条件以使得双链核酸变为单链。例如,可对双链核酸施加本领域已知的任何变性条件。汇集的单链样品可在多孔板的所有孔之间分布。在合适的条件下,基于在各孔的珠上加载的确切条形码(K,L),包含条形码的衍生的珠可在各孔中捕获特定的核酸分子。然后可洗涤珠。例如,当使用磁珠时,可用磁体将珠拉下,以允许洗涤并去除溶液。在一些实施方式中,可反复洗涤所述的珠。然后可使用PCR来扩增保留结合在珠上的核酸以在多孔构建体板的各孔中产生个体克隆。

在本发明的其他方面中,可使用纳米孔测序来在单一核苷酸水平上对个体核酸链进行测序。本领域技术人员应理解纳米孔测序的优势在于使样品制备测序的读取最小化且不需要核苷酸、聚合酶或连接酶,并且有非常长的读取长度的潜力。然而,纳米孔测序可能有较高的错误率(各碱基约10%错误)。在一些实施方式中,纳米测序装置包括可转轨的微流阀来再循环全长核酸构建体以允许多重测序发生。在一些实施方式中,纳米孔可与一系列可转轨的微流阀连接使得全长核酸构建体可多次经转轨回到纳米孔以允许多重测序通过。使用这些构型,可两次或多次测量全长核酸分子。所得的无错核酸序列可被转轨到收集孔中用于回收和应用。

在本发明的一些方面,本文提供了替代的制备性测序方法。该方法包括使用能够结合目标核酸的5’末端和3’末端的双末端引物使目标核酸(例如,全长目标核酸)环化。在一些实施方式中,双末端引物具有与5’末端和3’末端条形码互补的序列。可加入核酸酶以降解线性核酸,由此锁定需要的构建体。任选地,可使用对目标核酸具有特异性的引物来扩增目标核酸。

反转的体外克隆

在本发明的一些方面中,提供了用于分离和/或回收序列-验证的感兴趣核酸的方法。可使用本文所述的方法来从核酸文库或核酸序列集合中回收,例如,无错的感兴趣核酸序列。核酸文库或核酸序列的集合可包括一个或多个感兴趣的目标核酸序列(例如,N个基因)。在一些实施方式中,核酸序列的文库可包括从寡核苷酸或核酸片段组装的构建体。可如本文所述组装多个条形码化的构建体。在一些实施方式中,可使用条形码文库来组装并条形码化多个构建体,从而可在各末端用独特的条形码来对各核酸构建体加标签。在其他实施方式中,可从多个内部目标序列片段和独特的条形码序列组装多个构建体。例如,核酸序列的文库可包括N个不同目标核酸序列的M个拷贝。例如,96条目标序列的100个拷贝和条形码文库可具有316种不同的条形码,100000种组合。在一些实施方式中,条形码文库在条形码的外侧可具有相同的扩增序列(例如,共同引物结合序列)。在一些实施方式中,如果需要,可使用共同的扩增标签来扩增条形码化的构建体的集合,以具有用于下一代测序的合适核酸浓度。在一些实施方式中,条形码化的构建体可经过从两个末端开始的测序反应得到短成对末端读取。在一些实施方式中并且如图13A所示,构建体集合的条形码化的构建体可经环化以得到条形码群组,其与核酸构建体的长度无关。如此,可扩增含有识别序列如条形码Ki和Lj或寡核苷酸标签的小核酸片段。对识别序列进行测序以将Ki和Lj(Ki1,Lj1)、(Ki2,Lj2)等相关联。例如,对识别序列的测序可产生具有根据它们相应的独特识别序列对的相同性的目标序列的C克隆。然后可使用识别序列来在图13A所示的微量滴定板的单独孔中扩增C特异性源构建体分子。例如,如果C=8个克隆,可提供8块板的N条目标核酸序列(例如,96个基因),各板具有不同的指数标签(图13B)。可使用NexteraTM标签化来消化源分子(C*N)并且使用

Figure BDA0002623180040000303

或更高通量的下一代测序平台测序来识别正确的目标序列。可使用测序数据来识别目标核酸序列,并且分选序列-验证的感兴趣核酸。例如,如图13A所示,左侧候选物板的孔A1可含有序列-验证的感兴趣核酸。然后可从经充分识别具有序列-验证的感兴趣核酸的孔中回收经识别的克隆。

测定条形码对信息

在一些实施方式中,并如本文所示,可通过对全长分子进行测序来确定条形码对。从两末端开始测序给出了需要的配对信息。为了最有效地确定使用全长测序方法的条形码对,进行多重NexteraTM标签化反应,其中NexteraTM酶的量不同。这些单独的反应可平行进行并且在使用单独的指数的同时使用进行测序。然后可组合读取信息并作为整体进行处理。使用这类处理设计能够识别可随后通过扩增捕获的无错分子。然而,由于测序的长度限制(例如,超过约1000bp的核酸的低劣测序),使用这种反应配对的条形码可能对于超过1000bp的构建体不是高效的。

根据一些实施方式,可按照图14中所述的方法确定条形码对信息。图14A和14B说明了允许通过构建体的钝末端连接成环将分子的条形码化末端结合在一起的不同方法。在两种概念中,可通过使用序列H1作为引物位点的PCR将条形码添加到构建体中。在用H2引物稀释和扩增之后,构建体集合可被分成两条平行的路径。可用带有p5和p7序列的H2引物扩增一部分,p5和p7序列对于在上测序而言是必需的。可通过基于NexteraTM的切割来将经扩增的构建体片段化并且随后使用

Figure BDA0002623180040000312

进行测序。第二条路径的重点在于确定条形码配对信息。参考图14A,可对条形码对进行扩增和测序。参考图14B,可通过限制性酶将条形码对从环中切下并且随后进行测序。使用本文所述的方法,末端条形码对可以不依赖测序的构建体的长度的方式相连。

图14C显示了将条形码与合成的构建体连接的不同方法。按照一些实施方式,可使用限制性酶如BsaI或任何合适的限制性酶来打开相容核酸突出端,其然后可用于将配对的条形码分子连接到构建体上,得到环状构建体。然后可稀释环状构建体的集合并且用引物H2进行扩增。然后如图14A或图14B所示对构建体进行处理。图14D显示了使用对构建体以及分离的条形码对的平行测序来识别正确的分子用于通过扩增的后续捕获的非限制性实施方式。

根据一些实施方式,条形码对可以分子集合产生,各自具有单对条形码。参考图15,这些分子可以经环化并稀释至合适的水平,其可以通过合适的条形码总数来限定。例如,条形码的数量可以是105或106。然后可使用多重置换扩增来对经稀释的条形码进行扩增以产生各条形码的多拷贝。然后将所得的条形码集合一分为二。第一部分可用于对合成的构建体进行条形码化。可使用下一代测序对第二部分进行测序。测序数据可给出集合内的条形码-条形码相关性。采用合适的测序,可确定集合完成。应理解当使用这类集合对构建体进行测序时,条形码相关性是已知的,排除了对图14所示的处理的需要。

应用

本发明各方面可以用于涉及合成核酸的生成和/或使用的一定范围应用。如本文所述,本发明提供了具有提高的效率的产生具有需要的序列的合成核酸的方法。所得的核酸可以经体外扩增(如使用PCR、LCR,或任何合适的扩增技术)、体内扩增(如通过克隆到合适的载体中)、分离和/或纯化。组装核酸(单独或克隆到载体中)可以转化入宿主细胞(如原核、真核、昆虫、哺乳动物或其他宿主细胞)。在一些实施方式中,所述宿主细胞可以用于增殖所述核酸。在某些实施方式中,所述核酸可以整合到所述宿主细胞的基因组中。在一些实施方式中,所述核酸可以取代细胞基因组上的对应核酸区域(如通过同源重组)。因此,核酸可以用于生成重组生物。在一些实施方式中,目标核酸可以是整个基因组或用于取代全部或部分宿主生物体基因组的基因组大片段。重组生物也可以用于多种研究、工业、农业,和/或医学应用。

许多本文所述的技术可以一起使用,在一个或多个点上应用合适的组装技术来产生核酸分子。例如,可以使用基于连接酶的组装来组装寡核苷酸双链体和低于100到超过10000个碱基对长度(例如,100聚体-500聚体、500聚体-1000聚体、1000聚体-5000聚体、5000聚体-10000聚体、25000聚体、50000聚体、75000聚体、100000聚体等)的核酸片段。在示例性实施方式中,本文所述方法可以在组装生物(如病毒、细菌、酵母或其他原核或真核生物)的整个基因组(或其大片段,如约10%、20%、30%、40%、50%、60%、70%、80%、90%或更多)中使用,可选将特异性修饰在一个或多个所需位置整合到序列中。

可以任何合适的形式(例如,在稳定的缓冲液中,冻干等)包装任何核酸产物(例如,包含经扩增、克隆、纯化、分离等的核酸)用于存储和/或运输(例如,用于运输至分布中心或用户)。相似地,可以在合适的缓冲液中制备任何宿主细胞(例如,用载体转化的或具有修饰的基因组细胞)用于储存和/或运输(例如,用于分布至用户)。在一些实施方式中,可以冷冻细胞。然而,也可以使用其它稳定的细胞制剂。

宿主细胞可以在培养中生长和膨胀。可以使用宿主细胞来表达一个或多个RNA或感兴趣的多肽(例如,治疗用、工业用、农业用和/或药用蛋白质)。表达的多肽可以是天然多肽或非天然多肽。可以分离或纯化多肽用于后续使用。

因此,使用本发明的方法产生的核酸分子可以被纳入到载体中。载体可以是克隆载体或表达载体。在一些实施方式中,载体可以是病毒载体。病毒载体可以包含能够感染目标细胞的核酸序列。相似地,在一些实施方式中,可操作地与合适的启动子系统连接的原核表达载体可用于转化目标细胞。在其他实施方式中,可操作地与合适的启动子系统连接的真核载体可以用于转染目标细胞或组织。

本文所述的构建体的转录和/或翻译可以在体外(例如,使用不含细胞的系统)或体内(例如,在细胞中表达)进行。在一些实施方式中,可以制备细胞裂解物。在某些实施方式中,可以分离或纯化表达的RNA或多肽。本发明的核酸也可以用于向表达的多肽或其片段中添加检测和/或纯化标签。基于多肽的融合/标签的例子包含,但不限于六组氨酸(His6)Myc和HA,和其他具有多用途的多肽,如GFP5GST、MBP、几丁质等。在一些实施方式中,多肽可以包含一个或多个非天然氨基酸残基。

在一些实施方式中,可以制备针对由一个或多个合成核酸编码的多肽或其片段的抗体。在某些实施方式中,可以提供合成多肽作为在研究和开发中筛选的库(例如,识别潜在的治疗性蛋白质或多肽,识别用于药物开发的潜在蛋白目标等)。在一些实施方式中,可以使用合成核酸作为治疗法(例如,用于基因治疗,或用于基因调控)。例如,可以向患者以足够表达治疗量的蛋白质的量提供合成的核酸。在其他实施方式中,可以足够调控(例如,下调)基因表达的量向患者给予合成核酸。

应理解本文所述的不同行动或实施方式可以独立实施并且可以在美国或美国以外的不同地方实施。例如,接受目标核酸的订单、分析目标核酸序列、设计一个或多个起始核酸(例如,寡核苷酸)、合成起始核酸、纯化起始核酸、组装起始核酸、分离组装的核酸、确认组装的核酸的序列、操纵组装的核酸(例如,扩增、克隆、***宿主基因组等)中的每个行动和任意其它行动或这些行动中的任意部分可以在美国以内或美国以外的一个位置或不同地点单独实施。在一些实施方式中,组装过程可以包括在一个地点(在美国以内或美国以外)和在一个或多个远程地点(在美国以内或美国以外)实施的行动的组合。

自动化应用

本文提供的方法和设备方面可以包含自动操作本文所述的一个或多个作用(act)。在一些实施方式中,扩增和/或组装反应中的一个或多个步骤可以使用一个或多个自动化样品处理装置(如一个或多个自动化液体或流体处理设备)来自动操作。自动化设备和方法可以用于递送反应试剂,包含下列中的一种或多种:起始核酸、缓冲液、酶(如一种或多种连接酶和/或聚合酶)、核苷酸、盐、和任何其他试剂如稳定剂。自动化设备和方法也可以用于控制反应条件。例如,自动化热循环仪可以用于控制反应温度和可以使用的任何反应循环。在一些实施方式中,扫描激光器可以被自动化以提供适于孵育多核苷酸的一个或多个反应温度或温度循环。相似地,经组装多核苷酸产物的后续分析可以自动进行。例如,测序可以使用测序设备和自动化测序方案自动进行。其他步骤(如扩增、克隆等)也可以使用一种或多种合适设备和相关方案自动进行。应该理解本文所述的一个或多个设备或设备组件可以在某一系统(如机器人系统)或微环境(如微流体反应室)中组合。组装反应混合物(如液体反应样品)可以从所述系统的一个组件向另一个组件转移,使用自动化设备和方法(如样品和/或样品容器的机械化操作和/或转移,包含自动化移液设备、微系统等)。所述系统和其任何组件可以通过控制系统来控制。

由此,本文所提供设备的方法步骤和/或内容可以使用例如计算机系统(如计算机控制系统)自动进行。能实施本文所提供技术方面的计算机系统可以包含用于任何处理类型的计算机(如本文所述序列分析和/或自动化设备控制)。然而,应该理解某些处理步骤可以通过作为所述组装系统一部分的一种或多种自动化设备来提供。在一些实施方式中,计算机系统可包含两台或更多台计算机。例如,一个计算机可以通过网络偶联到第二个计算机。一个计算机可以进行序列分析。第二计算机可以控制系统中的一个或多个自动化合成和组装设备。其他方面中,其他计算机可以包含在网络中以控制一个或多个分析或处理作用。各计算机可以包含内存和处理器。所述计算机可采用任何形式,因为本文提供的技术方面对在任何特定计算机平台上实施没有限制。相似地,所述网络能采用任何形式,包含专用网络或公共网络(如互联网)。显示设备能与一个或多个设备和计算机联合。或者,或另外,显示设备可以位于远端位点,并且根据本文提供的技术连接以显示分析输出。所述系统不同组件之间的连接可以通过有线、光纤、无线传送,卫星传送,任何其他合适的传送,或者上述两种或多种的任意组合。

本文所提供技术的各个不同方面、实施方式、或作用能以多种方式独立自动进行和实施。例如,各个方面、实施方式或作用能使用硬件、软件或其组合独立实施。当以软件实施时,所述软件密码能在任何合适的处理器或处理器集合上执行,所述处理器集合在单独计算机中提供或分布在多个计算机上。应该理解完成上述功能的任何组件或组件集合能通常看作控制上面所讨论功能的一个或多个控制器。所述一个或多个控制器能以多种方式实施,例如有使用微码或软件程序控制的专用硬件或通用目的硬件(如一个或多个处理器)以完成上述功能。

在这方面,应该理解本文所提供技术实施方式的一种实现中包含了用计算机程序(如多种指令)编码的至少一种计算机可读介质(如计算机内存、软盘、光盘、磁带等),当在处理器上运行时,完成本文所提供技术的一种或多种上述功能。所述计算机可读介质可运输,从而其上存储的程序能加载到任何计算机系统来源以运行本文所提供技术的一种或多种功能。另外,应该理解执行时,提及完成上面讨论功能的计算机程序不限于在主机上运行应用程序。相反,所述术语计算机程序在本文以一般意义使用,指任何类型的计算机编码(如软件或微码),能用于编程处理器以进行上面讨论的本文所提供技术方面。

应该理解与处理器存储于计算机可读介质上的数个本文所提供技术的实施方式一致,所述计算机实施处理在其执行过程中可以接收手工输入(如来自用户)。

因此,本文所述组装设备或组件的整体系统水平控制可以通过系统控制器进行,所述系统控制器可以向以下提供控制信号:相关的核酸合成器、液体处理设备、热循环仪、测序设备、相关的机械化组件,以及对运行所需输入/输出或其他控制功能的其他合适系统。因此,所述系统控制器与任何设备控制器一起形成控制核酸组装系统运作的控制器。所述控制器可以包含通用目的数据处理系统和其他相关设备,所述通用目的数据处理系统能是通用目的计算机或通用目的计算机的网络,所述其他相关设备包含通信设备、调制解调器、和/或其他回路或组件,以进行所需输入/输出或其他功能。所述控制器也能至少部分作为单个特定目的集成电路(如ASIC)或ASIC阵列实施,各有用于整体、系统水平控制的主要或中央处理器部分,和专用的分离部分以在中央处理器部分控制下进行多种不同特定计算、功能和其他处理。所述控制器也能使用多种分离的专用程序集成或其他电子回路或设备实施,例如硬连线电子设备或逻辑回路如分开的元件电路或程序逻辑设备。所述控制器也能包含任何其他组件或设备,如用户输入/输出设备(监控器、显示器、打印机、键盘、用户点击设备、触摸屏、或其他用户界面等)、数据存储设备、驱动马达、连接、阀控制器、机械化设备、真空和其他泵、压力传感器、检测器、电源供应器、脉冲源、通信设备或其他电子电路或组件等。所述控制器也可以控制系统其他部分的运作,如自动化客户订单处理、质量控制、包装、运输、开票等,以进行本领域已知而本文没有详述的其他合适功能。

本发明的各方面可以单独使用、联用或以前述实施方式未特定讨论的各种排列来使用,并且因此并不限制其应用于前面描述或附图说明所示组件的细节和排列。例如,一个实施方式的所述方面可与其他实施方式所述方面以任何方式组合。

权利要求中修改权利要求项使用的顺序术语“第一”、“第二”、“第三”等本身并不暗指任何优先、级别高低、或一个权利要求项高于另一个的顺序或实行方法作用的暂时顺序,而是仅仅用作标记把有某一名称的一个权利要求项与有相同名称的另一项(但是就顺序术语使用而言)区分开以区别权利要求项。

而且,本文所用的词语和术语是为了描述目的,而不是限制性的。本文使用“包含”、“包括”、或“具有”、“含有”、“涉及”及其变体表示涵盖其后列出的项目及其等价物,以及额外的项目。

列出以下的实施例作为本发明的代表。这些实施例并不构成将本发明的范围的限制与此,并且对于本公开、附图和所附的权利要求而言,其他等同的实施方式会是显而易见的。

实施例

实施例1:

本文所述并在图1A-C所示的方法允许从具有多种不同核酸构建体的板中识别具有正确的需要序列的目标核酸,各多种核酸构建体包括正确和错误序列的混合物。

在图1A步骤1中,在单独的微板孔中提供了多种构建体(CA1-CAn,...CN1-CNn),各孔包含正确和错误的序列位点的混合物。各构建体可具有在5’末端处侧接构建体特异性区域X和共同区域或衔接子A并且在3’末端处侧接构建体特异性区域Y和共同区域或衔接子B的目标区。

在图1A步骤II中,可稀释各构建体混合物至有限数量的分子(约100-1000),使得板的各孔包含分子的标准化混合物。各稀释物可被混合并一起汇集到一个管中。

在图1A步骤III中,通过连接或聚合酶链反应用引物对(P1,P2)和核苷酸标签或条形码(K,L)的大型文库来对多种分子加标签。本文所述的方法允许用独特的条形码对(K,L)来对各分子加标签以区分所述分子与集合中的其他分子。例如,各孔可包含约100个分子并且各分子可带有独特的K-L标签(例如,K1-L1,Kj-Lj...K100-L100)。整个样品可经过扩增以产生足够的材料用于测序和制备性回收。

在图1B步骤IV中,随后分割样品,样品的一部分经过NexteraTM标签化。可优化标签化反应以使得每个分子有两次断裂,确保一部分分子含有标签条形码之一和构建体目标区的部分长度。样品的保留部分并不经过标签化,其重新返回混合并准备用于测序。显示了有一次断裂的两个示例分子,各自一分为二以对在5’或3’末端带有标签的片段测序。例如,如图1B所示,分子b可一分为二以产生b1和b2。

在图1B步骤V中,全长分子产生成对读取,其将标签对(Kj,Lj)定位到个体克隆构建体分子(例如,构建体C1,孔1中的克隆j)。NexteraTM标签化的成对读取产生一条具有用于识别的标签的序列,和另一条在构建体目标区内部的序列。用高通量测序,可产生足够的覆盖度来重构各标签对构建体的共有序列并且确定序列是否正确。例如,如图1B所示,测序中的各片段产生两个读取(成对读取)。分子“a”产生读取,使独特条形码KA1-x和独特条形码LA1-x相联合。没有其他分子应具有相同的组合。如果来自相同构建体的两个分子具有共同的条形码,则因这些读取的源分子的模糊性而弃去数据。通过具有条形码的成对读取的一个读取来识别片段b1、b2、c1、c2等。另一个读取用于识别分子的内部区域的共有序列。来自各克隆的共有序列与需要的序列相比较。示例显示来自孔A1的结果,其中克隆x是正确的,但是克隆y和z是错误的。可从测序结果中平行获得汇集在一起的各原始构建体的相似结构。

在图1C步骤VI中,在各孔中使用一对引物来扩增正确的构建体序列,引物具有来自与正确的核酸克隆相应的标签对的独特标签序列。可在单独的孔中用带标签的集合作为模板来扩增各克隆。这允许产生克隆的构建体的板,各孔含有不同的需要序列,各分子具有正确的序列。如图1C所示,各孔中的分子是原始构建体的体外克隆,具有相应于条形码组合(K,L)的侧接序列用于扩增具有正确预定序列的克隆。

实施例2:

在区分个体源分子时,前述的体外克隆方法是特别有效的。共有序列(来自一种构建体的全部源分子)可具有来自在某一位置处具有错误的个体源分子的小竞争信号。在一些实施方式中,可将共有序列与来自具有错误的个体源分子的痕迹相比。在大多数情况下,没有来自错误碱基的(大)背景的竞争信号时,源分子可被干净地称作错误。图7A和7B显示了有效的源分子分离的示例。右侧是特定构建体在某一位置处的所有读取的共有痕迹。如图7A-B所示,在存在“突变”或“错误”信号的情况中,其相对于整个群而言很小,突变/错误来源于单个克隆(源分子)。左侧是除了来自特定条形码对以外的相同构建体的全部读取的共有痕迹(即,克隆)。显示了相同的位置,其仅仅含有“突变”信号并且不含来自野生型/参照背景的信号。因此,两个信号是完全可分开的并且对应于区分开的个体源分子。

实施例3:

图8显示了使用编码的条形码来分离或探寻具有预定序列的核酸。在一个示例性实施方式中,5’条形码是14N且3’条形码是20N。如图8所示,引物(本文中也称为探寻引物)被用于分离目标(芯片-110.0001)。使用各条形码对(如下文中以粗体显示的左侧条形码)来制备引物。克隆A使用引物序列1和2;克隆B使用3和4等。使用探寻引物的PCR来非常干净地回收目标分子。

芯片

Figure BDA0002623180040000381

Figure BDA0002623180040000382

芯片

Figure BDA0002623180040000391

芯片

Figure BDA0002623180040000393

芯片

Figure BDA0002623180040000395

如图9所示,54种大小单位为从约650至约1100bp的构建体经标准化并汇集在一起。通过使用柄序列的聚合酶链反应来将条形码连接到各构建体上(5′:CATCAACGTTCATGTCGCGC(SEQ ID NO:17),3′:CCTTGGGTGCTCGCAGTAAA(SEQ ID NO:18))。条形码化的引物由用于亿明达测序制备的共同区、条形码的简并区和如上所示的柄序列组成。设计5’条形码的简并部分为具有14N并且设计3’条形码的简并部分为具有20N。5′条形码引物由以下序列组成:TCGTCGGCAGCGTC(SEQ ID NO:19)AGATGTGTATAAGAGACAG(SEQ IDNO:20)NNNNNNNNNNNNNNCATCAACGTTCATGTCGCGC(SEQ ID NO:17)。3′条形码化的引物由以下序列组成:GTCTCGTGGGCTCGG(SEQ ID NO:21)AGATGTGTATAAGAGACAG(SEQ ID NO:22)NNNNNNNNNNNNNNNNNNNNCCTTGGGTGCTCGCAGTAAA(SEQ ID NO:18)。

使用KOD聚合酶进行5轮循环的聚合酶链反应(PCR)。使用SPRI珠来纯化所得的混合物以去除短的产物和引物。然后使用1000x倍初始稀释的8倍稀释将收集的样品稀释至512000倍。收集的样品用作PCR反应中的模板,该PCR反应使用KOD聚合酶并使用相应于之前PCR引物的5′共同区的引物。在30轮循环之后,再次使用SPRI珠来纯化样品以去除短产物、引物和蛋白质。该阶段的样品被称作“探寻模板”。

除了增加的输入DNA量(150ng)以外,按照亿明达手册所述进行NexteraTM标签化反应。用Zymo纯化试剂盒来清洁标签化反应(如亿明达手册所推荐)。然后将样品按照亿明达手册编入索引,并再次SPRI清洁。

如手册所述,通过使用KAPA实验室定量试剂盒(卡帕生物系统公司(KapaBiosystems))的qPCR对所得的DNA文库进行定量。使用所得的标准曲线和滴定曲线来将DNA浓度转化为nM级。如亿明达手册所述,制备2nM或4nM浓度的样品等份用于测序并且以约15pM的浓度加载在仪器上。

图9显示了对于一半板的证明:851个判定的克隆,跨越41种构建体(包含完美的和判定为突变的)。产生了80对引物(每种构建体约2个)。80个克隆分离中67个(84%)是成功的。各送4个克隆进行Sanger测序。用于该证明的条形码是如上述的编码的条形码。

信息分析:

Figure BDA0002623180040000403

仪器中获取测序读取并且使用Smith-Waterman比对法与参比序列比对柄序列。通过获取与柄序列相邻的序列来读取来自比对读取的条形码,由此建立条形码与读取的相关性。在第一读取含有5′条形码而第二读取含有3′条形码的情况下确定读取对。这些相关性经阈值评价和打分,以确保配对的高保证。然后使用这些相关性形成含有全部读取的子集读取群,其含有任何条形码,并且然后与参比序列比对以判定该克隆的共有序列。产生痕迹显示各位置判定的读取的数量(及它们的碱基相同性)。

然后使用产生对于参比的完美共有序列的条形码对来制备引物,其含有尽可能多的条形码序列,具有合适的解链温度和需要的其他特征。在使用KOD聚合酶和模板的PCR反应中使用引物,该模板是小稀释量的“探寻模板”。

实施例4:

在该完全板的示例中,87个大小范围为约700至约1200bp的构建体被汇集在一起。存在跨越71个构建体(82%)的2072个判定的克隆,其中1387个判定为完美(68%)。完美判定跨越62个构建体(占具有至少一个克隆的构建体的81%,占集合内构建体的71%)。对于65个构建体,接受对应于各构建体的一个克隆的一个引物对并用作条形码和引物来分离该克隆。接受了总共65个引物对:62个完美,3个已知突变。图10显示了65个克隆中64个扩增产物可清楚地检测到(A1消失,参见图10)。

等同形式

本发明提供了用于高保真基因组装的新方法和设备等。尽管讨论了本发明的

具体实施方式

,但以上说明书仅为说明性而非限制性的。本领域的技术人员在阅读本说明书后将清楚了解本发明的许多变化。本发明的全部范围应该通过参考所附权利要求书连同其等同物的全部范围,以及说明书连同此类变化来决定。

通过引用纳入

参考2013年3月13日提交的美国临时申请系列号61/851,774、2013年1月16日提交的美国临时申请系列号61/848,961、2012年4月24日提交的美国临时申请系列号61/637,750、2012年4月25日提交的美国临时申请系列号61/638,187以及2012年6月15日提交的国际PCT申请号PCT/US2012/042597。本文提到的所有发表物、专利和序列数据库条目在此通过引用全文纳入,就好像各个单独发表物或专利特定和单独地表明通过引用纳入。

序列表

<110> GEN9股份有限公司(Gen9, Inc.)

<120> 在体外克隆中分选核酸和多重制备物的方法

<130> 127662-013703PCT

<140> 尚未指定

<141> 2013-04-24

<150> 61/851,774

<151> 2013-03-13

<150> 61/637,750

<151> 2012-04-24

<150> 61/638,187

<151> 2012-04-25

<150> 61/848,961

<151> 2013-01-16

<160> 38

<170> PatentIn version 3.5

<210> 1

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 1

actcacctcg tttc 14

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 2

ccttataagc atgtctcata 20

<210> 3

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 3

agagacagac tcacctcgtt tc 22

<210> 4

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 4

gagacagtat gagacatgct tataagg 27

<210> 5

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

gccgccgctg gggc 14

<210> 6

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 6

cctccccacg ctctctagcc 20

<210> 7

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 7

ggccgccgct ggggc 15

<210> 8

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 8

acagggctag agagcgtggg gagg 24

<210> 9

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 9

ggagcgatca ccat 14

<210> 10

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 10

tagacgttca tggtacatac 20

<210> 11

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

acagggagcg atcaccat 18

<210> 12

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

acaggtatgt accatgaacg tcta 24

<210> 13

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 13

cggagtgctg ggat 14

<210> 14

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> cctttgtggt catgagtttg

<400> 14

cctttgtggt catgagtttg 20

<210> 15

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

agcggagtgc tgggat 16

<210> 16

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 16

agcaaactca tgaccacaaa gg 22

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 17

catcaacgtt catgtcgcgc 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

ccttgggtgc tcgcagtaaa 20

<210> 19

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 19

tcgtcggcag cgtc 14

<210> 20

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 20

agatgtgtat aagagacag 19

<210> 21

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 21

gtctcgtggg ctcgg 15

<210> 22

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 22

agatgtgtat aagagacag 19

<210> 23

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 23

ctaaatggat tcga 14

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 24

tgatgaaaga aataaaatgt 20

<210> 25

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 25

tgtataagag acagctaaat ggattcga 28

<210> 26

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 26

tataagagac agacatttta tttctttcat ca 32

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 27

gatggagatg ggcaacgcaa 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 28

gatggagatg tgcaacgcaa 20

<210> 29

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 29

gagacctcgg ctgg 14

<210> 30

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 30

gttctacccc gaataaatgc 20

<210> 31

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 31

caggcattta ttcggggtag aac 23

<210> 32

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 32

taacaataca gcagggtgtt 20

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 33

ttacttcttc caatcaacta 20

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 34

ttacttcttc aaatcaacta 20

<210> 35

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 35

gagacctcgg ctgg 14

<210> 36

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 36

gttctacccc gaataaatgc 20

<210> 37

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 37

acaggagacc tcggctgg 18

<210> 38

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 38

ttacttcttc caatcaacta 20

61页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基因组柱提取试剂盒和提取方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!