无缝核酸装配方法

文档序号:1255989 发布日期:2020-08-21 浏览:13次 >En<

阅读说明:本技术 无缝核酸装配方法 (Seamless nucleic acid assembly method ) 是由 丽贝卡·纽金特 陈思远 埃利安·李 内森·雷纳德 于 2018-06-12 设计创作,主要内容包括:本文提供了用于无缝核酸装配的方法、系统和组合物。本文提供的方法、系统和组合物提供了核酸的有效装配而无需引物去除。用于无缝核酸装配的方法、系统和组合物包括使用内切核酸酶或外切核酸酶,任选地结合额外的酶,以装配核酸或多核苷酸。(Provided herein are methods, systems, and compositions for seamless nucleic acid assembly. The methods, systems, and compositions provided herein provide for efficient assembly of nucleic acids without primer removal. Methods, systems, and compositions for seamless nucleic acid assembly include the use of endonucleases or exonucleases, optionally in combination with additional enzymes, to assemble nucleic acids or polynucleotides.)

无缝核酸装配方法

交叉引用

本申请要求2018年4月26日提交的第62/663,089号美国临时专利申请和2017年6月12日提交的第62/518,496号美国临时专利申请的权益,所述临时申请中的每一个均通过引用整体并入本文。

序列表

本申请含有序列表,该序列表已经以ASCII格式电子提交,并且通过引用整体并入本文。创建于2018年6月6日的所述ASCII副本被命名为4854-746_601_SL.txt,大小为1,585个字节。

背景技术

从头核酸合成是基础生物学研究和生物技术应用的强大工具。尽管已知用于以小规模合成核酸的相对较短片段的各种方法,但这些技术在可扩展性、自动化、速度、精确度和成本方面却不尽人意。因此,仍然需要有效的无缝核酸装配方法。

发明内容

本文提供了核酸合成和装配方法,其包括:(a)提供多个多核苷酸,以及(b)将所述多个多核苷酸与外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶混合,其中基于相邻多核苷酸之间的互补序列,所述多个多核苷酸以持续的预定顺序退火。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸合成和装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸合成和装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸合成和装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸合成和装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸合成和装配方法,其中所述瓣状内切核酸酶1的浓度在约0.32U至约4.8U的范围内。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约1.0U至约2.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述聚合酶的浓度在约0.1U至约2U的范围内。本文进一步提供了核酸合成和装配方法,其中所述聚合酶的浓度约为0.1U。本文进一步提供了核酸合成和装配方法,其中所述聚合酶的浓度约为0.2U。本文进一步提供了核酸合成和装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸合成和装配方法,其中所述连接酶的浓度在约4.0U至约8.0U的范围内。

本文提供了核酸合成和装配方法,其包括:(a)提供第一双链核酸;(b)提供第二双链核酸;(c)提供第三双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、与所述第一双链核酸同源的第一同源序列、与所述第二双链核酸同源的第二同源序列和3'侧翼衔接子序列;以及(d)将所述第一双链核酸、第二双链核酸和第三双链核酸与包含外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶的反应混合物混合。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸合成和装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸合成和装配方法,其中所提供的瓣状内切核酸酶1的量是约0.32U至约4.8U。本文进一步提供了核酸合成和装配方法,其中所提供的瓣状内切核酸酶1的量小于约5.0U。本文进一步提供了核酸合成和装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸合成和装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸合成和装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列或所述第二同源序列为约10个至约100个碱基对。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列和所述第二同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列或所述第二同源序列为约20个至约80个碱基对。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列和所述第二同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列或所述第二同源序列约为40个碱基对。本文进一步提供了核酸合成和装配方法,其中所述第一同源序列和所述第二同源序列各自独立地约为40个碱基对。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述外切核酸酶III的浓度在约1.0U至约2.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述聚合酶的浓度以约0.1U至约2U的量存在。本文进一步提供了核酸合成和装配方法,其中所述聚合酶的浓度为约0.1U至约0.2U。本文进一步提供了核酸合成和装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸合成和装配方法,其中所述连接酶的浓度在约4.0U至约8.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述连接酶的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸合成和装配方法,其中所述第一双链核酸、所述第二双链核酸或所述第三双链核酸或其任意组合为线性片段。本文进一步提供了核酸合成和装配方法,其中步骤(d)之后的产物为线性片段。本文进一步提供了核酸合成和装配方法,其中步骤(d)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶的反应混合物混合。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所提供的瓣状内切核酸酶1的量是约0.32U至约4.8U。本文进一步提供了核酸装配方法,其中所提供的瓣状内切核酸酶1的量小于约5.0U。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约1.0U至约2.0U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度以约0.1U至约2U的量存在。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度为约0.1U至约0.2U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度在约4.0U至约8.0U的范围内。本文进一步提供了核酸装配方法,其中所述连接酶的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸装配方法,其中所述第一双链核酸或所述第二双链核酸为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶的反应混合物在约30℃至约60℃的温度下混合。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶1的浓度在约0.32U至约4.8U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.5U至约1.0U的范围内。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约1.0U至约2.0U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.1U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.1U。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.2U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度在约4.0U至约8.0U的范围内。本文进一步提供了核酸装配方法,其中所述连接酶的浓度在0.5U至约1.0U的范围内。本文进一步提供了核酸装配方法,其中所述第一双链核酸或所述第二双链核酸为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含瓣状内切核酸酶、聚合酶和连接酶的反应混合物混合,其中该瓣状内切核酸酶导致5’突出端。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含约0.5U至约1.0U外切核酸酶、约0.32U至约4.8U瓣状内切核酸酶、约0.1U至约2U聚合酶和至多约2.0U的连接酶的反应混合物混合。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含约0.32U至约4.8U瓣状内切核酸酶、约0.1U至约2U聚合酶和至多约2.0U的连接酶的反应混合物混合。

本文提供了核酸装配方法,其包括:(a)提供多个多核苷酸,其中每个所述多核苷酸不包含与所述多个多核苷酸中的另一个多核苷酸具有序列同源性的末端区域;以及(b)将所述多个多核苷酸与外切核酸酶、内切核酸酶、聚合酶和连接酶混合,其中基于相邻多核苷酸之间的互补序列,所述多个多核苷酸以持续的预定顺序退火。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶1的浓度在约0.32U至约4.8U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.01U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.1U。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.01U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸;(b)提供第二双链核酸;(c)提供第三双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、与所述第一双链核酸同源的第一同源序列、与所述第二双链核酸同源的第二同源序列和3'侧翼衔接子序列,其中所述第一双链核酸、第二双链核酸和第三双链核酸在末端区域包含非同源序列;以及(d)将所述第一双链核酸、第二双链核酸和第三双链核酸与包含外切核酸酶、内切核酸酶、聚合酶和连接酶的反应混合物混合。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所提供的瓣状内切核酸酶1的浓度是约0.32U至约4.8U。本文进一步提供了核酸装配方法,其中所述内切核酸酶是以小于约5.0U的浓度提供的瓣状内切核酸酶1。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.01U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸装配方法,其中所述第一双链核酸、所述第二双链核酸或所述第三双链核酸或其任意组合为线性片段。本文进一步提供了核酸装配方法,其中步骤(d)之后的产物为线性片段。本文进一步提供了核酸装配方法,其中步骤(d)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含外切核酸酶、内切核酸酶、聚合酶和连接酶的反应混合物混合。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所提供的瓣状内切核酸酶1的浓度是约0.32U至约4.8U。本文进一步提供了核酸装配方法,其中所提供的瓣状内切核酸酶1的浓度小于约5.0U。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.1U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度为约0.01U至约0.2U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸装配方法,其中所述第一双链核酸或所述第二双链核酸或其任意组合为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含外切核酸酶、内切核酸酶、聚合酶和连接酶的反应混合物在约30℃至约60℃的温度下混合。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶1的浓度在约0.32U至约4.8U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.01U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.1U。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度约为0.01U。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。本文进一步提供了核酸装配方法,其中所述第一双链核酸或所述第二双链核酸或其任意组合为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为线性片段。本文进一步提供了核酸装配方法,其中步骤(c)之后的产物为环状片段。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含内切核酸酶、聚合酶和连接酶的反应混合物混合,其中该内切核酸酶导致5’突出端。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含约0.5U至约1.0U外切核酸酶、约0.32U至约4.8U内切核酸酶、约0.01U至约2U聚合酶和至多约2.0U的连接酶的反应混合物混合。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将所述第一双链核酸和第二双链核酸与包含约0.32U至约4.8U内切核酸酶、约0.01U至约2U聚合酶和至多约2.0U的连接酶的反应混合物混合。

本文提供了核酸装配方法,其包括:(a)提供第一双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;(b)提供第二双链核酸,其以5'至3'的顺序包含:5'侧翼衔接子序列、同源序列、插入序列和3'侧翼衔接子序列;以及(c)将第一双链核酸和第二双链核酸与包含至少一种具有3'或5'外切核酸酶活性的酶、聚合酶和连接酶的反应混合物混合,其中所述至少一种具有3'或5'外切核酸酶活性的酶去除5'侧翼衔接子序列或3'侧翼衔接子序列。本文进一步提供了核酸装配方法,其中所述至少一种具有3’或5’外切核酸酶活性的酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地约为40个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约10个至约100个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列或所述第二双链核酸的同源序列为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述第一双链核酸的同源序列和所述第二双链核酸的同源序列各自独立地为约20个至约80个碱基对。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。

本文提供了核酸装配方法,其包括:(a)提供至少10个不同的片段,其中所述至少10个不同的片段中的每一个不包含与所述至少10个不同的片段中的另一个片段具有序列同源性的末端区域;以及(b)将所述至少10个不同的片段与多种酶混合,其中所述多种酶选自内切核酸酶、外切核酸酶、聚合酶和连接酶,以形成核酸。本文进一步提供了核酸装配方法,其中所述核酸连接至载体序列。本文进一步提供了核酸装配方法,其中所述核酸的长度为50个碱基至200个碱基。本文进一步提供了核酸装配方法,其中所述核酸的长度为100个碱基至2000个碱基。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。

本文提供了核酸装配方法,其包括:(a)提供多个多核苷酸,其中每个所述多核苷酸不包含与所述多个多核苷酸中的另一个多核苷酸具有序列同源性的末端区域;以及(b)将所述多个多核苷酸与3’至5’外切核酸酶、热稳定的内切核酸酶、高保真聚合酶和热稳定的连接酶混合,其中基于相邻多核苷酸之间的互补序列,所述多个多核苷酸以持续的预定顺序退火。本文进一步提供了核酸装配方法,其中所述外切核酸酶是外切核酸酶III。本文进一步提供了核酸装配方法,其中所述内切核酸酶是瓣状内切核酸酶。本文进一步提供了核酸装配方法,其中所述瓣状内切核酸酶是瓣状内切核酸酶1、外切核酸酶1、XPG、Dna2或GEN1。本文进一步提供了核酸装配方法,其中所述内切核酸酶是以约0.32U至约4.8U范围内的浓度提供的瓣状内切核酸酶1。本文进一步提供了核酸装配方法,其中所述聚合酶具有5’至3’聚合酶活性。本文进一步提供了核酸装配方法,其中所述聚合酶是DNA聚合酶。本文进一步提供了核酸装配方法,其中所述连接酶催化至少两个核酸的连接。本文进一步提供了核酸装配方法,其中所述外切核酸酶III的浓度在约0.1U至约10U的范围内。本文进一步提供了核酸装配方法,其中所述聚合酶的浓度在约0.01U至约2U的范围内。本文进一步提供了核酸装配方法,其中所述连接酶的浓度至多约为2.0U。

援引并入

本说明书中所提及的所有出版物、专利和专利申请均通过引用而并入本文,其程度犹如具体地和个别地指出每一单独的出版物、专利或专利申请均通过引用而并入。

附图说明

本专利或申请文件包含至少一张以彩色绘制的附图。在请求并支付必要的费用后,专利局将会提供具有彩图的该专利或专利申请公布文本的副本。

图1A描绘了瓣状内切核酸酶介导的核酸装配的示意图。

图1B描绘了采用桥式装配的瓣状内切核酸酶介导的核酸装配的示意图。

图2描绘了用于多核苷酸合成和瓣状内切核酸酶介导的核酸装配的系统。

图3示出了计算机系统。

图4是示出计算机系统的架构的框图。

图5是使用共享虚拟地址存储空间的多处理器计算机系统的框图。

图6是说明网络的示图,该网络被配置用于并入多个计算机系统、多个蜂窝电话和个人数据助理,以及网络附加存储(NAS)。

图7是来自BioAnalyzer读取的图,在x轴上为核苷酸碱基,在y轴上为荧光单位。

图8是来自BioAnalyzer读取的图,在x轴上为核苷酸碱基,在y轴上为荧光单位。

图9是采用不同浓度的ExoIII和Fen1时,菌落形成单位(CFU)的图。

图10是采用不同的酶浓度时,菌落形成单位(CFU)和瓣状内切核酸酶介导的核酸装配反应的正确装配百分比的图。

图11是1.8kb装配体的菌落形成单位(CFU)的图。

图12是采用两个DNA片段时,瓣状内切核酸酶介导的核酸装配的图。

图13是采用瓣状内切核酸酶介导的核酸装配将多个DNA片段装配到DNA载体中时,对于若干个基因(x轴)的菌落形成单位(y轴)的图。

图14A是采用浓度增加的ExoIII通过瓣状内切核酸酶介导的核酸装配将多个DNA片段装配到DNA载体中时,针对若干个基因(x轴)的菌落形成单位(y轴)的图。

图14B是装配的基因的下一代序列分析的图。

图14C是装配率的样本的图。

图15A是使用核酸桥,瓣状内切核酸酶介导的核酸装配的平均菌落形成单位(CFU)(y轴)的图。

图15B是使用核酸桥,瓣状内切核酸酶介导的核酸装配的对数尺度菌落形成单位(CFU)(y轴)的图。

图16A是使用1、2、3、4、5、6、7、8、9、10、11或12个片段时,瓣状内切核酸酶介导的基因(x轴)的核酸装配的菌落形成单位(CFU,y轴)的图。

图16B是使用1、2、3、4、5、6、7、8、9、10、11或12个片段时,群体测序百分比(y轴)和装配的基因(x轴)的下一代序列分析图。

图16C是使用1、2、3、4、5、6、7、8、9、10、11或12个片段时,基因(x轴)的通过率(y轴)的图。

图17是对两种基因使用方法2和方法3,使用10分钟和30分钟的孵育时间,瓣状内切核酸酶介导的核酸装配的菌落形成单位(CFU,y轴)的图。

图18A是来自BioAnalyzer读取的图,在x轴上为核苷酸碱基,在y轴上为荧光单位。

图18B是来自BioAnalyzer读取的图,在x轴上为孵育时间,在y轴上为荧光单位。

图19A-19B是使用瓣状内切核酸酶介导的核酸装配、比较1和比较2方法,针对不同数目的片段(x轴)的菌落形成单位(y轴)的图。

图20A-20B是瓣状内切核酸酶介导的核酸装配、比较1装配和比较2装配的装配错误图。

图20C是相对于装配体总计数的百分比(y轴)的图,其比较了内切核酸酶介导的核酸装配、比较1装配和比较2装配(x轴)。

图21A是针对各种数目的插入物,装配的构建体在PCR扩增前和扩增后的图。

图21B是使用瓣状内切核酸酶介导的核酸装配、比较1和比较2方法,针对不同数目的片段(x轴),相对于装配体总计数的百分比(y轴)的图。

图21C是使用瓣状内切核酸酶介导的核酸装配,群体CFU百分比和NGS结果的图。

图21D是正确装配的构建体和错误装配或不正确的构建体的分布百分比的图。

图22A是对于装配之前的扩增的寡核苷酸群体,与各种GC类别(x轴)相比,每5,400观察到的频率(y轴)的图。

图22B是对于通过瓣状内切核酸酶介导的核酸装配而装配的寡核苷酸群体,与各种GC类别(x轴)相比,每5,400观察到的频率(y轴)的图。

图23是来自多重基因装配反应的基因水平结果的图。

具体实施方式

定义

贯穿本公开内容,各个实施方案以范围格式给出。应当理解,范围格式的描述只是为了方便和简明,而不应被解释为对任何实施方案的范围的硬性限制。因此,除非上下文另有明确规定,否则对范围的描述应被认为明确公开了所有可能的子范围以及该范围内精确到下限单位十分之一的各个数值。例如,对诸如从1至6的范围的描述应被认为已经明确公开了诸如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等子范围,以及该范围内的各个值,例如,1.1、2、2.3、5和5.9。无论范围的宽度如何,这都是适用的。这些中间范围的上限和下限可独立地包括在更小的范围内,并且也被涵盖于本发明之中,但受制于所声称范围中的任何被明确排除的限值。除非上下文另有明确规定,否则当所声称的范围包括限值之一或全部两者时,排除了这些包括的限值之一或全部两者的范围也被包括在本发明中。

本文使用的术语仅用于描述特定实施方案的目的,而非旨在限制任何实施方案。除非上下文另有明确规定,否则如本文所用的单数形式“一个”、“一种”和“该”也意欲包括复数形式。进一步应当理解,术语“包括”和/或“包含”在本说明书中使用时指定所述特征、整体、步骤、操作、元件和/或组分的存在,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组分和/或其群体。如本文所用的,术语“和/或”包括一个或多个相关所列项目的任何及所有组合。

除非具体说明或者从上下文中明显看出,否则如本文所用的,术语“核酸”涵盖双链或三链核酸以及单链分子。在双链或三链核酸中,核酸链不必共同延伸(即,双链核酸不必沿两条链的全长都是双链的)。当提供时,核酸序列以5’至3’的方向列出,除非另有说明。本文所述的方法提供了分离的核酸的生成。本文所述的方法另外提供了分离并纯化的核酸的生成。本文提及的“核酸”在长度上可包含至少5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000个或更多个碱基。而且,本文提供了合成任意数目的编码多肽区段的核苷酸序列的方法,该序列包括编码非核糖体肽(NRP)的序列,编码以下物质的序列:非核糖肽合成酶(NRPS)模块和合成变体、其它模块化蛋白质如抗体的多肽区段、来自其它蛋白质家族的多肽区段,包括非编码DNA或RNA,如调节序列,例如启动子、转录因子、增强子、siRNA、shRNA、RNAi、miRNA、衍生自微小RNA的核仁小RNA,或任何感兴趣的功能性或结构性DNA或RNA单元。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、基因间DNA、由连锁分析限定的基因座(多个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核仁小RNA、核酶、互补DNA(cDNA)(其为mRNA的DNA呈现形式,通常通过信使RNA(mRNA)的逆转录或通过扩增来获得);经合成或通过扩增产生的DNA分子、基因组DNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。编码本文提及的基因或基因片段的cDNA可包含至少一个编码外显子序列的区域,而没有基因组等同序列中的间插内含子序列。

除非特别说明或从上下文中可以明显看出,否则如本文所用的,关于数字或数字范围的术语“约”应被理解为表示所述数字及其+/-10%的数字,或者对于范围列出的值,表示低于所列下限的10%至高于所列上限的10%。

在本文提及的示例性工作流程中被称为“通用引物”的引物是识别多个DNA片段共有的引物结合位点的短多核苷酸。然而,这些工作流程不限于仅使用通用引物,并且附加地或替代地可以并入片段特异性引物。另外,尽管本文描述的示例性工作流程是指基因片段的装配,但是它们不限于此,并且通常适用于较长核酸的装配。

无缝核酸装配

本文提供了具有提高的效率和准确性的核酸装配方法。本文进一步提供了将核酸装配为长基因的方法。通过包含内切核酸酶或外切核酸酶、任选地结合额外的酶的装配方法,将本文所述的多核苷酸装配成更长的核酸。

在图1A中描绘了使用瓣状内切核酸酶装配核酸的示例性方法。瓣状内切核酸酶介导的核酸装配使用第一基因片段127和第二基因片段131来进行。第一基因片段127的底部链被设计为从5'至3'包含第一通用引物结合序列107a、同源序列103、插入序列108和第二通用引物结合序列107b。第二基因片段131的顶部链被设计为从5'至3'包含第一通用引物结合序列107c、同源序列105、插入序列110和第二通用引物结合序列107d。使第一基因片段127和第二基因片段131与包含外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶的反应混合物接触。外切核酸酶消化109 3'端以暴露同源位点,产生片段133。在一些情况下,该外切核酸酶是外切核酸酶III。瓣状内切核酸酶切割111 5'瓣,产生片段135。在一些情况下,该瓣状内切核酸酶是瓣状内切核酸酶1(FEN-1)。聚合酶补平缺口113并留下切口,从而产生片段137。连接酶然后密封115该切口,从而产生片段139。

在图1B中描绘了使用瓣状内切核酸酶和桥式装配方法装配核酸的示例性方法。瓣状内切核酸酶介导的核酸装配使用双链核酸桥151、第一基因片段155和第二基因片段157来进行。双链核酸桥151包含第一通用引物结合序列153a、与第一基因片段155同源的第一同源序列155a、与第二基因片段157同源的第二同源序列157a以及第二通用引物结合序列153b。使双链核酸桥151、第一基因片段155和第二基因片段157与包含外切核酸酶、瓣状内切核酸酶、聚合酶和连接酶的反应混合物接触。外切核酸酶消化159 3'端以暴露同源位点,产生片段169。在一些情况下,该外切核酸酶是外切核酸酶III。聚合酶补平缺口161并留下切口,从而产生片段171。瓣状内切核酸酶切割165 5'瓣,产生片段173。在一些情况下,该瓣状内切核酸酶是瓣状内切核酸酶1(FEN-1)。连接酶然后密封167该切口,从而产生片段175。在一些情况下,该连接酶是ampligase。

本文提供了酶促介导的核酸装配方法。在一些情况下,该酶促介导的核酸装配包括向基因片段添加同源序列。在一些情况下,从头合成的基因片段已经包含同源序列。在一些情况下,该酶促介导的核酸装配包括使用酶混合物。在一些情况下,该酶混合物包含内切核酸酶。在一些情况下,该酶混合物任选地包含外切核酸酶、聚合酶或连接酶。在一些情况下,该酶混合物包含外切核酸酶、内切核酸酶、聚合酶和连接酶。在一些情况下,该酶混合物包含内切核酸酶、聚合酶和连接酶。在一些情况下,该内切核酸酶是瓣状内切核酸酶。在一些情况下,酶促介导的核酸装配导致效率提高。在一些情况下,该酶混合物包含不是限制酶的酶。在一些情况下,该酶混合物包含作为结构特异性酶的酶。在一些情况下,该酶混合物包含作为结构特异性酶而不是序列特异性酶的酶。

本文提供了这样的方法,其中使用包含一种或多种酶的位点特异性碱基切除试剂作为切割剂,所述切割剂仅在切割位点切割双链DNA的单链。许多修复酶单独地或与其它试剂组合地适合于产生这类切口。表1中提供了修复酶的示例性列表。根据各个实施方案,还使用修复酶的同源物或非天然变体,包括表1中的那些。根据本文所述的方法和组合物使用的任何修复酶可以是天然存在的、重组的或合成的。在一些情况下,DNA修复酶是具有一种或多种活性的天然或体外产生的嵌合蛋白。在各个实施方案中,切割剂具有酶活性,包括酶混合物,其包括参与碱基切除修复的切口内切核酸酶、AP内切核酸酶、糖基化酶和裂合酶中的一种或多种。

修复酶在原核和真核细胞中发现。在此具有适用性的一些酶在一个分子中具有糖基化酶和AP内切核酸酶活性。AP内切核酸酶按照其切割位点进行分类。I类AP内切核酸酶和II类AP内切核酸酶在无碱基位点3'和5’侧的磷酸基团处切割DNA,留下3'-OH和5-磷酸末端。III类和IV类AP内切核酸酶还在无碱基位点3'和5’侧的磷酸基团处切割DNA,但是它们产生3'-磷酸和5'-OH。使用的多核苷酸切割酶的实例包括DNA修复酶,其列于表1中。

表1.DNA修复酶

本文提供了酶促介导的核酸装配方法,其中用于装配的基因片段或基因包含同源序列。在一些情况下,该同源序列包含至少或大约5、10、20、30、40、50、60、70、80、90、100个或超过100个碱基对。在一些情况下,碱基对的数目是40个碱基对。在一些情况下,碱基对的数目具有约5至100、10至90、20至80、30至70或40至60个碱基对的范围。

本文提供了酶促介导的核酸装配方法,其中用于装配的基因片段或基因不包含同源序列。在一些情况下,对于从头合成的没有同源序列的基因片段,其酶促介导的核酸装配方法包括使用核酸桥的装配。在一些情况下,该核酸桥包含DNA或RNA。在一些情况下,该核酸桥包含DNA。在一些情况下,该核酸桥是双链的。在一些情况下,该核酸桥是单链的。

本文提供了使用核酸桥的酶促介导的核酸装配方法,其中该核酸桥包含一个或多个通用引物结合序列。在一些情况下,该核酸桥包含至少或大约1、2、3、4、5、6、7、8个或超过8个通用引物结合序列。在一些情况下,该核酸桥进一步包含同源序列。在一些情况下,该同源序列与从头合成的基因片段同源。在一些情况下,该核酸桥进一步包含一个或多个同源序列。例如,该核酸桥包含与不同的从头合成的基因片段同源的一个或多个同源序列。在一些情况下,该核酸桥包含1、2、3、4、5、6、7、8、9、10个或超过10个同源序列。在一些情况下,该同源序列包含至少或大约5、10、20、30、40、50、60、70、80、90、100个或超过100个碱基对。在一些情况下,碱基对的数目是40个碱基对。在一些情况下,碱基对的数目是50个碱基对。在一些情况下,碱基对的数目具有约5至100、10至90、20至80、30至70或40至60个碱基对的范围。

本文提供了酶促介导的核酸装配方法,其中使双链核酸与具有外切核酸酶活性的酶接触。在一些情况下,该外切核酸酶具有3'外切核酸酶活性。具有3'外切核酸酶活性的示例性外切核酸酶包括但不限于外切核酸酶I、外切核酸酶III、外切核酸酶V、外切核酸酶VII和外切核酸酶T。在一些情况下,该外切核酸酶具有5'外切核酸酶活性。具有5'外切核酸酶活性的示例性外切核酸酶包括但不限于外切核酸酶II、外切核酸酶IV、外切核酸酶V、外切核酸酶VI、外切核酸酶VII、外切核酸酶VIII、T5外切核酸酶和T7外切核酸酶。在一些情况下,该外切核酸酶是外切核酸酶III(ExoIII)。外切核酸酶包括野生型外切核酸酶及其衍生物、嵌合体和/或突变体。突变的外切核酸酶包括在外切核酸酶的氨基酸或核酸序列内包含一个或多个突变、插入、缺失或其任意组合的酶。

在一些情况下,所述外切核酸酶在对于酶活性而言最适的温度下,例如,在约25-80℃、25-70℃、25-60℃、25-50℃或25-40℃范围内的温度下使用。在一些情况下,该温度是约37℃。在一些情况下,该温度是约50℃。在一些情况下,该温度是约55℃。在一些情况下,该温度是约65℃。在一些情况下,该温度是至少或大约15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃或高于80℃。

在一些情况下,酶促介导的核酸装配方法不包括使用外切核酸酶。在一些情况下,酶促介导的核酸装配方法包括使用外切核酸酶。在一些情况下,使用一种或多种外切核酸酶。例如,使用至少或大约1、2、3、4、5、6种或超过6种外切核酸酶。在一些情况下,该外切核酸酶具有5’至3'外切核酸酶活性。在一些情况下,该外切核酸酶具有3’至5'外切核酸酶活性。在一些情况下,方法包括使双链DNA与内切核酸酶接触。在一些情况下,该内切核酸酶是瓣状内切核酸酶。在一些情况下,方法包括使双链DNA与瓣状内切核酸酶、连接酶或聚合酶接触。在一些情况下,该瓣状内切核酸酶是瓣状内切核酸酶1。

本文提供了这样的方法,其中用具有内切核酸酶活性的酶处理双链核酸。在一些情况下,该内切核酸酶具有5'核酸酶活性。在一些情况下,该内切核酸酶具有3'核酸酶活性。在一些情况下,该内切核酸酶是瓣状内切核酸酶。在一些情况下,该瓣状内切核酸酶具有5'核酸酶活性。在一些情况下,该瓣状内切核酸酶是酶的5'-核酸酶家族的成员。示例性的5'-核酸酶包括但不限于瓣状内切核酸酶1、外切核酸酶1、着色性干皮病互补组G(XPG)、Dna2和缺口内切核酸酶1(GEN1)。在一些情况下,该瓣状内切核酸酶是瓣状内切核酸酶1。在一些情况下,该瓣状内切核酸酶具有3'核酸酶活性。具有3'核酸酶活性的示例性瓣状内切核酸酶包括但不限于RAG1、RAG2和MUS81。在一些情况下,该瓣状内切核酸酶是古菌、细菌、酵母、植物或哺乳动物瓣状内切核酸酶。示例性的5'核酸酶和3'核酸酶可见于表2中。

表2.示例性核酸酶

在一些情况下,所述内切核酸酶在对于酶活性而言最适的温度下,例如,在25-80℃、25-70℃、25-60℃、25-50℃或25-40℃的温度下使用。在一些情况下,该温度是约50℃。在一些情况下,该温度是约55℃。在一些情况下,该温度是约65℃。在一些情况下,该温度是至少或大约15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃或高于80℃。在一些情况下,该内切核酸酶是热稳定的内切核酸酶。热稳定的内切核酸酶可以包括在至少或大约60℃、65℃、70℃、75℃、80℃或高于80℃的温度下具有功能的内切核酸酶。在一些情况下,该内切核酸酶是瓣状内切核酸酶。在一些情况下,该瓣状内切核酸酶是热稳定的瓣状内切核酸酶。

本文提供了核酸装配方法,其中所述内切核酸酶与所述外切核酸酶之比为约0.1:1至约1:5。在一些情况下,该内切核酸酶是瓣状内切核酸酶。在一些情况下,内切核酸酶与外切核酸酶之比为至少或大约0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5或超过1:5。在一些情况下,内切核酸酶与外切核酸酶之比为至少或大约1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1或低于1:0.1。

本文提供了包括外切核酸酶的核酸装配方法,其中该外切核酸酶的浓度为约0.1U至约20U或更高。例如,该外切核酸酶的浓度为至少或大约0.1U、0.25U、0.5U、0.75U、1U、1.6U、2U、3U、4U、5U、6U、7U、8U、9U、10U、12U、14U、16U、18U、20U或超过20U。在一些情况下,该外切核酸酶的浓度在约0.5U至约1.0U的范围内。在一些情况下,该外切核酸酶的浓度为约1.0U至约2.0U。在一些情况下,该外切核酸酶的浓度约为1.6U。在一些情况下,该外切核酸酶的浓度约为5.0U。在一些情况下,该外切核酸酶的浓度范围为约0.1U至20U、0.25U至18U、0.5U至16U、0.75U至14U、1U至12U、2U至10U、3U至9U或4U至8U。

本文描述的酶促介导的核酸装配方法可包括内切核酸酶,其中该内切核酸酶的浓度为约0.25U至约12U或更高。在一些情况下,该内切核酸酶是瓣状内切核酸酶。该内切核酸酶的示例性浓度包括但不限于至少或大约0.25U、0.5U、0.75U、1U、2U、3U、4U、5U、6U、7U、8U、9U、10U、11U、12U或超过12U。在一些情况下,该内切核酸酶的浓度约为0.32U。在一些情况下,该内切核酸酶的浓度约为1.6U。在一些情况下,该内切核酸酶的浓度在约0.32U至约4.8U的范围内。在一些情况下,该内切核酸酶的浓度在约0.25U至12U、0.5U至11U、0.75U至10U、1U至9U、2U至8U、3U至7U或4U至6U的范围内。

本文提供了酶促介导的核酸装配方法,其中使双链核酸与聚合酶混合。在一些情况下,该聚合酶是DNA聚合酶。在一些情况下,该聚合酶是高保真聚合酶。高保真聚合酶可包括导致模板核酸的准确复制或扩增的聚合酶。在一些情况下,该DNA聚合酶是热稳定的DNA聚合酶。该DNA聚合酶可以来自任何DNA聚合酶家族,包括但不限于A族聚合酶、B族聚合酶、C族聚合酶、D族聚合酶、X族聚合酶和Y族聚合酶。在一些情况下,该DNA聚合酶来自包括但不限于栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、热球菌属(Thermococcus)、火球菌属(Pyrococcus)、气火菌属(Aeropyrum)、产液菌属(Aquifex)、硫化叶菌属(Sulfolobus)、火叶菌属(Pyrolobus)或甲烷嗜热菌属(Methanopyrus)的属。

本文所述用于扩增反应的聚合酶可具有多种酶活性。聚合酶在本发明的方法中使用,例如,用来延伸引物以产生延伸产物。在一些情况下,该DNA聚合酶具有5’至3’聚合酶活性。在一些情况下,该DNA聚合酶具有3’至5’外切核酸酶活性。在一些情况下,该DNA聚合酶具有校正活性。示例性聚合酶包括但不限于DNA聚合酶(I、II或III)、T4 DNA聚合酶、T7 DNA聚合酶、Bst DNA聚合酶、Bca聚合酶、Vent DNA聚合酶、Pfu DNA聚合酶和Taq DNA聚合酶。热稳定的DNA聚合酶的非限制性实例包括但不限于Taq、 DNA聚合酶、 HighFidelity DNA聚合酶、 DNA聚合酶、Expand High Fidelity聚合酶、HotTub聚合酶、Pwo聚合酶、Tfl聚合酶、Tli聚合酶、UlTma聚合酶、Pfu聚合酶、KOD DNA聚合酶、JDF-3DNA聚合酶、PGB-D DNA聚合酶、Tgo DNA聚合酶、Pyrolobus furmarius DNA聚合酶、Vent聚合酶和Deep Vent聚合酶。

本文描述了包括DNA聚合酶的方法,其中该DNA聚合酶的浓度为约0.1U至约2U,或大于2U。在一些情况下,该DNA聚合酶的浓度约为0.1U。在一些情况下,该DNA聚合酶的浓度约为0.2U。在一些情况下,该DNA聚合酶的浓度约为0.01U。在一些情况下,该DNA聚合酶的浓度在至少或大约0.005U至2U、0.005U至1U、0.005U至.5U、0.01U至1U、0.1U至0.5U、0.1U至0.5U、0.1U至1U、0.1U至1.5U、0.1U至2U、0.5U至1.0U、0.5U至1.5U、0.5U至2U、1U至1.5U、1.0U至2.0U或1.5U至2U的范围内。

供本文所述方法使用的DNA聚合酶在对于酶活性而言最适的温度下,例如,在25-80℃、25-70℃、25-60℃、25-50℃或25-40℃的温度下使用。在一些情况下,该温度是约50℃。在一些情况下,该温度是约55℃。在一些情况下,该温度是约65℃。在一些情况下,该温度是至少或大约15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃或高于80℃。

本文所述用于酶促介导的核酸装配的方法可包括扩增反应,其中该扩增反应包含通用引物结合序列。在一些情况下,该通用引物结合序列能够结合相同的5'或3'引物。在一些情况下,该通用引物结合序列在该扩增反应中的多个靶核酸之间共有。

本文提供了酶促介导的核酸装配方法,其中用连接酶处理双链核酸。如本文所述的连接酶可以起到连接核酸片段的作用。例如,该连接酶用来连接DNA的相邻3'-羟基化和5'-磷酸化末端。连接酶包括但不限于大肠杆菌连接酶、T4连接酶、哺乳动物连接酶(例如,DNA连接酶I、DNA连接酶II、DNA连接酶III、DNA连接酶IV)、热稳定的连接酶和快速连接酶。在一些情况下,该连接酶是热稳定的连接酶。在一些情况下,该连接酶是Ampligase。

连接酶的浓度可以变化。在一些情况下,连接酶的浓度在约0U至约2U的范围内。连接酶的示例性浓度约为0.5U。在一些情况下,连接酶的浓度约为1.0U。在一些情况下,连接酶的浓度约为5.0U。在一些情况下,连接酶的浓度在至少或大约0U至0.25U、0U至0.5U、0U至1U、0U至1.5U、0U至2U、0.25U至0.5U、0.25U至1.0U、0.25U至1.5U、0.25U至2.0U、0.5U至1.0U、0.5U至1.5U、0.5U至2.0U、1.0U至1.5U、1.0U至2.0U、1.5U至2.0U、2.0U至4.0U、4.0U至6.0U、4.0U至8.0U、6.0U至10.0U的范围内。

在一些情况下,所述连接酶在对于酶活性而言最适的温度下,例如,在25-80℃、25-70℃、25-60℃、25-50℃或25-40℃的温度下使用。在一些情况下,该温度是约50℃。在一些情况下,该温度是约55℃。在一些情况下,该温度是约65℃。在一些情况下,该温度是至少或大约15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃或高于80℃。

本文提供了用于酶促介导的核酸装配的方法,其中装配许多基因片段。在一些情况下,持续地或顺序地装配所述基因片段。在一些情况下,将基因片段装配到载体中。在一些情况下,将基因片段装配用于长线性基因装配。在一些情况下,基因片段的数目为至少或大约2、3、4、5、6、7、8、9、10个或超过10个基因片段。在一些情况下,基因片段的数目为至少或大约10、11、12、13、14、15、16、17、18、19、20个或超过20个基因片段。在一些情况下,基因片段的数目在约1至2、1至3、1至4、1至5、1至6、1至7、1至8、1至9、1至10、2至3、2至4、2至5、2至6、2至7、2至8、2至9、2至10、3至4、3至5、3至6、3至7、3至8、3至9、3至10、4至5、4至6、4至7、4至8、4至9、4至10、5至6、5至7、5至8、5至9、5至10、6至7、6至8、6至9、6至10、7至8、7至9、7至10、8至9、8至10或9至10的范围内。在一些情况下,基因片段的数目为约1至约20、约2至约18、约3至约17、约4至约16、约6至约14或约8至约12个。

本文提供了用于酶促介导的核酸装配的方法,其中装配的基因片段的比例为约0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5或大于1:5。例如,如果装配两个基因片段,则第一基因片段与第二基因片段之比为1:1。在一些情况下,第一基因片段与第二基因片段之比为至少或大约1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1或低于1:0.1。

本文所述的用于酶促介导的核酸装配的方法可包括将一个或多个基因片段装配到载体中,其中所述一个或多个基因片段与载体之比变化。在一些情况下,所述一个或多个基因片段与载体之比为至少或大约0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5或超过1:5。在一些情况下,所述一个或多个基因片段与载体之比为至少或大约1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1或低于1:0.1。

如本文所述的用于酶促介导的核酸装配的方法可包括将用于装配的寡核苷酸群体装配到载体中。在一些情况下,进行重叠延伸PCR以装配寡核苷酸群体。在一些情况下,该寡核苷酸群体包含至少或大约2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200个或超过200个寡核苷酸。在一些情况下,装配寡核苷酸群体以生成包含至少或大约50、100、200、250 300、400、500、600、700、800、900、1000、1100、1300、1400、1500、1600、1700、1800、2000、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200,4400、4600、4800、5000、6000、7000、8000、9000、10000个或超过10000个碱基的长核酸。

如本文所述的用于酶促介导的核酸装配的方法可包括多重基因装配。在一些情况下,多个序列在单一反应中装配。在一些情况下,至少或大约2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200个或超过200个序列在单一反应中装配。在一些情况下,将通过多重基因装配而装配的序列插入载体中。

用于酶促介导的核酸装配的方法可包括使用核酸桥装配一个或多个基因片段,其中所述一个或多个基因片段与该核酸桥之比变化。在一些情况下,所述一个或多个基因片段与核酸桥之比为至少或大约0.2:1、0.25:1、0.5:1、0.75:1、1:1、1:1.5、1:2、1:3、1:4、1:5或超过1:5。在一些情况下,所述一个或多个基因片段与核酸桥之比为至少或大约1:1、1:0.9、1:0.85、1:0.8、1:0.75、1:0.7、1:0.65、1:0.6、1:0.55、1:0.5、1:0.45、1:0.4、1:0.35、1:0.3、1:0.25、1:0.2、1:0.15、1:0.1或低于1:0.1。

本文提供了用于基因片段的酶促介导的核酸装配的方法,其中装配的基因片段数目的总大小为至少或大约50、100、200、250 300、400、500、600、700、800、900、1000、1100、1300、1400、1500、1600、1700、1800、2000、2400、2600、2800、3000、3200、3400、3600、3800、4000、4200,4400、4600、4800、5000、6000、7000、8000、9000、10000或超过10000个碱基。在一些情况下,装配的基因片段数目的总大小在约300至1,000、300至2,000、300至3,000、300至4,000、300至5,000、300至6,000、300至7,000、300至8,000、300至9,000、300至10,000、1,000至2,000、1,000至3,000、1,000至4,000、1,000至5,000、1,000至6,000、1,000至7,000、1,000至8,000、1,000至9,000、1,000至10,000、2,000至3,000、2,000至4,000、2,000至5,000、2,000至6,000、2,000至7,000、2,000至8,000、2,000至9,000、2,000至10,000、3,000至4,000、3,000至5,000、3,000至6,000、3,000至7,000、3,000至8,000、3,000至9,000、3,000至10,000、4,000至5,000、4,000至6,000、4,000至7,000、4,000至8,000、4,000至9,000、4,000至10,000、5,000至6,000、5,000至7,000、5,000至8,000、5,000至9,000、5,000至10,000、6,000至7,000、6,000至8,000、6,000至9,000、6,000至10,000、7,000至8,000、7,000至9,000、7,000至10,000、8,000至9,000、8,000至10,000或9,000至10,000个碱基的范围内。

本文所述的包括酶促介导的核酸装配的方法产生高百分比的正确装配。在一些情况下,正确装配的百分比为至少或大约60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或超过99%。在一些情况下,平均正确装配的百分比为至少或大约60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或超过99%。在一些情况下,正确装配的百分比为100%。

如本文所述的包括酶促介导的核酸装配的方法产生低百分比的错误装配。在一些情况下,错误装配率百分比至多为5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%。在一些情况下,错误装配率百分比为约1%至约25%、约5%至约20%或约10%至约15%。在一些情况下,平均错误装配率至多为5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%。在一些情况下,平均错误装配率为约1%至约25%、约5%至约20%或约10%至约15%。

本文所述的包括酶促介导的核酸装配的方法导致效率提高。在一些情况下,效率通过菌落形成单位数来衡量。在一些情况下,本文所述的方法导致至少或大约100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、12000、14000、16000、18000、20000、25000、30000、35000、40000、50000、60000、70000、80000、90000、100000或超过100000个菌落形成单位。

用于核酸合成和无缝装配的系统

多核苷酸合成

本文提供了通过本文描述的方法在通过从头合成产生多核苷酸后无缝装配核酸的方法。示例性工作流程可见于图2中。接收包含核酸序列的计算机可读输入文件。计算机处理核酸序列以产生关于合成多核苷酸序列或共同编码该核酸序列的多个多核苷酸序列的指令。指令被传送到材料沉积装置203,以供基于所述多个核酸序列合成所述多个多核苷酸。材料沉积装置203,如多核苷酸合成仪,被设计为以逐步方式释放试剂,使得多个多核苷酸平行地一次延伸一个残基,以生成具有预定核酸序列的寡聚物。材料沉积装置203在阵列205上生成寡聚物,该阵列包括用于多核苷酸酸合成和延伸的座位的多个簇207。然而,该阵列不必具有组织成簇的座位。例如,座位可以均匀地分布在整个阵列上。合成从头多核苷酸并将其从板上移出,并在收集室209中开始装配反应,然后形成更长多核苷酸的群体211。收集室可以包括多个表面(例如,顶表面和底表面)或容纳来自合成表面的经转移材料的孔或通道的夹心结构。也可以合成从头多核苷酸并从板上移出,以形成更长多核苷酸的群体211。然后,可将更长多核苷酸的群体211划分成小滴或进行PCR。然后,通过瓣状内切核酸酶介导的核酸装配213使更长多核苷酸的群体211经历核酸装配。

本文提供了通过本文描述的方法在通过从头合成产生多核苷酸后无缝装配核酸的系统。在一些情况下,该系统包括计算机、材料沉积装置、表面和核酸装配表面。在一些情况下,该计算机包括具有核酸序列的可读输入文件。在一些情况下,该计算机处理该核酸序列以产生关于合成多核苷酸序列或共同编码该核酸序列的多个多核苷酸序列的指令。在一些情况下,该计算机向材料沉积装置提供关于合成多个多核苷酸酸序列的指令。在一些情况下,该材料沉积装置将核苷沉积在表面上以供延伸反应。在一些情况下,该表面包括用于延伸反应的座位。在一些情况下,该座位是斑点、孔、微孔、通道或柱杆(post)。在一些情况下,在延伸反应之后合成所述多个多核苷酸酸序列。在一些情况下,将所述多个多核苷酸酸序列从表面上移出,并准备用于核酸装配。在一些情况下,该核酸装配包括瓣状内切核酸酶介导的核酸装配。

本文提供了涉及亚磷酰胺化学的多核苷酸合成方法。在一些情况下,多核苷酸合成包括用亚磷酰胺将碱基偶联。在一些情况下,多核苷酸合成包括通过在偶联条件下沉积亚磷酰胺来偶联碱基,其中相同的碱基任选地与亚磷酰胺沉积超过一次,即双偶联。在一些情况下,多核苷酸合成包括未反应位点的加帽。在一些情况下,加帽是可选的。在一些情况下,多核苷酸合成包括氧化。在一些情况下,多核苷酸合成包括解封闭或脱三苯甲基化。在一些情况下,多核苷酸合成包括硫化。在一些情况下,多核苷酸合成包括氧化或硫化。在一些情况下,在多核苷酸合成反应期间的一个步骤或每个步骤之间,例如使用四唑或乙腈来洗涤所述基底。亚磷酰胺合成方法中任一步骤的时间范围包括小于约2min、1min、50sec、40sec、30sec、20sec或10sec。

使用亚磷酰胺方法的多核苷酸合成包括随后将亚磷酰胺构件(例如,核苷亚磷酰胺)添加至增长的多核苷酸链以形成亚磷酸三酯键。亚磷酰胺多核苷酸合成沿3’至5’方向进行。亚磷酰胺多核苷酸合成允许在每个合成循环中将一个核苷酸受控添加至增长的核酸链。在一些情况下,每个合成循环包括偶联步骤。亚磷酰胺偶联包括在活化的核苷亚磷酰胺与(例如通过连接体)结合至基底的核苷之间形成亚磷酸三酯键。在一些情况下,将核苷亚磷酰胺提供给活化的基底。在一些情况下,将核苷亚磷酰胺提供给具有活化剂的基底。在一些情况下,核苷亚磷酰胺以相对于与基底结合的核苷1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍或更多倍的过量来提供给基底。在一些情况下,核苷亚磷酰胺的添加在无水环境中(例如,在无水乙腈中)进行。添加核苷亚磷酰胺后,任选地洗涤该基底。在一些情况下,偶联步骤重复一次或额外多次,任选地在向基底添加核苷亚磷酰胺之间进行洗涤步骤。在一些情况下,本文使用的多核苷酸合成方法包括1、2、3个或更多个连续的偶联步骤。在许多情况下,在偶联之前,与基底结合的核苷通过去除保护基团来脱保护,其中该保护基团起到防止聚合的作用。常见的保护基团为4,4’-二甲氧基三苯甲基(DMT)。

偶联后,亚磷酰胺多核苷酸合成方法任选地包括加帽步骤。在加帽步骤中,用加帽剂处理增长的多核苷酸。加帽步骤可用来在偶联后封闭未反应的与基底结合的5’-OH基团以防止进一步链延伸,从而防止形成具有内部碱基缺失的多核苷酸。此外,用1H-四唑活化的亚磷酰胺可以在很小的程度上与鸟苷的O6位置反应。不受理论的束缚,在用I2/水氧化后,该副产物(可能经由O6-N7迁移)可经历脱嘌呤。无嘌呤位点可终止在多核苷酸的最终脱保护过程中被切割,从而降低全长产物的产率。O6修饰可通过在用I2/水氧化之前用加帽试剂处理而去除。在一些情况下,与没有加帽的合成相比,在多核苷酸合成过程中包括加帽步骤会降低错误率。作为实例,加帽步骤包括用乙酸酐和1-甲基咪唑的混合物处理与基底结合的多核苷酸。在加帽步骤之后,任选地洗涤所述基底。

在一些情况下,在添加核苷亚磷酰胺之后,并且任选地在加帽和一个或多个洗涤步骤之后,对与基底结合的增长的核酸进行氧化。氧化步骤包括将亚磷酸三酯氧化成四配位的磷酸三酯——天然存在的磷酸二酯核苷间连接的受保护的前体。在一些情况下,增长的多核苷酸的氧化通过任选地在弱碱(例如,吡啶、二甲基吡啶、三甲吡啶)的存在下用碘和水处理来实现。氧化可在无水条件下采用例如叔丁基过氧化氢或(1S)-(+)-(10-樟脑磺酰基)-氧杂吖丙啶(CSO)进行。在一些方法中,在氧化之后进行加帽步骤。第二个加帽步骤允许基底干燥,因为可能持续存在的来自氧化的残余水可以抑制随后的偶联。氧化后,任选地洗涤基底和增长的多核苷酸。在一些情况下,氧化步骤用硫化步骤来代替,以获得多核苷酸硫代磷酸,其中任何加帽步骤均可在硫化之后进行。许多试剂能够进行有效的硫转移,包括但不限于3-(二甲基氨基亚甲基)氨基)-3H-1,2,4-二噻唑-3-硫酮、DDTT、3H-1,2-苯并二噻戊环-3-酮1,1-二氧化物(也被称为Beaucage试剂)和N,N,N'N'-四乙基秋兰姆二硫化物(TETD)。

为了使后续核苷掺入循环通过偶联而发生,除去与基底结合的增长的多核苷酸的受保护的5’末端,使得伯羟基对下一个核苷亚磷酰胺是反应的。在一些情况下,保护基团为DMT,并且用在二氯甲烷中的三氯乙酸进行解封闭。进行延长时间的脱三苯甲基化或者使用比推荐的酸溶液更强的酸溶液进行脱三苯甲基化可导致与固体支持物结合的多核苷酸的脱嘌呤增加,因此降低了所需全长产物的产率。本文所述的本发明的方法和组合物提供了受控的解封闭条件,从而限制不希望的脱嘌呤反应。在一些情况下,与基底结合的多核苷酸在解封闭后洗涤。在一些情况下,解封闭后的有效洗涤有助于以低错误率合成多核苷酸。

多核苷酸合成方法一般包括一系列迭代的以下步骤:将受保护的单体施加至活化官能化的表面(例如,座位)以与活化的表面、连接体或与预先脱保护的单体连接;使所施加的单体脱保护,使其可与随后施加的受保护的单体反应;以及施加另一种受保护的单体以供连接。一个或多个中间步骤包括氧化或硫化。在一些情况下,在一个或全部步骤之前或之后有一个或多个洗涤步骤。

基于亚磷酰胺的多核苷酸合成方法包括一系列化学步骤。在一些情况下,合成方法的一个或多个步骤涉及试剂循环,其中该方法的一个或多个步骤包括向该基底施加对该步骤有用的试剂。例如,试剂通过一系列液相沉积和真空干燥步骤进行循环。对于包含诸如孔、微孔、通道等三维特征的基底,试剂任选地经由孔和/或通道穿过该基底的一个或多个区域。

使用本文所述的方法和/或基底合成的多核苷酸在长度上包含至少约20、30、40、50、60、70、75、80、90、100、120、150、200、500个或更多个碱基。在一些情况下,在座位内合成至少约1pmol、10pmol、20pmol、30pmol、40pmol、50pmol、60pmol、70pmol、80pmol、90pmol、100pmol、150pmol、200pmol、300pmol、400pmol、500pmol、600pmol、700pmol、800pmol、900pmol、1nmol、5nmol、10nmol、100nmol或更多的多核苷酸。本文提供的在表面上合成多核苷酸的方法允许以较快的速度合成。作为实例,每小时合成至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、70、80、90、100、125、150、175、200个或更多个核苷酸。核苷酸包括腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶、尿苷构件,或其类似物/修饰形式。在一些情况下,多核苷酸文库在基底上平行合成。例如,包含大约或至少约100、1,000、10,000、100,000、1,000,000、2,000,000、3,000,000、4,000,000或5,000,000个解析座位的基底能够支持合成至少相同数目的不同的多核苷酸,其中编码不同序列的多核苷酸在解析座位上合成。

用于生成高密度多核苷酸阵列的各种合适的方法是已知的。在示例性工作流程中,提供了基底表面层。在该示例中,改变表面的化学性质,以改进多核苷酸合成过程。生成低表面能区域以排斥液体,同时生成高表面能区域以吸引液体。表面本身可以是平面表面的形式或者包含形状的变化,例如增加表面积的突起或微孔。在该工作流程示例中,如在通过引用整体并入本文的国际专利申请公开WO/2015/021080中所公开的,所选择的高表面能分子发挥支持DNA化学过程的双重功能。

多核苷酸阵列的原位制备在固体支持物上进行,并利用单核苷酸延伸过程平行延伸多个寡聚物。沉积装置,如多核苷酸合成仪,被设计为以逐步方式释放试剂,使得多个多核苷酸平行地一次延伸一个残基,以生成具有预定核酸序列的寡聚物。在一些情况下,多核苷酸在该阶段从表面上切下。切割包括例如采用氨或甲胺的气体切割。

基底

用作多核苷酸合成表面的装置可以是基底的形式,其包括但不限于均质阵列表面、图案化的阵列表面、通道、珠子、凝胶等。本文提供了包含多个簇的基底,其中每个簇包含多个支持多核苷酸附着和合成的座位。如本文所用的术语“座位”是指结构上的离散区域,其提供了对编码单个预定序列的多核苷酸从该表面延伸的支持。在一些情况下,座位在二维表面(例如,基本上为平面的表面)上。在一些情况下,座位在三维表面(例如,孔、微孔、通道或柱杆)上。在一些情况下,座位的表面包含这样的材料,该材料被活化官能化,以附着至少一个核苷酸以供多核苷酸合成,或者优选地,附着相同核苷酸的群体以供多核苷酸群体合成。在一些情况下,多核苷酸是指编码相同核酸序列的多核苷酸群体。在一些情况下,基底的表面包括基底的一个或多个表面。使用所提供的系统和方法在本文所述的文库内合成的多核苷酸的平均错误率通常小于1/1000、小于约1/2000、小于约1/3000或更低,通常没有错误校正。

本文提供了支持在共同支持物上的可寻址位置处平行合成具有不同预定序列的多个多核苷酸的表面。在一些情况下,基底为合成超过50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个不同的多核苷酸提供支持。在一些情况下,该表面为合成超过50、100、200、400、600、800、1000、1200、1400、1600、1800、2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个编码不同序列的多核苷酸提供支持。在一些情况下,至少一部分多核苷酸具有相同的序列或被配置为用相同的序列合成。在一些情况下,该基底提供用于增长具有至少80、90、100、120、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500个或更多个碱基的多核苷酸的表面环境。

本文提供了在基底的不同座位上合成多核苷酸的方法,其中每个座位支持合成多核苷酸群体。在一些情况下,每个座位支持合成与在另一座位上增长的多核苷酸群体具有不同序列的多核苷酸群体。在一些情况下,每个多核苷酸序列被合成为在用于多核苷酸合成的表面上同一座位簇内的不同座位上具有1、2、3、4、5、6、7、8、9或更多的冗余度。在一些情况下,基底的座位位于多个簇内。在一些情况下,基底包含至少10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000个或更多个簇。在一些情况下,基底包含超过2,000、5,000、10,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,100,000、1,200,000、1,300,000、1,400,000、1,500,000、1,600,000、1,700,000、1,800,000、1,900,000、2,000,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000或10,000,000个或更多个不同的座位。在一些情况下,基底包含约10,000个不同的座位。单簇内的座位的量在不同情况下是不同的。在一些情况下,每个簇包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500个或更多个座位。在一些情况下,每个簇包含约50-500个座位。在一些情况下,每个簇包含约100-200个座位。在一些情况下,每个簇包含约100-150个座位。在一些情况下,每个簇包含约109、121、130或137个座位。在一些情况下,每个簇包含约19、20、61、64个或更多个座位。

在一些情况下,在基底上合成的不同多核苷酸的数目取决于基底上可用的不同座位的数目。在一些情况下,基底的簇内座位的密度至少是或约为1、10、25、50、65、75、100、130、150、175、200、300、400、500、1,000个或更多个座位/mm2。在一些情况下,基底包含10-500、25-400、50-500、100-500、150-500、10-250、50-250、10-200或50-200mm2。在一些情况下,簇内两个相邻座位的中心之间的距离为约10-500、约10-200或约10-100um。在一些情况下,相邻座位的两个中心之间的距离大于约10、20、30、40、50、60、70、80、90或100um。在一些情况下,两个相邻座位的中心之间的距离小于约200、150、100、80、70、60、40、30、20或10um。在一些情况下,每个座位独立地具有约0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100um的宽度。在一些情况下,每个座位独立地具有约0.5-100、0.5-50、10-75或0.5-50um的宽度。

在一些情况下,基底内的簇的密度是至少或大约1个簇/100mm2、1个簇/10mm2、1个簇/5mm2、1个簇/4mm2、1个簇/3mm2、1个簇/2mm2、1个簇/1mm2、2个簇/1mm2、3个簇/1mm2、4个簇/1mm2、5个簇/1mm2、10个簇/1mm2、50个簇/1mm2或更高。在一些情况下,基底包含约1个簇/10mm2至约10个簇/1mm2。在一些情况下,两个相邻簇的中心之间的距离至少为或约为50、100、200、500、1000、2000或5000um。在一些情况下,两个相邻簇的中心之间的距离约为50-100、50-200、50-300、50-500或100-2000um。在一些情况下,两个相邻簇的中心之间的距离约为0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下,每个簇独立地具有约0.5至2、约0.5至1或约1至2mm的横截面。在一些情况下,每个簇独立地具有约0.5、0.6、0.7、0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm的横截面。在一些情况下,每个簇独立地具有约0.5、0.6、0.7、0.8、0.9、1、1.1、1.15、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mm的内部横截面。

在一些情况下,基底是大约标准96孔板的大小,例如,约100至约200mm乘以约50至约150mm。在一些情况下,基底具有小于或等于约1000、500、450、400、300、250、200、150、100或50mm的直径。在一些情况下,基底的直径约为25-1000、25-800、25-600、25-500、25-400、25-300或25-200mm。在一些情况下,基底具有至少约100、200、500、1,000、2,000、5,000、10,000、12,000、15,000、20,000、30,000、40,000、50,000mm2或更大的平面表面积。在一些情况下,基底的厚度约为50-2000、50-1000、100-1000、200-1000或250-1000mm。

表面材料

本文提供的基底、装置和反应器由适合于本文描述的方法、组合物和系统的任何种类的材料制成。在某些情况下,将基底材料制造成表现出低水平的核苷酸结合。在一些情况下,修饰基底材料以生成表现出高水平的核苷酸结合的不同表面。在一些情况下,基底材料对可见光和/或紫外线是透明的。在一些情况下,基底材料具有足够的导电性,例如,能够跨整个基底或其一部分形成均匀的电场。在一些情况下,导电材料在电气上接地。在一些情况下,该基底是导热的或隔热的。在一些情况下,该材料是耐化学的且耐热的,以支持化学或生化反应,例如多核苷酸合成反应过程。在一些情况下,基底包含柔性材料。对于柔性材料而言,材料可包括但不限于:改性及未改性的尼龙、硝酸纤维素、聚丙烯等。在一些情况下,基底包含刚性材料。对于刚性材料而言,材料可包括但不限于:玻璃;熔融石英;硅、塑料(例如,聚四氟乙烯、聚丙烯、聚苯乙烯、聚碳酸脂,及其混合物等);金属(例如,金、铂等)。基底、固体支持物或反应器可由选自硅、聚苯乙烯、琼脂糖、葡聚糖、纤维素聚合物、聚丙烯酰胺、聚二甲基硅氧烷(PDMS)和玻璃的材料制成。基底/固体支持物或者其中的微结构、反应器可使用本文所列材料或本领域中已知的任何其他适当材料的组合制成。

表面架构

本文提供了用于本文描述的方法、组合物和系统的基底,其中所述基底具有适合于本文描述的方法、组合物和系统的表面架构。在一些情况下,基底包含凸起和/或凹陷特征。具有这类特征的一个益处是用来支持多核苷酸合成的表面积增大。在一些情况下,具有凸起和/或凹陷特征的基底被称为三维基底。在一些情况下,三维基底包含一个或多个通道。在一些情况下,一个或多个座位包含通道。在一些情况下,通道可通过沉积装置如多核苷酸合成仪进行试剂沉积。在一些情况下,试剂和/或流体收集在与一个或多个通道流体连通的较大的孔中。例如,基底包含与簇内的多个座位相对应的多个通道,并且所述多个通道与该簇的一个孔流体连通。在一些方法中,多核苷酸文库在簇的多个座位中合成。

本文提供用于本文描述的方法、组合物和系统的基底,其中所述基底被配置用于多核苷酸合成。在一些情况下,该结构被配制为允许用于表面上多核苷酸合成的受控的流动和质量传递路径。在一些情况下,基底的构造允许在多核苷酸合成过程中质量传递路径、化学暴露次数和/或洗涤功效的受控且均匀的分布。在一些情况下,基底的构造允许增加扫描效率,例如通过提供足以用于增长多核苷酸的体积,使得由增长的多核苷酸所排除的体积占可用于或适合于增长多核苷酸的初始可用体积的不超过50%、45%、40%、35%、30%、25%、20%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更少。在一些情况下,三维结构允许流体的受管控的流动,从而允许化学暴露的快速交换。

本文提供了用于与本文所述的酶促介导的核酸装配和多核苷酸合成有关的方法、组合物和系统的基底,其中所述基底包含被配置用于容纳本文所述的酶促反应的结构。在一些情况下,通过物理结构实现隔离。在一些情况下,通过表面的差异官能化以生成用于多核苷酸合成的活化和钝化区域来实现隔离。在一些情况下,差异官能化通过在整个基底表面上交替呈现疏水性,从而造成可引起沉积的试剂结珠或润湿的水接触角效应来实现。采用较大的结构可减少飞溅和邻近斑点的试剂对不同的多核苷酸合成位置的交叉污染。在一些情况下,使用装置如多核苷酸合成仪将试剂沉积到不同的多核苷酸合成位置。具有三维特征的基底以允许以低错误率(例如,小于约1:500、1:1000、1:1500、1:2,000;1:3,000;1:5,000;或1:10,000)合成大量多核苷酸(例如,超过约10,000个)的方式配置。在一些情况下,基底包含密度约为或大于约1、5、10、20、30、40、50、60、70、80、100、110、120、130、140、150、160、170、180、190、200、300、400或500个特征/mm2的特征。

基底的孔可具有与基底的另一个孔相同或不同的宽度、高度和/或容积。基底的通道可具有与基底的另一个通道相同或不同的宽度、高度和/或容积。在一些情况下,簇的直径或包含簇的孔的直径或两者约为0.05-50、0.05-10、0.05-5、0.05-4、0.05-3、0.05-2、0.05-1、0.05-0.5、0.05-0.1、0.1-10、0.2-10、0.3-10、0.4-10、0.5-10、0.5-5或0.5-2mm。在一些情况下,簇或孔或两者的直径小于或约为5、4、3、2、1、0.5、0.1、0.09、0.08、0.07、0.06或0.05mm。在一些情况下,簇或孔或两者的直径约为1.0mm至约1.3mm。在一些情况下,簇或孔或两者的直径约为1.150mm。在一些情况下,簇或孔或两者的直径约为0.08mm。簇的直径是指二维或三维基底内的簇。

在一些情况下,孔的高度约为20-1000、50-1000、100-1000、200-1000、300-1000、400-1000或500-1000um。在一些情况下,孔的高度小于约1000、900、800、700或600um。

在一些情况下,基底包含与簇内的多个座位相对应的多个通道,其中通道的高度或深度为5-500、5-400、5-300、5-200、5-100、5-50或10-50um。在一些情况下,通道的高度小于100、80、60、40或20um。

在一些情况下,通道、座位(例如,在基本上平坦的基底中)或通道和座位两者(例如,在其中座位对应于通道的三维基底中)的直径约为1-1000、1-500、1-200、1-100、5-100或10-100um,例如约90、80、70、60、50、40、30、20或10um。在一些情况下,通道、座位或通道和座位两者的直径小于约100、90、80、70、60、50、40、30、20或10um。在一些情况下,两个相邻通道、座位或通道和座位的中心之间的距离约为1-500、1-200、1-100、5-200、5-100、5-50或5-30,例如约20um。

表面修饰

本文提供了用于在表面上合成多核苷酸的方法,其中该表面包含各种表面修饰。在一些情况下,采用表面修饰通过加成工艺或减成工艺对表面进行化学和/或物理改变,以改变基底表面或基底表面的选定位点或区域的一种或多种化学和/或物理性质。例如,表面修饰包括但不限于:(1)改变表面的润湿性质;(2)对表面进行官能化,即,提供、修改或取代表面官能团;(3)对表面进行去官能化,即,移除表面官能团;(4)以其它方式例如通过刻蚀来改变表面的化学组成;(5)增大或减小表面粗糙度;(6)在表面上提供涂层,例如,展现出与表面的润湿性质不同的润湿性质的涂层;和/或(7)在表面上沉积微粒。

在一些情况下,在表面顶部添加化学层(被称为粘附促进剂)有利于基底表面上的座位的结构化图案化。用于施加粘附促进剂的示例性表面包括但不限于玻璃、硅、二氧化硅和氮化硅。在一些情况下,该粘附促进剂是具有高表面能的化学品。在一些情况下,在基底的表面上沉积第二化学层。在一些情况下,第二化学层具有低表面能。在一些情况下,涂覆在表面上的化学层的表面能支持小液滴在表面上的定位。根据所选择的图案化布置,座位的接近度和/或在座位处的流体接触面积是可改变的。

在一些情况下,(例如为了多核苷酸合成)核酸或其它部分所沉积到的基底表面或解析座位是光滑的或基本上为平面的(例如,二维的),或者具有不规则性,诸如凸起或凹陷特征(例如,三维特征)。在一些情况下,用一个或多个不同的化合物层来修饰基底表面。感兴趣的此类修饰层包括但不限于无机层和有机层,如金属、金属氧化物,聚合物、有机小分子等。

在一些情况下,使用增大和/或减小表面能的一个或多个部分对基底的解析座位进行官能化。在一些情况下,部分是化学惰性的。在一些情况下,部分被配置为支持所需的化学反应,例如在多核苷酸合成反应中的一个或多个过程。表面的表面能或疏水性是决定核苷酸附着到该表面上的亲和力的因素。在一些情况下,基底官能化方法包括:(a)提供具有包含二氧化硅的表面的基底;和(b)使用本文所述的或本领域已知的合适的硅烷化剂(例如,有机官能烷氧基硅烷分子)对所述表面进行硅烷化。方法和官能化剂在通过引用整体并入本文的美国专利5474796中有描述。

在一些情况下,基底表面通常经由存在于基底表面上的反应性亲水部分,在有效地将硅烷偶联至基底表面的反应条件下,使基底表面与含有硅烷混合物的衍生化组合物相接触来进行官能化。硅烷化一般通过使用有机官能烷氧基硅烷分子自装配来覆盖表面。还可使用本领域当前已知的多种硅氧烷官能化试剂,例如用于降低或增大表面能。有机官能烷氧基硅烷根据其有机官能来分类。

计算机系统

本文所述的任何系统均可以可操作地连接至计算机,并且可以本地或远程地通过计算机进行自动化。在一些情况下,本发明的方法和系统进一步包括计算机系统上的软件程序及其使用。因此,对分配/抽真空/再填充功能的同步(如编排和同步材料沉积装置运动、分配动作和真空致动)的计算机化控制处于本发明的范围内。计算机系统可被编程为在用户指定的碱基序列与材料沉积装置的位置之间接合,以将正确的试剂递送至基底的指定区域。

图3中示出的计算机系统300可被理解为能够从介质311和/或网络端口305读取指令的逻辑设备,其可任选地连接至具有固定介质312的服务器309。诸如图3示出的系统可包括CPU 301、磁盘驱动器303、可选的输入设备如键盘315和/或鼠标316以及可选的监视器307。可通过示出的通信媒介实现与本地或远程位置处的服务器的数据通信。通信媒介可包括传输和/或接收数据的任何手段。例如,通信媒介可以是网络连接、无线连接或因特网连接。这样的连接可提供经由万维网的通信。可以设想有关本公开的数据可经过这样的网络或连接而传输,以便由图3所示的用户方322接收和/或审阅。

图4是示出可与本发明的示例实施方案结合使用的计算机系统400的架构的框图。如图4所示,该示例计算机系统可包括用于处理指令的处理器402。处理器的非限制性示例包括:处理器、AMD OpteronTM处理器、Samsung 32-位RISC ARM 1176JZ(F)-S v1.0处理器、ARM Cortex-A8 Samsung S5PC100处理器、ARM Cortex-A8 Apple A4处理器、Marvell PXA 930处理器或功能上等效的处理器。多个执行线程可用于并行处理。在一些情况下,也可以使用多个处理器或具有多个核的处理器,无论是在单一计算机系统中,在群集中,还是通过包含多个计算机、蜂窝电话和/或个人数据助理设备的网络跨系统分布。

如图4所示,高速缓冲存储器404可连接至或并入处理器402,以提供由处理器402新近或频繁使用的指令或数据的高速存储器。处理器402通过处理器总线408连接至北桥406。北桥406通过存储器总线412连接至随机存取存储器(RAM)410,并管理处理器402对RAM410的访问。北桥406还通过芯片集总线416连接至南桥414。南桥414又连接至外围总线418。外围总线可以是例如PCI、PCI-X、PCI Express或其它外围总线。北桥和南桥通常被称为处理器芯片集,并管理在处理器、RAM与外围总线418上的外围组件之间的数据传送。在一些备选的架构中,北桥的功能性可以并入处理器中,而不是使用单独的北桥芯片。在一些情况下,系统400可包括附接至外围总线418的加速器卡422。加速器可包括现场可编程门阵列(FPGA)或用于加速某个处理的其它硬件。例如,加速器可用于适应性数据重建或用来评价在扩展集处理中使用的代数表达式。

软件和数据存储在外部存储器424中,并可加载至RAM 410和/或高速缓冲存储器404中,以供处理器使用。系统400包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:Linux、WindowsTM、MACOSTM、BlackBerry OSTM、iOSTM和其它功能上等效的操作系统,以及在操作系统顶部运行的、用于根据本发明的示例实施方案管理数据存储和优化的应用软件。在该实例中,系统400还包括与外围总线连接的网络接口卡(NIC)420和421,以提供与外部存储如网络附加存储(NAS)和可用于分布式并行处理的其它计算机系统的网络接口。

图5是根据示例实施方案使用共享虚拟地址存储空间的多处理器计算机系统的框图。该系统包括可访问共享的存储器子系统504的多个处理器502a-f。该系统中在存储器子系统504中并入多个可编程硬件存储算法处理器(MAP)506a-f。每个MAP 506a-f可以包含存储器508a-f以及一个或多个现场可编程门阵列(FPGA)510a-f。MAP提供可配置的功能单元,并且可以向FPGA 510a-f提供特定算法或算法的部分,以供与相应的处理器密切协同地进行处理。例如,在示例实施方案中,MAP可用来评价与数据模型相关的代数表达式以及用来进行适应性数据重建。在该示例中,每个MAP可被用于这些目的的所有处理器全局访问。在一种配置中,每个MAP可使用直接存储器访问(DMA)来访问相关联的存储器508a-f,使其独立于且异步于各自的微处理器502a-f而执行任务。在这一配置中,MAP可将结果直接馈送至另一MAP以用于流水处理和并行执行算法。

图6是显示了具有多个计算机系统602a和602b、多个蜂窝电话和个人数据助理602c以及网络附加存储(NAS)604a和604b的网络的示图。在示例实施方案中,系统602a、602b和602c可管理数据存储并优化对存储在网络附加存储(NAS)604a和604b中的数据的数据访问。数学模型可用于该数据,并使用跨计算机系统602a和602b和蜂窝电话以及个人数据助理系统602c的分布式并行处理进行评价。计算机系统602a和602b和蜂窝电话以及个人数据助理系统602c也可提供对存储在网络附加存储(NAS)604a和604b中的数据的适应性数据重建的并行处理。图6仅示出了一个实例,而多种多样的其它计算机架构和系统可与本发明的多个实施方案一起使用。例如,刀片式服务器可用来提供并行处理。处理器刀片可通过背板连接,以提供并行处理。存储还可通过单独的网络接口连接至背板或作为网络附加存储(NAS)。在一些实例中,处理器可维持单独的存储空间,并通过网络接口、背板或其它连接器传输数据以便由其它处理器并行处理。在一些情况下,部分或全部处理器可使用共享的虚拟地址存储空间。

本文所述的任何系统可包括存储在非暂时性计算机可读存储介质上的序列信息。在一些情况下,本文所述的任何系统都包括计算机输入文件。在一些情况下,该计算机输入文件包含序列信息。在一些情况下,该计算机输入文件包含关于合成多个多核苷酸序列的指令。在一些情况下,该指令由计算机接收。在一些情况下,该指令由该计算机处理。在一些情况下,该指令被传送到材料沉积装置。在一些情况下,该非暂时性计算机可读存储介质用程序编码,该程序包括可由任选地联网的数字处理设备的操作系统执行的指令。在一些情况下,计算机可读存储介质是数字处理设备的有形组件。在一些情况下,计算机可读存储介质可任选地从数字处理设备中移除。在一些情况下,举非限制性示例而言,计算机可读存储介质包括CD-ROM、DVD、闪速存储设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务等。在一些情况下,程序和指令被永久、基本永久、半永久或非暂时地编码在介质上。

实施例

给出以下实施例是为了说明本发明的各个实施方案的目的,而不意味着以任何方式限制本发明。这些实施例以及目前代表优选实施方案的本文所述方法是示例性的,而非旨在限制本发明的范围。本领域技术人员将会想到其变化以及包含在由权利要求的范围所限定的本发明的精神之内的其它用途。

实施例1:基底表面的官能化

对基底进行官能化以支持多核苷酸文库的附着和合成。首先使用包含90%H2SO4和10%H2O2的水虎鱼溶液(piranha solution)将基底表面润湿清洗20分钟。将该基底在含有去离子水的数个烧杯中冲洗,在去离子水鹅颈旋塞下保持5min,并用N2干燥。随后将该基底在NH4OH(1:100;3mL:300mL)中浸泡5min,使用手持式喷枪(handgun)用去离子水冲洗,在连续三个含有去离子水的烧杯中各浸泡1min,然后再使用手持式喷枪用去离子水冲洗。然后通过将基底表面暴露于O2来等离子体清洗该基底。使用SAMCO PC-300仪器在下游模式下以250瓦进行O2等离子体蚀刻1min。

使用具有以下参数的YES-1224P气相沉积烘箱系统,用包含N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺的溶液对清洁的基底表面进行活化官能化:0.5至1托,60min,70℃,135℃汽化器。使用Brewer Science 200X旋涂仪对基底表面进行抗蚀剂涂覆。将SPRTM 3612光致抗蚀剂以2500rpm旋涂在基底上40sec。该基底在Brewer热板上以90℃预烘30min。使用Karl Suss MA6掩模对准仪对基底进行光刻。将该基底暴露2.2sec并在MSF 26A中显影1min。剩余的显影剂用手持式喷枪冲洗,并将基底在水中浸泡5min。该基底在烘箱中以100℃烘烤30min,随后使用Nikon L200目视检查光刻缺陷。采用清洁工艺利用SAMCO PC-300仪器以250瓦进行O2等离子体蚀刻1min来去除残余抗蚀剂。

用与10μL轻质矿物油混合的100μL全氟辛基三氯硅烷溶液对基底表面进行钝化官能化。将该基底放置于腔室中,泵送10min,随后关闭通往泵的阀门并静置10min。使该腔室排气。该基底通过在70℃下在500mL NMP中进行两次5min浸泡并同时以最大功率(在Crest系统上的9)进行超声波处理来剥离抗蚀剂。然后将该基底在室温下在500mL异丙醇中浸泡5min,同时以最大功率进行超声波处理。将该基底浸入300mL的200标准酒精度(proof)的乙醇中并用N2吹干。活化该官能化表面以充当多核苷酸合成的支持物。

实施例2:在寡核苷酸合成装置上合成50-聚体序列

将二维寡核苷酸合成装置组装至流动池中,其与流动池(Applied Biosystems(ABI394 DNA合成仪")连接。该二维寡核苷酸合成装置用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺(Gelest)均匀地官能化,并用来使用本文所述的多核苷酸合成方法合成50bp的示例性多核苷酸("50-聚体多核苷酸”)。

所述50-聚体的序列如SEQ ID NO.:1所述。5'AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3'(SEQ ID NO.:1),其中#表示胸苷-琥珀酰基己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244),它是允许在脱保护过程中从表面上释放多核苷酸的可切割的连接体。

根据表3中的方案和ABI394 DNA合成仪,使用标准DNA合成化学法(偶联、加帽、氧化和解封闭)完成合成。

表3.合成方案

亚磷酰胺/活化剂组合以类似于本体试剂通过流动池递送的方式进行递送。当在全部时间内保持环境被试剂“润湿”时,不进行干燥步骤。

从ABI394 DNA合成仪中去除限流器,以使得能够更快速流动。在没有限流器的情况下,酰胺类(amidites)(在ACN中0.1M)、活化剂(在ACN中的0.25M苯甲酰基硫基四唑(“BTT”;来自GlenResearch的30-3070-xx))和Ox(在20%吡啶、10%水和70%THF中的0.02MI2)的流速大致为约100uL/sec,乙腈(“ACN”)和加帽试剂(帽A和帽B的1:1混合物,其中帽A是在THF/吡啶中的乙酸酐,帽B是在THF中的16%1-甲基咪唑(1-methylimidizole))的流速大致为约200uL/sec,而解封闭剂(在甲苯中的3%二氯乙酸)的流速大致为约300uL/sec(相比之下,在有限流器的情况下,所有试剂的流速均为约50uL/sec)。观测完全排出氧化剂的时间,相应地调节化学品流动时间的时间选择,并在不同的化学品之间引入额外的ACN洗涤。在多核苷酸合成后,将芯片在75psi下在气态氨中脱保护过夜。将五滴水施加到表面上以回收多核苷酸。然后在BioAnalyzer小RNA芯片上分析所回收的多核苷酸(数据未示出)。

实施例3:在寡核苷酸合成装置上合成100-聚体序列

使用实施例2中描述的用于合成50-聚体序列的相同过程,在两个不同的硅芯片上合成100-聚体多核苷酸(“100-聚体多核苷酸”;5'CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3',其中#表示胸苷-琥珀酰基己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244);SEQ ID NO.:2),第一个用N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺均匀地官能化,而第二个用11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷的5/95混合物官能化,并在BioAnalyzer仪器上分析从表面提取的多核苷酸(数据未示出)。

使用下列热循环程序,在50uL PCR混合物(25uL NEB Q5主混合物,2.5uL 10uM正向引物,2.5uL10uM反向引物,1uL从表面提取的多核苷酸,用水加至50uL)中使用正向引物(5'ATGCGGGGTTCTCATCATC3';SEQ ID NO.:3)和反向引物(5'CGGGATCCTTATCGTCATCG3';SEQID NO.:4)进一步PCR扩增来自两个芯片的全部十个样品:

98℃,30sec

98℃,10sec;63℃,10sec;72℃,10sec;重复12个循环

72℃,2min

PCR产物还在BioAnalyzer上运行(数据未示出),在100-聚体位置处显示出尖锐峰。然后,对PCR扩增的样品进行克隆,并进行Sanger测序。表4总结了从来自芯片1的斑点1-5采集的样品和从来自芯片2的斑点6-10采集的样品的Sanger测序结果。

表4.测序结果

因此,合成的多核苷酸的高质量和均匀性在具有不同表面化学的两个芯片上重现。总体上,89%,相当于被测序的262个100-聚体中的233个,是没有错误的完美序列。表5总结了从来自斑点1-10的多核苷酸样品中获得的序列的错误特征。

表5.错误特征

实施例4.瓣状内切核酸酶介导的核酸装配

瓣状内切核酸酶介导的核酸装配反应

准备瓣状内切核酸酶介导的核酸装配反应。按照以下表6中的浓度,将水、dNTP(New England Biolabs)、Ampligase缓冲液(Epicentre)、ExoIII(New England Biolabs)、Phusion(New England Biolabs)、Ampligase(Epicentre)和Fen1(New England Biolabs)合并并等分到96孔板中。以表6中所示的浓度添加DNA和载体。将板密封,以1000rpm混合30秒,并短暂离心。将板在50℃下用105℃加热的盖子孵育30分钟,然后冷却至4℃。将反应体系在40uL冷缓冲液中以1:5稀释。

表6.反应浓度

试剂 终浓度
载体 4nM
基因片段1 4nM
dNTP 0.2mM
10X Ampligase缓冲液 1X
ExoIII 10U
Phusion 0.2U
Ampligase 1U
Fen1 3.2U
剩余加水直到10uL

体外PCR测定

在准备好瓣状内切核酸酶介导的核酸装配反应后,进行PCR扩增。按照以下表7中的反应条件进行25uL PCR反应,并使用根据表8的热循环仪条件进行扩增。在BioAnalyzer(Agilent)上分析PCR产物(图7)。检测到未指定的背景条带701、环状载体703和插入到载体705中的装配的DNA。

表7.PCR反应条件

表8.热循环仪条件

温度 时间 循环数
95℃ 30秒 1
95℃ 20秒 25
55℃ 20秒
68℃ 3分钟
68℃ 5分钟 1
4℃ 无限

转化

PCR反应后,将2uL稀释的反应液电穿孔到20uL电感受态细胞10G(Lucigen)中。用600uL预温的Lucigen回收培养基回收细胞。将样品以1:2系列稀释到Lucigen回收培养基中,并将7uL点样到Lennox+Carb板上。使板在37℃下生长过夜(约16小时)。通过对菌落进行计数以使用以下CFU公式确定菌落形成单位(CFU)来确定反应效率:(菌落数*反应总体积)/(平板接种体积*稀释倍数)。

大肠杆菌转化体的菌落计数见表9。变化倍数由具有插入物的菌落数(1X稀释)与没有插入物的菌落数进行比较来确定。

表9.菌落计数

观察到体外PCR测定(图7)与作为装配构建体的读出的大肠杆菌转化体数目的相关性(表10)。具体而言,将线性化的载体与1个DNA插入物装配在一起,该DNA插入物含有彼此具有同源性的40个碱基对。大肠杆菌中的菌落组成与同插入物装配后载体的再环化有关。体外PCR测定的峰大小与转化后大肠杆菌菌落计数的数目相关。阴性对照反应缺少DNA插入物,并且显示低水平的背景菌落。

实施例5.采用三个基因片段,瓣状内切核酸酶介导的核酸装配

与实施例4类似地进行瓣状内切核酸酶介导的核酸装配反应。将三个DNA片段插入到载体中。在准备好瓣状内切核酸酶介导的核酸装配反应后,与实施例4类似地进行PCR扩增。在BioAnalyzer(Agilent)上分析PCR产物(图8)。检测到再环化的消化的载体801和插入到载体803中的装配的DNA。

实施例6.采用不同浓度的Fen1和ExoIII,瓣状内切核酸酶介导的核酸装配

与实施例4类似地准备瓣状内切核酸酶介导的核酸装配反应。如表10所示测试了不同的条件。

表10.反应条件

如图9所示,对每个样品进行菌落数计数。数据显示,采用滴定的Fen1和ExoIII的菌落计数显著高于基线,并且与体外PCR测定中较高的扩增产物相关。

分离菌落,并通过菌落PCR测定装配体。反应在Fragment Analyzer(毛细管凝胶电泳)上进行。通过PCR产物的大小确定合适的装配体(数据未示出)。

使分离的菌落生长过夜,并微量制备以分离装配的载体DNA。通过下一代测序分析样品。如表11所示,不同的Fen1和ExoIII浓度导致不同量的正确装配的构建体。在通过的样品中,所有通用引物侧翼序列都被去除。在菌落PCR中具有适当大小的7/10个样品中,所有7个在同源位点处均通过NGS。

表11.菌落数据

实施例7.采用不同浓度的酶,瓣状内切核酸酶介导的核酸装配

与实施例4类似地准备瓣状内切核酸酶介导的核酸装配反应。将三个基因片段插入到载体中。使用根据以下表12的反应条件作为基线以及Phusion、Ampligase、ExoIII和Fen1浓度的变化进行实验。表13中显示了所用的Phusion、Ampligase、ExoIII和Fen1的浓度。

表12.反应条件

试剂 终浓度
载体 4nM
基因片段 4nM
dNTP 0.2mM
10X Ampligase缓冲液 1X
ExoIII 1U
Phusion 0.2U或0.1U
Ampligase 1U
Fen1 0.32U
剩余加水直到10uL

表13.酶浓度

参见图10,针对每种不同的酶比例测量了平均菌落形成单位(CFU)(灰色条)。还通过菌落PCR(cPCR)测定,测量了正确装配的百分比(黑色圆圈)。呈现的数据为结果的平均值。

使用不同的酶比例,CFU的数目增加并且正确装配的百分比提高(图10)。与其它反应条件相比,包含0.32U Fen1、1U ExoIII、0.2U Phusion和1U Ampligase的反应条件导致CFU数目增加最多,并且正确装配的百分比超过85%。

实施例8.1.8kb片段的瓣状内切核酸酶介导的核酸装配

与实施例4类似地准备瓣状内切核酸酶介导的核酸装配反应。使用1U ExoIII、0.2U Phusion、1U Ampligase和0.32U Fen1的酶浓度,采用插入物(白色条)以及不采用插入物(散列的条,左起第三个条),进行了瓣状内切核酸酶介导的核酸装配反应。还使用1UExoIII、0.1U Phusion、1U Ampligase和0.32U Fen1的酶浓度,采用插入物(黑色条)以及不采用插入物(散列的条,左起第四个),测试了瓣状内切核酸酶介导的核酸装配反应。然后测量来自斑点板的菌落形成单位(Y轴)。参见图11,与没有插入物的反应相比,在包含插入物的反应中CFU的数目增加。

实施例9.两个DNA片段的瓣状内切核酸酶介导的核酸装配

与实施例4类似地准备瓣状内切核酸酶介导的核酸装配反应。测定了不同量的输入DNA或线性化载体对菌落形成单位(CFU)的影响。所测试的输入DNA的量为2nM或4nM线性化载体。参见图12,装配了两个DNA片段,并且起始材料的量与菌落形成单位的量呈正相关。

实施例10.多段式DNA向DNA载体中的装配

与实施例4类似地准备瓣状内切核酸酶介导的核酸装配反应。使用表14中所示的试剂反应浓度进行实验。在冰上准备反应,并且在添加各种试剂之后,将反应在50℃下孵育30分钟。然后将反应体系以1:5稀释,并转化到大肠杆菌中。

表14.方法1反应浓度

试剂 5uL反应 终浓度
dNTP(10mM) 0.1 0.2mM
10x Ampligase缓冲液 0.5 1X
ExoIII(100U/uL) 0.005 0.1U/uL
Phusion(2U/uL) 0.05 0.02U/uL
Ampligase(5U/uL) 0.1 0.1U/uL
Fen1(32U/uL) 0.005 0.032U/uL
载体DNA 20fmol
插入物DNA 40fmol/插入物
水* 至5uL

然后测量菌落形成单位(CFU)。如图13所示,针对测试的不同基因(x轴)测量菌落形成单位(y轴)。从数据可以看出,根据所述反应条件的瓣状内切核酸酶介导的核酸装配反应导致高CFU和装配保真率。

实施例11.使用大量ExoIII,多段式DNA向DNA载体中的装配

与实施例4和实施例10类似地准备瓣状内切核酸酶介导的核酸装配反应。与实施例10相比,ExoIII的浓度增加了16倍。反应浓度见表15。在冰上准备反应,并且在添加各种试剂之后,将反应在65℃下孵育30分钟。然后将反应体系以1:5稀释,并转化到大肠杆菌中。

表15.方法2反应浓度

然后测量菌落形成单位。如图14A所示,使用根据方法1的反应浓度(表14)和根据方法2的反应浓度(表15),针对测试的不同基因(x轴)测量菌落形成单位(y轴)。图14A的结果显示,使用方法2获得更高的CFU和更高的装配保真度。

还进行了下一代测序(NGS)。如图14B所示,使用根据方法1的反应浓度(表14)和根据方法2的反应浓度(表15),在瓣状内切核酸酶介导的核酸装配后,测量了空或低覆盖度(白色条)、错误装配(点线条)、通过的克隆(水平条)和SNP(黑色条)。NGS结果显示出与图14A类似的结果,不同之处在于,使用方法2观察到更高的CFU和提高的装配保真度。参见图14C,使用方法1和方法2(x轴)比较了装配率(y轴)。与方法1相比,使用方法2提高了装配保真率。

该实施例表明,使用所述反应条件的瓣状内切核酸酶介导的核酸装配反应导致更高的菌落形成单位和提高的装配保真度。

实施例12:使用桥式装配方法的瓣状内切核酸酶介导的核酸装配

与实施例4和实施例10类似地准备瓣状内切核酸酶介导的核酸装配反应。反应条件见表14。另外,使用了40fmol的DNA桥。

各种样品包括无桥的装配体(阴性对照)、包含40个碱基对同源序列的片段(阳性对照)、包含与每个片段同源的40个碱基对同源序列的双链DNA桥以及包含与每个片段同源的50个碱基对同源序列的双链DNA桥。准备反应,并转化到大肠杆菌中。然后确定正确装配体的数目和正确装配体的百分比,并且在表16中示出。

表16.桥式装配方法

如表16所示,使用40个碱基对和50个碱基对的双链DNA(dsDNA)桥进行的瓣状内切核酸酶介导的核酸装配反应导致高于90%的正确装配体。进一步如图15A所示,与阴性对照相比,使用40个碱基对和50个碱基对的dsDNA桥的装配导致更高水平的装配。

测量使用桥式装配方法得到的CFU。如图15B所示,在不同插入物量(40fmol、225fmol或500fmol)下单链DNA(ssDNA)装配获得的菌落形成单位高于阴性对照(对照)。作为阳性对照,对ssDNA进行PCR扩增以产生双链DNA(dsDNA),并进行装配。

数据表明,通过使用桥核酸的瓣状内切核酸酶介导的核酸装配进行ssDNA装配导致更高百分比的正确装配体和更高数目的菌落形成单位。

实施例13:12个片段的瓣状内切核酸酶介导的核酸装配

与实施例4和实施例10类似地准备瓣状内切核酸酶介导的核酸装配反应。将多个片段装配到载体中,包括1、2、3、4、5、6、7、8、9、10、11和12个片段。每个DNA片段是500个碱基对。装配反应后,将反应转化到大肠杆菌中,并测量菌落形成单位。图16A示出了装配1、2、3、4、5、6、7、8、9、10、11和12个片段的菌落形成单位的图。

还进行了下一代测序(NGS)。如图16B所示,在瓣状内切核酸酶介导的核酸装配后,测量了空或低覆盖度(白色条)、错误装配(点线条)、通过的克隆(水平条)和SNP(黑色条)。还如图16C所示测量了通过率。数据显示12个片段的装配导致克隆成功和高通过率。

实施例14:使用少量聚合酶的瓣状内切核酸酶介导的核酸装配

与实施例4和实施例10类似地准备瓣状内切核酸酶介导的核酸装配反应。与实施例10相比,Phusion聚合酶的浓度降低了10倍。反应浓度见表17。在冰上准备反应,并且在添加各种试剂之后,将反应在65℃下孵育10-30分钟。将包含三个片段的反应体系克隆到质粒中,并转化到大肠杆菌中。如图17所示,在孵育10分钟和孵育30分钟后测量菌落形成单位。与实施例11(方法2)中描述的反应浓度相比,根据表17中的反应浓度使用减少的Phusion聚合酶增加了CFU的数目。在孵育10分钟或孵育30分钟后测量到类似的CFU。数据表明,使用减少量的聚合酶提高了克隆效率。

表17.方法3反应条件

实施例15:非克隆片段的瓣状内切核酸酶介导的核酸装配

确定了非克隆片段装配的反应效率。使用表15中所示的方法2和表17中所示的方法3,准备了用于装配2个DNA片段的反应。然后将反应于65℃下孵育10-30分钟。在BioAnalyzer上分析装配PCR产物(图18A),正确装配的片段是3000个碱基对。参见图18A,1801是未装配的基因片段,1803是使用方法2(红线,1805)和方法3(蓝线,1807)装配的基因片段。

还确定了非克隆装配。参见图18B,对于基因1和基因2,使用方法2或方法3反应条件,对孵育10分钟、20分钟或30分钟测量了荧光单位(y轴)。与方法2相比,使用方法3孵育10分钟、20分钟或30分钟时,荧光单位增加。数据显示使用方法3改善了非克隆片段的装配。

实施例16:采用瓣状内切核酸酶介导的核酸装配改善的装配

将使用与实施例14中所述类似的反应条件的瓣状内切核酸酶介导的核酸装配与通过不同比较方法的装配进行比较。生成了十二个500bp序列,并设计了一系列用于将一到十个DNA片段装配到载体中的构建体。使用瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法,将DNA装配为具有同源末端。比较1装配依赖于在通过PCR或DNA合成快速引入的构建体末端的同源性。比较1装配中的每个片段均需要不同的PCR引物对。比较2方法是具有变化的重叠区域的核酸片段的装配方法。确定了多个同源性长度和孵育时间的影响。

瓣状内切核酸酶介导的核酸装配在65℃下进行。在65℃时,消除了大多数二级结构,并且大大提高了装配保真度(数据未示出)。

确定了使用瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法的装配效率和准确性。效率由菌落形成单位(CFU)确定,而准确性由下一代测序(NGS)确定。

对于包含衔接子序列的双链DNA(dsDNA)非克隆片段,确定了使用瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法的效率。衔接子序列充当通用引物对。通过用对每种构建体具有特异性的引物(“衔接子-关”)扩增dsDNA片段,生成了包含同源性末端的dsDNA。每个片段包含与它们的预期终点的40或25bp重叠同源性。将一到十个dsDNA片段装配到线性质粒中,并将反应体系转化到大肠杆菌中。对于一个片段的装配,瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法产生稳定的菌落形成单位。瓣状内切核酸酶介导的核酸装配方法导致更高的菌落形成单位,而不管反应时间、同源性长度和装配的段数如何(图19A)。对于6个或更多个片段的片段装配,瓣状内切核酸酶介导的核酸装配方法导致菌落形成单位高于背景(图19A)。当片段的数目增加时,与10分钟的反应相比,在采用30分钟的反应时,瓣状内切核酸酶介导的核酸装配方法更有效(图19A)。还使用瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法测试了25bp的同源性长度,并且对于所有三种方法而言,两个或更多个片段的装配均未成功。

使用瓣状内切核酸酶介导的核酸装配方法、比较1方法和比较2方法,确定了具有隐蔽同源序列(“衔接子-开”)的DNA的效率。设计了从DNA片段末端起隐蔽约23bp的40个碱基对同源性。所有方法给出的CFU均显著高于其各自的背景(图19B)。参见图19B,一个片段的瓣状内切核酸酶介导的核酸装配在采用十分钟孵育时,其产生的菌落9倍于使用比较1方法的装配,并且568倍于使用比较2方法的装配。当插入物的数目增加时,对于四个片段,比较1方法和比较2方法未能得到超过背景水平的菌落(图19B)。瓣状内切核酸酶介导的十个片段向载体中的核酸装配导致相对于背景的642倍增加(图19B)。与使用比较1方法或比较2方法的装配相比,使用瓣状内切核酸酶介导的核酸装配时,具有末端同源序列和隐蔽同源序列的DNA的装配导致更有效的装配。

使用从每个反应8个菌落中分离出的质粒进行下一代测序。瓣状内切核酸酶介导的核酸装配和比较2方法分别导致84%和86%的正确装配率。每种方法均显示有8%的样品装配错误。使用比较1方法的装配导致10%的错误装配和25%的SNP率,从而导致总体正确装配率为65%。根据装配的插入物数目分析通过率和失败率,比较1方法在10个插入物时导致保真度丧失。对于比较1装配和比较2装配,大多数错误集中在25bp的片段连接点内(图20A-20C)。

使用下一代测序确定23bp衔接子的存在。瓣状内切核酸酶介导的核酸装配导致高于比较1和比较2方法的正确装配率。在所有装配反应中,瓣状内切核酸酶介导的核酸装配反应的平均正确装配率为72%,与之相比,比较1装配为4.5%,而比较2装配为31%。瓣状内切核酸酶介导的核酸装配样品中从未存在衔接子序列。相反,对于全长构建体,59%的比较1装配体和23%的比较2装配体含有部分或全长衔接子序列。通过比较1装配而装配的构建体更可能发生错误装配,总错误装配率为63%,与之相比,瓣状内切核酸酶介导的核酸装配为7%,而比较2方法为6%。错误装配率随着比较2装配体中的片段数目增加而增加。此外,比较1装配在阴性对照反应中具有高CFU。对24个比较1阴性对照样品(无插入物的载体)的测序表明,每种构建体都是在骨架的各个区域重组到自身的载体。参见图20C和图21B。图20C示出了低覆盖度(白色条)、错误装配(黑色条)、基因中的SNP(水平阴影条)、完美装配(垂直阴影条)和通用(单)尾(方格条)的图。表18示出了来自图20C的数据。与不同的装配方法相比,瓣状内切核酸酶介导的核酸装配导致更有效且更准确的装配。图21B示出了低覆盖度(白色条)、错误装配(黑色条)、基因中的SNP(水平阴影条)、完美装配(垂直阴影条)和通用(单)尾(方格条)的图。

表18.测序数据

实施例17:采用瓣状内切核酸酶介导的核酸装配改善的灵活性

体外无缝装配

使用瓣状内切核酸酶介导的核酸装配确定DNA片段的装配。使用与实施例14中所述类似的反应条件的瓣状内切核酸酶介导的核酸装配用来将2、3和4个线性dsDNA片段装配在一起。在包含瓣状内切核酸酶介导的核酸装配酶混合物的反应中,检测未掺入的起始材料、部分和全长构建体(图21A,泳道1-3、7-9)。在不存在瓣状内切核酸酶介导的核酸装配酶混合物的情况下,在65℃孵育30分钟后,存在起始材料,但没有完全装配的构建体。为了富集全长构建体,使用对全长构建体具有特异性的末端引物位点对反应进行PCR扩增。在不存在瓣状内切核酸酶介导的核酸装配酶混合物的情况下,PCR扩增后未观察到全长构建体(图21A,泳道4-6)。观察到对于全长构建体而言适当大小的产物(图21A,泳道10-12)。瓣状内切核酸酶介导的核酸装配在体外导致正确装配的片段。

一锅组合装配

确定瓣状内切核酸酶介导的核酸装配的特异性。使用九个包含相同通用引物尾的线性DNA片段。设计了40bp的同源性位点,其用于将三个不同的3段式构建体定向装配到相同的载体中。确定用于进行毒性筛选并建立装配基线的每种构建体的单个克隆效率。然后在单个体外装配反应中使用全部九个DNA片段和目的载体。将反应混合物克隆到大肠杆菌中后,挑取192个菌落进行微量制备,随后进行NGS分析。参见图21A、21C和21D,基于克隆单个构建体的预期中值分布为每个构建体31%±3%。

参见图21C,对包含片段1-3(正方形)、片段7-9(三角形)、片段10-12(圆形)的装配体和不正确的装配体(十字形)确定平均CFU。在组合装配后,扩展(spread)增加到±5%(图21C)。在测试的构建体中,96.5%含有正确装配的构建体(图21D)。失败的装配体由片段7-8、片段7-12、片段9-12的全长基因组成。瓣状内切核酸酶介导的核酸装配导致特异性的定向装配。

实施例18.扩增的寡核苷酸群体的克隆

将多个片段装配成基因。与实施例17类似地进行扩增的寡核苷酸群体的克隆。进行重叠延伸PCR以产生超过200个碱基对的双链DNA(dsDNA)片段,以装配到载体中。反应在55℃下进行30分钟,并根据表19中所示的瓣状内切核酸酶介导的核酸装配方法(方法4)进行准备。

表19.反应条件(方法4)

在装配之前(图22A)和瓣状内切核酸酶介导的核酸装配之后(图22B),对扩增的寡核苷酸群体进行下一代测序(NGS)。图22A-22B显示,在瓣状内切核酸酶介导的核酸装配后,没有序列丢失,并且与装配前的扩增的寡核苷酸群体相比,在没有引入明显样品偏差的情况下装配了样品。

实施例19.多重基因装配

使用瓣状内切核酸酶介导的核酸装配方法进行了多重基因装配。将多个序列装配到1个孔中。这些序列包含两个由重叠延伸PCR生成的双链DNA(dsDNA)部分。按照如表19中所述的方法4准备反应,并在55℃下进行30分钟。装配样品,然后克隆到载体中。装配了三个群体:群体11、群体927和群体942。每个群体包含96个单独的克隆,对它们进行Sanger测序以确定存在哪个基因。通过测量完美的序列、具有SNPS的序列、截短的物质或具有区段缺失的序列来确定起始DNA物质的质量。如图23所示,装配的准确性是完美的(没有嵌合基因),并且均匀性/分布良好。

虽然本文已经示出并描述了本发明的优选实施方案,但对于本领域技术人员明显的是,这些实施方案仅通过示例的方式提供。本领域技术人员在不脱离本发明的情况下将会想到许多变化、改变和替代。应当理解,可在实施本发明时采用本文所述本发明实施方案的各种替代方案。旨在以所附权利要求限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。

序列表

<110> 特韦斯特生物科学公司

<120> 无缝核酸装配方法

<130> 44854-746.601

<140>

<141>

<150> 62/663,089

<151> 2018-04-26

<150> 62/518,496

<151> 2017-06-12

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成寡核苷酸

<220>

<221> 修饰的碱基

<222> (51)..(52)

<223> 胸苷-琥珀酰基己酰胺CED亚磷酰胺

<400> 1

agacaatcaa ccatttgggg tggacagcct tgacctctag acttcggcat tttttttttt 60

tt 62

<210> 2

<211> 112

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成多核苷酸

<220>

<221> 修饰的碱基

<222> (101)..(102)

<223> 胸苷-琥珀酰基己酰胺CED亚磷酰胺

<400> 2

cgggatcctt atcgtcatcg tcgtacagat cccgacccat ttgctgtcca ccagtcatgc 60

tagccatacc atgatgatga tgatgatgag aaccccgcat tttttttttt tt 112

<210> 3

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成引物

<400> 3

atgcggggtt ctcatcatc 19

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成引物

<400> 4

cgggatcctt atcgtcatcg 20

89页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:使用三羟基和四羟基季铵化合物作为电泳分离的拆分剂

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!