一种大片段同源重组修复方法

文档序号：62729 发布日期：2021-10-01 浏览：17次 >En<

阅读说明：本技术 一种大片段同源重组修复方法 (Large-fragment homologous recombination repair method ) 是由马石金汪俭肖晓文谢天王早霞杜军于 2021-06-16 设计创作，主要内容包括：本发明属于合成生物学技术领域,是对大片段组装技术的补充,具体涉及一种通过同源重组的方法进行大片段修复的技术。本发明针对大片段上出现的突变,以突变点为中心构建修复片段,基于同源重组理论,直接在质粒上、活细胞内进行针对碱基置换、编码移位、缺失、插入、增加或删减序列等问题的修复,避免了重新合成片段,再次进行组装的繁复过程,减少工艺流程,缩短修复时间,提高合成效率,较少经济成本,具有较高的推广价值和应用前景。(The invention belongs to the technical field of synthetic biology, and relates to a technology for repairing large fragments by a homologous recombination method, which is a supplement to a large fragment assembly technology. Aiming at the mutation appearing on a large fragment, the invention constructs a repair fragment by taking a mutation point as a center, and directly repairs the problems of base replacement, coding shift, deletion, insertion, sequence addition or deletion and the like on a plasmid and in a living cell based on the homologous recombination theory, thereby avoiding the complex process of re-synthesizing the fragment and assembling again, reducing the process flow, shortening the repair time, improving the synthesis efficiency, reducing the economic cost, and having higher popularization value and application prospect.)

一种大片段同源重组修复方法

技术领域

：

本发明属于合成生物学

技术领域

，是对大片段组装技术的补充，具体涉及一种通过同源重组的方法进行大片段修复的技术。

背景技术

：

合成生物学是近年来发展起来的一门新兴学科，其主要目标是通过DNA编码的生物学部件模块来设计构造多样的新装置、网络和生物学路径，其中最关键的是如何合成或改造基因。因此，DNA的合成或修饰便成了合成生物学的关键之处。微生物能合成多样的代谢产物，很多代谢产物的合成酶基因往往成簇存在，且往往较大，通常有几十甚至上百kb，所以很难用化学合成法或PCR方法进行合成。目前，研究人员开发了基于酿酒酵母或大肠杆菌的制备DNA大片段的方法。

酿酒酵母不仅在工业和食品中应用广泛，由于具有遗传背景清晰、同源重组效率高等优点，也在分子生物学研究中广泛应用。作为第一个完整测序的真核微生物，酿酒酵母在分子生物学和生物合成有价值产物中具有重要意义。合成生物学中的大片段组装技术，大多都是基于酿酒酵母细胞的同源重组能力，具体的是将目标大片段预先设计为若干5-8kb的小片段，使用传统的方法构建5-8kb片段，每个片段之间包含70-100bp的同源臂，将所有的片段和线性化载体转化到酿酒酵母细胞中，细胞会识别各个片段之间的同源臂，并进行重组，形成环形的完整质粒。

如中国发明专利201310389392.0，公开了一种多片段DNA的酵母快速组装方法，包括以下步骤：(1)将多个含有同源臂的DNA分子与线性化的酵母穿梭载体共转化酵母；(2)将整个筛选培养板上的全部转化后的酵母菌落洗脱下来，离心，弃上清，得到转化后的酵母菌细胞；(3)提取步骤(2)获得的酵母菌细胞的质粒DNA，转化大肠杆菌感受态细胞；(4)筛选大肠杆菌克隆，得到大片段DNA。该发明的方法组装大片段DNA分子的速度快、简便可行、成功率高、成本低，效率高、易操作，可将多个小片段DNA分子组装成一个大片段DNA分子，有利于进行工业化规模扩大，用途广泛。

合成生物学中的大质粒往往是成串的基因组成，往往很长，从40kb-1000kb不等，因此在复制过程中可能会产生突变；或者是待组装的片段内部也包含有同源序列，导致部分片段丢失；或者在组装过程中往往会根据组装情况或实验需要进行调整，比如增加、删减部分指定序列等。因此，针对大片段合成过程中产生的碱基置换、编码移位、缺失、插入、增加或删减序列等问题，需要对质粒进行修复。本发明之前的传统方法都是重新制备5-8kb片段，再次组装，这导致工作量大大增加。

但基于本发明的技术创新，不必进行繁复的再次组装。

发明内容

：

为了解决上述技术问题，本发明将提供一种大片段修复技术，该技术基于同源重组理论，直接在质粒上、活细胞内进行针对碱基置换、编码移位、缺失、插入、增加或删减序列等问题的修复，避免了重新合成片段，再次进行组装的繁复过程，减少工艺流程，缩短修复时间，提高合成效率，较少经济成本，具有较高的推广价值和应用前景。

所述大片段修复方法，包括如下步骤：

(1)构建修复片段

针对大片段上出现的突变，以突变点为中心构建修复片段，所述修复片段包括：突变位点上游同源臂、突变位点正确序列、突变位点下游基因全长序列、标记基因和载体同源臂；

进一步地，所述的突变位点正确序列可以自突变位点起向上游延伸若干个碱基；

所述的突变位点下游基因全长序列，是指大片段上突变位点下游至大片段3’末端终的一段序列；

或者，所述的修复片段包括：载体同源臂、标记基因、突变位点上游基因全长序列、突变位点正确序列和突变位点下游同源臂；

进一步地，所述的突变位点正确序列可以自向突变位点起向下游延伸若干个碱基；

所述的突变位点上游基因全长序列，是指大片段上突变位点上游至大片段5’末端终的一段序列；

优选地，所述修复片段为上述片段中碱基数量更少的一种；

进一步地，所述上、下游同源臂长度为50-500bp，更优的是200-500bp，最优的是500bp；

进一步地，所述标记基因包括但不限于酵母必须氨基酸营养缺陷型筛选标记、抗生素类筛选标记等；

更进一步地，所述酵母必须氨基酸营养缺陷型筛选标记包括但不限于-Leu、-His、-Trp、-Ade等；

更进一步地，所述抗生素类筛选标记包括但不限于潮霉素、两性霉素B、G418等；

(2)转化修复片段

将修复片段转入带有突变位点大片段的质粒的酵母细胞中，进行同源重组，通过营养缺陷或抗性筛选获得阳性转化子；

(3)修复验证

挑取阳性转化子对突变位点进行测序验证。

有益效果：

本发明针对生物大片段合成过程中出现的基因突变问题提供一种修复技术，该技术可直接在质粒上针对突变问题进行修复，无需重新合成片段，无需重新组装，因此益处是显而易见的：

①修复速度快，待组装的片段越大，节省的时间越多。常规的重新组装的方法，需要重新通过PCR制备各个5-8kb的片段材料，再转化酵母细胞进行组装，转化子进行菌落PCR筛选、测序验证，整个过程需要耗时14-60个工作日不等(片段越大耗时越长)，相当于再次组装一个大片段。但使用本发明的方法，只需要制备一段包含突变位点正确序列，突变位点上、下游同源臂，标记基因的DNA序列，转化到酵母细胞中进行修复，筛选后只需要检测突变位点序列即可，整个流程耗时只需7-10个工作日，大大减少修复时间。

②成本低，组装的成本主要在于5-8kb片段的制备、转化子筛选、测序产生的时间成本、人工成本、物料成本。基于本发明，只需要合成一条DNA，而不必重新PCR扩增制备5-8kb片段，转化子筛选、测序也只需要检测突变部分的DNA序列，因此成本大大低。

③修复效率高，修复只需要转化一条DNA片段到酵母细胞中，相对于多片段转化酵母，转化效率大大提高(此处转化效率理解为：单个片段转化到一个酵母细胞和多个片段同时转化到同一个细胞的效率。可以理解的是，转化所用片段数量越多，它们共同转化到同一个细胞的概率越低。)。此外待转化的片段含有筛选标记，大大提高阳性率。

附图说明

：

图1：预期合成的DNA片段示意图(黑色部分为载体，白色部分为目标合成的DNA)：

图2：实际合成的DNA发生突变示意图：

图3：设计修复片段示意图。

图4：修复片段同源重组示意图。将图3中的修复片段转化到含有突变质粒的酵母细胞中，在发生突变的位点两端发送重组替换进行修复。

图5：重组后正确片段示意图。正确的DNA序列替换错误的DNA序列，也即目标片段符合预期，载体上多了一段筛选标记，不影响目标片段的合成。

图6：20K酵母组装示意图。

图7：测序峰图。

图8：菌落PCR验证。

图9：突变位点测序验证。

具体实施方式

：

下面通过具体的实施方案叙述本发明。除非特别说明，本发明中所用的技术手段均为本领域技术人员所公知的方法。另外，实施方案应理解为说明性的，而非限制本发明的范围，本发明的实质和范围仅由权利要求书所限定。对于本领域技术人员而言，在不背离本发明实质和范围的前提下，对这些实施方案中的物料成分和用量进行的各种改变或改动也属于本发明的保护范围。

本发明提供一种针对DNA大片段组装过程中出现的碱基置换、编码移位、缺失、插入、增加或删减序列等问题的修复方法，该方法通过构建围绕突变位点为中心的修复片段，再将修复片段在酵母细胞中进行同源重组，实现对突变序列的修复。如预期合成的大片段在载体上进行组装后如图1所示，测序后发现突变如图2所示。

上述修复方法的核心为修复片段的构建。

本发明以突变位点为中心构建的修复片段可以是包含自突变位点正确序列起至大片段3’端的基因全长序列，具体地，所述修复片段包括：突变位点上游同源臂、突变位点正确序列、突变位点下游基因全长序列、标记基因和载体同源臂(如图3-A所示)；所述的突变位点正确序列也可以是自突变位点起，向上游延伸1个或多个碱基构成，如，延伸1个碱基，延伸2个碱基，延伸5-10个碱基等；

本发明以突变位点为中心构建的修复片段可以是包含自突变位点正确序列起至大片段5’端的基因全长序列，具体地，所述修复片段包括：载体同源臂、标记基因、突变位点上游基因全长序列、突变位点正确序列和突变位点下游同源臂(如图3-B所示)；所述的突变位点正确序列也可以是自突变位点起，向下游延伸1或多个碱基构成，如，延伸1个碱基，延伸2个碱基，延伸5-10个碱基等；

可以理解的是，为了节省成本，优选的选择上述两种修复片段中碱基数量更少的一种。如待合成的大片段为100kb，实际合成中在自5’端至3’端的第90kb处发生碱基置换，则优先的修复片段是包含自突变位点正确序列起至大片段3’端的基因全长序列，具体地，所述修复片段包括：突变位点上游同源臂、突变位点正确序列至大片段3’端的基因全长序列、标记基因和载体同源臂。

在本发明中，通过将修复片段转化到含有突变位点的质粒的酵母细胞中进行同源重组进行修复(如图4-A、4-B所示)，所采用的转化方法可以是PEG-LiAc法、电转化法、原生质体法等，可以理解的是，可采用任何可将替换的DNA片段成功转化到活的酵母细胞中的转化方法。

在本发明中，为了提高修复片段阳性转化子的筛选效率，修复片段中还添加有标记基因，所述标记基因包括但不限于酵母必须氨基酸营养缺陷型筛选标记、抗生素类筛选标记等；所述酵母必须氨基酸营养缺陷型筛选标记包括但不限于-Leu、-His、-Trp、-Ade等；所述抗生素类筛选标记包括但不限于潮霉素、两性霉素B、G418等。

在本发明中，为了确保大片段的成功修复，在筛选阳性转化子后还需对修复片段进行测序验证，此处仅需要检测突变位点序列即可，不需要对全长大片段序列进行测序，可以进一步提高效率，降低成本。针对突变位点的检测方法为本领域的常规技术手段，本领域技术人员可自行设计突变位点附近的同源臂，扩增成功后测序即可获得确认结果。修复后的含有大片段的质粒如图5所示。

以下将通过具体实施方式对本发明作进一步地解释说明。

实施例1一种针对大片段中碱基突变进行修复的方法

大片段合成目标为Y21968-34，片段长度约为20K；分成A，B，C，D四个5K左右大小的片段进行酵母组装(组装方法参考专利201310389392.0《多片段DNA的酵母快速组装方法》进行)，方案如图6所示。

组装完成后，扩增产物测序发现片段D中靠近末端有一部分序列发生插入突变，一小段DNA插入(插入的序列为：GAGACCTTGGAACCGGTCTCAGGA如图7测序峰图显示)。

针对上述插入突变，采用如下方法进行修复：

1、根据目标DNA序列以插入突变位置为中心搭建修复片段，修复片段组成如下(修复片段序列如SEQ ID NO.3所示)：

(1)突变位点正确序列的上游同源臂300bp；

(2)突变位点正确序列及下游基因全长序列，即从插入位点开始向上延伸一个碱基(ACCTGGCTGA)再向3’端延伸至D片段末尾处的核苷酸序列；

(3)标记基因：酵母营养缺陷型-LEU筛选标记；

(4)载体同源臂300bp；

2、酵母转化

(1)全基因合成上述修复片段，通过PCR制备5μg所述片段；

(2)通过PEG-LiAc法将上述片段转化到带有突变位点的质粒的酵母细胞中进行重组修复。

(3)菌落PCR鉴定：取15个转化子进行菌落PCR鉴定，结果如图8所示，可以观察到这15个转化子均为阳性(由于是酵母菌落直接扩增，挑取的菌量也有多有少，因此图8中扩增的有一部分菌p有二聚体，但不影响阳性转化子的验证)；

(4)对突变位点进行测序，使用引物：CCGCTAAACTGATCCACCCGACCATGC，Sanger一代测序测一个反应(注：一个反应测得800-1000bp序列)，结果如图9所示，可以观察到错误的序列已经被成功修复。

以下为本实施例修复序列的说明：

(1)目标DNA突变位点附近的预期的DNA序列，即正确的DNA序列(SEQ ID NO.1)

ATGGGTAAAAAAGCTGAATACGGTCAGGGTCACCCGATCTTCCTGGAATACGCTGAACAGATCATCCAGCACAAAGAATACCAGGGTATGCCGGACCTGCGTTACCCGGACGGTCGTATCCAGTGGGAAGCTCCGTCTAACCGTAAATCTGGTATCTTCAAAGACACCAACATCAAACGTCGTAAATGGTGGGAACAGAAAGCTATCTCTATCGGTATCGACCCGTCTTCTAACCAGTGGATCTCTAAAACCGCTAAACTGATCCACCCGACCATGCGTAAACCGTGCAAAAAATGCGGTCGTATCATGGACCTGCGTTACTCTTACCCGACCAAAAACCTGATCAAACGTATCCGTAAACTGCCGTACGTTGACGAATCTTTCGAAATCGACTCTCTGGAACACATCCTGAAACTGATCAAACGTCTGGTTCTGCAGTACGGTGACAAAGTTTACGACGACCTGCCGAAACTGCTGACCTGCAAAGCTGTTAAAAACATCCCGCGTCTGGGTAACGACCTGGACACCTGGCTGAACTGGATCGACTCTGTTTACATCCCGTCTGAACCGTCTATGCTGTCTCCGGGTGCTATGGCTAACCCGCCGGACCGTCTGGACGGTTTCCACTCTCTGAACGAATGCTGCCGTTCTCACGCTGACCGTGGTCGTTGGGAAAAAAACCTGCGTTCTTACACCACCGACCGTCGTGCTTTCGAATACTGGGTTGACGGTGACTGGGTTGCTGCTGACAAACTGATGGGTCTGATCCGTACCAACGAACAGATCAAAAAAGAAACCTGCCTGAACGACAACCACCCGGGTCCGTGCTCTGCTGACCACATCGGTCCGATCTCTCTGGGTTTCGTTCACCGTCCGGAATTCCAGCTGCTGTGCAACTCTTGCAACTCTGCTAAAAACAACCGTATGACCTTCTCTGACGTTCAGCACCTGATCAACGCTGAAAACAACGGTGAAGAAGTTGCTTCTTGGTACTGCAAACACATCTGGGACCTGCGTAAACACGACGTTAAAAACAACGAAAACGCTCTGCGTCTGTCTAAAATCCTGCGTGACAACCGTCACACCGCTATGTTCATCCTGTCTGAACTGCTGAAAGACAACCACTACCTGTTCCTGTCTACCTTCCTGGGTCTGCAGTACGCTGAACGTTCTGTTTCTTTCTCTAACATCAAAATCGAAAACCACATCATCACCGGTCAGATCTCTGAACAGCCGCGTGACACCAAATACACCGAAGAACAGAAAGCTCGTCGTATGCGTATCGGTTTCGAAGCTCTGAAATCTTACATCGAAAAAGAAAACCGTAACGCTCTGCTGGTTATCAACGACAAAATCATCGACAAAATCAACGAAATCAAAAACATCCTGCAGGACATCCCGGACGAATACAAACTGCTGAACGAAAAAATCTCTGAACAGTTCAACTCTGAAGAAGTTTCTGACGAACTGCTGCGTGACCTGGTTACCCACCTGCCGACCAAAGAATCTGAACCGGCTAACTTCAAACTGGCTCGTAAATACCTGCAGGAAATCATGGAAATCGTTGGTGACGAACTGTCTAAAATGTGGGAAGACGAACGTTACGTTCGTCAGACCTTCGCTGACCTGGAC(后接载体)

(2)组装后发生错误部分的序列(SEQ ID NO.2)

ATGGGTAAAAAAGCTGAATACGGTCAGGGTCACCCGATCTTCCTGGAATACGCTGAACAGATCATCCAGCACAAAGAATACCAGGGTATGCCGGACCTGCGTTACCCGGACGGTCGTATCCAGTGGGAAGCTCCGTCTAACCGTAAATCTGGTATCTTCAAAGACACCAACATCAAACGTCGTAAATGGTGGGAACAGAAAGCTATCTCTATCGGTATCGACCCGTCTTCTAACCAGTGGATCTCTAAAACCGCTAAACTGATCCACCCGACCATGCGTAAACCGTGCAAAAAATGCGGTCGTATCATGGACCTGCGTTACTCTTACCCGACCAAAAACCTGATCAAACGTATCCGTAAACTGCCGTACGTTGACGAATCTTTCGAAATCGACTCTCTGGAACACATCCTGAAACTGATCAAACGTCTGGTTCTGCAGTACGGTGACAAAGTTTACGACGACCTGCCGAAACTGCTGACCTGCAAAGCTGTTAAAAACATCCCGCGTCTGGGTAACGACCTGGACAgagaccttggaaccggtctcaggacaCCTGGCTGAACTGGATCGACTCTGTTTACATCCCGTCTGAACCGTCTATGCTGTCTCCGGGTGCTATGGCTAACCCGCCGGACCGTCTGGACGGTTTCCACTCTCTGAACGAATGCTGCCGTTCTCACGCTGACCGTGGTCGTTGGGAAAAAAACCTGCGTTCTTACACCACCGACCGTCGTGCTTTCGAATACTGGGTTGACGGTGACTGGGTTGCTGCTGACAAACTGATGGGTCTGATCCGTACCAACGAACAGATCAAAAAAGAAACCTGCCTGAACGACAACCACCCGGGTCCGTGCTCTGCTGACCACATCGGTCCGATCTCTCTGGGTTTCGTTCACCGTCCGGAATTCCAGCTGCTGTGCAACTCTTGCAACTCTGCTAAAAACAACCGTATGACCTTCTCTGACGTTCAGCACCTGATCAACGCTGAAAACAACGGTGAAGAAGTTGCTTCTTGGTACTGCAAACACATCTGGGACCTGCGTAAACACGACGTTAAAAACAACGAAAACGCTCTGCGTCTGTCTAAAATCCTGCGTGACAACCGTCACACCGCTATGTTCATCCTGTCTGAACTGCTGAAAGACAACCACTACCTGTTCCTGTCTACCTTCCTGGGTCTGCAGTACGCTGAACGTTCTGTTTCTTTCTCTAACATCAAAATCGAAAACCACATCATCACCGGTCAGATCTCTGAACAGCCGCGTGACACCAAATACACCGAAGAACAGAAAGCTCGTCGTATGCGTATCGGTTTCGAAGCTCTGAAATCTTACATCGAAAAAGAAAACCGTAACGCTCTGCTGGTTATCAACGACAAAATCATCGACAAAATCAACGAAATCAAAAACATCCTGCAGGACATCCCGGACGAATACAAACTGCTGAACGAAAAAATCTCTGAACAGTTCAACTCTGAAGAAGTTTCTGACGAACTGCTGCGTGACCTGGTTACCCACCTGCCGACCAAAGAATCTGAACCGGCTAACTTCAAACTGGCTCGTAAATACCTGCAGGAAATCATGGAAATCGTTGGTGACGAACTGTCTAAAATGTGGGAAGACGAACGTTACGTTCGTCAGACCTTCGCTGACCTGGAC(后接载体)

(3)修复片段(SEQ ID NO.3)

TCTTCTAACCAGTGGATCTCTAAAACCGCTAAACTGATCCACCCGACCATGCGTAAACCGTGCAAAAAATGCGGTCGTATCATGGACCTGCGTTACTCTTACCCGACCAAAAACCTGATCAAACGTATCCGTAAACTGCCGTACGTTGACGAATCTTTCGAAATCGACTCTCTGGAACACATCCTGAAACTGATCAAACGTCTGGTTCTGCAGTACGGTGACAAAGTTTACGACGACCTGCCGAAACTGCTGACCTGCAAAGCTGTTAAAAACATCCCGCGTCTGGGTAACGACCTGGAC(上游同源臂300bp)ACCTGGCTGAACTGGATCGACTCTGTTTACATCCCGTCTGAACCGTCTATGCTGTCTCCGGGTGCTATGGCTAACCCGCCGGACCGTCTGGACGGTTTCCACTCTCTGAACGAATGCTGCCGTTCTCACGCTGACCGTGGTCGTTGGGAAAAAAACCTGCGTTCTTACACCACCGACCGTCGTGCTTTCGAATACTGGGTTGACGGTGACTGGGTTGCTGCTGACAAACTGATGGGTCTGATCCGTACCAACGAACAGATCAAAAAAGAAACCTGCCTGAACGACAACCACCCGGGTCCGTGCTCTGCTGACCACATCGGTCCGATCTCTCTGGGTTTCGTTCACCGTCCGGAATTCCAGCTGCTGTGCAACTCTTGCAACTCTGCTAAAAACAACCGTATGACCTTCTCTGACGTTCAGCACCTGATCAACGCTGAAAACAACGGTGAAGAAGTTGCTTCTTGGTACTGCAAACACATCTGGGACCTGCGTAAACACGACGTTAAAAACAACGAAAACGCTCTGCGTCTGTCTAAAATCCTGCGTGACAACCGTCACACCGCTATGTTCATCCTGTCTGAACTGCTGAAAGACAACCACTACCTGTTCCTGTCTACCTTCCTGGGTCTGCAGTACGCTGAACGTTCTGTTTCTTTCTCTAACATCAAAATCGAAAACCACATCATCACCGGTCAGATCTCTGAACAGCCGCGTGACACCAAATACACCGAAGAACAGAAAGCTCGTCGTATGCGTATCGGTTTCGAAGCTCTGAAATCTTACATCGAAAAAGAAAACCGTAACGCTCTGCTGGTTATCAACGACAAAATCATCGACAAAATCAACGAAATCAAAAACATCCTGCAGGACATCCCGGACGAATACAAACTGCTGAACGAAAAAATCTCTGAACAGTTCAACTCTGAAGAAGTTTCTGACGAACTGCTGCGTGACCTGGTTACCCACCTGCCGACCAAAGAATCTGAACCGGCTAACTTCAAACTGGCTCGTAAATACCTGCAGGAAATCATGGAAATCGTTGGTGACGAACTGTCTAAAATGTGGGAAGACGAACGTTACGTTCGTCAGACCTTCGCTGACCTGGAC(突变位点正确序列及下游基因全长序列)

AACTGTGGGAATACTCAGGTATCGTAAGATGCAAGAGTTCGAATCTCTTAGCAACCATTATTTTTTTCCTCAACATAACGAGAACACACAGGGGCGCTATCGCACAGAATCAAATTCGATGACTGGAAATTTTTTGTTAATTTCAGAGGTCGCCTGACGCATATACCTTTTTCAACTGAAAAATTGGGAGAAAAAGGAAAGGTGAGAGCGCCGGAACCGGCTTTTCATATAGAATAGAGAAGCGTTCATGACTAAATGCTTGCATCACAATACTTGAAGTTGACAATATTATTTAAGGACCTATTGTTTTTTCCAATAGGTGGTTAGCAATCGTCTTACTTTCTAACTTTTCTTACCTTTTACATTTCAGCAATATATATATATATTTCAAGGATATACCATTCTAATGTCTGCCCCTAAGAAGATCGTCGTTTTGCCAGGTGACCACGTTGGTCAAGAAATCACAGCCGAAGCCATTAAGGTTCTTAAAGCTATTTCTGATGTTCGTTCCAATGTCAAGTTCGATTTCGAAAATCATTTAATTGGTGGTGCTGCTATCGACGCTACAGGTGTCCCACTTCCAGATGAGGCGCTGGAAGCCTCCAAGAAGGTTGATGCCGTTTTGTTAGGTGCTGTGGGTGGTCCTAAATGGGGTACAGGTAGTGTTAGACCTGAACAAGGTTTACTAAAAATCCGTAAAGAACTTCAATTGTACGCCAACTTAAGACCATGTAACTTTGCATCCGACTCTCTTTTAGACTTATCTCCAATCAAGCCACAATTTGCTAAAGGTACTGACTTCGTTGTTGTCAGAGAATTAGTGGGAGGTATTTACTTTGGTAAGAGAAAGGAAGACGATGGTGATGGTGTCGCTTGGGATAGTGAACAATACACCGTTCCAGAAGTGCAAAGAATCACAAGAATGGCCGCTTTCATGGCCCTACAACATGAGCCACCATTGCCTATTTGGTCCTTGGATAAAGCTAATGTTTTGGCCTCTTCAAGATTATGGAGAAAAACTGTGGAGGAAACCATCAAGAACGAATTTCCTACATTGAAGGTTCAACATCAATTGATTGATTCTGCCGCCATGATCCTAGTTAAGAACCCAACCCACCTAAATGGTATTATAATCACCAGCAACATGTTTGGTGATATCATCTCCGATGAAGCCTCCGTTATCCCAGGTTCCTTGGGTTTGTTGCCATCTGCGTCCTTGGCCTCTTTGCCAGACAAGAACACCGCATTTGGTTTGTACGAACCATGCCACGGTTCTGCTCCAGATTTGCCAAAGAATAAGGTCAACCCTATCGCCACTATCTTGTCTGCTGCAATGATGTTGAAATTGTCATTGAACTTGCCTGAAGAAGGTAAGGCCATTGAAGATGCAGTTAAAAAGGTTTTGGATGCAGGTATCAGAACTGGTGATTTAGGTGGTTCCAACAGTACCACCGAAGTCGGTGATGCTGTCGCCGAAGAAGTTAAGAAAATCCTTGCTTAA(酵母营养缺陷型-LEU筛选标记)ggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcgccggcggctgctaacaaagcccgaaaggaagctgagttggctgctgccaccgctgagcaataactagcataaccccttggggcctctaaacgggtcttgaggggttttttgctgaaaggaggaactatatccggatgaccgacctgtccggtgccctgaatgaactgcaggacgagtaatcacactggctcaccttcgggtgggcctttctgcgtttatgctagtgataataagtgactgaggtatgtgc(载体同源臂300bp)

实施例2缺失、置换的修复

同理的，若实施例1中错误插入序列gagaccttggaaccggtctcaggaca处为缺失、置换等情形，也可采用上述同样的方法构建修复序列，转化入酵母细胞中通过同源重组的方式进行修复。

例如正确的序列为……AgagaccttggaaccggtctcaggacaCCTGGCTGA……，在组装过程中缺失了gagaccttggaaccggtctcaggaca部分，则突变位点正确序列为从插入位点向上延伸一个碱基开始(AgagaccttggaaccggtctcaggacaCCTGGCTGA)向3’端延伸至D片段末尾处的核苷酸序列，修复片段的其余部分同上；

例如正确的序列为……AgagagaccttggaaccggtctcaggacaCCTGGCTGA……，在组装过程中突变为AxxxxxxxxxxxxCCTGGCTGA，则突变位点正确序列为从插入位点向上延伸一个碱基开始(AgagagaccttggaaccggtctcaggacaCCTGGCTGA)向3’端延伸至D片段末尾处的核苷酸序列，修复片段的其余部分同上。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本专利构思的前提下，上述各实施方式还可以做出若干变形、组合和改进，这些都属于本专利的保护范围。因此，本专利的保护范围应以权利要求为准。

SEQUENCE LISTING

<110> 北京擎科生物科技有限公司

<120> 一种大片段同源重组修复方法

<130> 1

<160> 3

<170> PatentIn version 3.5

<210> 1

<211> 1632

<212> DNA

<213> 人工序列

<400> 1

atgggtaaaa aagctgaata cggtcagggt cacccgatct tcctggaata cgctgaacag 60

atcatccagc acaaagaata ccagggtatg ccggacctgc gttacccgga cggtcgtatc 120

cagtgggaag ctccgtctaa ccgtaaatct ggtatcttca aagacaccaa catcaaacgt 180

cgtaaatggt gggaacagaa agctatctct atcggtatcg acccgtcttc taaccagtgg 240

atctctaaaa ccgctaaact gatccacccg accatgcgta aaccgtgcaa aaaatgcggt 300

cgtatcatgg acctgcgtta ctcttacccg accaaaaacc tgatcaaacg tatccgtaaa 360

ctgccgtacg ttgacgaatc tttcgaaatc gactctctgg aacacatcct gaaactgatc 420

aaacgtctgg ttctgcagta cggtgacaaa gtttacgacg acctgccgaa actgctgacc 480

tgcaaagctg ttaaaaacat cccgcgtctg ggtaacgacc tggacacctg gctgaactgg 540

atcgactctg tttacatccc gtctgaaccg tctatgctgt ctccgggtgc tatggctaac 600

ccgccggacc gtctggacgg tttccactct ctgaacgaat gctgccgttc tcacgctgac 660

cgtggtcgtt gggaaaaaaa cctgcgttct tacaccaccg accgtcgtgc tttcgaatac 720

tgggttgacg gtgactgggt tgctgctgac aaactgatgg gtctgatccg taccaacgaa 780

cagatcaaaa aagaaacctg cctgaacgac aaccacccgg gtccgtgctc tgctgaccac 840

atcggtccga tctctctggg tttcgttcac cgtccggaat tccagctgct gtgcaactct 900

tgcaactctg ctaaaaacaa ccgtatgacc ttctctgacg ttcagcacct gatcaacgct 960

gaaaacaacg gtgaagaagt tgcttcttgg tactgcaaac acatctggga cctgcgtaaa 1020

cacgacgtta aaaacaacga aaacgctctg cgtctgtcta aaatcctgcg tgacaaccgt 1080

cacaccgcta tgttcatcct gtctgaactg ctgaaagaca accactacct gttcctgtct 1140

accttcctgg gtctgcagta cgctgaacgt tctgtttctt tctctaacat caaaatcgaa 1200

aaccacatca tcaccggtca gatctctgaa cagccgcgtg acaccaaata caccgaagaa 1260

cagaaagctc gtcgtatgcg tatcggtttc gaagctctga aatcttacat cgaaaaagaa 1320

aaccgtaacg ctctgctggt tatcaacgac aaaatcatcg acaaaatcaa cgaaatcaaa 1380

aacatcctgc aggacatccc ggacgaatac aaactgctga acgaaaaaat ctctgaacag 1440

ttcaactctg aagaagtttc tgacgaactg ctgcgtgacc tggttaccca cctgccgacc 1500

aaagaatctg aaccggctaa cttcaaactg gctcgtaaat acctgcagga aatcatggaa 1560

atcgttggtg acgaactgtc taaaatgtgg gaagacgaac gttacgttcg tcagaccttc 1620

gctgacctgg ac 1632

<210> 2

<211> 1658

<212> DNA

<213> 人工序列

<400> 2