一种分离和富集以及从头组装mhc基因的方法

文档序号:1516812 发布日期:2020-02-11 浏览:16次 >En<

阅读说明:本技术 一种分离和富集以及从头组装mhc基因的方法 (Method for separating, enriching and de novo assembling MHC genes ) 是由 刘贇 邱文青 李陶陶 杜多 张丹丹 于 2019-10-27 设计创作,主要内容包括:本发明属于生物化学与分子生物学技术领域,具体为一种分离和富集以及从头组装人类主要组织相容性复合体基因的方法。本发明方法是基于CRISPR/cas9和脉冲场凝胶电泳(PFGE)系统,对MHC区域大片段DNA进行分离,对目标区域进行有效富集,利用10X Genomics平台进行长片段DNA测序,通过基因的从头组装获得N50 scaffold &gt;0.9 Mb的MHC单体型,并且覆盖度达到整个4.6M MHC区域的90%以上;相较于传统二代测序组装技术,本发明方法具有明显的优越性。(The invention belongs to the technical field of biochemistry and molecular biology, and particularly relates to a method for separating, enriching and de novo assembling human major histocompatibility complex genes. The method is based on CRISPR/cas9 and a Pulse Field Gel Electrophoresis (PFGE) system, large-fragment DNA in an MHC region is separated, a target region is effectively enriched, a 10X Genomics platform is utilized to carry out long-fragment DNA sequencing, an MHC haplotype of N50 scaffold &gt;0.9 Mb is obtained through the assembly of genes from the head, and the coverage degree reaches more than 90 percent of the whole 4.6M MHC region; compared with the traditional next generation sequencing and assembling technology, the method has obvious superiority.)

一种分离和富集以及从头组装MHC基因的方法

技术领域

本发明属于生物化学与分子生物学技术领域,具体涉及一种从头组装人类主要组织相容性复合体基因的方法。

背景技术

主要组织相容性复合体(MHC)是由一组高度多态性基因组成的染色体区域,其基因产物在不同的细胞表面表达,称之为MHC分子或MHC抗原,因这些抗原在器官移植中代表供受双方的组织相容程度,亦称为组织相容性抗原。人类主要组织相容性复合体为HLA基因系统,位于6号染色体短臂6p21.3区,是由一系列紧密连锁的基因座位所组成的具有高度多态性的遗传复合体,在人体免疫应答及免疫调节中起关键作用。

近年来许多研究表明,MHC基因与一些自身免疫病,如1型糖尿病、类风湿性关节炎、强直性脊柱炎、乳糜泻等相关联,同时一些感染性疾病如结核、麻风和HIV/AIDS等也与HLA有一定的关联。大量的外显子测序(WES)研究表明,在头颈癌、鳞状细胞肺癌、胃腺癌中发现HLA 1类基因的高频体细胞突变。HLA复合体中很多基因座位的DNA序列在人群中存在许多变异体,也就是等位基因。HLA 1类基因具有丰富的等位基因,这些等位基因可以将内源性的抗原提呈到细胞表面,供细胞毒性T细胞识别杀伤。在一些癌症的发展进程中,HLA基因的体细胞突变可能导致这一过程的紊乱从而形成免疫逃逸。因而在某些疾病中对于HLA等位基因的研究至关重要。

传统的,确定HLA基因型的方法如血清学分型、细胞学分型等技术,由于分型抗体亲和性低,缺乏单价抗血清以及操作繁琐等原因,使得此类技术无法大规模应用。由于MHC区域各基因单倍型组合的高度多样性以及不同水平的连锁不平衡性,使得基于PCR的分型方法,如PCR-SSP、PCR-SSO 、PCR-SBT等技术无法满足HLA单倍型分析的需要。另外,由于HLA基因GC碱基含量丰富,捕获以及扩增效率低,在全基因组测序中,HLA区域覆盖度低,导致一些重要的等位基因信息被丢失。而传统的HLA捕获测序由于基于已有的参考序列设计捕获探针,会导致个体所特有的某些等位基因信息被忽略。

发明内容

本发明的目的在于提供一种不依赖已有的参考序列,能够得到完整MHC单体型信息的分离和富集以及从头组装人类主要组织相容性复合体(MHC)基因的方法。

本发明提供的分离和富集以及从头组装MHC基因的方法,是基于CRISPR/cas9和脉冲场凝胶电泳(PFGE)系统,对MHC区域大片段DNA进行分离,对目标区域进行有效富集,利用10X Genomics平台进行长片段DNA测序,通过基因的从头组装获得N50 scaffold >0.9 Mb的MHC单体型,并且覆盖度达到整个4.6M MHC区域的90%以上;具体步骤如下:

(1)将细胞包埋至低熔点(一般指熔点低于70℃)琼脂糖中,通过制胶模具形成体积约为85ul,包含约1-5 x 106个细胞的长方形胶块,对胶块内的细胞进行蛋白酶K消化处理;

(2)利用EnGen sgRNA试剂盒在体外转录合成sgRNA,利用CRISPR/cas9系统,体外37℃对胶块内的DNA进行切割处理1-3小时,4℃反应终止处理1小时以上(例如为1-3小时);

(3)利用脉冲场凝胶电泳系统分离MHC大片段DNA;

(4)将分离出的含有MHC 基因的胶块放置在低熔点胶中进行电泳浓缩,利用琼脂糖酶及透析膜回收分离出来的大片段DNA;

(5)Q-PCR检测DNA富集效率,以及从头组装MHC序列,获得HLA单倍型信息。

步骤(1)中,所述细胞为GM12878、GM12891或GM12892等细胞系,以及各种例如血液,肿瘤等组织分离出的细胞样品。

步骤(2)中, sgRNA位置在MHC区域的两端及中间,仅3处(见后sgRNA靶向示意图)切割位置,能够保证得到两段2.3M 的大片段MHC DNA,共同构成约4.6M的完整MHC区域。

步骤(3)中,对于大片段MHC DNA的分离采用的是脉冲场凝胶电泳的方法。

步骤(4)中,将DNA电泳到低熔点琼脂糖胶中,再通过琼脂糖酶以及透析膜点滴透析的方法进行大片段DNA的回收。

步骤(5)中,对于MHC序列的组装,是不依赖已有的参考序列,从头组装,得到单个个体的MHC 单体型信息。

根据本发明方法获得的MHC单体型,覆盖率达到整个4.6M MHC区域的90%以上;相较于传统二代测序组装技术,本发明方法具有明显的优越性。

附图说明

图1为本发明方法流程图。

图2为sgRNA 靶向位置示意图。

图3为回收MHC大片段图。

图4为MHC Q-PCR富集图。其中,HFE,up-1kb基因为MHC区域上游基因,RNF8,down-1kb基因为MHC区域下游基因。GM12878基因组DNA作为对照。

图5为单倍型组装结果图。其中,蓝色和红色分别代表父母本单体型,经典的HLA-I类(HLA-A, HLA-B and HLA-C) 与 II 类 (HLA-DRB1, HLA-DQA1 and HLA-DQB1)基因在坐标中标注。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合具体实施例,对本发明进一步详细说明。应当理解,所描述的实施例仅仅用以解释本发明,并不用于限定本发明。以下实施例中所涉及的试剂或仪器,如无特别说明均为市售,所涉及检测方法如无特别说明,则均为常规方法。下面的实例是结合GM12878细胞株对本发明的方法进行进一步说明。

实施例1:细胞胶块包埋

1.1、GM12878细胞株:GM12878细胞在5% CO2和37°C培养箱中培养,培养基为RPMI-1640培养基(Life Technologies, Carlsbad, CA, USA),里面加有浓度为10% 的胎牛血清(Life Technologies),1%的青霉素/链霉素(Life Technologies),每两天以1:5比例传代细胞,并检测一下支原体。

1.2、用L buffer(0.1M EDTA(pH 8.0);0.01M Tris-Cl(pH 7.6);0.02M NaCl)配制浓度为1.2% 的低熔点琼脂糖胶(Bio-Rad,A600015),融化后的琼脂糖胶在42℃水浴锅中冷却。

1.3、GM12878细胞悬浮液300g离心 5 分钟,去上清,细胞沉淀用预冷的PBS重悬,此过程重复3次,最终细胞以2 x 107/mL浓度重悬于预冷的L buffer中,放置42℃水浴锅中预热5分钟,与等体积的低熔点琼脂糖胶混合均匀后,转移至制胶模具中(Bio-Rad,1703713)中,4℃放置15-30分钟。

1.4、凝固的细胞胶块转移至3倍胶块体积的含有L buffer、0.5mg/ml 蛋白酶K以及1%(w/v)月桂酰基肌氨酸钠(Sarkosyl)溶液中,50℃孵育。3小时后更换成新的2倍胶块体积的含有L buffer、0.5mg/ml 蛋白酶K以及1%(w/v)月桂酰基肌氨酸钠(Sarkosyl)溶液中,50℃孵育12-16小时。

1.5、胶块转移至50倍体积的TE(pH 7.6)中,室温轻柔摇晃洗涤3小时,期间更换2-4次新的TE(pH 7.6)。

1.6、胶块转移至2倍体积含有1mg/mL PMSF的TE(pH 7.6)中,50℃孵育30 分钟。更换新的2倍体积含有1mg/mL PMSF的TE(pH 7.6),室温孵育1小时。

1.7、胶块转移至50倍体积的TE(pH 7.6)中,室温轻柔摇晃洗涤3小时,期间更换2-4次新的TE(pH 7.6)。

1.8、4℃保存处理好的细胞胶块于TE(pH 7.6)中。

实施例2:sgRNAs的设计与合成

2.1、针对经典MHC上游3k区域,下游1k区域以及中间1/2处(图2)通过CRISPRdirect(https://crispr.dbcls.jp)网站设计sgRNA,通过cas9核酸酶切割,将得到两段2.3M大小左右的大片段DNA,共同构成约4.6M的完整MHC区域。sgRNA序列信息如下表1所示:

表1.sgRNA序列

Figure 669033DEST_PATH_IMAGE002

2.2 、采用EnGen sgRNA试剂盒(NEB,E3322S)体外转录合成sgRNA,RNA Clean &Concentrator™- 25试剂盒(Zymo Research,R1017)纯化sgRNA。

实施例3:体外CRISPR/cas9切割基因组DNA

3.1、使用试剂盒(NEB,M0386T)进行体外CRISPR/cas9切割胶块内基因组DNA。100 ul反应体系中,包含同比例加入的上中下游sgRNA至总浓度为40nM,cas9核酸酶40nM,1X cas9buffer ,1/2体积的胶块(体积约40ul),RNA酶抑制剂(Thermo Fisher)1U/ul。

3.2、胶块提前用10 mM Tris-HCl(PH 7.6)室温旋转洗涤3次,每次10min,提前用1X cas9 buffer(NEB) 4℃处理2-16小时。

3.3、1X cas9 buffer ,sgRNA,cas9核酸酶,RNA酶抑制剂提前预混,37℃孵育15min。

3.4、在预混体系中加入细胞胶块,37℃孵育2小时,去除反应液,加入60 ul终止反应液(L buffer、1mg/ml 蛋白酶K以及1%(w/v)月桂酰基肌氨酸钠),4℃孵育1小时。

实施例4:脉冲场凝胶电泳分离MHC DNA

4.1、使用H.wingei CHEF DNA Size Marker(Bio-Rad, 1703667)作为DNA条带大小参照。

4.2、将胶块整齐排列在横放的制胶梳子上,待胶块不会滑落后竖立梳子,倒入由ERT MEGABASE AGAROSE(Bio-Rad, 1613109)与1X TAE配制0.8%的分离胶(提前放在50℃水浴锅中冷却),室温放置约30分钟,待胶凝固。

4.3、将凝固的分离胶转移至脉冲场电泳槽中,电泳槽中提前加入约2L的1X TAE电泳液,冷却至14℃。

4.4、电泳条件设置为:Voltage Gradient:3V/cm;Angle:106°;Run time:48h;Switch Time:500s。

4.5、电泳结束后,使用3X Gel-Green(翌圣)进行胶块染色30分钟,在蓝光透射仪上分离出含有2.3M大小片段的胶块区域,将其放置在4% 低熔点胶中。

4.6、将低熔点胶放置在电泳槽中,电泳条件设置为:Voltage Gradient:3V/cm;Angle:106°;Run time:16.5h;Switch Time:500s。

4.7、电泳结束后,使用3X Gel-Green(翌圣)进行胶块染色30分钟,在蓝光透射仪上分离出跑到低熔点胶里的DNA。

实施例5:点滴透析法回收大片段DNA ,以及Q-PCR检测富集效率

5.1、于70℃金属浴中融化低熔点胶10分钟,将融化的胶转移至42℃,孵育5分钟。

5.2、每100mg的4% 低熔点胶加入8 ul 0.5U/ul 琼脂糖酶,轻柔地混合均匀,42℃孵育45分钟。

5.3、在6cm 培养皿中加入15ml TE buffer,将0.1um透析膜平铺在TE buffer表面,使膜水化10min 。

5.4、用宽口枪头将已消化的DNA样品转移到透析膜上,室温透析45分钟。

5.5、用宽口枪头将透析结束的DNA样品转移到新的1.5ml EP管中,取出2 ul,用Qubit 定量DNA浓度。

5.6、通过Q-PCR 验证MHC 区域TCF19、MUC21、MICB基因相比较于MHC上游区域HFE基因、下游RNF8基因的富集程度,Q-PCR引物如表2所示:

表2. Q-PCR引物

Figure 992698DEST_PATH_IMAGE004

共收集3批GM12878细胞的MHC区域基因,通过Q-PCR 验证TCF19、MUC21、MICB基因相较于HFE基因富集效率分别为59.9,59.7,48.5倍,相较于下游RNF8基因富集效率分别为43.9,33.7,44倍,说明我们的MHC区域基因得到了有效的富集。

实施例6:10X Genomics测序及数据分析

6.1、回收富集得到的MHC DNA进行脉冲场凝胶电泳,电泳条件设置为:VoltageGradient:6V/cm;Angle:120°;Run time:22h;Switch Time:50-90s,0.5X TBE buffer,1%agarose(Bio-Rad, 1613109),结果显示,DNA片段大小集中在50-200kb之间(图3),大小符合10X Genomics测序平台要求,最终以200pg起始量进行建库测序。

6.2、测序数据根据10X Genomics官网分析流程进行处理,利用Supernovaassembler v2.0.0 (10× Genomics)软件,成功组装出了两个N50 scaffold sizes 均大于0.88M 的GM12878 HLA基因组的单体型(图4),并且我们对于HLA 4.6M区域的覆盖率达到了90%以上,成功找到27个等位基因,这是使用传统二代测序技术所达不到的。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 复旦大学

<120> 一种分离和富集以及从头组装MHC基因的方法

<130> 001

<160> 21

<170> SIPOSequenceListing 1.0

<210> 1

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gttggctgta atcctacgcc 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

catgttccac gcccttgcag 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ctggttttac acatcgctgg 20

<210> 4

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

actgttccca gacggaaaac 20

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aagatgcatt gagctctgcg 20

<210> 6

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggcagagccc cgtgcatcct 20

<210> 7

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ggtagcctga gacttcgtaa 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ttccaacagg agtcttacct 20

<210> 9

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

agagaaacac cgaaaaatcg 20

<210> 10

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ccactgtgtc acttagtccg 20

<210> 11

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

agcgccgcgt gtgtaacggc 20

<210> 12

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atggagccca ggaagaaact 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

taacccaggt cttgccattc 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tggttaaaat tgggctctgg 20

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

gcagccgact cttcttgttc 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ttccacccct cttcttgcta 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

cccacaaccc tgtattggac 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tgggacgtgg ctagtcataa 20

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

catcccaaat gaaggcacca tta 23

<210> 20

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tctctccaac tgcctgcttg 20

<210> 21

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

ggccccacac ctatgaacaa 20

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种核酸单碱基突变检测的方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!