一种大豆snp分型检测芯片及其在分子育种与基础研究中的应用

文档序号:1966750 发布日期:2021-12-14 浏览:16次 >En<

阅读说明:本技术 一种大豆snp分型检测芯片及其在分子育种与基础研究中的应用 (Soybean SNP typing detection chip and application thereof in molecular breeding and basic research ) 是由 邱丽娟 李英慧 刘继强 于 2021-02-08 设计创作,主要内容包括:本发明提供一种用于大豆基因分型的SNP分子标记组合、大豆全基因组芯片(中豆芯一号芯片)及其应用。所述用于大豆基因分型的SNP分子标记组合由158,959个SNP分子标记组成,所述中豆芯一号芯片包含158,959个SNP分子标记,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-158,959所示。本发明的用于大豆基因分型的SNP分子标记组合、大豆全基因组芯片的分布均匀,代表性高,功能性强,实用性好,支持位点填充,且可依据增测的表型数据和填充后的基因组全序列不断增加因果位点和紧密关联位点数目,升级芯片,具有很大的经济实用价值和应用前景。(The invention provides an SNP molecular marker combination for soybean genotyping, a soybean whole genome chip (a chip with a soybean core I) and application thereof. The SNP molecular marker combination for soybean genotyping is composed of 158,959 SNP molecular markers, the chip with the soybean core I comprises 158,959 SNP molecular markers, and the nucleotide sequences of the SNP molecular markers are respectively shown in SEQ ID NO: 1-158,959. The SNP molecular marker combination for soybean genotyping and the soybean whole-genome chip are uniformly distributed, have high representativeness, strong functionality and good practicability, support the filling of loci, can continuously increase the number of causal loci and close association loci according to the measured phenotype data and the filled genome whole sequence, upgrade the chip and have great economic and practical values and application prospects.)

一种大豆SNP分型检测芯片及其在分子育种与基础研究中的 应用

技术领域

本发明涉及分子生物学、功能基因组学、生物信息学、分子育种技术领域,具体地说,涉及一种大豆SNP分型检测芯片及其在分子育种与基础研究中的应用。

背景技术

大豆起源于中国,古称“菽”,约在5000年前由其野生种驯化而来,随后广泛传播于世界各地,后因大豆产品缺乏竞争力而导致我国大豆产业发展滞后。据国家农业部数据显示,中国大豆的需求量每年大概在1.1亿吨左右,而我国大豆产量在1600万吨左右,90%的大豆需要进口。2019年的中央一号文件提出的大豆振兴计划,在科研上加快优质、高产大豆品种选育,开展联合攻关,提高大豆品种的适应性、高产性和优质性。但是,目前的大豆分子育种研究主要针对少数质量性状基因位点,对大豆产量和品质等多基因控制的复杂数量性状尚无有效的分子育种体系。

分子标记技术(Molecular marker technologies)是指应用大分子化合物、蛋白质和DNA在生物个体间的差异来标识遗传变异的技术方法。DNA分子标记是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,是DNA水平遗传多态性的直接反映。与其他几种遗传标记——形态学标记、生物化学标记、细胞学标记相比,DNA分子标记具有其优越性:多数为共显性,对隐性的性状的选择十分便利;基因组变异丰富,标记的数量多;检测手段简单、迅速。随着分子生物学技术的发展,DNA分子标记技术已有数十种,广泛应用于遗传连锁图的构建和基因定位、遗传育种、物种亲缘关系鉴别、基因库构建、基因克隆等方面。

SNP(Single Nucleotide Polymorphism,单核苷酸多态性),是指在基因组上单个核苷酸的变异形成的DNA序列上的多态性。理论上讲,基因组DNA上任何一个核苷酸都有四种可能的碱基组成形式,但大多数情况下只有两种碱基的变异,由一个碱基发生转换(Transitions)或颠换(Transversion)而变成另一个碱基,通常转换发生的频率要高于颠换,所以SNP标记通常为双等位基因(Vigna等,A review on SNP and other types ofmolecular markers and their use in animal genetics.Genet SelEvol.2002,34:275-306.)。SNP标记数量多,在基因组上分布广。基于SNP的新型高通量分子标记技术主要有两大类:一类是基于新一代测序技术的高通量分子标记技术;另一类是基于基因芯片技术的分子标记技术。

基于SNP基因型,可对大豆进行遗传多样性分析、全基因组关联分析、QTL精细定位、分子进化分析、分子标记辅助育种、全基因组选择等。其在聚合育种及拓宽品种的遗传基础方面将发挥重大作用。

目前,虽然有多款大豆全基因组SNP分型芯片问世,但是这些芯片都存在着一些不足,从而限制了其在中国大豆科学研究及分子育种中的应用。

1)现有芯片的设计多来源于美国、韩国的大豆种质资源,不适合对

中国大豆种质资源进行检测;

2)现有芯片全部以Wm82.a1.v1为参考基因组,与最新的参考基因组Wm82.a2.v1存在版本差异,造成大豆基因组信息不完整;

3)现有芯片在设计时,仅参考几个品种或几十个国外种质资源基因序列,中国大豆种质资源的基因组多样性缺失;

4)现有芯片缺少或不对中国用户公开其功能性标记位点;

5)现有芯片基因组覆盖率低、芯片位点分布不均衡。

综上,现阶段没有针对中国种质特有的大豆SNP分型芯片用以辅助大豆分子育种,给中国大豆的基因组学研究、品种选育及产业化带来了技术障碍。

发明内容

本发明的目的是提供用于大豆基因分型的SNP分子标记组合及其应用。

为了实现本发明目的,本发明提供用于大豆基因分型的SNP分子标记,所述SNP分子标记的核苷酸序列如SEQ ID NO:1-158,959任一所示。

继而本发明提供用于大豆基因分型的SNP分子标记组合,所述SNP分子标记组合为上述SNP分子标记中的任意两个或多个组合。优选所述SNP分子标记组合由158,959个SNP标记组成,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-158,959所示。

本发明利用高通量DNA测序技术,对来自不同国家和地区的2533份大豆样本进行了全基因组重测序。分析以Wm82.a2.v1为参考基因组,利用BWA软件进行比对、GATK-3.8软件进行变异检测。分析后获得的2533份样本原始变异数据通过固有筛选策略流程(参见图1)过滤,共得到11,048,862个高质量的变异位点。根据北京康普森生物技术有限公司自定义芯片设计原则,从中挑选出158,959个核心SNP位点。其中所述分子标记的SNP位点位于SEQ ID NO.1~158,959所示的核苷酸序列的第51位。

本发明还提供所述SNP分子标记组合在制备大豆全基因组育种芯片中的应用。

本发明的另一目的是提供一款大豆全基因组芯片——中豆芯一号,其包含158,959个SNP分子标记,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-158,959所示。

本发明还提供大豆全基因组育种芯片(中豆芯一号)包含的158,959个SNP位点,其具有SEQ ID NO:1-158,959所示的核苷酸序列。

本发明的中豆芯一号芯片数据来源于2533份大豆的重测序结果,绝大部分为中国核心种质,具有广泛的代表性,且在中国大豆基因组学研究中具有重要意义;所述中豆芯一号芯片参考基因组为Wm82.a2.v1;所述中豆芯一号芯片上基因区的位点和具有生物学功能的位点数量多,占比高,涵盖大豆重大育种价值的因果基因、紧密关联位点、一般关联位点等;并且所述中豆芯一号芯片位点均匀分布,基因组覆盖度高。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆品种鉴定中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在检测大豆育种材料中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆全基因组关联分析中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆分子标记辅助育种中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆种质资源DNA指纹图谱分析中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆杂交后代基因型鉴定中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆全基因组选择育种中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆亲缘分析中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆聚类分析中的应用。

本发明还提供所述SNP分子标记/组合或所述中豆芯一号芯片在大豆品种真实性检验中的应用。

与其他分子标记检测系统相比,本发明具有以下优点和效果:

(1)均匀分布:平均距离约为6kb,MAF>0.1的SNP位点占比81.3%。

(2)代表性高:信息来自中国和国际2,533份代表性大豆核心种质重测序数据和野生大豆泛基因组数据。

(3)功能性强:高比例的SNP为注释基因的Large-effect位点,涵盖重要基因相关位点、驯化和遗传改良选择区间以及野生和栽培大豆种间特有及种内亚群间特有的SNP位点。

(4)实用性好:基本涵盖已公布的重要性状相关标记(已报道的11种病害及17种农艺性状相关位点),突出了脂肪和脂肪酸、异黄酮、蛋白质、油分、株高、百粒重、抗病、耐旱耐涝等重要性状。

(5)支持位点填充:具有超高密度位点填充率,可在原有位点数基础上,位点总数扩充近10倍,填充后结果一致性高达87.5%。

(6)芯片可升级:可依据增测的表型数据和填充后的基因组全序列不断增加因果位点和紧密关联位点数目,升级芯片。

附图说明

图1示出了本发明中豆芯一号芯片位点筛选基本流程图。其中,QTL-数量性状定位;GWAS-全基因组关联分析;MAF--最小等位基因频率;SNP-单核苷酸多态性。

图2示出了本发明中豆芯一号芯片SNP位点密度。其中位点数目表示单核苷酸多态性的数量。

图3示出了本发明SNP位点的MAF分布情况。

图4示出了与其它商业化芯片SNP位点分布比较结果。其中,由外向内各圈依次为染色体、基因、180KSoyaSNP 180芯片位点、中豆芯一号芯片位点、IlluminaSoySNP50K芯片位点分布情况;chr为染色体。

图5示出了四款芯片位点基因分布情况比较结果。其中,downstream-基因下游区;upstream-基因上游区;exonic-外显子区;splicing-内含子剪切区;intronic-内含子区;UTR3-3′非翻译区;UTR5-5′非翻译区。

图6示出了中豆芯一号功能性位点分析结果。

图7示出了始花期QQ图和Manhattan图(GLM)。

图8示出了百粒重Manhattan图(GLM)。

图9示出了各性状表型与预测值相关性(rMP)。其中,R1-开花期;R7-成熟期。

具体实施方式

在以下的实施例中提供了本发明的示例性的实施方案。以下的实施例仅通过示例的方式给出,并用于帮助普通技术人员使用本发明。所述实施例并不能以任何方式来限制本发明的范围。若未特别指明,实施例均按照常规实验条件,或按照制造厂商说明书建议的条件。

标记开发流程:

1)初始数据集的获得

中豆芯一号SNP标记信息来源于中国农业科学院作物科学研究所提供的2533份国内外大豆种质资源(包括了830份核心种质资源、182份的微核心种质资源,涵盖东北、黄淮海及南方生态区的栽培品种、地方品种和野生品种以及国外种质,构成自然群体,具有丰富的基因型和表型数据),采用首先利用Novaseq platform(Illumina Inc.)测序技术对其进行全基因组测序,每个样本获得20X的全基因组覆盖度。排除低质量和具有接头污染的的reads,获得clean data。所有的clean data通过BWA软件mapping到Wm82.a2.v1基因组上,利用Sam tools软件中rmdup参数去除PCR重复,利用GATK软件进行变异分型,之后共获得11,408,862个SNP变异位点。

同时,中豆芯一号SNP标记信息还来源于涵盖QTL、GWAS、驯化相关基因、种间和种内亚群差异、优良性状、终止子、可变剪切、非同义突变等位点,位点类型概况如下表:

2)初始数据集的质控

北京康普森生物技术有限公司根据自定义的位点质控原则对上述数据进行筛选评估:(1)质控:样本call rate 90%,位点call rate 90%,MAF>0.05,样本杂合率15%以下,哈迪温伯格平衡0.0001;(2)非重复样本;以上质控均有Plink软件完成,最终获得9,092,284个位点集用于后续中豆芯一号芯片选点。

3)芯片位点筛选

北京康普森生物技术有限公司根据自定义的位点筛选原则对上述数据进行筛选评估:(1)tiling order 1=优良QTL位点、GWAS位点、重要基因(VIP)、选择基因、普通基因、终止子/可变剪切/非同义突变位点;(2)tiling order 2=种间和种内亚群差异位点;(3)tiling order 3=选择区间(驯化)位点;(4)tiling order 4=全基因组覆盖位点;(5)tiling order 5=填补gap位点。按照tiling order的优先级对位点进行进一步的综合考虑,保留MAF≥0.01的原则,删除无多态性位点,删除SNP侧翼序列有干扰的位点后,对序列进行滑窗选点,另外需考虑的因素包括:非A/T、G/C位点优先;全基因组均匀覆盖;位点评估分值在0.4以上;探针序列重复性在99%以下;缺失率低于3%;是否为单拷贝;不在转座子、重复区域中。

表1 芯片位点概况

通过上述原则构建中豆芯一号芯片的变异位点集合,最终筛选了158,959个分子标记。所述158,959个SNP分子标记的信息如SEQ ID NO:1-158,959所示,它们在大豆基因组上的分布情况如图2所示,MAF值如图3所示。

检测原理:

大豆基因组DNA的碱基有4种,分别是A、C、G、T。在SNP芯片的检测过程中将A和T两种碱基用DNP(二硝基苯)标记,它们可以结合标记红色荧光的抗DNP的抗体,从而显示红色;C和G两种碱基用生物素标记,它们可以结合标记绿色荧光的链霉亲和素,从而显示绿色。

当SNP分型为A/T和G/C的时候,只有一种颜色标记,需要用两个探针来进行检测;当SNP分型为非A/T和G/C的时候,有两种颜色标记,一个探针即可以完成检测。

检测方法:

1)提取待检测大豆基因组DNA。

2)对DNA进行全基因组扩增。

3)将扩增后的DNA产物片段化后与芯片进行就杂交,置于杂交炉内反应过夜。在杂交过程中,片段化后的DNA经过变性,与位点特异的50个碱基探针结合。

4)以捕获到的DNA为模板进行单碱基的延伸反应,在芯片的探针上加上可以检测的荧光标签基团,从而区分样本的SNP类型。

5)将处理好的芯片放入扫描仪中,利用激光激发芯片上单碱基延伸产物的荧光基团,扫描仪获取由荧光基团发出的荧光,并生成高分辨率的图片。由此所得的数据直接导入GenomeStudio软件进行分析,得到每个样本的SNP分型数据。

实施例1:中豆芯一号芯片重复性检验

实验材料:样本1(蒙豆28和绥农26的后代)、样本2(蒙豆16和合05648的后代)和样本3(蒙豆16和合05648的后代)。

策略:将样本1、样本2和样本3在同一芯片上的不同位置进行检测,统计相同样本在同一芯片上不同位置的SNP位点的检出情况,即进行样本板内重复性检验。

分析:板内重复相似率。

实验结果:板内重复相似率均在99.9%以上,验证结果(表2)表明中豆芯一号产品具有高度的可靠性和准确性。

表2 板内检测结果一致性

实施例2:中豆芯一号位点分布及不同芯片比较

实验材料:180K芯片、NJAU 355K SoySNP芯片、Illumina SoySNP50K芯片和中豆芯一号芯片。

实验结果:

1.中豆芯一号位点分布均匀,芯片兼容性高,如图4所示。

2.在已开发的大豆芯片中(表3),SoyaSNP 180芯片和IlluminaSoySNP50芯片的参考基因组均为Wm82.a1.v1,且数据基础的数量远远小于中豆芯一号。

3.中豆芯一号外显子具有基因功能位点的占比更高,如图5所示。

表3 四款芯片基本情况比较

实施例3:中豆芯一号具有基因功能位点分析

实验材料:中豆芯一号。

基因型数据来源:芯片获得。

实验结果:中豆芯一号拥有农艺性状相关位点和病害性状相关位点,如图6所示。功能基因上的相关位点包含已报道的包括茸毛有无、种子硬实、百粒重、粒长、株高和主茎节数、蛋白、脂肪、香味和异黄酮等农艺性状相关位点;还包括大豆胞囊线虫病、花叶病毒病、食心虫、锈病和豆卷叶螟等病虫害相关位点,耐涝、耐酸铝、耐盐和抗炸荚等抗逆性状相关位点。

实施例4:中豆芯一号关联分析

实验材料:816份材料最初来自不同的地理起源,包括美国、意大利、加拿大等国外品种,中国内蒙古、黑龙江省、辽宁省和吉林省等不同纬度地区的246份种质资源和高世代稳定品系。

基因型数据来源:中豆芯一号芯片检测获得。

分析模型:混合线性模型。

实验结果:利用混合线性模型(MLM)对供试群体始花期进行关联分析,结果表明,在P<1×10-5水平下,5条染色体上共定位到10个与始花期相关联的位点(图7)。其中3号和17号染色体上分别有1个相关位点,13号和20号染色体上有2个相关位点,14号染色体上有4个相关位点。其中20号染色体上的2个位点ss36101227和ss36111683在前人(Kuroda etal.2013A)报道的QTL区间内(Gm20:36842373-Gm20:25275083)。利用混合线性模型(MLM)对供试群体百粒重进行关联分析,结果表明,在P<1×10-5水平下,在2条染色体上共定位到14个与始花期相关联的位点(图8)。其中8号染色体上有6个相关位点,20号染色体上有8个相关位点。其中8号染色体上的ss 17213693位点和ss 17225326与前人(Zhang et al,2004)报道的区间(Gm08:16773792-Gm08:17232172)内。ss17234326、ss17241295、ss17333509和ss17894954位点位于前人(Han Y,2012;Sun et al.,2012)报道的区间内(Gm08:17232172-Gm08:47395378;Gm08:17542611-Gm08:39910959)。综上,中豆芯一号可以有效的对大豆性状进行GWAS分析。

实施例5:中豆芯一号在GS中的应用

实验材料:816份材料最初来自不同的地理起源,包括美国、意大利、加拿大等国外品种,中国内蒙古、黑龙江省、辽宁省和吉林省等不同纬度地区的246份种质资源和高世代稳定品系。

分析:开花期(R1)、成熟期(R7),收获后测定小区产量(Yield)、百粒重(100-seedweight)、蛋白含量(Protein)、脂肪含量(Oil)等表型。

基因型数据来源:中豆芯一号芯片检测获得。

分析模型:ABLUP、GBLUP和HBLUP模型。

预测准确性验证:5fold交叉验证,比较预测GEBV与表型的相关性。结果表明,以系谱关系构建的ABLUP模型在所有性状中的预测准确度最低,均在0.5以下。GBLUP方法预测准确度在0.57~0.78之间,预测效果均优于HBLUP,可见在本试验中,材料间的系谱关系不能提高预测准确度,以基因型数据为基础构建模型的GBLUP预测效果较好。而以GBLUP为例,R7的预测准确度最高,达到了0.78,百粒重、蛋白、脂肪的准确度也均达到了0.7以上,各性状中准确度最低的为小区产量,仅为0.57(图9)。综上,可以利用中豆芯一号对大豆进行分子育种分析及预测。

工业实用性

本发明提供一种用于大豆基因分型的SNP分子标记组合、大豆全基因组芯片(中豆芯一号芯片)及其应用。所述用于大豆基因分型的SNP分子标记组合由158,959个SNP分子标记中的任意两个或多个组成,所述中豆芯一号芯片包含158,959个SNP分子标记,所述SNP分子标记的核苷酸序列分别如SEQ ID NO:1-158,959所示。本发明的用于大豆基因分型的SNP分子标记组合、大豆全基因组芯片的分布均匀,代表性高,功能性强,实用性好,支持位点填充,且可依据增测的表型数据和填充后的基因组全序列不断增加因果位点和紧密关联位点数目,升级芯片,具有很大的经济实用价值和应用前景。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于检测高级别鳞状上皮内病变的引物组合物

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!