用于荷斯坦牛热应激耐受力鉴定的snp位点组合及芯片制备

文档序号:62794 发布日期:2021-10-01 浏览:29次 >En<

阅读说明:本技术 用于荷斯坦牛热应激耐受力鉴定的snp位点组合及芯片制备 (SNP locus combination for heat stress tolerance identification of Holstein cattle and chip preparation ) 是由 陈坤琳 夏淑雯 王慧利 赵芳 丁强 钱勇 仲跻峰 于 2021-08-11 设计创作,主要内容包括:本发明公开了一种用于荷斯坦牛热应激耐受力鉴定的SNP位点组合及芯片制备,所述SNP位点组合包括2264个SNP位点,所述的2264个SNP位点是基于337头中国荷斯坦奶牛的血液简化基因组测序结果筛选得到,每个SNP位点包含两个不同碱基变异位点,所述SNP位点的变异信息采用染色体编号-物理位置参考基因型/等位基因型的形式进行表示。本发明所采用的2264个SNP标记在中国荷斯坦牛基因组染色体上分布均匀,标记间最大距离为30.9Mb,最小距离为1bp,平均间距为1.1Mb,其应用于GWAS分析时,不会丢失位点。(The invention discloses an SNP locus combination for heat stress tolerance identification of Holstein cows and preparation of a chip, wherein the SNP locus combination comprises 2264 SNP loci, the 2264 SNP loci are obtained by screening based on a blood simplified genome sequencing result of 337 Chinese Holstein cows, each SNP locus comprises two different base variation loci, and variation information of the SNP loci is expressed in a form of a chromosome number _ physical position reference genotype/allelic genotype. The 2264 SNP markers adopted by the invention are uniformly distributed on the genome chromosome of the Chinese Holstein cattle, the maximum distance between the markers is 30.9Mb, the minimum distance is 1bp, the average distance is 1.1Mb, and the locus cannot be lost when the SNP markers are applied to GWAS analysis.)

用于荷斯坦牛热应激耐受力鉴定的SNP位点组合及芯片制备

技术领域

本发明涉及一种用于荷斯坦牛热应激耐受力鉴定的基因芯片,具体为一种用于荷斯坦牛热应激耐受力鉴定的SNP位点组合及芯片制备,属于动物分子育种应用领域。

背景技术

随着全球气候持续变暖和养殖集约化程度提高,热应激危害畜牧养殖日趋严重。荷斯坦牛耐寒怕热,汗腺机能不发达,散热能力差,且产奶过程又产生大量的代谢热,导致其对热应激尤为敏感。奶牛热应激的主要表现为:采食量下降,呼吸频率增加,直肠温度升高,流涎增多,站立时间长等,引起疾病多发、繁殖障碍及产奶性能降低等生产问题,严重制约我国南方奶业发展。

近年来,随着分子生物技术的不断发展,分子标记选择育种已被广泛应用于奶牛。奶业发达国家(如美国、澳大利亚、新西兰等)将热应激抗性、耐受性或易感性的育种值纳入了遗传评估体系。有研究表明,直肠温度和呼吸频率具有一定的遗传力,但估计值较小。若依赖表型的常规育种方法进行选择,难度较大且时间较长,而分子育种策略对于如抗热性能等低遗传力性状更具优势,可缩短世代间隔,加快遗传进展。

抗热应激属复杂性状,受多基因控制,同时还受营养、管理等其它因素影响,仅依赖少数几个标记选择很难达到理想的遗传进展。基因组选择技术,如单核苷酸多态性(SNP,Single Nucleotide Polymorphisms)芯片,可通过提高SNP标记的数量,从而实现对育种值的准确预测。然而当前存在的突出问题:一是商业SNP芯片及其遗传评估目前价格不菲,仅限于优秀种公牛和种子母牛中应用;二是依据基因组上等距离分布选择的SNP基本位于基因间区和基因内含子内,大部分SNP没有功能(Richardson等,2011;Hayes等,2014;Nicolazzi等,2014)。为降低成本,提高效率,通过筛选荷斯坦牛热应激耐受的功能性SNP,集成开发SNP芯片,可提高荷斯坦牛群体的遗传抗热应激能力,促进我国奶业持续健康发展。

发明内容

本发明的目的在于完善现有技术缺陷,为了解决上述问题而提供一种用于荷斯坦牛热应激耐受性能鉴定的SNP位点组合及芯片制备。

本发明通过以下技术方案来实现上述目的,一种用于荷斯坦牛热应激耐受力相关性能鉴定的SNP位点组合,所述SNP位点组合包括2264个SNP位点,所述的2264个SNP位点是基于337头荷斯坦奶牛的血液简化基因组测序结果筛选得到,所述SNP位点的获取方法包括以下步骤,

(1)基于337头荷斯坦牛的血液简化基因组测序数据,获得6,298,342个SNP分子标记;

(2)对步骤(1)所获得的6,298,342个SNP分子标记根据连锁不平衡筛选具有标记性的SNP,得到4,905,142个SNP分子标记;

(3)根据步骤(2)所得到的4,905,142个SNP分子标记的缺失率、位点评分估值、多态值和基因分布,筛选113,127个分子标记;

(4)根据步骤(3)所得到的113,127个SNP分子标记,运用GEMMA分析软件,采用混合线性模型与测定的表型信息进行全基因组关联分析,获得2264个分子标记。

优选地,所述每个SNP位点包含两个不同碱基变异位点,所述SNP位点的变异信息采用染色体编号_物理位置参考基因型/等位基因型的形式进行表示。

优选地,所述2264个SNP标记位点的获取要求在337份荷斯坦牛血液中,位点哈迪-温伯格的p值大于0.00015,基因型缺失小于20%,最大等位基因频率小于95%,最小等位基因频率大于5%,选择每个性状关联分析中最显著300个标记位点,去除重复的SNP标记。

优选地,所述2264个SNP标记位点,其中668个标记位于功能基因上,覆盖3%的牛编码基因,SNP分子标记分布均匀,标记平均间距为1.1Mb。

优选地,还包括基于中国荷斯坦牛SNP标记位点组合在全基因组关联分析(GWAS)上的应用。

优选地,所述基于中国荷斯坦牛SNP标记位点组合在全基因组关联分析(GWAS)上的应用包括检测基因型、检测表型、构建全基因组选择模型并获得标记效应以及筛选优势等位基因并获得表型性状与优势等位基因之间的关联情况四个应用。

优选地,所述检测表型包括检测337头中国荷斯坦牛直肠温度、体表温度、呼吸频率、血液常量/微量元素(Ca、Cu、Fe、Mg、Zn)在内的8个性状,作为构建基因组选择模型的表型输入文件。

优选地,所述优势等位基因以染色体编号_物理位置_优势基因型的形式表示。

一种用于荷斯坦牛热应激耐受力鉴定的SNP位点组合芯片制备,芯片制备方法包括优势等位基因进行去重后,获得2264个SNP标记位点,以所获得的所述2264个SNP标记位点,设计检测所述2264个SNP标记位点的探针,并制备检测所述2264个SNP标记位点的液相基因芯片。

优选地,所述液相基因芯片含有一套用于检测SNP位点的核苷酸探针,所述液相芯片的溶液体系为无核酸酶的水,所述溶液体系中探针的浓度为60ng/μL。

本发明的有益效果是:

1、本发明基因芯片所选的标记位点多为功能关联位点,优先选用全基因组关联分析(GWAS)功能标记;

2、本发明所采用的2264个SNP标记在中国荷斯坦牛基因组染色体上分布均匀,标记间最大距离为30.9Mb,最小距离为1bp,平均间距为1.1Mb,其应用于GWAS分析等时,不会丢失位点;

3、本发明基因芯片对功能基因有一定的覆盖度,SNP标记位点覆盖了荷斯坦奶牛427个功能基因,约占总基因数的2%,且55个SNP标记位点位于基因编码区域,在2264个SNP标记位点中,其中668个SNP标记位点位于基因上,此类SNP标记位点占SNP标记位点总数的29.5%;从而使得,其在分子辅助育种或基因组选择育种应用时,可加速育种进程;

4、本发明基因芯片为低密度SNP芯片,具有成本低,准确度高,针对性强等优点。

附图说明

图1为本发明2264个SNP标记位点在中国荷斯坦牛基因组中的分布图。

图2为本发明2264个SNP标记位点序列图。

图3为本发明获得的与直肠温度相关的300个优势等位基因序列图。

图4为本发明获得的与体表温度相关的300个优势等位基因序列图。

图5为本发明获得的与呼吸频率相关的300个优势等位基因序列图。

图6为本发明获得的与血液常量/微量元素(Ca、Cu、Fe、Mg、Zn)相关的1500个优势等位基因序列图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种用于荷斯坦牛热应激耐受力鉴定的SNP位点组合及芯片制备,所述SNP位点组合包括2264个SNP位点,所述的2264个SNP位点是基于337头荷斯坦奶牛的血液简化基因组测序结果筛选得到,每个SNP位点包含两个不同碱基变异位点,用于检测该位点的等位基因变化,所述SNP位点的变异信息采用染色体编号_物理位置参考基因型/等位基因型的形式进行表示,所述2264个SNP标记位点即S0001-S2264如图2所示。

所述SNP位点组合的获取方法包括以下步骤,

(1)基于337头荷斯坦牛的血液简化基因组测序数据,共获得6,298,342个SNP分子标记;

(2)对步骤(1)所获得的6,298,342个SNP分子标记根据连锁不平衡筛选具有标记性的SNP,得到4,905,142个SNP分子标记;

(3)根据步骤(2)所得到的4,905,142个SNP分子标记的缺失率、位点评分估值、多态值和基因分布,筛选得到113,127个分子标记;

(4)根据步骤(3)所得到的113,127个SNP分子标记,运用GEMMA分析软件,采用混合线性模型与测定的表型信息进行全基因组关联分析,获得2264个分子标记。

实施例12264个SNP位点的获取

一种中国荷斯坦奶牛基因组SNP标记位点组合,包括2264个SNP位点,每个SNP位点包含两个不同碱基变异位点,用于检测该位点的等位基因变化,所述2264个SNP标记位点如图2所示。

在本实施例中,所述中国荷斯坦牛基因组SNP标记位点组合(即2264个SNP标记位点)来源于337份中国荷斯坦牛的简化基因组测序信息及相关全基因组关联分析(GWAS)位点,其获得方法,包括如下步骤:

1)样本的采集与获得:337份中国荷斯坦牛尾静脉血液采集于南京周边大型规模牧场,常规饲养管理;并获得直肠温度、体表温度、呼吸频率、血液常微量元素(Ca、Cu、Fe、Mg、Zn)这8个重要表型性状的数值;

2)2264个SNP位点获取:利用CTAB法提取高质量的牛血液基因组DNA,用于简化基因组测序,共获得6,298,342个SNP分子标记;对所获得的6,298,342个SNP分子标记根据连锁不平衡筛选具有标记性的SNP,得到4,905,142个SNP分子标记;对所获得的4,905,142个SNP分子标记的缺失率、位点评分估值、多态值和基因分布,筛选得到113,127个分子标记;对所获得的113,127个SNP分子标记,运用GEMMA分析软件,采用混合线性模型与测定的表型信息进行全基因组关联分析,获得2264个分子标记;

上述简化基因组测序获得高质量的clean data数据量为46Gb,平均每个样品136Mb,测序深度约为22倍;将测序数据利用BWA软件将数据比对到牛参考基因组(版本号为ARS-UCD1.2),PICARD软件去除重复,GATK软件获得高质量的SNP;

对获得的SNP标记位点与测定的表型信息进行全基因组关联分析,分析软件为GEMMA,采用混合线性模型进行分析;

2264个SNP标记位点的获取要求在337份荷斯坦牛血液中,位点哈迪-温伯格的p值大于0.00015,基因型缺失小于20%,最大等位基因频率小于95%,最小等位基因频率大于5%,选择每个性状关联分析中最显著300个标记位点,去除重复的SNP标记;最终得到所述的2264个SNP标记位点,其中668个标记位于功能基因上,覆盖3%的牛编码基因,SNP分子标记分布均匀,标记平均间距为1.1Mb。

实施例2一种基于中国荷斯坦牛全基因组SNP标记位点组合在全基因组关联分析(GWAS)上的应用,包括如下步骤:

1)检测基因型

以实施例1获得的2264个SNP位点为基础,设计探针并制备检测所述2264个SNP位点的液相基因芯片,分析2264个SNP标记位点在染色体上的分布密度,结果见图1,将2264个SNP标记位点作为构建基因组选择模型的基因型文件;

2)检测表型

检测337头中国荷斯坦牛包括直肠温度、体表温度、呼吸频率、血液常量/微量元素(Ca、Cu、Fe、Mg、Zn)在内的8个性状,作为构建基因组选择模型的表型输入文件:8个性状的检测方法如下:

直肠温度:兽用温度计测量荷斯坦牛直肠温度;

体表温度:兽用红外线温度计检测荷斯坦牛耳后温度;

呼吸频率:监测荷斯坦牛每分钟呼吸次数;

血液常量/微量元素:肝素钠抗凝管收集全血,原子吸收法检测血液各元素水平;

3)构建全基因组选择模型以及获得标记效应

利用2264个SNP标记位点作为基因型与检测的8个荷斯坦牛性状表型值构建针对每个性状全基因组选择模型,进而分析获得2264个SNP标记位点中每个SNP标记位点对各个性状的效应值;

4)筛选优势等位基因,获得表型性状与优势等位基因之间的关联情况

利用全基因组选择,分析获得所述8个性状中每个性状关联的标记效应值的绝对值排名靠前的300个优势等位基因,即每个表型性状获得与其相关的300个优势等位基因,8个表型性状共计获得2400个优势等位基因,关联结果如图3-图6所示。

上述实施例中,所述优势等位基因以染色体编号_物理位置_优势基因型的形式表示。

实施例3液相基因芯片制备

对实施例2获得的2400个优势等位基因进行去重后,获得2264个SNP标记位点,以所获得的所述2264个SNP标记位点,设计检测所述2264个SNP标记位点的探针,并制备检测所述2264个SNP标记位点的液相基因芯片。

上述实施例中,所述液相基因芯片含有一套用于检测SNP位点的核苷酸探针,所述液相芯片的溶液体系为无核酸酶的水,所述溶液体系中探针的浓度为60ng/μL。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

52页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种鉴别高原鼢鼠的试剂盒及方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!