一种评估香猪表型性状的个体基因组育种值方法
阅读说明:本技术 一种评估香猪表型性状的个体基因组育种值方法 (Individual genome breeding value method for evaluating phenotypic characters of fragrant pigs ) 是由 王嘉福 王志勇 犹龙江 陈芳 孙镘熹 刘畅 黄世会 牛熙 冉雪琴 于 2021-01-22 设计创作,主要内容包括:本发明提供一种香猪表型性状的个体基因组育种值评估方法,涉及动物育种技术领域,为香猪的选种、配种提供理论依据。该发明采用GBLUP(基因组最佳线性无偏估计)模型,结合表型、基因型和谱系信息进行基因组育种值估测,采用自编写的Python程序,计算个体的育种值(即种畜个体遗传潜力的相对值)。(The invention provides an individual genome breeding value evaluation method for fragrant pig phenotypic characters, relates to the technical field of animal breeding, and provides a theoretical basis for seed selection and hybridization of fragrant pigs. The invention adopts a GBLUP (optimal linear unbiased estimation of genome) model, combines phenotype, genotype and pedigree information to estimate the breeding value of the genome, and adopts a self-written Python program to calculate the breeding value of an individual (namely, the relative value of the genetic potential of an individual breeding stock).)
技术领域
本发明涉及动物分子育种技术领域,具体来说,涉及一种评估香猪表型性状的个体基因组育种值方法。
背景技术
从江香猪,是我国珍贵的地方猪种,产区位于贵州省从江县。香猪体型小,基因较为纯和,肉质鲜嫩,无膻腥味,营养价值高,是加工制作高品质肉品的原材料。随着人们的生活水平提升,对肉质的要求越来越高,香猪成为了越来越多人们需求的首选,但是香猪产仔率较低,经常供不应求,因此,如何提高产仔数成为当前香猪养殖业的重点。
传统育种耗时费力,而通过GBLUP方法不仅可以缩短世代间隔,快速准确的选育出携带优良基因型的个体作为种猪。GBLUP方法的原理:指通过检测覆盖全基因组的分子标记,利用基因组水平的遗传信息对个体进行遗传评估,以期获得更高的育种值与估计准确度,是全基因组范围的标记辅助选择技术。
发明内容
本发明的目的在于提供一种评估香猪表型性状个体基因组育种值方法,进行选育、选配种猪。
本发明的一种方法:在实验室筛选到的香猪繁殖性状18个结构变异位点,作为分子标记位点,构建GBLUP模型,用Python程序自编写代码,作为一个脚本,输入数据即可计算每个个体对应的育种值,该方法简单快捷,省去了繁琐的计算过程,还可用于计算其它动物表型性状的个体基因组育种值计算。
为解决香猪传统育种中面临的费时、费力和耗费大量资金等问题,本发明所采取的技术方案是:一种评估香猪表型性状的个体基因组育种值方法,使用表型、基因型、和谱系信息进行基因组育种值的预测,评估个体的遗传价值(即育种值),具体包括以下步骤:
一种评估香猪表型性状的个体基因组育种值方法,采用GBLUP(基因组最佳线性无偏估计)模型,使用表型、基因型和谱系信息进行基因组育种值的预测,计算出估计的个体育种值(即遗传价值),具体包括以下步骤:
步骤1:将基因型数值化,即予以赋值,基因型DD、DI和II分别赋值为-1,0,1,其中,-1代表DD基因型,0代表ID基因型,1代表II基因型,构建基因型关系矩阵,得到个体间的亲缘关系矩阵,G矩阵,其定义为:
G=ZZ'/k
其中,Z阵列元素为:0-2pj、1-2pj、2-2pj分别对应基因型DD、DI、II;pj为等位基因I的频率,Z'为Z矩阵对应的逆矩阵。k定义为:
k=2∑Pj(1-Pj)
步骤2:构建BLUP(最佳线性无偏估计)育种模型,即用遗传标记构建个体间的关系矩阵,将关系矩阵放入混合模型方程组,计算出个体的基因组估计育种值。BLUP育种模型的动物表型观测值由环境因素和遗传因素组成。BLUP模型的一般数学公式为:
y=Xb+Zμ+e
其中,y为表型性状观察值;b为固定效应向量(如:环境和生理因素);μ为随机加性遗传效应向量,即育种值;X和Z分别为固定效应b和随机效应μ的关联矩阵;e为随机残差效应向量。
步骤3:上式是混合模型方程组的一般数学式,需要将其进一步转换为混合模型方程组。与据表型系谱计算BLUP的方法相比,GBLUP可利用分子标记代替表型系谱,可以更真实地描述个体间的遗传关系。基因组选择技术用标记的基因型构建个体间的关系矩阵(G矩阵),实现基因组育种值的直接估计。使用步骤1中构建的G矩阵模型代入混合模型方程组中,计算出每个个体的基因组育种值。GBLUP模型下的基因组选择的基本原理,即:
其中,G就是步骤1中所求的亲缘关系矩阵G矩阵,而G-1为基因组关系矩阵G的逆矩阵,λ为遗传力相关值:
Cov(u,e')=0,其中,I为单位矩阵,即每个个体的数量记录,V(μ)为μ随机加性遗传效应向量方差,V(e)为e随机残差效应向量的方差,Cov表示协方差,h2为遗传加性方差,即动物变异的传递能力。在混合模型方程组中,X`X评估动物的固定效应;Z`Z评估动物的随机效应;Z`X、X`Z均为评估动物的固定效应与随机效应的关系,λG-1为遗传力相关值与亲缘关系乘积,为固定效应计算值;为随机效应计算值,即个体的基因组育种值;为表型观测值的累加。矩阵构建完成后,因数据量较大,使用Python程序编写的代码,进行转换数值、计算育种值。得到的育种值代表的是评估的动物群体中,个体遗传潜力的相对值,所以,育种值越大表明其遗传潜力较好,可以作为种猪,反之(比如负值)则淘汰。
矩阵构建完成后,用Python语言编写代码进行数值转换。因其数据量较大,需应用Python语言编写的代码将表型数据、基因型数据进行转换,采用步骤1和步骤3所述方法计算个体的育种值。求解出来的育种值代表的是评估的动物群体中,个体遗传潜力的相对值。所以,育种值越大表明其遗传潜力较好,可以作为种猪;如为负值,则该个体不利于目的性状的改善,不宜为种猪,需将其淘汰,或降级作为育肥猪使用。
本发明的有益效果:前期在实验室筛选出来的18个繁殖性状结构变异位点,作为分子标记位点,并构建育种值模型,用Python程序编写代码,作为一个脚本,可求出每个个体的基因型育种值,育种值大的可选择作为种猪,反之淘汰作为商品猪出售,可作为香猪选育、配种的方法,也可用于其它动物的基因型育种值计算,该方法简单、便捷。
附图说明
图1为本发明实施例提供的一种香猪表型性状的个体基因组育种值方法流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例的方法如下所述。
在基因组重测序数据分析和生物信息学分析基础上,筛选出18个基因中所含的结构变异位点(表1),并设计引物。
表1为18个基因中所含的结构变异位点作为分子标记及引物
采集香猪耳组织样本共116个,并提取其基因组DNA,作为模板进行基因分型,然后统计香猪样本谱系信息、表型信息,具体数据见表2和3,实施例中表型性状用到的是香猪的产仔数(第三胎),统计后备母猪的产仔数情况。
表2
表3
步骤1:将基因型进行赋值,基因型DD、DI和II分别赋值为-1,0,1,其中,-1代表DD,0代表ID,1代表II,如下所示。
构建基因组关系矩阵,得到个体间的亲缘关系矩阵G矩阵,同时并构建GBLUP混合模型中的每个矩阵,下面为构建每个矩阵的代码。
每个矩阵构建完成后,对矩阵进行组合,构建混合模型方程组,如下代码所示。
在目标文件夹中找到输出文件,文件中包含有每个个体的育种值,可以用EXCEL程序打开,排序,选出育种值较高的个体作为种猪。表4所示。
表4
本实施例中,根据计算出来的育种值,可选择序号1-37对应的编号母猪作为后备种猪,其余母猪的个体遗传潜力的相对值偏低,即种畜利用价值较低,可淘汰作为商品猪出售。
序列表
<110>贵州大学
<120>一种评估香猪表型性状的个体基因组育种值方法
<160>36
<210>1
<211>22
<212>DNA
<213>人工合成
<400>1
CCCCACCTCGATAACACTTGAT
<210>2
<211>22
<212>DNA
<213>人工合成
<400>2
CTGGGCTGCAGTGGTGAAAATA
<210>3
<211>20
<212>DNA
<213>人工合成
<400>3
GTGGAGCGTCTGGGGAACAT
<210>4
<211>20
<212>DNA
<213>人工合成
<400>4
TGGGAGATGGAAGGTGGAGG
<210>5
<211>22
<212>DNA
<213>人工合成
<400>5
TTGGCACCATTTTCTGACAGCA
<210>6
<211>22
<212>DNA
<213>人工合成
<400>6
GGGTGTGGGATAGACTGGGATT
<210>7
<211>22
<212>DNA
<213>人工合成
<400>7
CTTTCCCCTCCACTGACTCCCT
<210>8
<211>22
<212>DNA
<213>人工合成
<400>8
CTTTCCCCTCCACTGACTCCCT
<210>9
<211>22
<212>DNA
<213>人工合成
<400>9
GGCTAAACATTGCCGAGTGACT
<210>10
<211>23
<212>DNA
<213>人工合成
<400>10
GGAATACAGAAGGCAGAGAGGGT
<210>11
<211>21
<212>DNA
<213>人工合成
<400>11
TGGATATGCGTGCACAGTCAG
<210>12
<211>21
<212>DNA
<213>人工合成
<400>12
TAATTGGGCTCTTGGGTCAGG
<210>13
<211>23
<212>DNA
<213>人工合成
<400>13
CCCATGCGTAACAAAAGACACT
<210>14
<211>24
<212>DNA
<213>人工合成
<400>14
GTCCAGAACTGTACCTCCAAGAGT
<210>15
<211>24
<212>DNA
<213>人工合成
<400>15
CATCACAACATCAGCGATAGTCTG
<210>16
<211>23
<212>DNA
<213>人工合成
<400>16
TGTTGAGGGGAAATATGTCTGGT
<210>17
<211>23
<212>DNA
<213>人工合成
<400>17
AGCCACAACAAGAACTCCAACAT
<210>18
<211>24
<212>DNA
<213>人工合成
<400>18
CCTAGAACGCTAAACCCTCAGAAT
<210>19
<211>22
<212>DNA
<213>人工合成
<400>19
CATCAGGTCATCAGGCAAAGGA
<210>20
<211>22
<212>DNA
<213>人工合成
<400>20
TCTGTGAGGTTCAAAACGGTGG
<210>21
<211>25
<212>DNA
<213>人工合成
<400>21
TGAGTCTGCCAGTAGTTTTCAGTTT
<210>22
<211>24
<212>DNA
<213>人工合成
<400>22
TATATGGGAAGATGCAAGTGTCTG
<210>23
<211>23
<212>DNA
<213>人工合成
<400>23
TGTTCCTTTCCACTGTGTCAATG
<210>24
<211>21
<212>DNA
<213>人工合成
<400>24
CCCCTCTAAACTTTTCAGCGG
<210>25
<211>24
<212>DNA
<213>人工合成
<400>25
ACTCAGTTTTCCTAGGTCTCTCCC
<210>26
<211>24
<212>DNA
<213>人工合成
<400>26
ACGGCTGAGTAATATTCCATTGTG
<210>27
<211>22
<212>DNA
<213>人工合成
<400>27
TTAGCAGATCTGGCCCTTGATG
<210>28
<211>24
<212>DNA
<213>人工合成
<400>28
ACAAGAGGGAGAATAGTGACTGGC
<210>29
<211>23
<212>DNA
<213>人工合成
<400>29
GACCTCCAACTTCAGCATTTTCA
<210>30
<211>21
<212>DNA
<213>人工合成
<400>30
ATGCCTTCCTCCTTGTGTCCA
<210>31
<211>20
<212>DNA
<213>人工合成
<400>31
TACATCTCAGGCGTCGTGGG
<210>32
<211>22
<212>DNA
<213>人工合成
<400>32
GTAAAGCATTTGGTCAGGCAGG
<210>33
<211>22
<212>DNA
<213>人工合成
<400>33
CCCCAGCTCCCTTACCTAATAG
<210>34
<211>23
<212>DNA
<213>人工合成
<400>34
GGTGGTGTAAATGCAGTTATCGG
<210>35
<211>22
<212>DNA
<213>人工合成
<400>35
GTCTTTGGCAGGCATTTTCTCA
<210>36
<211>23
<212>DNA
<213>人工合成
<400>36
TAGGCTTGCGTTTCCACTCTTAG
- 上一篇:一种医用注射器针头装配设备
- 下一篇:一种基于神经网络对生物代谢路径的预测方法