监督数据分析
一种玉米表型预测方法及系统
本发明涉及一种玉米表型预测方法及系统,该方法包括:采用基因芯片技术获得多个玉米品种的SNP数据,获得样本数据集,样本数据集中每个样本包括一个玉米材料的SNP碱基和玉米材料对应的玉米粒颜色;构建卷积神经网络模型;根据样本数据集,以SNP碱基为输入,以玉米粒颜色为输出训练卷积神经网络模型,获得玉米表型预测模型;将待预测玉米材料的SNP碱基输入玉米表型预测模型,获得待预测玉米材料的玉米粒颜色。本发明采用玉米表型预测模型进行玉米表型,提高了表型预测准确度和效率。

2021-11-02

访问量:30

一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用
本发明属于生物医药领域,具体涉及一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用。该方法首先鉴定肾乳头状细胞癌的细胞起源,其次差异分析具有不同细胞起源的肾乳头状细胞癌个体之间及其对应的起源细胞类型之间的基因开放染色质活性评分,得到肾乳头状细胞癌源自细胞起源的分子标记组。该分子标记组可用于对肾乳头状细胞癌进行精确的分型,有助于在早期对将呈现不同恶性程度的肾乳头状细胞癌进行精确的进展风险预测,从而提高对恶性肾乳头状细胞癌诊断的准确性。此外,本发明还根据筛选的分子标记组及LDHA的表达量,建立了一套随机森林模型,用于早期对恶性肾乳头状细胞癌患者的高效精准识别,有助于对进展型肿瘤的早期介入和密切监测。

2021-11-02

访问量:36

一种胃癌预后标志物的筛选和分类方法、胃癌预后标志物和检测胃癌预后的试剂及应用
本发明提供了一种胃癌预后标志物的筛选和分类方法、胃癌预后标志物和检测胃癌预后的试剂及应用,涉及胃癌预后技术领域。本发明筛选和分类方法包括以下步骤:(1)将与胃癌相关的多组学预后标志物信息导入训练好的支持向量机SVM模型中,分类成A亚型、B亚型和C亚型;(2)筛选A亚型、B亚型和C亚型中具有特异性表达的基因,得胃癌预后标志物。本发明所述胃癌预后标志物与多组学和生存信息相关,可提高预后预测和治疗选择的准确性,其判定结果与TCGA中真实预后数据结果具有高度的一致性。

2021-10-26

访问量:34

一种基于多角度编码和特征选择的DNA结合蛋白识别方法
本发明公开了一种基于多角度编码和特征选择的DNA结合蛋白识别方法,包括,在训练阶段,iDBP-DEP利用四种表示方法对蛋白质序列进行编码,得到3240维的特征向量作为初始特征;根据特征选择算法选择最优的特征子集;所述iDBP-DEP将所述子集输入SVM分类器进行训练,得到预测模型;测试集中的每个蛋白质通过相同的步骤进行编码,得到对应的最佳特征子集,并输入所述预测模型中进行预测,最终获得相应的预测结果。本发明方法提供的iDBP-DEP在各项评估指标上均展现了优越的性能,具有较良好的有效性和稳定性。

2021-10-26

访问量:40

一种病毒数据库的数据分析方法、系统、设备及存储介质
本发明公开了一种病毒数据库的数据分析方法、系统、设备及存储介质,包括以下步骤:基于样品的病毒数据,对所述病毒数据通过质控后对比宿主基因组,去除宿主污染,得到筛选后的待分析病毒数据;对所述待分析病毒数据组装宏病毒,得到病毒contig;对所述病毒contig评估筛选,去除假阳性病毒,得到病毒contig筛选结果;对所述病毒contig筛选结果进行病毒分类,得到病毒contig类群;对所述病毒contig类群比对到已知病毒数据库上,判断所述病毒contig类群是否在已知的病毒数据库内;若否,则基于此病毒contig类群的功能分类及病毒丰度将此病毒contig类群写入已知病毒数据库中以更新已知病毒数据库。本发明的数据分析方法能够提升病毒数据有效性和准确性并扩充已知病毒数据库。

2021-10-22

访问量:36

一种突变候选基因的筛选方法
本发明涉及基因组测序分析技术领域,具体涉及一种突变候选基因的筛选方法,通过使用已有公共正常样本的数据构建正常突变分类模型,进行模拟突变发生,而不是仅仅使用已知突变位点以及总体的突变频率,避免直接使用数据结论造成的结果偏差。同时当研究样本数量很少或不存在对照样本时,无法构建突变分类模型,也可直接使用正常突变分类模型,进行突变模拟和计算。该方法可快速并准确地从大量的非同义突变数据中,寻找并筛选出具有重要意义的主效基因,以便进行下一步研究验证。

2021-10-22

访问量:31

甲状腺肿瘤良恶性鉴别模型及其应用
本发明涉及用于甲状腺肿瘤良恶性鉴别和恶性潜能未定的滤泡性肿瘤评估的甲基化标志物、试剂盒、装置、计算机可读介质和系统。

2021-10-22

访问量:23

8种代谢产物作为精子受损的生物标记
本发明公开了8种代谢产物作为精子受损的生物标记,包括如下步骤:(一)、实验分组:将取样标本分成三份,分别为:A、正常捐精自愿者的精液;B、精索静脉曲张病人手术前精液;C、精索静脉曲张病人手术后精液,(二)、实验步骤:A、将代谢物定性与(相对)定量结果进行是否去噪或筛选的操作,当需要对其进行去噪或筛选的操作,可对其进行先重名物资筛选,然后再对其进行噪音剔除。通过采用本发明设计的检测方法,新发现的8种代谢产物具有AUC>90%的预测效能,通过利用这8种在精液里存在的代谢产物,可以判定精子是否受到损伤以及精液质量的衡量,给精液质量的检测工作带来了极大的便利。

2021-10-19

访问量:21

使用核酸扩增测定的靶生物体的机器学习量化
在一些示例中,用于扩增和定量样本中存在的靶生物体的系统包括检测设备,该检测设备被配置为扩增和检测与靶生物体相关联的核酸。该检测设备被配置为接收样本并且在扩增循环内扩增样本中的核酸。该检测设备被配置为捕获包括在扩增循环期间收集的核酸的测量结果的数据集。该系统还包括计算设备,该计算设备被配置为接收数据集并且将机器学习系统应用于数据集。训练机器学习系统以基于数据集中的测量结果来估计样本中存在的靶生物体的量。

2021-10-01

访问量:29

异常片段检测与分类
一种用于确定来自一测试对象的一测试样本中是否存在癌症的系统和方法,所述测试样本包含一组的多个片段的脱氧核糖核酸(DNA)。所述多个片段可通过概率分析来识别,或在确定为高甲基化或低甲基化时进行识别。所述系统生成一测试特征向量,具有对于每个CpG位点用于一经训练的模型中的分数。所述分数基于所述测试样本中与所述CpG位点相重叠的所述多个片段的一数量。所述系统将所述测试特征向量输入到所述经训练的模型中。所述经训练的模型具有一函数,其基于所述测试特征向量和一分类参数组生成一癌症预测。所述测试样本的所述癌症预测可以包含对于每个癌症类型的一癌症预测值,所述癌症预测值描述所述测试样本属于一特定癌症类型的可能性。

2021-09-21

访问量:23

注册成为会员可查看更多数据。
技术分类