基于二代测序的可视化分析方法、系统及存储介质

文档序号:1143096 发布日期:2020-09-11 浏览:43次 >En<

阅读说明:本技术 基于二代测序的可视化分析方法、系统及存储介质 (Visualization analysis method, system and storage medium based on next generation sequencing ) 是由 周在威 王剑 陈瑛 陈爱玲 吴境雄 于 2020-05-27 设计创作,主要内容包括:本发明公开了一种基于二代测序的可视化分析方法、系统及存储介质,方法包括:获取资料库中存储的基因二代测序数据以及预设的样本类型;根据预设的模式信息,生成测序任务信息;根据所述测序任务信息,对所述基因二代测序数据进行筛选;根据预设的样本类型并通过调用生物信息学软件库和脚本库,对筛选后的基因二代测序数据进行分析,获得分析结果。本发明提供的基于二代测序的可视化分析方法、系统及存储介质,可以有效的避免了医学人员不熟悉计算机编程代码的问题。实现简单,便捷的操作,达到了医学人员进行二代测序(NGS)数据分析的要求。(The invention discloses a visualized analysis method, a visualized analysis system and a storage medium based on next generation sequencing, wherein the method comprises the following steps: acquiring gene next-generation sequencing data stored in a database and a preset sample type; generating sequencing task information according to preset mode information; screening the second-generation gene sequencing data according to the sequencing task information; and analyzing the screened gene second-generation sequencing data by calling a bioinformatics software library and a script library according to a preset sample type to obtain an analysis result. The visualized analysis method, the visualized analysis system and the storage medium based on the second-generation sequencing provided by the invention can effectively avoid the problem that medical personnel are not familiar with computer programming codes. The method is simple to implement and convenient to operate, and meets the requirement of medical personnel on the analysis of Next Generation Sequencing (NGS) data.)

基于二代测序的可视化分析方法、系统及存储介质

技术领域

本发明是涉及基因二代测序领域,特别是涉及一种基于二代测序的可视化分析方法、系统及存储介质。

背景技术

随着二代测序技术(ngs)的普及和商用化,大量的人类的基因信息被检测出来了。不过,人体基因组的大小约为30亿个碱基对,即3000Mbp。基因组大小通常以核苷酸碱基对的数量表示,单位为百万计,写成Mb或Mbp。人类基因组由23对染色体(共46个)所构成,每一个染色体皆含有数百个基因。1号到22号染色体编号顺序,大致符合他们由大到小的尺寸排列,23号为决定性别的性染色体。最大的染色体约含有2亿5千万个碱基对,最小的则约有3800万个碱基对。总共约30亿个碱基对,即3000Mbp。

现有技术中,进行基于二代测序数据(NGS)的人类基因组的数据分析对于进行分析的人员要求非常高,需要强大的计算机背景以及医学知识。

基于此,本申请的发明人发现,现有技术中的方法难以实现,也不能达到数据分析的要求。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

发明内容

为解决上述问题,本发明实施例的目的在于提供基于二代测序的可视化分析方法、系统及存储介质。

第一方面,本发明实施例提供了一种基于二代测序的可视化分析方法,包括:获取资料库中存储的基因二代测序数据以及预设的样本类型;根据预设的模式信息,生成测序任务信息;根据所述测序任务信息,对所述基因二代测序数据进行筛选;根据预设的样本类型并通过调用生物信息学软件库和脚本库,对筛选后的基因二代测序数据进行分析,获得分析结果。

在一种可能的实现方式中,所述获取资料库中存储的基因二代测序数据包括:判断所述基因二代测序数据是否为大于10g的数据;若为大于10g的数据,则对所述基因二代测序数据进行获取;若不是大于10g的数据,则重新对基因样本进行二代测序。

在一种可能的实现方式中,预设的模式信息包括等位基因频率小于千分之一,或者,影响蛋白质功能的生物学信息。

在一种可能的实现方式中,所述预设的样本类型包括:遗传模式型以及医学表型,所述遗传模式型包括显性遗传或隐性遗传。

在一种可能的实现方式中,所述可视化分析方法还包括,显示所述分析结果。

在一种可能的实现方式中,所述分析结果为符合疾病特征的基因突变表格。

第二方面,本发明实施例还提供了一种基于二代测序的可视化分析系统,包括:获取单元,用于获取资料库中存储的基因二代测序数据以及预设的样本类型;测试任务生成模块,用于根据预设的模式信息,生成测序任务信息;筛选单元,用于根据所述测序任务信息,对所述基因二代测序数据进行筛选;分析单元,用于根据预设的样本类型并通过调用生物信息学软件库和脚本库,对筛选后的基因二代测序数据进行分析,获得分析结果。

在一种可能的实现方式中,所述获取单元还用于:判断所述基因二代测序数据是否为大于10g的数据;若为大于10g的数据,则对所述基因二代测序数据进行获取;若不是大于10g的数据,则重新对基因样本进行二代测序。

在一种可能的实现方式中,所述可视化分析系统还包括:显示单元,用于显示所述基因组重测序分析结果。

第三方面,本发明实施例还提供了一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求上述的基于二代测序的可视化分析方法。

本发明实施例提供的基于二代测序的可视化分析方法、系统及存储介质,可以有效的避免了医学人员不熟悉计算机编程代码的问题。实现简单,便捷的操作,达到了医学人员进行二代测序(NGS)数据分析的要求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本发明实施例所提供的基于二代测序的可视化分析方法的流程图;

图2示出了本发明实施例所提供的基于二代测序的可视化分析系统的结构示意图。

具体实施方式

下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

本发明实施例提供了一种基于二代测序的可视化分析方法,参见图1所示,包括:步骤1-步骤6;

步骤1,获取资料库中存储的基因二代测序数据以及预设的样本类型,其中,所述基因二代测序数据为二代测序(NGS)数据;

步骤2,根据预设的模式信息,生成测序任务信息;

在一种实现方式中,预设的模式信息包括等位基因频率小于千分之一,或者,影响蛋白质功能的生物学信息。

步骤3,根据所述测序任务信息,对所述基因二代测序数据进行筛选;

步骤4,根据预设的样本类型并通过调用生物信息学软件库和脚本库,对筛选后的基因二代测序数据进行分析,获得分析结果。

由此,本实施例提供的基于二代测序的可视化分析方法,可以有效的避免了医学人员不熟悉计算机编程代码的问题。实现简单,便捷的操作。达到了医学人员进行二代测序(NGS)数据分析的要求。

在一种实现方式中,所述预设的样本类型包括:遗传模式型以及医学表型,所述遗传模式型包括显性遗传或隐性遗传。

在一种实现方式中,步骤S1之前可以包括:对基因样本进行基因二代测序。

在一种实现方式中,步骤S1可以包括:判断所述基因二代测序数据是否为大于10g的数据;若为大于10g的数据,则对所述基因二代测序数据进行获取;若不是大于10g的数据,则重新对基因样本进行二代测序。

在一种实现方式中,步骤4之后还可以包括:

步骤5,所述可视化分析方法还包括,显示所述分析结果。

在一种实现方式中,所述分析结果为符合疾病特征的基因突变表格。

在医院或第三方检测机构收到二代测序数据后,由医学和遗传学的专业人员进行操作,提取相关的二代测序数据,进行匹配相关的样本类型,遗传模式和医学表型后,并进行处理,就可以得到相关的基因突变表格了。

本实施例中,所述生物信息学软件库,可以包括:SEEDERSEQ,GATK,ANNOVAR。

所述脚本库,可以包括:SNP检测脚本、医学分析脚本和合并非常规原始数据脚本。

可以理解的是,本实施例中的可视化分析是针对人类已知基因组序列进行基因组测序的此基础上,对患病个体或群体进行医学相关性分析。基因组测序的个体,通过序列比对,可以找到大量的单核昔酸多态性位点SNP(Single Nucleotide Polymorphisms),并根据患者相关的医学表型和遗传病相关的遗传模式进行综合分析。

在现有技术中,测序数据分析需要用到多款生物信息学软件,要对每款软件的使用方法都比较了解,且不同分析模块间的衔接需要人工干预,导致分析繁琐,效率低下,更重要的是,信息分析人员没有医学和遗传学的专业知识,医学或遗传学的人员没有相关的编程知识,为解决该问题,本发明能够实现可视化的遗传病基因二代测序数据点突变可视化分析流程。

进一步的,本实施例通过调用生物信息学软件和个性化分析脚本库,简化基于二代测序的可视化分析方法分析流程,提高基因组测序效率,节省了科研成本。

本实施例还提供一种基于二代测序的可视化分析系统,参见图2所示,包括:获取单元1、测试任务生成模块2、筛选单元3、分析单元4。

获取单元1,用于获取资料库中存储的基因二代测序数据以及预设的样本类型,其中,所述基因二代测序数据为基因样本经过二代测序后的数据。

测试任务生成模块2,用于根据预设的模式信息,生成测序任务信息。

筛选单元3,用于根据所述测序任务信息,对所述基因二代测序数据进行筛选。

分析单元4,用于根据预设的样本类型并通过调用生物信息学软件库和脚本库,对筛选后的基因二代测序数据进行分析,获得分析结果。

所述获取单元1还用于:判断所述基因二代测序数据是否为大于10g的数据;若为大于10g的数据,则对所述基因二代测序数据进行获取;若不是大于10g的数据,则重新对基因样本进行二代测序。

在一种实现方式中,所述可视化分析系统还包括:显示单元5,用于显示所述基因组重测序分析结果。

由此,本实施例提供的基于二代测序的可视化分析系统,可以有效的避免了医学人员不熟悉计算机编程代码的问题。实现简单,便捷的操作。达到了医学人员进行二代测序(NGS)数据分析的要求。

本发明实施例还提供了一种存储介质,所述存储介质存储有计算机可执行指令,其包含用于执行上述基于二代测序的可视化分析方法的程序,该计算机可执行指令可执行上述任意方法实施例中的方法。

其中,所述存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基因比对加速装置、方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!