一种动态交互式微生物组学在线分析云平台及其生成方法

文档序号:1546370 发布日期:2020-01-17 浏览:47次 >En<

阅读说明:本技术 一种动态交互式微生物组学在线分析云平台及其生成方法 (Dynamic interactive microbiology online analysis cloud platform and generation method thereof ) 是由 周煌凯 夏昊强 高川 张羽 陶勇 罗玥 张秋雪 于 2019-10-28 设计创作,主要内容包括:本发明公开了一种动态交互式微生物组学在线分析云平台及其生成方法,所述云平台包括:用户登录管理模块,用于提供用户注册账号信息,获取登陆信息,根据登陆信息确定登陆用户的权限,提供登陆用户利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析的接口;数据模块,用于提供用户进行上传数据操作,获取用户上传的数据;项目分析模块,用于提供对用户上传的数据进行选择,构建样本关系单-分组方案以及样本关系单-比较方案,并对选取的样本关系单以及相应的参数进行新建流程分析操作;动态交互模块,用于提供用户实现动态交互数据解析,通过交互式用户界面的形式呈现分析结果。(The invention discloses a dynamic interactive microbiology online analysis cloud platform and a generation method thereof, wherein the cloud platform comprises: the user login management module is used for providing user registration account information, acquiring login information, determining the authority of a login user according to the login information, and providing an interface for the login user to perform biological information analysis on 16S, ITS and 18S and microorganism metagenome sequencing by using a cloud platform; the data module is used for providing data uploading operation for a user and acquiring data uploaded by the user; the project analysis module is used for selecting the data uploaded by the user, constructing a sample relation single-grouping scheme and a sample relation single-comparison scheme, and performing new flow analysis operation on the selected sample relation single and corresponding parameters; and the dynamic interaction module is used for providing a user to realize dynamic interaction data analysis and presenting an analysis result in the form of an interactive user interface.)

一种动态交互式微生物组学在线分析云平台及其生成方法

技术领域

本发明涉及生物信息分析技术领域,特别是涉及一种动态交互式微生物组学在线分析云平台及其生成方法。

背景技术

随着测序技术的进步与发展,高通量测序技术产生的数据总量已达EB级,因此如何利用生物信息技术从海量数据中挖掘有价值的核心信息,数据展示以便于实时解析和关键报告数据挖掘,已成为该领域科研人员的核心难题。而在生物信息分析平台方面,目前比较著名的国内外平台包括:国外的Galaxy生物信息分析平台、华大基因的BGI online平台。然而,这些平台功能虽然强大,适合专业生物信息用户,但对没有任何生物信息基础的用户使用尚有难度。

而且,市面上大部分高通量测序服务公司,都只提供的传统静态结题报告,在数据挖掘方面费时费力,不利于该领域科研人员进行数据分析研究,且若用户下机数据如需修改参数,需经公司技术和生物信息工程师进行反复交流商讨修改且重新分析需用户缴纳补充分析费用,此过程极为浪费时间和经济成本。

微生物包括病毒、细菌、真菌、藻类等,微生物多样性测序是一种利用高通量测序技术对PCR所扩增的16S、18S、ITS等微生物物种特征序列进行检测的研究方法。微生物组学是继基因组学以后,生命科学与生物技术研究领域的重大突破之一,在医疗、健康、农业、生态环境和工业制造方面具有广阔的应用前景。随着人类微生物组计划的投入,微生物组学的生物信息分析也面临上述问题。

然而,目前暂时还没有同时具有操作简单、安全性高、个性化分析丰富的生物信息学在线分析平台,因此,若能够提供一种可动态化数据挖掘和实时解析数据结果的生物信息分析平台,将会有巨大的行业需求。

发明内容

为克服上述现有技术存在的不足,本发明之目的在于提供一种动态交互式微生物组学在线分析云平台及其生成方法,以自动实现生物信息的动态化数据挖掘和实时解析,使得无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,从而便于实时数据挖掘分析。

为达上述目的,本发明提出一种动态交互式微生物组学在线分析云平台,包括:

用户登录管理模块,用于提供用户注册账号信息,获取登陆信息,根据登陆信息确定登陆用户的权限,提供登陆用户利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析的接口;

数据模块,用于提供用户进行上传数据操作,获取用户上传的数据;

项目分析模块,用于提供对用户上传的数据进行选择,构建样本关系单-分组方案以及样本关系单-比较方案,并对选取的样本关系单以及相应的参数进行新建流程分析操作;

动态交互模块,用于提供用户实现动态交互数据解析,通过交互式用户界面的形式呈现分析结果。

优选地,所述用户登录管理模块包括:

分享数据单元,用于提供用户将数据结果与他人分享、讨论及交接;

任务查看单元,用于提供用户链接至所述动态交互模块进行分析内容、参数查看,以及获取分析结果;

用户权限管理单元,用于提供用户购买所述云平台的相应权限的流程分析内容,根据用户的充值操作提供用户不同的操作权限;

云平台信息提供单元,用于提供所述云平台的相关信息。

优选地,用户登录管理模块提供用户批量下载所有分析数据和个性化报告。

优选地,所述数据模块提供用户对所要上传的数据的数据来源、数据类型以及数据格式的选择,将所选择的数据进行上传,并于上传过程中,实时显示数据上传状态。

优选地,所述数据来源为不同测序平台已经去除barcode接头的单端或双端序列,所述数据类型为细菌/古菌/真菌/藻类、16S/ITS/18S、V3-V4/V5-V6中的任意一种,所述数据格式为后缀为.fastq/.fq/.fq.gz/.fastq.gz/.fastq.bz2/.fq.bz2中的任意一种。

优选地,所述项目分析模块包括:

数据选择及命名模块,用于提供用户对用户上传的数据进行选择,根据所选择的数据构建并命名数据集;

分组/比较方案构建模块,用于对选择的数据集构建样本关系单-分组方案以及样本关系单-比较方案;

分析模块,用于对选取的样本关系单以及相应的参数进行数据分析。

优选地,所述分析模块进行常规微生物多样性分析,包括但不限于分组分析、OTU聚类、统计、分析;物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析、个性报告生成。

优选地,所述动态交互模块包括:

新增任务模块,通过获取分组方案进行新增分组,通过OTU筛选进行新增OTU表格,通过新增分组和新增OTU表格开始新的任务交互分析;

数据挖掘模块,通过一键式选择参数切换,排除聚类不理想,使得多角度分析数据,寻找实验预期结果。

优选地,所述一键式选择参数切换包括但不限于切换OTU/phylum等物种分类水平、切换sample/group、切换分析模型、切换阈值等方面进行操作。

为达到上述目的,本发明还提供一种动态交互式微生物组学在线分析云平台的生成方法,包括如下步骤:

步骤S1,提供用户注册账号信息,获取登陆信息,根据登陆信息确定登陆用户的权限,提供登陆用户利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析的接口,实现用户登录管理模块;

步骤S2,提供用户上传数据操作,获取用户上传的数据;

步骤S3,提供对用户上传的数据进行选择,构建样本关系单-分组方案以及样本关系单-比较方案,并对选取的样本关系单以及相应的参数进行新建流程分析操作,实现项目分析模块

步骤S4,提供用户实现动态交互数据解析。

与现有技术相比,本发明一种动态交互式微生物组学在线分析云平台及其生成方法通过云端服务平台封装式的设计,将后台复杂的实验、分析流程以简单、交互式的方式呈现给终端用户,使非生物信息背景的用户,也能够通过平台简单的操作界面完成复杂的生物信息分析,本发明解决了传统高通量测序科研服务模式的弊端,对无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析实验数据。

附图说明

图1为本发明一种动态交互式微生物组学在线分析云平台的系统结构图;

图2为本发明具体实施例中用户登录管理模块的细部结构图;

图3为本发明具体实施例中项目分析模块的细部结构图;

图4a为本发明具体实施例中数据选择及命名模块的示意图;

图4b、图4c为本发明具体实施例中分组/比较方案构建模块的示意图;

图4d为本发明具体实施例中分析模块的示意图;

图5为本发明具体实施例中动态交互模块的细部结构图;

图6为本发明具体实施例中数据挖掘模块的示意图;

图7为本发明一种动态交互式微生物组学在线分析云平台的生成方法的步骤流程图;

图8为本发明具体实施例指云平台的在线分析过程图。

具体实施方式

以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种动态交互式微生物组学在线分析云平台的系统结构图。如图1所示,本发明一种动态交互式微生物组学在线分析云平台,包括:

用户登录管理模块10,用于提供用户注册账号信息,获取登陆信息,根据登陆信息确定登陆用户的权限,提供登陆用户利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析的接口,并通过交互式用户界面的形式对登陆用户呈现分析结果。具体地说,云平台提供注册账号接口,提供用户输入注册账号与密码,以于用户注册成功后,利用所注册的账号和密码进行登陆,用户可根据注册所得的账号和密码登录,于登陆成功后,利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析,通过交互式用户界面的形式对用户呈现分析结果,用户登录管理模块10还可提供用户批量下载所有分析数据和个性化报告。

具体地,如图2所示,用户登录管理模块10进一步包括

分享数据单元101,用于提供用户将数据结果与他人分享、讨论、交接等;

任务查看单元102,用于提供用户链接至动态交互模块进行分析内容、参数等查看,以及下载分析结果。

用户权限管理单元103,用于提供用户购买所述云平台的相应权限的流程分析内容,根据用户的充值操作提供用户不同的操作权限。在本发明具体实施例中,用户分为普通用户和会员用户,所述充值操作包括但不限于账户充值、会员购买、存储购买、和充值记录等操作,对于普通用户和会员用户,两者均可通过对账户充值奥币,进行购买云平台的相应权限的流程分析内容,所述账户充值,可提供用户选择微信或支付宝等支付方式,对充值金额进行选择充值、支付、并根据用户需求开具***。所述会员购买,可获得更大存储空间、容量扩增和单个样本分析更加划算等权益,所述存储购买,用户充值后可通过购买存储来扩增存储空间,更便于上传的数据量过大时进行分析。

云平台信息提供单元104,用于提供所述云平台的相关信息。在本发明具体实施例中,云平台信息提供单元104通过提供其他单元的链接,以便用户获取云平台特点、技术参数、示例结果展示、操作案例、参考文献等单元链接,用户可观看云平台功能展示和分析操作,便于用户更好了解云平台、便于用户登录云平台后进行个性化需求分析操作。

数据模块20,用于提供用户上传数据操作,此功能可以对用户高通量测序数据进行深度实验结果挖掘。在本发明具体实施例中,提供用户对所要上传的数据的数据来源、数据类型以及数据格式的选择,将所选择的数据进行上传,并可于上传过程中,实时显示数据上传状态。

优选的,所述数据来源,可以是不同测序平台已经去除barcode接头的单端或双端序列,所述数据类型,可以是细菌/古菌/真菌/藻类、16S/ITS/18S、V3-V4/V5-V6中的任意一种,所述数据格式,可以是后缀为.fastq/.fq/.fq.gz/.fastq.gz/.fastq.bz2/.fq.bz2中的任意一种。

项目分析模块30,用于提供对用户上传的数据进行选择,构建样本关系单-分组方案以及样本关系单-比较方案,并对选取的样本关系单以及相应的参数进行新建流程分析操作。

具体地,如图3所示,项目分析模块30包括:

数据选择及命名模块301,用于提供用户对用户上传的数据进行选择,根据所选择的数据构建并命名数据集。具体地,如图4a所示,数据选择及命名模块301具体地用于:1、选择数据类型、项目,这里的项目指的是用户将测序数据上传到文件夹的名称(例如demo(25),表示该文件夹/项目里有25个样本的测序数据,文件夹可由用户命名);2选择需要分析的所有样本(因为1个项目可能分批分析,或者2个项目一起分析,因此在样本上传完了,需要选择本次分析的样本,选择样本名,就是选择对应的测序数据);3、进行数据确认;4、修改样本实验名称(测序时的名称)为分析名称(即用于图表中的名称);5、命名数据集名称(即把用户选的样本,作为一个新的数据集,命名,所以可能是多个项目的,或者1个项目里面的一部分);6、进行数据样本提交。

分组/比较方案构建模块302,用于对选择的数据集构建样本关系单-分组方案以及样本关系单-比较方案。

具体地,如图4b所示,分组/比较方案构建模块302构建样本关系单-分组方案具体过程如下:1、选择数据集;2、命名样本关系单;3、命名第一个分组名称;4、选择分组的样本;5、完成样本选择;6、点击添加分组,设定其他分组;7、所有分组设定完成后,点击分组完成。

如图4c所示,分组/比较方案构建模块302构建样本关系单-比较方案具体过程如下、选择单样品比较、选择两两组间比较以及选择多组间比较;点击提交,生成样本关系单。

分析模块303,用于对选取的样本关系单以及相应的参数进行数据分析。在本发明具体实施例中,可进行常规微生物多样性分析,包括但不限于分组分析、OTU聚类、统计、分析;物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析、个性报告生成等。

如图4d所示,分析模块303的具体过程为:1、选择样本关系单;2、填写参数(如数据库);3、命名流程名称;4、点击开始分析;5、弹出信息确认框,于确认信息无误后,点击提交分析,进行在线数据分析。

优选的,所述项目分析模块30提供分析结果,在项目分析模块30中,可点击分析结果进入动态交互模块40,所述项目分析模块30还可提供查看流程参数、基于已有流程编辑修改细节并重新提交等操作。

动态交互模块40,用于提供用户实现动态交互数据解析,包括但不限于新建任务操作、数据挖掘操作、图形美化操作。

具体地,如图5所示,动态交互模块40具体包括

新增任务模块401,通过获取分组方案进行新增分组,通过OTU筛选进行新增OTU表格,通过新增分组和新增OTU表格开始新的任务交互分析。具体地,用户可点击分组方案进行新增分组,点击OTU筛选进行新增OTU表格,通过新增分组和新增OTU表格开始新的任务交互分析。

新增任务模块401为基于流程分析获得的OTU数据,根据新增分组和OTU表格进行重新分析。新增分组操作可对物种污染、离群样本、修改样本名称等进行一键式分析处理;新增OTU表格,可针对目标分组,指定过滤OTU或者物种、抽平,去除污染和干扰、更严格质控、关注高丰度物种。同时,此重新分析还可以新增环境因子或代谢物的数据进行分析,相对于传统用户依靠高通量测序公司分析的流程,耗时更短、在样本和数据层面解析实验结果更全面。

数据挖掘模块402,通过一键式选择参数切换,包括但不限于切换OTU/phylum等物种分类水平、切换sample/group、切换分析模型、切换阈值等方面进行操作,排除聚类不理想,使得多角度分析数据,寻找实验预期结果,如图6所示。

其中点击相应参数切换,可一键式切换sample/group,便于样本量大时,group便于快速查找组件规律,sample便于关注组内细节;也便于组内重复性不好时,选择分组展示;可通过点击参数切换,一键式生成物种堆叠图、物种热图、Alpha多样性柱形图、稀释曲线、功能热图等分析图表。

其中点击相应参数切换,可一键式切换模型,包括但不限于,卡方分布检验、Welch′s t检验、Wilcoxon秩和检验、KW秩和检验、Lefse分析等方差分析;Sobs、ACE、Shannon、Goods’s coverage、Simpson等Alpha多样性指数;PCoA、NMDS等降维分析;Bray、Jaccard、(un)weighted unifrac等物种进化距离分析;Anosim、Adonis等分组检验;CCA、RDA等环境因子关联分析。

其中,点击参数切换,可切换阈值,一键式个性化筛选数据,包括但不限于Lefse分析、自定义物种分类、自定义功能热图的数量和种类、自定义环境因子种类、自定义热图和网络图相关系数阈值、LDA阈值、差异分析P值和Q值。

图形美化模块403,用于提供云平台涵盖更丰富的参数,一键式参数调整和美化图形,包括但不限于配色方案切换、颜色修改、透明度调整、形状切换、字体大小调整、字体类型选择、标题修改、图形边框、刻度、辅助线/圈、配色方案、柱形图误差棒、热图类型切换等。

图7为本发明一种动态交互式微生物组学在线分析云平台的生成方法的步骤流程图,图8为本发明具体实施例指云平台的在线分析过程图。如图7及图8所示,本发明一种动态交互式微生物组学在线分析云平台的生成方法,包括如下步骤:

步骤S1,提供用户注册账号信息,获取登陆信息,根据登陆信息确定登陆用户的权限,提供登陆用户利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析的接口,并通过交互式用户界面的形式对登陆用户呈现分析结果,实现用户登录管理模块。具体地说,云平台提供注册账号接口,提供用户输入注册账号与密码,以于用户注册成功后,利用所注册的账号和密码进行登陆,用户可根据注册所得的账号和密码登录,于登陆成功后,利用云平台针对16S、ITS、18S以及微生物宏基因组测序进行生物信息分析,通过交互式用户界面的形式对用户呈现分析结果,用户登录管理模块可提供用户批量下载所有分析数据和个性化报告。

步骤S2,提供用户上传数据操作,以便可以对用户高通量测序数据进行深度实验结果挖掘。在本发明具体实施例中,提供用户对所要上传的数据的数据来源、数据类型以及数据格式的选择,将所选择的数据进行上传,并可于上传过程中,实时显示数据上传状态。

优选的,所述数据来源,可以是不同测序平台已经去除barcode接头的单端或双端序列,所述数据类型,可以是细菌/古菌/真菌/藻类、16S/ITS/18S、V3-V4/V5-V6中的任意一种,所述数据格式,可以是后缀为.fastq/.fq/.fq.gz/.fastq.gz/.fastq.bz2/.fq.bz2中的任意一种。

步骤S3,提供对用户上传的数据进行选择,构建样本关系单-分组方案以及样本关系单-比较方案,并对选取的样本关系单以及相应的参数进行新建流程分析操作,实现项目分析模块。

具体地,步骤S 3进一步包括:

步骤S300,提供用户对用户上传的数据进行选择,根据所选择的数据构建并命名数据集。具体地,步骤S300的具体过程如下:选择数据类型、项目;选择需要分析的所有样本;进行数据确认;修改样本实验名称(测序时的名称)为分析名称(即用于图表中的名称);命名数据集名称;进行数据样本提交。

步骤S301,对选择的数据集构建样本关系单-分组方案以及样本关系单-比较方案。

具体地,步骤S301中构建样本关系单-分组方案具体过程如下:选择数据集;命名样本关系单;命名第一个分组名称;选择分组的样本;完成样本选择;点击添加分组,设定其他分组;所有分组设定完成后,点击分组完成。

步骤S301中构建样本关系单-比较方案具体过程如下:选择单样品比较;选择两两组间比较以及选择多组间比较;点击提交,生成样本关系单。

步骤S302,对选取的样本关系单以及相应的参数进行数据分析。在本发明具体实施例中,可进行常规微生物多样性分析,包括但不限于分组分析、OTU聚类、统计、分析;物种组成分析、Alpha多样性分析、Beta多样性分析、功能分析、环境因子分析、个性报告生成等。

步骤S302的具体过程为:选择样本关系单;填写参数(如数据库);命名流程名称;点击开始分析;弹出信息确认框,于确认信息无误后,点击提交分析,进行在线数据分析。

优选的,于步骤S3中,还提供分析结果,可点击分析结果进入动态交互模块,所述项目分析模块还可提供查看流程参数、基于已有流程编辑修改细节并重新提交等操作。

步骤S4,提供用户实现动态交互数据解析,包括但不限于新建任务操作、数据挖掘操作、图形美化操作,实现动态交互模块。

具体地,步骤S4进一步包括:

步骤S400,通过获取分组方案进行新增分组,通过OTU筛选进行新增OTU表格,通过新增分组和新增OTU表格开始新的任务交互分析。具体地,用户可点击分组方案进行新增分组,点击OTU筛选进行新增OTU表格,通过新增分组和新增OTU表格开始新的任务交互分析。

新增任务操作为基于流程分析获得的OTU数据,根据新增分组和OTU表格进行重新分析。新增分组操作可对物种污染、离群样本、修改样本名称等进行一键式分析处理;新增OTU表格,可针对目标分组,指定过滤OTU或者物种、抽平,去除污染和干扰、更严格质控、关注高丰度物种。同时,此重新分析还可以新增环境因子或代谢物的数据进行分析,相对于传统用户依靠高通量测序公司分析的流程,耗时更短、在样本和数据层面解析实验结果更全面。

步骤S401,通过一键式选择参数切换,包括但不限于切换OTU/phylum等物种分类水平、切换sample/group、切换分析模型、切换阈值等方面进行操作,排除聚类不理想,使得多角度分析数据,寻找实验预期结果。

步骤S402,提供云平台涵盖更丰富的参数,一键式参数调整和美化图形,包括但不限于配色方案切换、颜色修改、透明度调整、形状切换、字体大小调整、字体类型选择、标题修改、图形边框、刻度、辅助线/圈、配色方案、柱形图误差棒、热图类型切换等。

综上所述,本发明一种动态交互式微生物组学在线分析云平台及其生成方法通过云端服务平台封装式的设计,将后台复杂的实验、分析流程以简单、交互式的方式呈现给终端用户,使非生物信息背景的用户,也能够通过平台简单的操作界面完成复杂的生物信息分析,本发明解决了传统高通量测序科研服务模式的弊端,对无生物信息基础的科研工作者也可根据需要自主选择参数、一键生成分析结果、图形完全动态,便于实时解析实验数据。

与现有技术相比,本发明具有如下优点:

1)实现测序数据上传:可随时随地上传原始测序reads,兼容多种数据来源,兼容多种数据类型。

2)实现新增数据流程分析:使用原始reads开始分析,增大数据调整空间;自由合并和拆分项目,避免多批次采样分析限制;可批量修改样本名称;自定义物种注释数据库版本,可随时完成信息更新和功能分析。

3)完善图表的美化、动态交互程度高:新增多项分析点、动态交互参数,可实现数据/模型任意切换,高效实现数据挖掘;按需求美化参数,获得更优质数据图形。

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种DNA存储加密编码方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!