一种治疗非酒精性脂肪肝中药的机理分析装置及方法

文档序号:139303 发布日期:2021-10-22 浏览:35次 >En<

阅读说明:本技术 一种治疗非酒精性脂肪肝中药的机理分析装置及方法 (Mechanism analysis device and method for traditional Chinese medicine for treating non-alcoholic fatty liver disease ) 是由 杨勇 谢宇鑫 沈坤龙 于 2021-06-07 设计创作,主要内容包括:本发明公开一种治疗非酒精性脂肪肝中药的机理分析装置及方法。本发明通过数据挖掘算法分析大量中药处方,获得高度关联的中药药方组合,再运用中药网络药理学知识,将复杂网络分析技术和大数据技术有效结合起来,分析具体的活性成分的潜在作用靶点,填补了目前中药治疗NAFLD的作用机制说明的空白,同时也为发掘潜在作用机制提供新思路,为后续新药的研发提供理论基础。(The invention discloses a mechanism analysis device and method for a traditional Chinese medicine for treating non-alcoholic fatty liver disease. According to the invention, a large number of Chinese medicine prescriptions are analyzed through a data mining algorithm to obtain highly-associated Chinese medicine prescription combinations, and then, the complex network analysis technology and the big data technology are effectively combined by applying Chinese medicine network pharmacological knowledge to analyze the specific potential action target of the active ingredients, so that the blank of the description of the action mechanism of the traditional Chinese medicine for treating NAFLD is filled, a new thought is provided for exploring the potential action mechanism, and a theoretical basis is provided for the research and development of subsequent new medicines.)

一种治疗非酒精性脂肪肝中药的机理分析装置及方法

技术领域

本发明属于数据挖掘领域和网络药理学领域,具体涉及一种治疗非酒精性脂肪肝中药的机理分析装置及方法。

背景技术

中药学在多年来的临床实践中积累了庞大的处方数据,这些数据积淀了众多中医药师用药经验与药理知识,但是由于缺乏完善的数据分析方法,许多处方数据中具有价值的知识规律还未被挖掘出来。数据挖掘技术对于复杂、多维的系统具有极高的适应性,非常适用于海量数据的潜在规律的挖掘与分析,可从不同侧面反映事物的因果关系。使用关联分析、聚类分析等数据挖掘方法,探索中医药处方内蕴含的用药与配伍知识,可为中医辨证论治的信息化提供理论基础;将其隐性的规律归纳总结,有助于推进中医“可直接继承、可测量、可验证”理论体系的构建。

中医学的整体观念与网络药理学、网络生物学等前沿科技的核心思想具有相通之处,随着网络药理学与中药研究的深入结合,中药网络药理学得到了快速的发展。中药网络药理学作为一门以中医药基本理论为指导的生物网络信息学科,其核心在于把握整体观念,旨在从生物体整体的生理病理角度出发,在细胞、分子、人体调控网络、器官等多个层面去研究中药的药理作用机制,进而为复杂疾病的治疗提供理论基础与研究方向,同时促进中药研究从当前的“单一靶标、单一药物”模式转向“网络靶标,多成分药物”的新模式。

数据挖掘技术与网络药理学的结合使用能够更好的探索中医药处方中蕴含的知识以及潜在的规律,并且能够为中医学从基于经验迈向基于证据提供新的途径,加速中药药物发现的进程,改进当前的处方药物研究策略,同时也为新药的研发提供理论基础。

非酒精性脂肪肝(nonalcoholic fatty liver disease,NAFLD)是一种以肝实质细胞脂肪变性和脂肪贮积为特征的疾病,它从肝脏病变,肝脏的脂肪堆积,影响体内物质代谢开始,进而影响血脂及血糖水平,逐渐进展为脂肪性肝炎、不可逆的肝纤维化,最终发展为肝癌。目前,NAFLD的发病趋向年轻化,且发病率在国内外均呈现逐年上升趋势,据统计NAFLD在全球成人中的发病率为25%。在中国,NAFLD更是肝功能异常的首要原因,同时也是第二大肝病隐患。中医对于NAFLD的治疗自古就有,将其归属于“胁痛”“肝癖”“积证”“肥气”等病证范畴。目前,临床上存在着大量治疗NAFLD的中医药处方,但是其中所蕴含的用药配伍知识以及潜在的规律尚未明确,同时也存在着具体药物分子作用机制不明确的问题。当前缺乏一种综合性的方法能够同时解决以上两个问题,而本发明使用数据挖掘与网络药理学分析相结合的方法,能够探究中药治疗NAFLD的处方用药规律,以及具体的药理作用机制,同时也能促进治疗NAFLD疾病的新药研发,为其提供理论基础。

发明内容

本发明的一个目的是提供一种治疗非酒精性脂肪肝中药的机理分析装置。本发明通过数据挖掘算法分析大量中药处方,获得高度关联的中药药方组合,再运用中药网络药理学知识,将复杂网络分析技术和大数据技术有效结合起来,分析具体的活性成分的潜在作用靶点,填补了目前中药治疗NAFLD的作用机制说明的空白,同时也为发掘潜在作用机制提供新思路,为后续新药的研发提供理论基础。

一种治疗非酒精性脂肪肝中药的机理分析装置包括:

数据获取模块,用于获取治疗非酒精性脂肪肝的相关药方;并统计所有药方中各中药的出现频率,根据前N1出现频率较高中药,N1可以为10%。然后标记将上述出现频次较高中药在所有药方中的出现情况,出现设置T,未出现设置成F,作为数据预处理文件;用数据挖掘软件SPSS Modeler,选择apriori算法模型;在SPSS Modeler软件中导入数据预处理文件,得到前项和后项;根据置信度进行从大到小排序,筛选出前N2个置信度对应的前项和后项对应的中药,作为关键中药。

中药分析模块,用于分析数据获取模块传送的关键中药化学成分及靶点;

疾病分析模块,用于获得与非酒精性脂肪肝相关的靶点,然后根据标准进行筛选合并。

PPI蛋白质互作网络图构建模块,用于关键中药的靶点与疾病NAFLD的靶点信息中取交集,获得共同靶点信息;将共同靶点信息导入String蛋白质数据库,绘制共同靶点的PPI蛋白质互作网络图,并获取靶点相互作用数据。将共同靶点的相互作用数据导入Cytoscape 3.8.2软件分析,计算连接度,获取核心靶点并进行分析。

药方作用机制分析模块,用于利用metascape系统数据库,对PPI蛋白质互作网络图构建模块获取的共同靶点进行GO富集分析和KEGG富集分析,解析药方中各中药在治疗非酒精性脂肪肝的过程中的作用机制。

本发明的另一个目的是提供一种基于数据挖掘与网络药理学分析中药治疗非酒精性脂肪肝的方法,包括以下步骤:

(1)对中药药方数据进行数据挖掘,获取合理的中药组合:

从医院中药药方大数据中,以非酒精性脂肪肝为关键字筛选出相关药方;并统计所有药方中各中药的出现频率,根据前N1出现频率较高的中药,N1可以为10%。然后标记将上述出现频次较高中药在所有药方中的出现情况,出现设置T,未出现设置成F,作为数据预处理文件;用数据挖掘软件SPSS Modeler,选择apriori算法模型;在SPSS Modeler软件中导入数据预处理文件,得到前项和后项;根据置信度进行从大到小排序,筛选出前N2个置信度对应的前项和后项对应的中药,作为关键中药。

(2)获得中药组合中各个中药的化学成分及靶点:

以关键中药作为关键字,在中药系统药理学数据库与分析平台TCMSP数据库中,以ADME参数筛选标准,获得对应中药活性化合物和靶点信息。利用Cytoscape 3.8.2软件,将中药的活性化合物及其作用靶点信息绘制成中药-活性成分-靶点的PPI图。

(3)获得疾病NAFLD的作用靶点:

从GeneCards基因数据库、OMIM数据库,以非酒精性脂肪肝缩写:“NAFLD”为关键词进行检索,获得与非酒精性脂肪肝相关的靶点,然后根据标准进行筛选合并。

(4)构建中药与NAFLD的PPI网络图:

从关键中药的靶点信息与疾病NAFLD的靶点信息中取交集,获得共同靶点信息。将共同靶点信息导入String蛋白质数据库,绘制共同靶点的PPI蛋白质互作网络图,并获取靶点相互作用数据。将共同靶点的相互作用数据导入Cytoscape 3.8.2软件分析,计算连接度,获取核心靶点并进行分析。

(5)对共同靶点进行富集分析:

利用metascape系统数据库,对共同靶点进行GO富集分析和KEGG富集分析,解析药方在治疗非酒精性脂肪肝的过程中的作用机制。

本发明的有益效果是:

单一的数据分析方法,缺乏临床试验或者理论依据。而本发明能够从网络药理学的方面提供理论支持,从蛋白相互作用,GO富集分析,KEGG富集分析等多方面对数据挖掘结果进行分析判断,提高数据挖掘结果的可靠性,准确性。此外,和运用医学知识分析单独中药或者中成药相比,本发明能够充分利用医院拥有大量治疗各种疾病的中药药方数据的优势,进一步的探讨潜在的治疗各种疾病的中药组合。并且相对于临床试验需要大量的时间与资源,用网络药理学分析可以快速便捷的从细胞、分子、人体调控网络、器官等多个水平去研究中药的药效作用机制。如果研究结果表示这些中药组合对于某一疾病不具有一定的治疗效果,可以转而研究其他组合,减少不必要的大量的临床试验,进而节省大量的时间和资源。如果研究结果表示中药组合对于某一疾病具有一定的治疗效果,就可以尝试安排临床试验,并为新药的研究做出一定的基础贡献。

附图表说明

图1数据挖掘流程图流程图;

图2组合药方化学成分-靶点信息蛋白质图,其中正八边形是中药,圆形是化学成分,正六边形中药共有的化学成分,菱形是蛋白基因;

图3药方-非酒精性脂肪肝靶点PPI网络图;

图4共同靶点Cytoscape重构PPI网络图;

图5 GO富集分析—BP生物学过程图;

图6 GO富集分析—CC细胞组成图;

图7 GO富集分析—MF分子功能图;

图8 KEGG富集分析图。

具体实施方式

为了对本发明的技术特征,设置的参考标准有更详细的了解,现结合具体的实验用例及图示附图详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。

基于数据挖掘治疗非酒精性脂肪肝的中药药方并用网络药理学过程及结果展示分析。

基于本发明装置进行数据挖掘和网络药理分析方法:

(1)对中药药方数据进行数据挖掘,获取合理的中药组合:

根据图1数据挖掘流程图,本实验案例从某三甲医院获取近5年来的中药药方数据,以非酒精性脂肪肝NAFLD为关键字进行精准筛选,共筛选出药方描述中含有非酒精性脂肪肝的中药药方共计219例,合计中药215味。然后进行预处理,统计各个中药在219例药方中的出现频次,根据出现的频次筛选出现概率前10%左右的中药,本实验共筛选了前23位中药。然后标记将23味中药在219例药方中的出现情况,出现设置T,未出现设置成F,作为数据预处理文件。用数据挖掘软件SPSS Modeler,选择apriori算法模型。在SPSS Modeler软件中导入数据预处理文件,并设置筛选标准:算法中的最低条件支持度设置,最小规则置信的设置,结果最大项术设置。本实验设置最低条件支持度为40,最小规则置信为70%,最大项术为4。

表1基于Apriori数据挖掘四联分析结果表

将数据挖掘结果以置信度大小为排列标准,并筛选出前20位,如表1所示。经分析得,置信度最高的后项为生白术和生白芍,对应前项出现频率最高的是党参,郁金,麦芽,茯苓。故最终选择生白术,生白芍,党参,郁金,麦芽,茯苓为实验的组合中药方。

(2)获得中药组合中各个中药的化学成分及靶点:

通过中药系统药理学数据库与分析平台TCMSP,分别以白术,白芍,党参,茯苓,麦芽,郁金六种中药为关键字检索活性化学成分。根据ADME参数标准,以口服利用度(oralbioavailability,OB)≥30%和类药性(drug-likeness,DL)≥0.18为标准进行筛选,获得中药活性化学成分及其蛋白质靶点信息。将中药和活性化学成分信息整理成表并编号,如表2。根据Uniprot蛋白质数据库的标准,对中药的靶点信息进行规范化标注。用Cytoscape3.8.2对白术,白芍,党参,茯苓,麦芽,郁金的化学成分及其作用靶点的关系网络进行绘制PPI关系图。

表2六味中药化学成分表

中药系统药理学数据库与分析平台TCMSP检索结果:白芍化学成分14个,含靶点的化学成分8个,相关靶点89个;白术化学成分7个,含靶点的化学成分4个,相关靶点18个;党参化学成分21个,含靶点的化学成分17个,相关靶点106个;麦芽化学成分18个,含靶点的化学成分14个,相关靶点104个;茯苓化学成分15个,含靶点的化学成分6个,相关靶点22个;郁金化学成分14个,含靶点的化学成分3个,相关靶点68个。合计化学成分46个,包括共有的化学成分4种,相关靶点174个。具体化学成分如表2六味中药化学成分表。其中A1化合物为白芍,麦芽,郁金共有。A2化合物为白芍,麦芽,郁金共有。B1化合物为白芍,麦芽共有。C1化合物为党参,麦芽共有。

图2组合药方化学成分-靶点信息蛋白质图,其中正八边形是中药,圆形是化学成分,正六边形中药共有的化学成分,菱形是蛋白基因。

(3)获得疾病NAFLD的作用靶点:

通过GeneCards基因数据库、OMIM数据库,以非酒精性脂肪肝缩写:“NAFLD”为关键词进行检索,获得与非酒精性脂肪肝机理相关的靶点。将两个数据库的筛选结果整合成基本靶点,再根据Uniprot蛋白质数据库的标准对化合物进行标准化。根据经验设定Score大于中位数的目标靶点为非酒精性脂肪肝的潜在靶点。设定Score>9的靶点为非酒精性脂肪肝的潜在靶点,最终得到520个非酒精性脂肪肝的相关靶点。

(4)构建中药与NAFLD的PPI网络图:

将中药靶点与NAFLD疾病靶点取交集,得到结果:白芍和NAFLD交集靶点40个;白术和NAFLD交集靶点5个;党参和NAFLD交集靶点42个;麦芽和NAFLD交集靶点42个;茯苓和NAFLD交集靶点4个;郁金和NAFLD交集靶点27个。将靶点预测结果合并后排除重复值,共获得69个靶点。在String数据库,将69个靶点的Uniprot数据库编号导入,选择目标多种蛋白质Multiple proteins,物种智人Homo sapiens。通过String数据库内部大量不同靶点的相互作用关系,得到69个靶点相互之间的关系,并在String数据库上绘制PPI蛋白质相互作用图。

PPI蛋白互作图的参数标准有很多:第一种是最低互作蛋白得分minimumrequired interaction score,选择的最低互作蛋白得分越高,靶点之间的相互作用连线满足条件的就越少。本实验选择了默认的分medium confidence。第二种是要显示的最大互动者数量max number of interactors,包含第一外壳和第二外壳,选择交互器越多,靶点直接的额外连线越多。本实验选择的默认连线,第一外壳和第二外壳都是none。

根据选择标准绘制PPI蛋白质互作网络图,结果如3药方-非酒精性脂肪肝靶点PPI网络图所示。其中PPI蛋白质互作网络图的节点数69,连线数758,平均节点度22个,平均局部聚类系数为0.661。

在String数据库上将数据导出成tsv文件,再将文件导入Cytoscape软件,用来重新构建PPI网络。通过69个靶点相互连接线数目degree进行分类,包括图形颜色和大小的分类,并重新绘图成更加直观明显的图4共同靶点Cytoscape重构PPI网络图。并以图4内核心靶点的连接度degree大小为排序标准,得到排序前10位的核心靶点。根据10个核心靶点的数据,查询疾病靶点表内数据,中药化合物表内数据,制成表3核心靶点与疾病,中药化学成分,中药对应关系表,因中药化学成分名字过于复杂,故采用表2的编号。

表3核心靶点与疾病,中药化学物质,中药对应关系表。

结果发现:前10位核心靶点,与疾病的关联度得分都远远超过之前的筛选标准9分。此外核心靶点TNF与疾病NAFLD的关联得分为115.15分,在与疾病NAFLD相关的520个靶点中,位列第一。核心靶点IL6与疾病NAFLD的关联得分为109.25分,在与疾病NAFLD相关的520个靶点中,位列第二。表明药方组合的核心靶点包括了治疗疾病NAFLD最关键的2个靶点。

(5)对中药和NAFLD进行富集分析:

登录metascape系统数据库,选择生物种类为智人Homo sapiens,对中药组合和NAFLD的69个共同靶点,进行各种富集分析:包括GO的BP(biological process)富集分析、CC(cellular component)富集分析、MF(molecular function)富集分析以及KEGG通路富集分析。保存结果,并选取结果中Log10(P)值排名靠前的结果将其进行可视化并分析。

结果分析:

在图4 BP的富集分析图中:有18个靶点作用于脂质代谢过程(regulation oflipid metabolic process);有19个靶点作用于对脂多糖的反应(response tolipopolysaccharide);有21个靶点作用于活性氧代谢过程(reactive oxygen speciesmetabolic process);有22个靶点作用于有机羟基化合物的代谢过程(organic hydroxycompound metabolic process);有19个靶点作用于细胞对有机环状化合物的反应(cellular response to organic cyclic compound)。靶点作用的脂质代谢过程和对脂多糖的反应过程对于脂肪肝的形成和降解都有直接关系;活性氧代谢过程和有机羟基化合物的代谢过程,与脂肪肝脂质的降解有间接的关系;细胞对有机环状化合物的反应对于非酒精性脂肪肝的脂质的形成有间接的关系。

在图5 CC的富集分析图当中,有13个靶点作用在脂筏(membrane raft)上;有5个靶点作用于过氧化物酶体(peroxisome)。靶点作用的脂筏和过氧化物酶体的合成,对于非酒精性脂肪肝的生成代谢有这间接的作用。

在图6 MF的富集分析图当中,有17个靶点作用在氧化还原酶活性(oxidoreductase activity);有12个靶点作用在脂质结合(lipid binding)。靶点作用的氧化还原酶活性和脂质结合这两个分子功能方面,对于非酒精性脂肪肝的代谢和形成都有着直接或间接的作用。

在图7KEGG的富集分析图当中,有17个靶点作用在Non-alcoholic fatty liverdisease(NAFLD)非酒精性脂肪肝病上。从metascape系统数据库获取Non-alcoholic fattyliver disease(NAFLD)的扩展内容得到具体内部包含的通路:Non-alcoholic fattyliver disease(NAFLD)通路;foxo signaling pathway通路;insulin resistance胰岛素抵抗通路;Adipocytokine signaling pathway脂肪细胞因子信号通路;Insulinsignaling pathway胰岛素信号通路。其中foxo signaling pathway对应的FOXO蛋白的主要调节机制是响应胰岛素或几种生长因子;insulin resistance胰岛素抵抗通路和Insulin signaling pathway胰岛素都是通过胰岛素,间接的影响非酒精性脂肪肝的病症;Adipocytokine signaling pathway脂肪细胞因子信号通路则是通过直接影响脂肪细胞来影响非酒精性脂肪肝的病症。

以上就是实验案例对本发明主要步骤及实施方法进行的详细的阐述。上述实验案例只是帮助理解本发明的方法及核心原理。对于数据挖掘领域和网络药理学领域的技术人员,依据本发明的核心原理,在具体的实施过程中对于实验标准可以根据需要进行变动。综上所述,本说明书不应理解为对本发明的限制。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于大数据的临床路径信息管理系统及方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!